• تحلیل و رصد فضای مجازی
  • محصولات
    اینستامی
    اینفومی
    برندمی
    دیتامی
  • بلاگ
    سوشال لیسنینگ
  • درباره ما
  • تماس با ما
  • سوالات متداول
لایف‌وب لایف‌وب
لایف‌وب
  • تحلیل و رصد فضای مجازی
  • محصولات
    اینستامی
    اینفومی
    برندمی
    دیتامی
  • بلاگ
    سوشال لیسنینگ
  • درباره ما
  • تماس با ما
  • سوالات متداول
  1. خانه
  2. آموزشی
  3. دیتاست چیست و چه انواعی دارد؟

دیتاست چیست و چه انواعی دارد؟

آیلین اکبری آیلین اکبری
1 تیر 1401
آموزشیهوش مصنوعی
دیتاست چیست و چه انواعی دارد؟

 

حتی اگر کمی با دنیای داده‌ها آشنایی داشته باشید، احتمالا عبارت «دیتاست» به گوش‌تان خورده است. در این مطلب از لایف‌وب به معنای دیتاست، انواع و روش‌های ایجاد آن می‌پردازیم. در نظر داشته باشید که دیتاست و توضیحات مربوط به آن می‌توانند پیچیده و گسترده باشند اما ما در این مطلب به صورت کلی به آن می‌پردازیم تا برای عموم مخاطبان قابل درک باشد. با لایف‌وب همراه باشید.

دیتاست چیست؟

همانطور که می‌دانیم به مجموعه اطلاعاتی که از طریق مشاهدات، اندازه‌گیری‌ها، مطالعه یا تجزیه و تحلیل به دست می‌آید، داده اطلاق می‌شود که می‌تواند شامل اطلاعاتی مانند حقایق، اعداد، ارقام، نام‌ها و… باشد.
داده‌ها را می‌توان در قالب گراف، نمودارها یا جدول سازماندهی کرد. از طریق داده کاوی، دانشمندان داده به تجزیه و تحلیل داده های جمع‌آوری شده کمک می‌کنند.

دیتاست (Dataset) به داده‌هایی گفته می‌شود که با موضوع یکسان، برای انجام تحقیقات و پروژه‌های مربوط به علم داده (Data Science) و کسب دانش از داده‌ها و همچنین مقایسه بین روش‌های مختلف استفاده می‌شوند.

یکی از پر کاربردترین قالب‌ها برای دیتاست، قالب CSV است که جدولی شامل ستون‌ها و ردیف‌های مشخص است اما قالب‌های دیگری نیز برای مجموعهٔ داده‌ها استفاده می‌شود.

روش‌های ایجاد دیتاست

دیتاست‌ها غالبا به صورت عمومی عرضه می‌شوند اما ممکن است برای موضوعات خاصی، دیتاست مورد نظر را پیدا نکنید. در چنین شرایطی باید سراغ راه‌های ایجاد مجموعهٔ داده بروید.
در واقع دیتاست‌ها از راه‌های مختلفی ایجاد می‌شوند که از این روش‌ها می‌توان به موارد زیر اشاره کرد:

  • داده‌های تولید شده از ماشین‌ها
  • داده‌های ثبت شده از مشاهدات انسانی
  • داده‌های ثبت شده از وب‌سایت‌ها
  • داده‌های جمع‌آوری شده از نظرسنجی

داده‌های دیتاست می‌توانند متنی، جدولی یا مولتی مدیا باشند. به عنوان مثال یک دیتاست می‌تواند شامل نظرات کاربران درشبکه‌های اجتماعی باشد و دیتاست دیگری، شامل عکس دوربین‌های مداربسته.

همچنین مجموعهٔ داده‌ها می‌توانند از لحاظ رسانه‌ای که روی آن ارائه می‌شوند، در ۴ دسته قرار بگیرند:

  • دیتاست‌هایی که بر روی یک فایل هستند.
  • دیتاست‌هایی روی چند فایل قرار دارند.
  • دیتاست‌هایی که بر روی پایگاه داده قرار دارند.
  • دیتاست‌هایی که در وب هستند.

منابع دیتاست

برای دسترسی به مجموعه داده‌ها، منابع گوناگونی وجود دارد که تعدادی از آنها را بیان می‌کنیم:

  • Google Dataset Search
  • Kaggle
  • Amazon
  • World Bank Data
  • Github
  • Visual Data
  • The Big Bad NLP Database
  • DataVancouver

دیتاست‌ها چه انواعی دارند؟

انواع مجموعه داده

از انواع مجموعه داده‌ها می‌توان به دیتاست‌های عمومی، دیتاست‌های ماشین لرنینگ، دیتاست‌های بینایی رایانه و مجموعه داده‌های تجزیه و تحلیل احساسات اشاره کرد.

مثال:

  • مجموعه دادهٔ Boston Housing Dataset یک مجموعه دادهٔ عمومی محسوب می‌شود که شامل اطلاعات مربوط به مسکن در منطق بوستون است توسط سرویس سرشماری ایالات متحده جمع‌آوری و تهیه شده است.
  • دیتاست Mall Customers Dataset مجموعه داده‌هایی شامل اطلاعات افرادی است که به یک مرکز خرید مراجعه و از آن بازدید می‌کنند. این دیتاست شامل جنسیت، سن، درآمد و سایر اطلاعات مشابه از این افراد است. مجموعه داده‌های Mall Customers Dataset یکی از دیتاست‌های یادگیری ماشین به شمار می‌روند.
  • Twitter Airline Sentiment: شامل داده‌های توییتری مربوط به خطوط هوایی ایالات متحده است که در دسته‌بندی‌های مثبت، منفی و خنثی قرار گرفته‌اند؛ این دیتاست یکی از مجموعه داده‌های تجزیه و تحلیل احساسات است.
اشتراک‌گذاری در فیس‌بوک اشتراک‌گذاری در توئیتر
دیدگاه خود را بنویسید لغو پاسخ

ایمیل شما منتشر نخواهد شد.قسمت‌های مورد نیاز علامت‌گذاری شده‌اند *

دسته بندی ها
  • آموزشی
  • اخبار لایف وب
  • پایش شبکه‌های اجتماعی
  • تحلیل شبکه‌های اجتماعی
  • دسته‌بندی نشده
  • هوش مصنوعی
نوشته های اخیر
  • خبر ممنوعیت واردات آیفون و تاثیر آن بر قیمت آیفون
    تحلیل انتشار محتوا درباره ممنوعیت واردات آیفون
  • پرتکرارترین هشتگ‌های توییتر در بهار ۱۴۰۱
    پرتکرارترین هشتگ‌های توییتر فارسی در بهار ۱۴۰۱
  • بررسی واکنش کاربران توییتری به حضور امین حیایی در تبلیغات بیژن
    بررسی واکنش کاربران توییتری به حضور امین حیایی در تبلیغات گروه صنایع غذایی بیژن
  • تعریف دیتاست (dataset)
    دیتاست چیست و چه انواعی دارد؟
  • سریال یاغی فیلیمو و محبوبیت چشمگیر آن در توییتر
    بررسی سریال یاغی از نگاه کاربران توییتری


برای دریافت اطلاعات بیشتر و مشاوره با کارشناسان در مورد محصولات لایف‌وب، با ما تماس بگیرید. | شماره تماس: ۰۹۹۴۱۰۸۰۸۸۴

لایف‌وب با در اختیار داشتن کلان داده‌ شبکه‌های اجتماعی، وب‌سایت‌ها و رسانه‌های چاپی و با پردازش مبتنی بر هوش مصنوعی، امکان رصد و پایش فضای مجازی را فراهم می‌کند.

آدرس: خیابان شهید بهشتی، خیابان میرعماد، کوچه یازدهم، پلاک 13

پست الکترونیکی : info@lifeweb.ir
شماره تماس 87700133-021
درباره ما
  • معرفی لایف‌وب
  • تماس با ما
  • بلاگ
  • درخواست همکاری
  • سوالات متداول
محصولات
  • اینفومی (Infomi)
  • برندمی (Brandmi)
  • دیتامی (Datami)
  • اینستامی (Instami)
بهترین مطالب بلاگ
  • سوشال لیسنینگ چیست؟
  • افکار عمومی و تاثیر روندنگاری بر مدیریت آن
  • روابط عمومی دیجیتال چیست؟
راهکارهای لایف‌وب
  • برندها
  • روابط عمومی
  • مراکز پژوهشی

© کلیه حقوق این سایت متعلق به شرکت فن آفرینان زندگی نو (لایف وب) می باشد.

جستجو

برای جستجو روی Enter و برای بستن ESC را بزنید