سایت بدون – محسن فینیزاده / به باور بسیاری از صاحبنظران، علم داده جذابترین و پرکاربردترین علم قرن حاضر است. در مجله بررسی کسبوکارها روارد[۱] از شغل دانشمند داده با عنوان جذابترین شغل یاد شده است. اما علم داده چیست؟
علم
داده[۲] یک زمینه میان رشتهای است که از روشها، فرایندها، الگوریتمها و
سیستمهای علمی برای استخراج دانش و بینش از دادهها در اشکال گوناگون
(ساختاریافته و ساختارنیافته) استفاده میکند. در حقیقت وظیفه اصلی علم
داده تبدیل اطلاعات و دادههای خام به دانش قابل استفاده میباشد. در علم
داده ، متخصصان در میان حجم عظیمی از دادههای
به ظاهر پراکنده ، الگوهایی را براساس مسأله خود مییابد و تصمیمگیریهای بعدی خود را براساس این کار انجام میدهند.
جیم
گری [۳]چنین مطرح میکند که «بهطور کلی میتوان گفت علم داده، مطالعه
محلی که دادهها از آن میآیند، نشانگر چه چیزی هستند و چگونگی
مبدل
ساختن آنها به منبعی ارزشمند برای کسبوکار و استراتژیهای فناوری اطلاعات
سازمان است. کاوش حجم بالایی از دادههای ساختاریافته و ساختار نیافته به
منظور شناسایی الگوهایی انجام میشود که میتوانند به سازمانها جهت
صرفهجویی در هزینهها، افزایش کارایی، شناسایی فرصتهای جدید در بازار و
افزایش مزایای رقابتی کمک کنند.
بهطور کلی میتوان گفت علم داده،
مطالعه محلی که دادهها از آن میآیند، نشانگر چه چیزی هستند و چگونگی مبدل
ساختن آنها به منبعی ارزشمند برای کسبوکار و استراتژیهای فناوری
اطلاعات سازمان است. کاوش حجم بالایی از دادههای ساختاریافته و
ساختارنیافته به منظور شناسایی الگوهایی انجام میشود که میتوانند به
سازمانها جهت صرفهجویی در هزینهها، افزایش کارایی، شناسایی فرصتهای
جدید در بازار و افزایش مزایای رقابتی کمک کنند. در علم داده، ریاضیات،
آمار، علوم کامپیوتر و دیگر روشها مانند یادگیری ماشین، کاوش داده و
بصریسازی داده مورد استفاده قرار میگیرد.
دانشمند علم داده باید در
چند زمینه مختلف دانش و تخصص داشته باشد. مهمترین این زمینهها، دانش
آماری و مهارتهای علمی و فنی لازم برای حل کردن مسائل پیچیده است. او با
استفاده از انواع مدلهای توصیفی، پیشبینی و استنباطی قادر به ریشهیابی و
پیشبینی مشکلات احتمالی خواهد بود و براساس عوامل مختلف راهحل مناسب
برای آنها را ارائه
خواهد کرد. دانشمند داده علاوه بر تخصص در زمینه
علوم کامپیوتری، با ریاضیات و همچنین حوزه تخصصی خود مثلاً اقتصاد و یا
علوم سیاسی نیز آشنا باشد. مهارتهای فرد متخصص در علم داده از حوزههای
تکنولوژی و کسبوکار فراتر میرود و ابعاد بین رشته را پیدا میکند.
در
حال حاضر سازمانها و کسبوکارها و بخشی از سیاست و مدیریت عمومی کشور بیش
از هر زمان دیگری برای تصمیمگیری متکی به دادههای جمعآوریشده در
بانکهای اطلاعاتیشان هستند. به همین خاطر نیاز به کسانی که توانایی
سازماندهی، گردآوری، تفسیر و استخراج الگوها و برآورد روندهای مختلف از
دادهها را داشته باشند، محسوستر از همیشه است. گردآوری داده توسط
کسبوکارها مسألهای است که در آینده با جدیت بیشتری ادامه خواهد یافت. این
موضوع محدود به سازمان و کسبوکار نبوده و بدون شک بهزودی علم داده در
ابعاد علمی، اجتماعی و حتی اقتصاد و سیاست نیز رشد چشمگیر و بیش از پیش در
ایران و جهان خواهد داشت.
علم داده در حوزههای مختلف براساس کلان داده
مورد بررسی کاربرد دارد؛ از علم داده در حوزه سلامت تا دادههای سازمانی
که حوزه مورد بحث ما کلان داده شبکههای اجتماعی است. به صورت کلی علم داده
بیشتر مواقع زمانی به کار میآید که یک کلان داده وجود داشته باشد و
نیازمند آن باشیم که آن کلان داده را به مؤلفهها و مفاهیم قابل درک تبدیل
کنیم. به بیان بهتر بتوانیم چند میلیون داده را تبدیل به یک جمله کنیم که
در تصمیمگیریها به ما کمک کند.
یکی از این کلان دادههای اصلی در
زندگی امروزه ما دادههای مربوط به شبکههای اجتماعی است. روزانه میلیونها
محتوا در قالب متن، عکس، ویدیو و… فقط در کشور ما در شبکههای
اجتماعی[۴] منتشر میشود، محتواهایی که با گستره زیاد در موضوع و موضع
روبهرو
است و به راحتی هر نفر میتواند در بسترهای مختلف شبکههای اجتماعی در هر
لحظه به هر تعداد که بخواهد در قالب هر نوع هویتی به انتشار محتوا بپردازد.
دادههای
شبکههای اجتماعی منبع بسیار عظیمی از محتواهایی است که به بازنمایی
شخصیت، رفتار، نظر، کنش و… کاربران میپردازد، تحلیل این کلاندادهها
میتواند مؤلفههای معنیداری را سبب شود که مقدمه تصمیمات بهینه باشد،
حوزه این تحلیلها در موضوعات مختلف مانند کنشهای جامعه، مخاطبشناسی،
اقتصاد و کنشهای مالی افراد و جامعه ، مطالعات جامعهشناسی و… بسیار
گسترده است که به صورت خلاصه میتوان گفت در هر حوزهای که کنش انسان مهم
باشد میتوان از تحلیل شبکه اجتماعی بهعنوان یکی از اصلیترین محلها
برای
بروز انسان استفاده کرد.
از جمله موارد موفقی که در چند سال
گذشته در کشور خودمان تجربه شده است میتوان به پیشبینی نتایج انتخابات
براساس دادههای شبکه اجتماعی، سنجش ذائقه و تمایل افراد در بازار و
بخشهایی از تحقیقات بازار، پیشبینی تمایلات افراد در بورس، خرید و فروش،
دلار و مسکن، سنجش برند، تصویر شخصیتها و سازمانها در فضای مجازی و….
اشاره کرد اما آنچه در سطح جهان در حال حاضر از تحلیل دادههای شبکه
اجتماعی استفاده میشود بسیار فراگیرتر و عمیقتر از این موضوعات است.