با توجه به ابزار ارتباطی که در دست داریم، دیتا و اطلاعات به راحتی قابل دسترسی و استخراج هستن. این وسط دو تا سوال مطرح میشه:
- چه داده هایی ارزشمند هستن؟
- چه جوری این داده ها رو آنالیز کنیم؟
دنبالهی موضوع داده های عظیم چیه؟
با توجه به ابزار ارتباطی که در دست داریم، دیتا و اطلاعات به راحتی قابل دسترسی و استخراج هستن. این وسط دو تا سوال مطرح میشه:
دنبالهی موضوع داده های عظیم چیه؟
اتفاقا در این زمینه یه نقل قولی هست که میگه «داده پادشاهه!» و بحثی هم به اسم تصمیمگیری بر مبنای داده وجود داره که مثلا میتونین این مقاله فوربز رو درباره ش مطالعه کنین.
در این زمینه، معروف هست که میگن «چیزی که نمیتونی اندازه بگیری رو نمیتونی مدیریت کنی». و این بحث مثلا از تبلیغات و مارکتینگ یه شرکت شروع میشه تا … . یکی از نقاط قوت تبلیغات آنلاین نسبت به بستر سنتی همین قابل اندازه گیری بودنش هست.
راجع به سوالاتون، فکر میکنم هر دادهای در جای خودش قابل استفاده ست. ولی چجوری انالیز کردنش خیلی به اطلاعاتی داره که در این داده ها دنبالش هستین.
فکر میکنم با توجه به تجربه، ارزش داده بیشتر براساس توانائی تحلیل هست و توقع معقول و نه لزوما نوع و ذات داده. اینکه از داده چی میخواید بسیار مهمه. برای نمونه: توی داده دنبال خصوصیات خاصی میگردید یا رفتارهای ویژه ای رو میخواد تشخیص بدید. این زمینه از تحقیقات با آنالیز بیشتر سرو کار داره. مثلا همبستگی یا تبدیلات خطی مثل فوریه، موجک (در زمینه های علمی) یا پیدا کردن روندهای خاص مثل آشوب. در بعضی از زمینه ها به دنبال پیش بینی هستید که خیلی سختتر هست و دقت عمل بیشتری میخواد. بازسازی دینامیکی، شبکه های عصبی مصنوعی (neural network) چیزهائی هستن که کمک میکنن در این زمینه.
البته وسوسه نوع دوم خیلی میاد سراغ آدم، ولی باید خیلی دقیق و واقعگرا بود تا نتایج غیرواقعی (که خیلی رایج هست توی کارهای امروزی) به دست نیاد.
یه مسئله مهم میتونه این باشه که جدائی تحلیل گرها از کسائی که با تکنولوژی داده گیری سروکار دارن چه فواید و چه معایبی داره؟ فکر کنم همه کسائی که با علوم پایه سروکار داشتن با این معضل سروکار داشتن. بخصوص برای ما که روحیه و زمینه همکاری نداریم پرداختن به این سئوال میتونه راه گشا باشه.