بیدار شدن جنگ خاموش داده ها : در کمتر از سی سال پیش, داشتن حافظه ذخیره سازی بیشتر از ۵ مگابایت برای بسیاری از کاربران کامپیوتر آرزویی دست نیافتنی بود . با پیشرفت تصاعدی فناوری, ظرفیت ذخیره سازی کامپیوتر های خانگی به بازه ۵۰۰ گیگابایت تا ۱ ترابایت رسید. اما در دنیای آی تی اتفاقات بزرگتری در حال رخ دادن است, شبکه های ابری یا کلود با ظرفیت های چند هزار گیگابایتی و اگزابایتی در حال بلعیدن جریان عظیم داده ها هستند…
بشر در مجموع روزانه ۲٫۵ کوئینتیلیون (۲٫۵ و هجده صفر در مقابل آن) بایت داده تولید میکند, این حجم از داده میتواند ۱۰ میلیون دیسک پر ظرفیت بلوری را پرکند که روی هم قرارگرفتن این تعداد از دیسک های بلوری ما را به ارتفاعی ۴ برابر برج ایفل میرساند!, بله ما از تولید ۱۰۰ گیگابایت داده در روز در سال ۱۹۹۲ به تولید۳۰ هزار گیگابایت داده در هر ثانیه, در سال ۲۰۱۳ رسیده ایم .
جنگ خاموش داده ها
بخشی از این داده ها ذاتا برای ذخیره شدن هستن, داده هایی مثل تصاویر دریافتی از تلسکوپ فضایی هابل, نتایج آزمایش های کوبنده ذرات هادرون, و ویدیو های و تصاویری که در رسانه های اجتماعی به اشتراک میگذاریم, بخش دیگری از داده ها جمع آوری میشوند. بدون آنکه حتی از جمع آوری شدن آنها خبر داشته باشیم. این داده ها شامل موقعیت های جغرافیایی شما, علایق شما, سابقه خرید های شما, لیست فیلم هایی که در سایت های تخصصی فیلم جستجو کرده اید. به طور کلی سابقه جستجو های شما و حتی آمار تصاویر اینستاگرامی که شما بیشتر از بقیه روی آنها مکث کرده اید. این داده ها, توسط کمپانی ها, و بدون اینکه از آنها خواسته باشیم در دیتاسنتر های عظیم جمع آوری میشوند.
حاصل تحلیل این داده ها, گذشته از تحلیل هایی که امثال آژانس امنیت ملی آمریکا برای مسائل امنیتی انجام میشوند, مجموع سلایق و علاقه مندی های شماست که در قالب تبلیغات هدفمند در اختیار آژانس های تبلیغاتی قرار داده میشود.
به روند کلی مراحلی که ذکر کردیم بزرگ داده یا بیگ دیتا گفته میشود, این علم نوپا شامل تکنیک های جمع آوری, مرتب سازی, ذخیره سازی و نهایتا تحلیل پیچیده این داده ها میباشد, نگهداری چنین حجم عظیمی از داده ها در تجهیزات ذخیره سازی معمولی میسر نیست. (نمیتوان دستگاه ذخیره سازی یکپارچه ای نام برد که ظرفیت آن از سطح ترابایت بیشتر باشد). سامانه های ذخیره سازی ابری برای حل این مشکل, ظرفیت ذخیره سازی سرور های قدرتمند قرار گرفته در دیتاسنتر های عظیم را یکپارچه میکنند و با کمک گرفتن از الگوریتم های فاکتورگیری و توزیع, داده ها را در بهینه ترین شکل ممکن ذخیره و در دسترس قرار میدهند.
شبکه های ابری
شبکه ابری گوگل به تنهایی بیش از ۱۰ اگزابایت داده را ذخیره میکند (هر اگزابایت یک میلیون گیگابایت) آمازون به تنهایی یک میلیون و چهارصد هزار سرور در دیتاسنتر های مختلف در اختیار دارد که آمازون را رکورد دار تعداد سرور اختصاصی در جهان کرده است.
تعداد سرور مجازی در حال اجرا روی این سرورها فراتر از تصور است. پیش بینی میشود حجم کل داده های روی اینترنت تا سال ۲۰۲۰ به ۴۰ زتابایت (۴۰۰ میلیارد گیگابایت) خواهد رسید, این جهش عظیم در حجم و کاربرد داده ها, شرکت های بزرگ را بر آن داشته تا اصول مدیریتی خود را مبتنی بر فناوری ابری و بیگ دیتا اصلاح کنند.
تا کنون کتاب های زیادی در مورد کاربرد بیگ دیتا و تحلیل داده ها در مدیریت کسب و کار نوشته شده که محبوب ترین آنها در آگوست ۲۰۱۶ توسط پیتر پارک معرفی شد. حتی سایت های کوچک نیز در حال مهاجرت از سرویس های ساده میزبانی وب به هاست های ابری هستند.
همچنین بحث های حقوقی جدی در مورد مالکیت داده ها در حال شکل گرفتن است که گاه و بیگاه به تصویر قوانین و لایحه های جدید در مجامع بین المللی می انجامد. و متاسفانه روند شکل گیری قوانین و اخلاق آی تی همچنان فرسنگ ها از روند پیشرفت فناوری دیجیتال فاصله دارد. با وجود فواید بسیاری که فناوری بیگ دیتا برای بشر به ارمغان آورده است, (از پیش بینی آب و هوا, تا بهینه سازی ترافیک, تشخیص پزشکی و دستیار های هوشمند نصب شده روی تلفن همراه), به نظر میرسد باعث چالشی عظیم در مسائل اخلاقی و حقوقی حریم خصوصی انسان ها خواهد شد.