Big Data : State of The Art (versi saya)


Kita sering membaca artikel mengenai Big Data (terutama di Indonesia) baik teknis maupun non teknis. Untuk non teknis bisa kita ambil kesimpulan peluang Big Data untuk membantu manajemen perusahaan dalam mengambil keputusan, ini seperti peran business intelligence atau data warehouse di masa lalu. Sedangkan di bidang teknis, pembicaraan akan berkutat di sekitaran komputasi parallel (Hadoop) dan sistem penyimpanan Big Data seperti NoSQL, Graph Database dan lain lain.   

Kalau kita lihat alur diatas, ini seperti yang satu membicarakan bagian hulu dan yang satu membicarakan bagian hilir, sedangkan bagian tengahnya yaitu Big Data Analytics sangat jarang dibahas. Ini Big Data Analytics lho yah, yang artinya pencarian pattern / insight, bukan Big Data Analysis seperti banyak salah tulis di artikel artikel pada umumnya.

Contoh alat yang populer untuk melakukan Big Data Analytics adalah Mahout (untuk clustering / classification) berdasarkan Hadoop / Java dan MLPacks (untuk beberapa metoda machine learning) berdasarkan library C++. Alasan kenapa Big Data Analytics jarang diperbincangkan sebenarnya cukup dimengerti, karena kedua alat diatas algoritma algoritma yang tersedia ternyata masih belum lengkap, masih banyak algoritma yang tidak ada untuk mendukung aktvitas analytics pada umumnya (contoh paling umum adalah analytics data jejaring sosial (graph)). Untuk itu riset riset dari rekan rekan informatika dan teknik komputer banyak membantu menyelesaikan permasalahan Big Data dari sisi komputasi dan algoritma.

Karena Big Data adalah yang masih fresh dan sedang mencari bentuk maka wajar tiap orang keluar dengan versi Big Datanya masing masing , termasuk peta taxonomi (state of the art) berdasarkan kebutuhannya sendiri sendiri. Untuk itu saya juga ikutan menentukan taxonomi Big Data versi saya. Jikalau kemudian hari ternyata salah yah gak apa apa, kesalahan merupakan proses pembelajaran :D. Kalau ada perubahan akan saya update di entry blog yang baru.

Dari gambar dibawah, saya klasifikasikan taxonomi riset Big Data menjadi dua kelompok besar, yang pertama berhubungan dengan komputasi dan algoritma (biasanya rekan rekan dari informatika dan ilmu komputer) dan yang kedua yang berhubungan dengan pengembangan metodologi (biasanya rekan rekan dari bisnis/manajemen, statistik, matematika, dan lain lainnya)

 

Screen Shot 2015 08 20 at 10 35 28 PM

 

 

 

 

 

 


Leave a Reply

Your email address will not be published. Required fields are marked *