Kiamat untuk Statistik ?


‘Statistika dalam bahaya’, adalah kalimat pembuka yang cukup mengagetkan, ini karena perkembangan keilmuan data saat ini didominasi bukan oleh orang orang statistika, tapi justru dari orang orang ilmu komputer. Tantangan data modern (dalam jumlah besar, bentuk kompleks, perlu analisa cepat) dijawab oleh pendekatan ‘engineer’ dan bukan pendekatan matematika / statistika. Kalimat tersebut adalah kalimat pembuka dari Prof. Maman Djauhari pada acara seminar Big Data yang diadakan oleh KK. Statistika, Prodi Matematika, ITB. Prof. Maman adalah dosen mata kuliah statistika sewaktu saya kuliah S1 dulu, sekarang beliau mengajar dan meneliti di Universitas Putra Malaysia. Karena memang saya awam keilmuan statistik, maka saya tertarik untuk datang dan melihat bagaimana pandangan orang statistik terhadap trend Big Data. Kalimat pembuka diatas cukup jadi konfirmasi atas dugaan saya.

Saya pernah menulis blog Statistika vs Data Mining beberapa waktu yang lalu. Tapi saya tidak berani publish terang terangan karena memang keterbatasan saya dalam penguasaan keilmuan statistika. Tapi dari ringkasan tersebut bisa disimpulkan kenapa pendekatan data analytics menggunakan data mining saat ini lebih ‘sophisticated’ ?, ini karena statistik selama ini sibuk fokus pada mencari hipotesis dan parameter, sedangkan data mining malah men’generate’ hipotesis dan parameter. Keilmuan statistik juga befokus pada menguji hipotesa dan model inferensial. Memang statistik dan data mining tidak bisa dibandingkan ‘apple to apple’ karena memang di matematika kita tidak mengenal alat ‘one tool fits all’ .. setiap alat dipakai sesuai dengan kasus / masalah yang dihadapi, demikian juga statistika dan data mining / data analytics digunakan pada jenis permasalahan yang berbeda.

Yang cukup menarik ternyata Prof. Maman juga menyajikan keilmuan complex network dan social network analysis, (dua ilmu yang sedang saya pelajari sekarang) sebagai dasar penelitian beliau di Malaysia, beliau fokus penggunaan dua metode tersebut di bidang finance. Beliau beralasan adalah trend teknologi data menuju model yang lebih fleksibel dan proses analisa yang cepat. Salah satu yang menarik saya adalah kasus ‘similarity among time series’ melihat beberapa data time series kemudian menyimpulkan bahwa data data tersebut dibuat oleh sumber yang sama. Ini menarik bagi saya, ternyata time series bukan melulu dipakai membuat model untuk forecasting.

Insight bagus dari Prof. Maman, jadi memang orang orang statistika seharusnya juga mulai ‘embrace’ keilmuan keilmuan lain dan mengembangkan teori/metode baru berdasarkan formulasi matematika untuk menjawab permasalahan Big Data. Statistika adalah ilmu yang usianya sudah ratusan tahun, bahkan pencarian partikel ‘tuhan’ Higgs Boson tahun 2013 yang lalu pada hakekatnya adalah ilmu statistika untuk mencari outliers dari tumpukan data berorde peta bytes, jadi saya ‘concern’ dengan perkembangannya keilmuan ini

mamanProf Maman, pada acara seminar Big Data di Matematika ITB

 


Leave a Reply

Your email address will not be published. Required fields are marked *