Andry Alamsyah Blog

Statistik vs Data Mining

Selama bertahun tahun statistik merupakan alat bantu yang ‘handal’ bagi para ilmuwan. Statistik sudah ada sejak abad 19 dan berdasarkan formulasi dasar matematika untuk menguji generalisasi dari hipotesa ‘sedikit’ data sample terhadap populasi yang diteliti. Selama bertahun tahun pula statistik berhadapan dengan isu mengenai terlalu sedikitnya data yang tersedia, sehingga kita harus mampu mengambil kesimpulan global dari sedikit data tersebut dengan tingkat kepercayaan yang tinggi, isu ini juga diakibatkan karena jaman dahulu mencari data ukuran besar itu mahal. Statistik mempunyai ciri khas mengkonfirmasi dugaan, data numerik, dan hanya menyelesaikan masalah terstruktur. Demikian juga dibidang bisnis dan ilmu sosial, pada umumnya masalah disederhanakan sedemikian rupa sehingga bisa diukur secara statistik.

Data Mining merupakan alat untuk menemukan pengetahuan di dalam data berdasarkan pola yang ada di dalam data tersebut. Data Mining muncul baru akhir akhir ini, seiring dengan tersedianya data berukuran besar di internet dan sosial media. Data Mining dalam skala besar disebut juga sebagai Big Data, karena fungsinya sama yaitu memperoleh pengetahuan dari data, kemudian dibuat modelnya untuk memprediksi, mengoptimasi dan membantu pengambilan keputusan bisnis. Data Mining menyediakan banyak algoritma untuk menangani data komples dalam menyelesaikan persoalan kompleks (contohnya jumlah variabel data yang banyak).

Jelas, Data Mining mempunyai sedikit keunggulan karena mampu melakukan ‘prediksi’ dibandingkan dengan statistik yang hanya melakukan ‘konfirmasi’ hipotesa. Sayangnya di Indonesia, Data Mining merupakan ‘domain’ dari orang orang IT. Rekan rekan dari ilmu sosial/bisnis jarang sekali menggunakan alat ini, padahal data data dari sosial media sungguh berlimpah dan sangat banyak pertanyaan pertanyaan dalam bisnis yang bisa dibantu dengan alat ini.

Ringkasan lengkap Statistik vs Data Mining saya lampirkan dalam slide di http://www.slideshare.net/andrybrewok/data-mining-vs-statistics

One thought on “Statistik vs Data Mining

  1. Pingback: Kiamat untuk Statistik ? - Andry Alamsyah Blog

Leave a Reply

%d bloggers like this: