Tag: data mining

  • Pengelompokan Top 1000 Universitas Dunia #Clustering #DataMining

    Sabtu pagi ini iseng iseng browsing dataset dan menemukan dataset yang cukup menarik, yaitu World University Ranking dari Kaggle. Dataset ini menggambarkan peringkat 1000 universitas di dunia berdasarkan yang dibuat oleh Times Higher Education University Ranking. Dari 1000 daftar universitas dunia, 229 diantaranya berada di USA, dan sisanya di negara negara lain di dunia, sayangnya Universitas…

  • Fungsi, Aplikasi, dan Algoritma pada Data Analytics

    Data Analytics yaitu proses menemukan pola data untuk kemudian dipergunakan menjadi informasi atau model yang berguna. Proses memerlukan suatu keilmuan data yang disebut sebagai Data Science. Di dalam data science ini terdapat banyak metode yang dipergunakan seperti metode Data Mining, Statistik, Ekonometrik, Matematika, Modelling dan lain lain. Karena itu istilah Data Analiycs, Data Science, Data…

  • Pengelompokkan Kemajuan Kota Dengan Clustering Data

    Karena kesibukan yang ga ada abisnya akhir akhir ini, maka sudah lama saya tidak sempat mencari dan melihat perkembangan dataset yang tersedia bebas di Internet. Berawal dari keluhan beberapa mahasiswa bimbingan dan penghuni labo tentang kesulitan mencari data, maka saya kemarin mencoba browsing browsing, dan akhirnya saya menemukan gudang dataset Indonesia yang lumayan ok di…

  • Data Analytics Menggunakan Orange

    Orange adalah software open source untuk pengolahan Data Analytics / Data Mining. Dibandingkan dengan software Data Mining lainnya, Orange unggul dalam hal visualisasi atau yang biasa kita sebut visual programming. Orange menyediakan banyak widget yang kita letakkan pada canvas / drawing board kemudian kita hubungkan dengan widget widget lainnya. Dengan media canvas ini maka akan…

  • Crawling – Mining Twitter Data menggunakan R

    Dalam aktivitas content mining, data mining, social network analysis dan sebagai bagian dari pekerjaan data science, maka melakukan mining terhadap media sosial merupakan hal yang ‘wajib’. Dalam entri blog kali ini saya akan menuliskan mengenai crawling percakapan dan konten dari media sosial Twitter menggunakan bahasa R. Penjelasan mengenai R ada di halaman wikipedia ini. R dibangun…

  • Kiamat untuk Statistik ?

    ‘Statistika dalam bahaya’, adalah kalimat pembuka yang cukup mengagetkan, ini karena perkembangan keilmuan data saat ini didominasi bukan oleh orang orang statistika, tapi justru dari orang orang ilmu komputer. Tantangan data modern (dalam jumlah besar, bentuk kompleks, perlu analisa cepat) dijawab oleh pendekatan ‘engineer’ dan bukan pendekatan matematika / statistika. Kalimat tersebut adalah kalimat pembuka dari…

  • Statistik vs Data Mining

    Selama bertahun tahun statistik merupakan alat bantu yang ‘handal’ bagi para ilmuwan. Statistik sudah ada sejak abad 19 dan berdasarkan formulasi dasar matematika untuk menguji generalisasi dari hipotesa ‘sedikit’ data sample terhadap populasi yang diteliti. Selama bertahun tahun pula statistik berhadapan dengan isu mengenai terlalu sedikitnya data yang tersedia, sehingga kita harus mampu mengambil kesimpulan…