Statistika vs Data Mining vs Machine Learning vs Artificial Intelligence
Di dunia data, ada beberapa istilah yang mirip namun mereka sebenarnya berbeda. Jika kita ingin mengetahui perbedaaannya, maka kita dengarkan saja definisi menurut para ahli. Kali ini akan dibahas beberapa istilah seperti statistika, data mining, machine learning dan artificial intelligence.
DATA MINING
Cara pandang dan pengetahuan yang berbeda membuat para ahli memberikan definisi berbeda mengenai Data Mining. Sebagian ahli mengatakan bahwa
Data Mining adalah langkah analisis terhadap proses penemuan pengetahuan di dalam basis data (Fayyad et al. 1996).
Data Mining merupakan gabungan sejumlah disiplin ilmu komputer (ACM 2006), (Clifton 2010), yang didefinisikan sebagai proses penemuan pola baru dari kumpulan data yang sangat besar, meliputi metode-metode yang merupakan irisan dari artificial intelligence,machine learning, statistics, dan database systems.
Data Mining ditujukan untuk mengekstrak (mengambil intisari) pengetahuan dari sekumpulan data sehingga didapatkan struktur yang dapat dimengerti manusia serta meliputi basis data dan management data, prapemrosesan data, pertimbangan model dan inferensi, ukuran ketertarikan, pertimbangan kompleksitas, pascapemrosesan terhadap struktur yang ditemukan, visualisasi, dan online updating.
MACHINE LEARNING
Metode ini membuat mesin bisa belajar sendiri tanpa diajarkan secara langsung oleh manusia. Machine learning mempelajari teori agar komputer mampu “belajar” dari data. Machine learning melibatkan berbagai disiplin ilmu seperti statistika, ilmu komputer, matematika dan bahkan neurologi. Machine learning menggunakan teori-teori statistika untuk membangun model.
The Science and engineering of making intelligent machines. (John McCarthy) .
Sebuah cabang ilmu komputer yang berkaitan dengan bagaimana mensimulasikan kecerdasan pada komputer.
Kemampuan mesin untuk meniru kecerdasan manusia
Jadi, Inti dari machine learning adalah bagaimana membuat komputer dapat menyelesaikan berbagai persoalan dan dapat belajar sendiri seperti manusia belajar sesuatu.
STATISTICS
Karl Pearson menyatakan bahwa “Statistics is the Grammar of Science”. Seringkali istilah statistika dan statistik sering disamakan, padahal mereka berbeda. Statistika merujuk kepada cabang ilmu, sedangkan statistik lebih merujuk kepada suatu data atau informasi. Itulah mengapa BPS kepanjangan-nya adalah Badan Pusat Statistik bukan Badan Pusat Statistika. Karena BPS adalah salah satu badan yang menjadi pusat data atau informasi.
Menurut Prof. Dr. Sudjana, M.A., M.Sc., statistik adalah suatu pengetahuan yang berhubungan dengan cara pengumpulan data, pengolahan penganalisisannya, dan penarikan kesimpulan berdasar kumpulan data dan penganalisa yang dilakukannya.
Menurut Supranto, statistika adalah suatu cabang ilmu yang mempelajari tentang cara pengumpulan, penyajian, menganalisis data serta mengambil kesimpulan secara umum berdasarkan hasil penelitian menyeluruh yang telah dilakukan.
ARTIFICIAL INTELLIGENCE
AI (Artificial Intelligence) sangat erat kaitannya dengan Machine Learning. Jika digambarkan secara diagram, wilayah kajian AI akan jauh lebih besar dibandingkan machine learning. Bisa disimpulkan bahwa machine learning adalah bagian dari AI atau machine learning merupakan implementasi atau subset dari AI.
Semua hal yang berkaitan dengan machine learning praktis akan terkait juga dengan AI. Sedangkan symbolic logic, rules engines, expert systems, knowledge graphs, semuanya adalah bagian dari AI dan tidak ada sangkut pautnya sama sekali dengan machine learning.
REFFERENCE
- Primartha, Rifkie. 2018. Belajar Machine Learning Teori dan Praktek. Informatika : Bandung.
- Suyanto. 2018. Machine Learning Tingkat Lanjut. Informatika : Bandung.
- Suyanto. 2017. Data Mining. Informatika : Bandung.
- J. Supranto. 1994. Statistik : Teori dan Aplikasi Jilid 1 Edisi Kelima. Erlanga : Jakarta.
- Sudjana. 1996. Metode Statistika, Tarsito : Bandung.