DATA MINING BASIC CONCEPT
INTRODUCTION TO DATA MINING
Kita hidup di dunia dimana data terkumpul setiap harinya, bahkan setiap detik pun data itu bisa berubah. Contohnya, siapa yang tidak memiliki handphone atau smartphone pada zaman sekarang? Setiap detik pasti kita melakukan sesuatu hal dengan handphone kita, disitulah semua data terekam. dari semua data yang terkumpul, kita hanya mendapatkan data saja, dan belum mendapatkan suatu informasi kegiatan, apa saja yang kita lakukan dengan handphone kita hari ini ? Proses untuk menemukan suatu insight/knowledge dari sekumpulan data yang besar itulah yang disebut dengan data mining. Suatu insight dapat berupa suatu informasia atau dalam bentuk pola suatu data. banyak yang menyebutkan data mining merupakan knowledge discovery from data (KDD) Yaitu proses untuk mendapatkan sesuatu informasi dari suatu data. data source dapat berupa database, data warehouse, website, dan informasi lain yang terkumpul dalam satu sistem yang dinamik.
BUSINESS MINDSET CONCEPT
Terdapat beberapa proses untuk mendapatkan insight dijelaskan dalam gambar diatas :
1. DATA CLEANING
adalah suatu proses menyiapkan data sebelum dilakukannya analisis lebih lanjut dengan cara menghapus atau memodifikasi data yang salah, tidak relevan, duplikat, tidak terformat, dan lainnya untuk memperoleh hasil analisis yang tepat
2. DATA INTEGRATION
adalah suatu proses mengintegrasikan / menggabungkan data dari berbagai sumber masuk ke satu lokasi terpusat yang menampung banyak jenis data berbeda dan volume yang besar.
3. DATA SELECTION
Adalah suatu proses meminimalkan jumlah data yang digunakan untuk proses mining dengan tepat merepresentasikan data aslinya dengan beberapa cara seperti :
- Pemiliihan variable/fitur
- Sampling
- Pemisahan variable/fitur
4. DATA TRANSFORMATION
Adalah proses transformasi/konversi/mengubah skala pengukuran data menjadi bentuk lain dengan tujuan memenuhi asumsi-asumsi yang mendasari metode analisis tertentu. Contohnya:
- transformasi akar kuadrat diperlukan apabila data tidak memenuhi asumsi kehomogenan varian/ragam, transformasi ini dilakukan agar dapat membuat varian/ragam menjadi homogen/sejenis.
5. DATA MINING
Adalah suatu proses untuk menggali informasi penting dari suatu kumpulan data yang besar.
6. PATTERN EVALUATION
Adalah pada tahap ini, kita menjelajahi pola-pola data untuk mengidentifikasi pola yang benar-benar menarik berdasarkan ukuran(measure) yang telah diberikan, pola-pola ini dengan jelas mempresentasikan pengetahuan dan informasi yang berguna.
7. KNOWLEGDE PRESENTATION
Adalah memvisualisasikan pengetahuan/informasi yang telah didapatkan untuk membantu orang lain yang bersangkutan untuk dapat mengintrepetasikan dan memahami hasil dari data mining.
Komentar
Posting Komentar