DATA MINING BASIC CONCEPT

 INTRODUCTION TO DATA MINING 


            Kita hidup di dunia dimana data terkumpul setiap harinya, bahkan setiap detik pun data itu bisa berubah. Contohnya, siapa yang tidak memiliki handphone atau smartphone pada zaman sekarang? Setiap detik pasti kita melakukan sesuatu hal dengan handphone kita, disitulah semua data terekam. dari semua data yang terkumpul, kita hanya mendapatkan data saja, dan belum mendapatkan suatu informasi kegiatan, apa saja yang kita lakukan dengan handphone kita hari ini ? Proses untuk menemukan suatu insight/knowledge dari sekumpulan data yang besar itulah yang disebut dengan data mining. Suatu insight dapat berupa suatu informasia atau dalam bentuk pola suatu data. banyak yang menyebutkan data mining merupakan knowledge discovery from data (KDD) Yaitu proses untuk mendapatkan sesuatu informasi dari suatu data. data source dapat berupa database, data warehouse, website, dan informasi lain yang terkumpul dalam satu sistem yang dinamik.


BUSINESS MINDSET CONCEPT

Terdapat beberapa proses untuk mendapatkan insight dijelaskan dalam gambar diatas :

1. DATA CLEANING 

adalah suatu proses menyiapkan data sebelum dilakukannya analisis lebih lanjut dengan cara menghapus atau memodifikasi data yang salah, tidak relevan, duplikat, tidak terformat, dan lainnya untuk memperoleh hasil analisis yang tepat

2. DATA INTEGRATION 

adalah suatu proses mengintegrasikan / menggabungkan data dari berbagai sumber masuk ke satu lokasi terpusat yang menampung banyak jenis data berbeda dan volume yang besar. 

3. DATA SELECTION

Adalah suatu proses meminimalkan jumlah data yang digunakan untuk proses mining dengan tepat merepresentasikan data aslinya dengan beberapa cara seperti :

- Pemiliihan variable/fitur

- Sampling

- Pemisahan  variable/fitur

4. DATA TRANSFORMATION 

Adalah proses transformasi/konversi/mengubah skala pengukuran data menjadi bentuk lain dengan tujuan memenuhi asumsi-asumsi yang mendasari metode analisis tertentu. Contohnya:

- transformasi akar kuadrat diperlukan apabila data tidak memenuhi asumsi kehomogenan varian/ragam, transformasi ini dilakukan agar dapat membuat varian/ragam menjadi homogen/sejenis.

5. DATA MINING 

Adalah suatu proses untuk menggali informasi penting dari suatu kumpulan data yang besar.

6. PATTERN EVALUATION 

Adalah pada tahap ini, kita menjelajahi pola-pola data untuk mengidentifikasi pola yang benar-benar menarik berdasarkan ukuran(measure) yang telah diberikan, pola-pola ini dengan jelas mempresentasikan pengetahuan dan informasi yang berguna.

7. KNOWLEGDE PRESENTATION

Adalah memvisualisasikan pengetahuan/informasi yang telah didapatkan untuk membantu orang lain yang bersangkutan untuk dapat mengintrepetasikan dan memahami hasil dari data mining.


DATA MINING FROM BUSINESS PERSPECTIVE 

Dalam dunia bisnis, insight bukan hanya sekedar kekuatan dari sebuah perusahaan, tapi insight merupakan sebuah “lifeblood”dalam menjalankan suatu bisnis. Insight datang dari sebuah informasi dan informasi berasal dari data. Insight tersebut dapat membantu para stakeholder untuk take decisions dalam setiap Langkah yang diambil. Insight dari sebuah data digunakan untuk memahami bagaimana operations berjalan, 
- bagaimana perilaku customer ketika meggunakan produk suatu bisnis, 
- bagaimana perusahaan dapat tetap bertahan dengan pesaing,
- Apakah stok supplier masih dapat memenuhi permintaan dalam beberapa bulan kedepan. 
- Bagaimana Langkah kita dalam menjaga patners tetap bekerja sama dengan kita, dan

Masih banyak lagi insight yang bisa kita dapatkan untuk menentukan pengambilan suatu keputusan yang dapat membantu perusahaan mengatur cost keluar, mengembangkan revenue(pendapatan), dan menaikkan penjualan. 

Forrester research dalalm buku business intelligence guidebook mengutip :

“Data is the raw material of everything firms do, but too many have treating it like waste material. Data is the new sun instead of the new oil, since it’s limitless and touches everything firms do. Data must flow dast and rich for your organization to serve customers better than your competitor can”


BUSINESS MINSET CONCEPT

 Tetapi data dapat menyebabkan masalah, Ketika sebuah perusahaan tidak dapat mengolah data dengan baik dan benar. Mereka hanya mengumpulkan data sehingga menyebabkan terlalu banyak informasi yang didapatkan tetapi tidak mendapatkan insight apapun seperti gambar diatas. Perbedaan data , informasi, dan insight dapat diillustrasikan sebagai berikut : 


1. DATA
Adalah sekumpulan bahan yang digunakan dalam memasak suatu sup, seperti wortel, kubis, dan ayam yang dapat dibeli dipasar kemudian bawang putih, merica, garam, dan lain lain yang dapat dibeli di toko bahan makanan. Dalam dunia data, hal ini disebut sebagai sumber data yang beragam system operasi.

2. INFORMASI
Adalah  Ketika semua bahan telah terkumpul, kemudian bahan-bahan tersebut diolah. Wortel dicuci, dikupas, dan dipotong. Ayam dicuci dan dipotong. Bawang putih dikupas, dicuci dan berbagai bahan lainnya telah diproses. Wortel, ayam, kobis, bawang putih yang telah diproses merupakan suatu informasi. Dalam dunia data, hal ini disebut sebagai proses ELT (extract, Transform, and Load) menjadi suatu informasi.

3. INSIGHT 
Adalah sup yang telah dimasak telah siap untuk dihidangkan. Sup yang telah jadi tersebut merupakan suatu insight yang menghasilkan beberapa action item, seperti :
- Mengambil sendok garpu
- Menyiapkan nasi
- Dan menghabiskan sup untuk dimakan.

Dalam dunia data dan bisnis, informasi dalam suatu report akan diambil suatu kesimpulan kemudian menghasilkan suatu keputusan.









Komentar