Pengenalan Kuliah Data Mining - Data Mining merupakan teknologi baru yang sangat berguna untuk membantu
perusahaan-perusahaan menemukan informasi yang sangat penting dari
gudang data mereka. Kakas data mining meramalkan tren dan sifat-sifat
perilaku bisnis yang sangat berguna untuk mendukung pengambila keputusan
penting. Analisis yang diotomatisasi yang dilakukan oleh data mining
melebihi yang dilakukan oleh sistem pendukung keputusan tradisional yang
sudah banyak digunakan. Data Mining dapat menjawab
pertanyaan-pertanyaan bisnis yang dengan cara tradisional memerlukan
banyak waktu untuk menjawabnya. Data Mining mengeksplorasi basis data
untuk menemukan pola-pola yang tersembunyi, mencari informasi pemrediksi
yang mungkin saja terlupakan oleh para pelaku bisnis karena terletak di
luar ekspektasi mereka.
Pengertian Data Mining
Dibawah ini terdapat beberapa definisi dari beberapa sumber yakni dari website , yaitu sebagai berikut :
Data
mining didefinisikan sebagai satu set teknik yang digunakan secara
otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan
relasi-relasi yang kompleks pada set data yang sangat besar. Set data
yang dimaksud di sini adalah set data yang berbentuk tabulasi, seperti
yang banyak diimplementasikan dalam teknologi manajemen basis data
relasional. Akan tetapi, teknik-teknik data mining dapat juga
diaplikasikan pada representasi data yang lain, seperti domain data
spatial, berbasis text, dan multimedia (citra). Data mining dapat juga
didefinisikan sebagai “pemodelan dan penemuan polapola yang tersembunyi
dengan memanfaatkan data dalam volume yang besar”.
Data mining
berdasarkan [JK06] adalah proses mengekstraksi pola-pola yang menarik
(tidak remeh-temeh, implisit, belum diketahui sebelumnya, dan berpotensi
untuk bermanfaat) dari data yang berukuran besar. Ada beberapa istilah
yang mempunyai kemiripan dengan data mining, yaitu ekstraksi
pengetahuan, analisis pola, pengerukan data, dan lain-lain. Ada yang
berpendapat data mining merupakan sinonim dari istilah knowledge
discovery in database (KDD).
Data Mining adalah suatu kelas
aplikasi database yang berfungsi melakukan pencarian pola-pola
tersembunyi di dalam suatu kumpulan data yang bisa digunakan untuk
memprediksikan tren atau perilaku yang akan datang.
Data mining
adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara
manual.
Data mining, the extraction of hidden predictive
information from large databases, is a powerful new technology with
great potential to help companies focus on the most important
information in their data warehouses. Data mining tools predict future
trends and behaviors, allowing businesses to make proactive,
knowledge-driven decisions.
Dari lima definisi diatas, dapat kita
simpulkan bahwa data mining adalah menggali / mencari data/informasi
yang tersembunyi dalam sebuah database atau kumpulan data dan
dikumpulkan menjadi knowledge (pengetahuan) yang dapat meramalkan tren
di masa mendatang dan menjadikan pengguna yang mengetahui tentang data
mining menjadi proaktif.
Sejarah dan Perkembangan Data Mining
Tahun 1990-an telah melahirkan “gunungan” data di bidang ilmu pengetahuan, bisnis dan pemerintah. Kemampuan teknologi informasi untuk mengumpulkan dan menyimpan berbagai tipe data jauh meninggalkan kemampuan untuk menganalisis, meringkas dan mengekstraksi “pengetahuan” dari data (Achmad Zulfikar,2009).
Metodologi tradisional untuk menganalisis data yang ada, tidak dapat menangani data dalam jumlah besar. Sementara para pelaku bisnis memiliki kebutuhan-kebutuhan untuk memanfaatkan gudang data yang sudah dimiliki, para peneliti melihat peluang untuk melahirkan sebuah teknologi baru yang menjawab kebutuhan ini, yaitu Data mining. Teknologi ini sekarang sudah ada dan diaplikasikan oleh perusahaan-perusahaan untuk memecahkan berbagai permasalahan bisnis (Achmad Zulfikar,2009).
Alasan utama mengapa data mining diperlukan adalah karena adanya sejumlah besar data yang dapat digunakan untuk mengahasilkan informasi dan knowledge yang berguna. Informasi dan knowledge yang didapat tersebut dapat digunakan pada banyak bidang, mulai dari manjemen bisnis, kontrol produksi, kesehatan, dan lain-lain (Han & Kamber, 2001).
Perkembangan data mining (DM) yang pesat tidak
dapat lepas dari perkembangan teknologi informasi yang memungkinkan data
dalam jumlah besar terakumulasi. Sebagai contoh, toko swalayan merekam
setiap penjualan barang dengan memakai alat POS (point of sales).
Database data penjualan tsb. bisa mencapai beberapa GB setiap harinya
untuk sebuah jaringan toko swalayan berskala nasional. Perkembangan
internet juga punya andil cukup besar dalam akumulasi data. Tetapi
pertumbuhan yang pesat dari akumulasi data itu telah menciptakan kondisi
yang sering disebut sebagai rich of data but poor of information ,
karena data yang terkumpul itu tidak dapat digunakan untuk aplikasi yang
berguna. Tidak jarang kumpulan data itu dibiarkan begitu saja
seakan-akan kuburan data (data tombs). Investasi yang besar di bidang IT
untuk mengumpulkan data berskala besar ini perlu dijustifikasi dengan
didapatnya nilai tambah dari kumpulan data ini.
Model Data Mining
Dalam perkembangan teknologi data mining, terdapat model atau mode yang digunakan untuk melakukan proses penggalian informasi terhadap data-data yang ada. Menurut IBM model data mining dapat dibagi menjadi 2 bagian yaitu: verification model dan discovery model.
VERIFICATION MODEL
Model ini menggunakan perkiraan (hypothesis) dari pengguna, dan melakukan
test terhadap perkiraan yang diambil sebelumnya dengan menggunakan data-data yang ada. Penekanan terhadap model ini adalah terletak pada user yang bertanggung jawab terhadap penyusunan perkiraan (hypothesis) dan permasalahan pada data untuk meniadakan atau menegaskan hasil perkiraan (hypothesis) yang diambil. Sebagai contoh misalnya dalam bidang pemasaran, sebelum sebuah perusahaan mengeluarkan suatu produk baru kepasaran, perusahaan tersebut harus memiliki informasi tentang kecenderungan pelanggan untuk membeli produk yang akan di keluarkan. Perkiraan (hypothesis) dapat disusun untuk mengidentifikasikan pelanggan yang potensial dan karakteristik dari pelanggan yang ada. Data-data tentang pembelian pelanggah sebelumnya dan data tentang keadaan pelanggan, dapat digunakan untuk melakukan perbandingan antara pembelian dan karakteristik pelanggan untuk menetapkan dan menguji target yang telah diperkirakan sebelumnya. Dari keseluruhan operasi yang ada selanjutnya dapat dilakukan penyaringan dengan cermat sehingga jumlah perkiraan (hypothesys) yang sebelumnya banyak akan menjadi semakin berkurang sesuai dengan keadaan yang sebenarnya.Permasalahan utama dengan model ini adalah tidak ada informasi bare yang dapat dibuat, melainkan hanya pembuktian atau melemahkan perkiraan (hypothesys) dengan data-data yang ada sebelumnya. Datadata yang ada pada model ini hanya digunakan untuk membuktikan mendukung perkiraan (hypothesis) yang telah diambil sebelumnya. Jadi model ini sepenuhnya tergantung pada kemampuan user untuk melakukan analisa terhadap permasalahan yang ingin digali dan diperoleh informasinya.
DISCOVERY MODEL
Model ini berbeda dengan verification model, dimana pada model ini system secara langsung menemukan informasi-informasi penting yang tersembunyi dalam suatu data yang besar. Data-data yang ada kemudian dipilah-pilah-untuk-menemukan suatu pola
contoh, misalkan sebuah bank ingin menemuan kelompok-kelompok pelanggan yang
dapat dijadikan target suatu produk yang akan di keluaran. Pada data-data yang ada selanjutnya diadakan proses pencarian tanpa adanya proses perkiraan (hypothesis) sebelumnya. Sampai akhirnya semua pelanggan dikelompokan berdasarkan karakteristik yang sama.
Penerapan atau Implementasi Data Mining Dalam Bidang Kehidupan
Penerapan Data Mining di Bidang Perbankan
Bank memiliki masalah memprediksi kelayakan kredit dari klien baru berdasarkan data historis dari klien masa lalu. Kredit ini juga mempengaruhi tingkat bunga kredit. Sekuel ini menjelaskan bagaimana Data Mining dapat diterapkan untuk masalah ini:
Sebuah bank memiliki data tentang klien kepada siapa itu memberi kredit di masa lalu. Data klien berisi data pribadi, data yang menjelaskan status keuangan dan perilaku keuangan sebelum dan pada saat itu klien diberi kredit. Klien dibagi menjadi empat kelas. Kelas pertama berisi semua klien-klien yang dibayar kembali kredit tanpa masalah. Kelas kedua mereka yang dibayar kembali dengan masalah kecil di sana-sini. Kelas ketiga berisi mereka yang hanya harus mendapatkan kredit setelah pemeriksaan rinci karena masalah besar payback terjadi di masa lalu, dan kelas keempat terdiri dari mereka yang tidak membayar sama sekali. Menggunakan tabel data, model prediksi dibuat untuk memprediksi probabilitas untuk setiap kelas untuk klien baru. Untuk kombinasi atribut yang bertanggung jawab untuk klien yang memiliki probabilitas tinggi tidak membayar kembali akan diidentifikasi oleh model prediksi juga.
Contoh ini menunjukkan bagaimana Data Mining dapat membantu bank untuk lebih baik memprediksi pemberian kredit pada pelanggan. Hal ini juga membantu untuk mengurangi jumlah kredit macet di satu sisi. Di sisi lain juga memungkinkan untuk menawarkan kondisi yang lebih baik kepada pelanggan lain dengan risiko lebih rendah .
Penerapan Data Mining di bidang Olah Raga
IBM Advanced Scout menggunakan data mining untuk menganalisis statistik permainan NBA (jumlah shots blocked, assists dan fouls) dalam rangka mencapai keunggulan bersaing (competitive advantage) untuk tim New York Knicks dan Miami Heat.
Penerapan Data Mining di bidang Telekomunikasi
Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara manual (dilayani oleh orang). Tujuannya tidak lain adalah untuk menambah layanan otomatis khusus untuk transaksi-transaksi yang masih dilayani secara manual. Dengan demikian jumlah operator penerima transaksi manual tetap bisa ditekan minimal.
Penerapan Data Mining di bidang Asuransi
Australian Health Insurance Commision menggunakan data mining untuk mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi. Hasilnya mereka berhasil menghemat satu juta dollar per tahunnya. Tentu saja ini tidak hanya bisa diterapkan untuk asuransi kesehatan, tetapi juga untuk berbagai jenis asuransi lainnya.
Penerapan Data Mining di Bidang Perusahaan
- Perencanaan Keuangan dan Evaluasi Aset
Data Mining dapat membantu Anda untuk melakukan analisis dan prediksi cash flow serta melakukan contingent claim analysis untuk mengevaluasi aset. Selain itu Anda juga dapat menggunakannya untuk analisis trend.
- Perencanaan Sumber Daya (Resource Planning)
Dengan melihat informasi ringkas (summary) serta pola pembelanjaan dan pemasukan dari masing-masing resource, Anda dapat memanfaatkannya untuk melakukan resource planning.
o Sekarang ini banyak perusahaan yang berupaya untuk dapat melakukan competitive intelligence. Data Mining dapat membantu Anda untuk memonitor pesaing-pesaing Anda dan melihat market direction mereka.
o Anda juga dapat melakukan pengelompokan customer Anda dan memberikan variasi harga/layanan/bonus untuk masing-masing grup.
o Menyusun strategi penetapan harga di pasar yang sangat kompetitif. Hal ini diterapkan oleh perusahaan minyak REPSOL di Spanyol dalam menetapkan harga jual gas di pasaran.