Implementasi Data Mining Untuk Rekomendasi Pemilihan Sekolah
Data Mining
Data
Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan databerupa pengetahuan yang selama ini tidak diketahui
secara manual. Patut diingat bahwa kata mining sendiri berarti usaha untuk
mendapatkan sedikit barang berharga dari
sejumlah besar material dasar. Karena itu Data Mining sebenarnya memiliki akar
yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial
intelligent), machine learning, statistik dan database.
Data Mining
adalah proses menerapkan metode ini untuk data dengan maksud untuk mengungkap pola-pola
tersembunyi. Dengan arti lain Data mining adalah proses untuk penggalian
pola-pola dari data. Data mining menjadi alat yang semakin penting untuk
mengubah data tersebut menjadi informasi. Hal ini sering digunakan dalam
berbagai praktek profil, seperti pemasaran, pengawasan, penipuan deteksi dan penemuan ilmiah. Telah digunakan selama bertahun-tahun oleh bisnis, ilmuwan dan pemerintah untuk
menyaring volume data seperti catatan perjalanan penumpang penerbangan,
data sensus dan supermarketscanner data
untuk menghasilkan laporan riset pasar. Alasan utama untuk menggunakan data
mining adalah untuk membantu dalam analisis koleksi
pengamatan perilaku. Data tersebut rentan terhadap collinearity karena
diketahui keterkaitan. Fakta yang takterelakkan data mining adalah bahwa subset/set data
yang dianalisis mungkin tidak mewakili seluruh domain,
dan karenanya tidak boleh berisi contoh-contoh hubungan kritis tertentu dan
perilaku yang ada dibagian lain dari domain . Untuk mengatasi masalah semacam
ini, analisis dapat ditambah menggunakan berbasis percobaan dan pendekatan
lain, seperti Choice Modelling untuk data yang dihasilkan manusia.Dalam situasi
ini, yang melekat dapat berupa korelasi dikontrol untuk, atau dihapus sama
sekali, selama konstruksi desain eksperimental.
Beberapa teknik yang sering disebut-sebut
dalam literatur Data Mining dalam penerapannya antara lain: clustering,
classification, association rule mining, neural network, genetic algorithm dan
lain-lain. Yang membedakan persepsi terhadap Data Mining adalah perkembangan
teknik-teknik Data Mining untuk aplikasi
pada database skala besar. Sebelum
populernya Data Mining, teknik-teknik tersebut hanya dapat dipakaiuntuk data
skala kecil saja.
Proses Data Mining
Tahap-Tahap Data Mining. Karena Data
Mining adalah suatu rangkaian proses, Data Mining dapat dibagi menjadi beberapa
tahap:
1. Pembersihan data (untuk membuang data yang tidak konsisten
dan noise)
2. Integrasi data (penggabungan data dari beberapa sumber)
3. Transformasi data (data diubah menjadi bentuk yang sesuai untuk di-mining)
4. Aplikasi teknik Data Mining
5. Evaluasi pola yang ditemukan (untuk menemukan yang menarik/bernilai)
6. Presentasi pengetahuan (dengan teknik visualisasi)
Implementasi Data Mining Untuk Rekomendasi Pemilihan Sekolah
Jumlah penyelenggara pendidikan di Sragen telah
mengalami peningkatan dalam kurun beberapa tahun terakhir. Hal ini juga salah
satu akibat dari semakin banyaknya jumlah siswa di wilayah tersebut. Namun
peningkatan jumlah ini ternyata tidak diimbangi dengan pengelolaan data sekolah
yang baik misalnya menggunakan teknologi informasi. Tidak adanya pusat data yang
terintegrasi secara baik menyebabkan pihak sekolah kesulitan menyampaikan
informasi akademik dan masyarakat sulit mendapatkan informasi yang valid
sehingga banyak calon siswa yang ragu untuk menentukan sekolah menengah tingkat
atas yang akan dituju sesuai dengan kriterianya. Berdasarkan hal tersebut,
sebuah data warehouse diperlukan sebagai pengelola data sekolah-sekolah secara
terintegrasi dengan baik dan dikembangkan sistem rekomendasi dengan menerapkan
teknik data mining.
Dengan demikian, data sekolah dapat digali untuk
menghasilkan suatu informasi yang dapat dimanfaatkan sebagai rekomendasi bagi
calon siswa sekolah menengah atas untuk menentukan pilihan sekolah yang dituju.
Sebuah diagram snowflake dirancang sebagai langkah awal dalam pengembangan data
warehouse. Data yang dikirim ke data warehouse terlebih dahulu diproses melalui
tahap ekstraksi, transformasi dan load. Sementara itu, sistem rekomendasi
dibangun dengan menerapkan metode naïve bayes dengan cara menghitung
probabilitas masing-masing kriteria yang diajukan berdasarkan data pelatihan
dalam data
warehouse.
Adapun kriteria yang digunakan yaitu biaya sekolah,
jarak sekolah, nilai akreditasi, tingkat kelulusan, dan nilai rerata ujian
akhir nasional. Hasil penelitian menunjukkan bahwa sebuah data warehouse telah
berhasil dibangun sebagai pengelola data sekolah di Sragen yang terintegrasi
dan terhubung dengan sistem rekomendasi untuk membantu calon siswa memilih
sekolah yang sesuai kriteria-kriteria yang diajukan. Rekomendasi yang
dihasilkan oleh sistem berdasarkan nilai probabilitas tertinggi dari setiap
variabel masing-masing sekolah, tingkat prioritas variabel, serta urutan
rangking sekolah.
sumber :
https://id.wikipedia.org/wiki/Penggalian_data
https://id.scribd.com/document/21568781/Konsep-Data-Mining-dan-Implementasi
http://journals.ums.ac.id/index.php/khif/article/view/2333/1857
https://www.kompasiana.com/aziznugraha28/5c9041e40b531c487c225de2/implementasi-data-mining-untuk-rekomendasi-pemilihan-sekolah
https://www.kompasiana.com/aziznugraha28/5c9041e40b531c487c225de2/implementasi-data-mining-untuk-rekomendasi-pemilihan-sekolah
Komentar
Posting Komentar