Implementasi Data Mining Untuk Rekomendasi Pemilihan Sekolah



Data Mining

Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan databerupa pengetahuan yang selama ini tidak diketahui secara manual. Patut diingat bahwa kata mining sendiri berarti usaha untuk  mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Karena itu Data Mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database.

Data Mining adalah proses menerapkan metode ini untuk data dengan maksud untuk mengungkap pola-pola tersembunyi. Dengan arti lain Data mining adalah proses untuk penggalian pola-pola dari data. Data mining menjadi alat yang semakin penting untuk mengubah data tersebut menjadi informasi. Hal ini sering digunakan dalam berbagai praktek profil, seperti pemasaran, pengawasan, penipuan deteksi dan penemuan ilmiah. Telah digunakan selama bertahun-tahun oleh bisnis, ilmuwan dan pemerintah untuk menyaring volume data seperti catatan perjalanan penumpang penerbangan, data sensus dan supermarketscanner  data untuk  menghasilkan laporan riset pasar. Alasan utama untuk menggunakan data mining adalah untuk membantu dalam analisis koleksi pengamatan perilaku. Data tersebut rentan terhadap collinearity karena diketahui keterkaitan. Fakta yang takterelakkan data mining adalah bahwa subset/set data yang dianalisis mungkin tidak mewakili seluruh domain, dan karenanya tidak boleh berisi contoh-contoh hubungan kritis tertentu dan perilaku yang ada dibagian lain dari domain . Untuk mengatasi masalah semacam ini, analisis dapat ditambah menggunakan berbasis percobaan dan pendekatan lain, seperti Choice Modelling untuk data yang dihasilkan manusia.Dalam situasi ini, yang melekat dapat berupa korelasi dikontrol untuk, atau dihapus sama sekali, selama konstruksi desain eksperimental.


Beberapa teknik yang sering disebut-sebut dalam literatur Data Mining dalam penerapannya antara lain: clustering, classification, association rule mining, neural network, genetic algorithm dan lain-lain. Yang membedakan persepsi terhadap Data Mining adalah perkembangan teknik-teknik Data Mining untuk aplikasi

pada database skala besar. Sebelum populernya Data Mining, teknik-teknik tersebut hanya dapat dipakaiuntuk data skala kecil saja.

Proses Data Mining

Tahap-Tahap Data Mining. Karena Data Mining adalah suatu rangkaian proses, Data Mining dapat dibagi menjadi beberapa tahap:

1. Pembersihan data (untuk membuang data yang tidak konsisten dan noise)

2. Integrasi data (penggabungan data dari beberapa sumber)

3. Transformasi data (data diubah menjadi bentuk yang sesuai untuk di-mining)

4. Aplikasi teknik Data Mining

5. Evaluasi pola yang ditemukan (untuk menemukan yang menarik/bernilai)

6. Presentasi pengetahuan (dengan teknik visualisasi)



                                                      







Implementasi Data Mining Untuk Rekomendasi Pemilihan Sekolah

Jumlah penyelenggara pendidikan di Sragen telah mengalami peningkatan dalam kurun beberapa tahun terakhir. Hal ini juga salah satu akibat dari semakin banyaknya jumlah siswa di wilayah tersebut. Namun peningkatan jumlah ini ternyata tidak diimbangi dengan pengelolaan data sekolah yang baik misalnya menggunakan teknologi informasi. Tidak adanya pusat data yang terintegrasi secara baik menyebabkan pihak sekolah kesulitan menyampaikan informasi akademik dan masyarakat sulit mendapatkan informasi yang valid sehingga banyak calon siswa yang ragu untuk menentukan sekolah menengah tingkat atas yang akan dituju sesuai dengan kriterianya. Berdasarkan hal tersebut, sebuah data warehouse diperlukan sebagai pengelola data sekolah-sekolah secara terintegrasi dengan baik dan dikembangkan sistem rekomendasi dengan menerapkan teknik data mining.

Dengan demikian, data sekolah dapat digali untuk menghasilkan suatu informasi yang dapat dimanfaatkan sebagai rekomendasi bagi calon siswa sekolah menengah atas untuk menentukan pilihan sekolah yang dituju. Sebuah diagram snowflake dirancang sebagai langkah awal dalam pengembangan data warehouse. Data yang dikirim ke data warehouse terlebih dahulu diproses melalui tahap ekstraksi, transformasi dan load. Sementara itu, sistem rekomendasi dibangun dengan menerapkan metode naïve bayes dengan cara menghitung probabilitas masing-masing kriteria yang diajukan berdasarkan data pelatihan dalam data
warehouse.

Adapun kriteria yang digunakan yaitu biaya sekolah, jarak sekolah, nilai akreditasi, tingkat kelulusan, dan nilai rerata ujian akhir nasional. Hasil penelitian menunjukkan bahwa sebuah data warehouse telah berhasil dibangun sebagai pengelola data sekolah di Sragen yang terintegrasi dan terhubung dengan sistem rekomendasi untuk membantu calon siswa memilih sekolah yang sesuai kriteria-kriteria yang diajukan. Rekomendasi yang dihasilkan oleh sistem berdasarkan nilai probabilitas tertinggi dari setiap variabel masing-masing sekolah, tingkat prioritas variabel, serta urutan rangking sekolah.



sumber :


https://id.wikipedia.org/wiki/Penggalian_data
https://id.scribd.com/document/21568781/Konsep-Data-Mining-dan-Implementasi
http://journals.ums.ac.id/index.php/khif/article/view/2333/1857
https://www.kompasiana.com/aziznugraha28/5c9041e40b531c487c225de2/implementasi-data-mining-untuk-rekomendasi-pemilihan-sekolah

Komentar

Postingan Populer