ABSTRAK
Data yang besar pada data mining membutuhkan beban
komputasi yang tinggi. Salah satu cara untuk mengurangi hal tersebut
diperlukan suatu reduksi data sehingga jumlah data semakin kecil.
Permasalahan yang timbul dari reduksi data biasanya adalah apakah
jumlah data setelah mengalami proses reduksi dapat mewakili jumlah
data awal yang besar. Proyek akhir ini mengajukan suatu pendekatan
baru dalam mereduksi data dengan menggunakan algoritma genetika.
Jumlah data hasil reduksi direpresentasikan menjadi
kromosom. Untuk memilih agar data hasil reduksi mendekati data
sesungguhnya, digunakan fungsi fitness berupa jumlah jarak terbesar
dalam kromosom. Kombinasi dari masing-masing kromosom harus
dioptimasi terlebih dahulu dengan pendekatan pemodelan optimasi pada
Travelling Salesman Problem. Untuk mengukur tingkat presisi dari
reduksi data ini, dilakukan dengan mengakumulasi kedekatan masingmasing
centroid hasil cluster dari data reduksi terhadap centroid hasil
cluster dari data sesungguhnya. Hasil eksperimen menunujukkan tingkat
presisi dari pendekatan reduksi data yang diajukan pada proyek akhir ini
dengan menggunakan Algoritma Genetika. Kinerja dari pendekatan
reduksi data pada proyek akhir ini akan dibandingkan dengan reduksi
data dengan menggunakan algoritma Density-Based Multiscale Data
Condensation.
Kata Kunci : Reduksi data, algoritma genetika, data mining.

wpChatIcon
EnglishIndonesian