Skripsi
Pengaruh Seleksi Fitur dan Pengacakan Data Terhadap Performa Algoritme K-Nearest Neighbor dan C4.5 pada Dataset Website Phising
bibliografi: hal. 88-89
RINGKASAN
Pada bidang keamanan komputer, phishing adalah aktifitas krimnal yang berusaha untuk mendapatkan informasi sensitif secara tidak sah. Informasi tersebut bisa berupa username, password, dan detail kartu kredit. Website palsu atau bisa dikenal dengan phishing website adalah salah satu kejahatan didunia maya yang popularitasnya kian meningkat seiring dengan penambahan pengguna internet. Pada penelitian ini dilakukan perbandingan algoritma K-Nearest Neighbor dan C4.5 pada pengguna website phishing. Tujuan penelitian ini adalah untuk mengetahui pengaruh seleksi fitur dan pengacakan data terhadap performa algoritme K-Nearest Neighbor dan C4.5. Tahapannya dimulai dari pengumpulan data, seleksi fitur, pengacakan data, dan klasifikasi data menggunakan aplikasi weka. Dari hasil pengujian yang dilakukan bahwa algoritme K-Nearest Neighbor memiliki tingkat akurasi tertinggi sebelum dilakukan seleksi fitur dan pengacakan data yaitu 97,17% dengan waktu runing 0,12 seconds, sedangkan algoritme C4.5 memiliki tingkat tertinggi sesudah dilakukan pengacakan data yaitu 95,91%.
Kata Kunci : Website Phishing, Data Mining, Seleksi Fitur, Klasifikasi, Algoritma K-Nearest Neighbor, Algoritma C4.5
ABSTRACT
In the field of computer security, phishing is a criminal activity that attempts to obtain sensitive information illegally. This information can be in the form of a username, password, and credit card details. Fake websites or known as phishing websites are among the cyber crimes whose popularity is increasing along with the addition of internet users. In this study, K-Nearest Neighbor and C4.5 algorithms were compared to phishing website users. The purpose of this study was to determine the effect of feature selection and data randomization on the performance of K-Nearest Neighbor and C4.5 algorithms. The steps start from data collection, feature selection, data randomization, and data classification using the Weka application. From the results of tests conducted that the K-Nearest Neighbor algorithm has the highest level of accuracy before feature selection and data randomization is 97.17% with runing time of 0.12 seconds, while the C4.5 algorithm has the highest level after data randomization is 95, 91%.
Keywords: Website Phishing, Data Mining, Feature Selection, data randomization, Classification, K-Nearest Neighbor Algorithm, C4.5 Algorithm
TI1895 | TI 1895 MAR p | UPT. PERPUSTAKAAN PUSAT (Rak 1) | Tersedia - No Loan |
Tidak tersedia versi lain