Skripsi
ANALISIS PERFORMA ALGORITME C4.5 PADA DATASET PENERIMAAN BEASISWA SI STMIK AMIKOM PURWOKERTO
RINGKASAN
STMIK Amikom Purwokerto merupakan kampus yang mulai mengadakan penerimaan beasiswa sejak tahun 2013. Salah satu beasiswa yang diadakan di STMIK Amikom Purwokerto yaitu beasiswa PPA. Beasiswa PPA (Peningkatan Prestasi Akademik) adalah bantuan yang diberikan pemerintah pada mahasiswa yang berprestasi. Pelaksanaan dari penerimaan beasiswa dilakukan dengan mengumpulkan berkas pendaftaran pada bagian kemahasiswaan STMIK Amikom Purwokerto. Selanjutnya data tersebut diseleksi menggunakan bantuan Microsoft Excel, tetapi setelah proses penyeleksian data harus dipilih kembali secara manual dengan hati-hati dikarenakan kriteria penerimaan beasiswa yang banyak dan waktu yang diberikan pemerintah hanya 1 minggu, sedangkan berkas yang dikumpulkan setiap mahasiswa tidak sedikit. Dikarenakan penyeleksian harus dilakukan kembali secara manual, maka penulis mencoba untuk menganalisis data penerimaan beasiswa dengan teknik data mining algoritme C4.5 menggunakan software weka untuk menghasilkan atribut yang paling berpengaruh dan menjadi suatu informasi yang bermanfaat untuk proses penyeleksian penerimaan beasiswa selanjutnya. Tujuan dari penelitian ini yaitu untuk mengetahui performa dari algoritme C4.5 serta mengetahui atribut yang paling berpengaruh sehingga dapat menjadi pertimbangan untuk proses penyeleksian penerimaan beasiswa selanjutnya. Metode yang digunakan dalam penelitian ini adalah metode data mining algoritme C4.5. Hasil yang diperoleh dari penelitian dengan menggunakan algoritme C4.5 didapatkan akurasi dengan imputasi missing values sebesar 63,44% dan tanpa imputasi missing values sebesar 68,45% serta akurasi dengan menghilangkan atribut yang tidak berpengaruh sebesar 67,38%. Dilihat dari ketiga hasil tersebut algoritme C4.5 memiliki akurasi yang cukup baik. Atribut yang paling berpengaruh yaitu prestasi, semester, usia, keaktifan, mendapat beasiswa dan IPK.
Kata kunci: Data Mining, Beasiswa, Algoritme C4.5, Decision Tree
ABSTRACT
STMIK Amikom Purwokerto is a college that began holding scholarships since 2013. One of the scholarships held at STMIK Amikom Purwokerto is the PPA scholarship. PPA Scholarship (Improved Academic Achievement) is a grant given by the government to outstanding students. The implementation of the scholarship is done by collecting the registration documents at the STMIK Amikom Purwokerto student affairs section. Furthermore, the data was selected using the help of Microsoft Excel, but after the selection process the data must be carefully chosen again manually because the scholarship acceptance criteria are many and the time given by the government is only 1 week, while the files collected by each student are not small. Because the selection must be done again manually, the authors try to analyze the scholarship receipt data with data mining techniques C4.5 using Weka software to produce the most influential attributes and provide useful information for the next scholarship acceptance selection process. The purpose of this study is to determine the performance of the C4.5 algorithm and find out the most influential attributes so that it can be considered for the next scholarship selection process. The method used in this research is C4.5 data mining algorithm method. The results obtained from the study using the C4.5 algorithm obtained accuracy with the imputation of missing values of 63.44% and without the imputation of missing values of 68.45% and accuracy by removing attributes that had no effect of 67.38%. Judging from the three results, the C4.5 algorithm has a pretty good accuracy. The most influential attributes are achievement, semester, age, activeness, getting scholarship and GPA.
Keywords: Data Mining, Scholarship, C4.5 Algorithm, Decision Tree
SI1607 | SI 1607 ASH A | UPT. PERPUSTAKAAN | Tersedia - No Loan |
Tidak tersedia versi lain