Skripsi
Komparasi Seleksi Fitur Untuk Diagnosa Penyakit Liver Dengan Klasifikasi Rule Based Algorithm
RINGKASAN
Hati adalah salah satu penyakit dalam yang dapat menyebabkan kematian. Penyakit hati tidak mudah ditemukan pada stadium awal. Untuk mengetahui seorang pasien terkena penyakit hati atau tidak, pasien harus melakukan berbagai tes, salah satunya adalah tes darah. Penerapan classification algorithm dapat menjadi salah satu teknik data mining untuk mendiagnosa penyakit liver. Penelitian ini menyajikan penerapan metode seleksi fitur dan rule based algorithm untuk mendeteksi penyakit liver. Penelitian ini menggunakan dataset yang diambil dari database UCI Machine Learning Repository yaitu ILPD (Indian Liver Patien Dataset). Metode yang digunakan dalam penelitian ini yaitu identifikasi masalah, pengumpulan data, tahap pre-processing, klasifikasi, pengujian signifikansi dan penarikan kesimpulan. Seleksi fitur yang digunakan yaitu Information Gain, Gain Ratio dan CFS. Selanjutnya diujikan ke rule based algorithm JRip, OneR dan PART. Hasil akurasi yang didapat dari JRip yaitu 84,4097% tanpa seleksi fitur; 84,3481% menggunakan Information Gain dan CFS; 81,5356% menggunakan Gain Ratio. Kemudian untuk OneR menghasilkan akurasi 66,7014% dari semua pengujian. Selanjutnya PART menghasilkan 87,3186% tanpa seleksi fitur; 82,0184% menggunakan Information Gain dan CFS; 75,6855% menggunakan Gain Ratio. Dapat disimpulkan bahwa dari semua seleksi fitur yang diajukan tidak ada yang dapat meningkatkan performa yang dihasilkan.
Kata kunci : liver, seleksi fitur, rule based algorithm
ABSTRACT
Liver is one of the deepest diseases that can cause death. Liver disease is not easy to find in the early stages. To find a patient affected by liver disease or not, the patient must perform various tests, one of which is a blood test. The application of classification algorithms can be one of the data mining techniques to diagnose liver disease. This research presents the application of feature selection method and rule algorithm to detect liver disease. This research uses dataset taken from UCI Machine Learning Repository database ILPD (Indian Liver Patien Dataset). The method used in this research is problem identification, data collection, pre-processing stage, classification, testing of significance and conclusion. Selection of features used are Information Gain, Gain Ratio and CFS. Next is tested to JRip, OneR and PART algorithm rules. The accuracy from Jrip is 84,409% without feature selection; 84,3481% used Information Gain and CFS; 81,5356% used Gain Ratio. Then The accuracy from OneR is 66,7014% of all testing. And the last test is PART, the accuracy is 87,3186% without feature selection; 87,3186% used Information Gain and CFS; 75,6855% used Gain Ratio. Of all the proposed feature submissions, nothing can improve the performance being hammered.
Keywords: liver, feature selection, rule algorithm
SI1171 | SI 1171 HAR k | UPT. PERPUSTAKAAN PUSAT (Rak 2) | Tersedia - No Loan |
Tidak tersedia versi lain