Skripsi
Imputasi Missing Values Berdasarkan Algoritma K-Nearest Neighbor pada Dataset Chronic Kidney Disease
bibliografi: hal. 52-53
RINGKASAN
Missing Values merupakan suatu permasalahan pada data yang diakibatkan adanya kekosongan data sehingga bisa menyebabkan adanya error. Missing values akan menyebakan data tidak bisa digunakan dengan maksimal, untuk mengangani permasalahan tersebut bisa dilakukan Imputasi missing values menggunakan algoritme K-Nearest Neighbor pada sebuah dataset Chronic Kidney Disease. Dataset Chronic Kidney Disease yang memiliki 400 data dengan 24 atribut dan satu class tujuan. Pada dataset Chronic Kidney Disease memiliki missing values sebanyak 1.012 nilai yang kosong. Dari hasil pengujian berdasarkan algoritme K-Nearest Neighbor diperoleh data testing dan data training pada pembagian data 10%, 20%, dan 30%. Selain hasil pengujian tersebut untuk mengetahui adannya tingkat error pada hasil dilakukan sebuah pengukuran nilai MAE dan MAPE. Dari beberapa pengujian memperoleh hasil yang terbaik yaitu dengan jumlah sample pengujian data testing 30% , dengan nilai yang diperoleh untuk MAE yaitu 0,014848 dan nilai MAPE 0,128986 .
Kata kunci: Chronic Kidney Disease, Missing Values, Imputation
ABSTRACT
Missing Values is a problem in data caused by a data vacuum so that it can cause errors. Missing values will cause data not to be used optimally. To handle these problems can be inputted missing values usingalgorithm K-Nearest Neighbor on adataset Chronic Kidney Disease. dataset Chronic Kidney Disease that has 400 data with 24 attributes and one destination class. Indataset Chronic Kidney Disease has missing values as many as 1,012 empty value. From the results of testing based on thealgorithm K-Nearest Neighbor , dataobtained testing anddata are training on data sharing 10%, 20%, and 30%. In addition to the results of these tests to determine the existence of an error rate on the results, a measurement of the MAE and MAPE values is performed. From several tests, the best results were obtained, with 30% testing sample testing data, with the value obtained for MAE that was 0.014848 and MAPE value 0.128986.
Keywords: Chronic Kidney Disease, Missing Values, Imputation
TI1890 | TI 1890 ALM i | UPT. PERPUSTAKAAN (Rak 1) | Tersedia - No Loan |
Tidak tersedia versi lain