Skripsi
Pengaruh Seleksi Fitur Terhadap Klasifikasi Algoritme C4.5 Pada Student Alcohol Consumption Dataset
RINGKASAN
Minuman beralkohol merupakan zat psikoaktif yang bersifat adiksi atau adiktif. Zat psikoaktif adalah golongan zat yang bekerja secara selektif, terutama pada otak, sehingga dapat menimbulkan perubahan pada perilaku, emosi, kognitif, persepsi dan kesadaran seseorang dan lain-lain. Hasil survey Dislitbang Polri tahun 2014 memperlihatkan bahwa pemakai narkotika dan minuman keras terbanyak dari golongan pelajar, baik SLTP, SLTA, maupun mahasiswa, yang jumlahnya mencapai 70%, sedangkan yang lulusan SD hanya 20%. Di era modern saat ini khususnya bidang teknologi informasi, kebutuhan akan informasi dan pengetahuan terbaru sangat berkembang pesat. Salah satuya adalah mengenai informasi pengguna alcohol di kalangan remaja yang lebih akurat. Data mining adalah proses untuk mengekstrasi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai data besar. Pada data mining terdapat suatu teknik klasifikasi yang menilai objek data untuk memasukannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia, dapat diterapkan dalam kasus – kasus di bidang kesehatan, sebagai contoh untuk kasus kecanduan alkohol pada remaja. Algoritma yang dapat digunakan dalam klasifikasi adalah decision tree C4.5. Penggunaan algoritma decision tree dalam menentukan tingkat penggunaan alcohol pada kalangan remaja menggunakan dua cara yaitu dengan seleksi atribut dan tanpa seleksi atribut. Hasil dari klasifikasi menggunakan algoritma decision tree dengan seleksi atribut memiliki tingkat akurasi yang lebih tinggi disbandingkan dengan decision tree tanpa seleksi atribut dengan nilai 89,2% dengan 85,5%.
Kata kunci : Alkohol, Remaja, Data mining, Klasifikasi, Decision tree
ABSTRACT
Alcoholic drinks are psychoactive substances that are addictive or addictive. Psychoactive substances are classes of substances that work selectively, especially in the brain, so it can cause changes in behavior, emotions, cognitive, perceptions and awareness of someone and others. Dislitbang Polri survey results in 2014 showed that users of narcotics and liquor mostly from the class of students, both junior high school, senior high school, and college students, which amounted to 70%, while only 20% of elementary school graduates. In today's modern era, especially in the field of information technology, the need for information and the latest knowledge is growing rapidly. One of them is about information about alcohol users in teens more accurate. Data mining is a process for extracting and identifying useful information and related knowledge from large data sets. In data mining there is a classification technique that assesses the data object to enter it into a certain class of available classes, can be applied in cases in the field of health, as an example for alcohol abuse cases in adolescents. The algorithm that can be used in classification is decision tree C4.5. The use of decision tree algorithm in determining the level of alcohol use among adolescents using two ways is by attribute selection and without attribute selection. The result of classification using decision tree algorithm with attribute selection has a higher level of accuracy compared to decision tree without attribute selection with 89.2% with 85.5%.
Keywords: Alcohol, Teenager, Data mining, Classification, Decision tree
TI1742 | TI 1742 HAN p | UPT. PERPUSTAKAAN PUSAT (Rak 1) | Tersedia - No Loan |
Tidak tersedia versi lain