Skripsi
PENERAPAN TEKNIK OVERSAMPLING PADA ANALISIS SENTIMEN ISU HAK CIPTA DI INDONESIA MENGGUNAKAN ALGORITMA RANDOM FOREST
Penelitian berjudul Penerapan Teknik Analisis Sentimen Isu Hak Cipta di Indonesia Menggunakan Algoritma random forest bertujuan untuk menganalisis dan mengklasifikasikan sentimen masyarakat Indonesia terkait isu hak cipta dengan membatasi variabel pada sentimen positif, negatif, dan netral. Data diperoleh dari 8.727 komentar di berbagai video Youtube melalui teknik Scraping. Proses pelabelan otomatis dilakukan terlebih dahulu menggunakan model DistilBERT multilingual yang menghasilkan distribusi sentimen negatif sebesar 55,77%, positif 42,57%, dan netral 1,66%. Setelah itu, data teks diproses melalui tahapan case folding, data cleaning, tokenisasi, stopword removal, dan stemming menggunakan Sastrawi stemmer. Untuk mengatasi masalah ketidakseimbangan data, digunakan teknik Synthetic Minority Oversampling Technique (SMOTE) sehingga performa model random forest tetap solid, dengan hasil prediksi benar 4.343 untuk kelas negatif dan 3.239 untuk kelas positif. Penelitian ini juga menghasilkan aplikasi web interaktif berbasis Streamlit yang mampu melakukan prediksi sentimen secara langsung dan menyediakan visualisasi data. Dengan demikian, penelitian ini memberikan kontribusi berupa pipeline analisis sentimen yang komprehensif, menggabungkan labeling berbasis transformer dengan ensemble learning, serta framework yang dapat digunakan kembali untuk isu serupa.
Kata kunci: analisis sentimen, hak cipta, random forest, komentar Youtube, Indonesia.
| TI0192 | TI0192 | UPT. PERPUSTAKAAN PUSAT (Skripsi dan Tesis) | Tersedia - No Loan |
Tidak tersedia versi lain