Skripsi
Kombinasi K-Means dan Support Vector Machine (SVM) Untuk Memprediksi Unsur SARA pada TWEET
bibliografi: hal. 85
RINGKASAN
Twitter merupakan salah satu layanan jejaring sosial dimana penggunanya dapat menyampaikan pesan sepanjang 140 huruf yang disebut “tweets” atau “kicau”. Kebebasan berpendapat sering disalahgunakan hingga akhirnya menyita perhatian terkait unsur yang menyinggung suku, agama, ras dan antargolongan (SARA). Dengan demikian peneliti akan melakukan penelitian dengan metode analisis sentiment untuk menentukan informasi kandungan pada tweet yaitu positif mengandung SARA atau negatif mengandung SARA menggunakan kombinasi k-means dan support vector machine (SVM). K-means digunakan untuk menentukan pengelompokan kelas hasil yang diperoleh berdasarkan k-means antara lain 118 tweet positif SARA dan 83 tweet negatif SARA. Proses klasifikasi atau prediksi dengan menggunakan 5-fold cross validation dan 10-fold cross validation. Hasil akurasi pada algoritma support vector machine (SVM) dengan 5-fold cross validation sebesar 64,18% dan 10-fold cross validation sebesar 63,68%. Berdasarkan hasil akurasi yang diperoleh untuk meningkatkan hasil akurasi, data hasil proses k-means diolah kembali secara manual hasil yang diperoleh 139 tweet positif SARA dan 62 tweet negatif SARA dengan hasil akurasi pada 5-fold cross validation sebesar 70,15% dan 10-fold cross validation sebesar 71,14%.
Kata Kunci: Twitter, K-Means, Support Vector Machine
ABSTRACT
Twitter is a social networking service where users can deliver 140-letter messages called "tweets" or "chirping". Freedom of expression is often misused until it finally draws attention to elements that pertain to ethnicity, religion, race and intergroup (SARA). Thus the researcher will conduct research with sentiment analysis method to determine the content information in a tweet that is positive containing SARA or negative containing SARA using a combination of k-means and support vector machine (SVM). K-means is used to determine the grouping of results obtained based on k-means, including 118 positive SARA tweets and 83 SARA negative tweets. Classification or prediction process using 5-fold cross validation and 10-fold cross validation. Accuracy results on the support vector machine (SVM) algorithm with 5-fold cross validation are 64.18% and 10-fold cross validation is 63.68%. Based on the results of the accuracy obtained to improve accuracy, the results of the k-means process were manually reprocessed the results obtained by 139 positive SARA tweets and 62 negative SARA tweets with the accuracy of 5-fold cross validation of 70.15% and 10-fold. cross validation is 71.14%.
Keywords: Twitter, K-Means, Support Vector Machine
SI1307 | SI 1307 ROH k | UPT. PERPUSTAKAAN (Rak 2) | Tersedia - No Loan |
Tidak tersedia versi lain