Final_Project
Klasifikasi Hoax Berita Berbasis Teks Berbahasa Indonesia Menggunakan Extreme Gradient Boosting (XGBOOST)
Banyaknya informasi yang tersebar tak lepas dari perkembangan internet.
Internet dipakai sebagai sarana penyebaran informasi dengan berbagai macam bentuk
informasi, baik itu teks, video, gambar, maupun audio. Namun, penyebaran informasi
seiring berkembangnya internet juga sejalan dengan penyalahgunaan internet itu
sendiri. Penyebaran informasi bohong atau yang biasa dikenal dengan sebutan hoax,
menjadi salah satu cyber crime yang paling nampak. Penggiringan opini lewat berita
hoax berpengaruh negatif terhadap kehidupan sosial bermasyarakat, seperti contohnya
memunculkan rasa benci terhadap sesuatu baik itu individu maupun kelompok.
Penelitian ini bermaksud membuat klasifikasi untuk membedakan hoax
maupun non-hoax atau valid pada berita berbentuk teks. Penelitian ini memanfaatkan
pembelajaran mesin terawasi atau supervised machine learning Pengembangan
klasifikasi teks akan menggunakan Extreme Gradient Boosting (XGBoost). XGBoost
termasuk kedalam varian dari tree Gradient boosting. Tree Gradient boosting
merupakan teknik machine learning. XGBoost dapat dipakai dalam menangani kasus
real baik skala kecil maupun besar menggunakan jumlah sumber daya yang minimal
sekalipun. Penelitian ini akan memakai dataset berjumlah 500 data dari 250 data hoax
dan 250 data non-hoax yang akan dipakai sebagai data latih dan uji dalam pembentukan
model. Dataset dibagi 80% sebagai data latih dan 20% sebagai data uji. Hasil evaluasi
model menunjukkan model klasifikasi teks dengan XGBoost mendapat nilai akurasi
sebesar 92%, presisi 96%, recall 88%, dan f1-score 92%.
| TI 21/007 | Referensi | Tersedia |
Tidak tersedia versi lain