Putri, Yolanda Prayetno and Arianto, Rakhmat and Palupiningsih, Pritasari (2019) KLASIFIKASI BERITA HOAX PADA BERITA BERBAHASA INDONESIA MENGGUNAKAN LATENT DIRICHLET ALLOCATION DAN VECTOR SPACE MODEL. Diploma thesis, ITPLN.
201531134_SKRIPSI_YOLANDA PRAYETNO PUTRI.pdf
Restricted to Registered users only
Download (3MB)
Abstract
Berita hoax merupakan suatu argumen yang tidak masuk akal (mengada-ada) tetapi dibuat seolah-olah berita itu benar terjadi. Banyaknya berita hoax yang bermunculan di situs berita online merupakan salah satu bentuk penyalahgunaan perkembangan teknologi yang mengakibatkan sulitnya mengetahui kecenderungan suatu berita hoax atau valid bagi masyarakat awam. Sehingga dibutuhkan aplikasi klasifikasi berita hoax. Latent Dirichlet Allocation adalah salah satu metode text mining yang digunakan untuk merangkum suatu dokumen bertujuan untuk mendapatkan kelompok bahasan topik yang terkandung di dalam dokumen atau bisa disebut sebagai topic modelling. Dalam hal ini Latent Dirichlet Allocation akan digunakan untuk pemodelan topik pada dataset isi berita. Hasil topic modelling akan dicocokkan dengan fungsi similarity menggunakan Vector Space Model untuk dihitung weighted dari setiap term yang terdapat dalam semua hasil topik yang terbentuk dan dataset judul berita kemudian diklasifikasikan berdasarkan kelas yang ada. Sebelum melakukan perhitungan, teks terlebih dahulu melewati proses tokenizing, filtering, dan stemming. Berdasarkan hasil pengujian, diperoleh akurasi sebesar 63.3%.
Hoax news is an argument that does not make sense (far-fetched) but made as if the news happened. The number of hoax news that has appeared on online news sites is one form of misuse of technological developments which makes it difficult to know the tendency of hoax news or valid for ordinary people. So the hoax news classification application is needed. Latent Dirichlet Allocation is one method of text mining that is used to summarize a document to get a discussion group of topics contained in the document or can be referred to as topic modeling. In this case, the Latent Dirichlet Allocation will be used for modeling topics in the news content dataset. The results of the topic modeling will be matched with the similarity function using the Vector Space Model to calculate the weighted of each term contained in all the results of the topics formed and the news title dataset is then classified based on the existing class. Before carrying out calculations, the text first goes through the process of tokenizing, filtering, and stemming. Based on the test results, we obtained an accuracy of 63.3%.
| Item Type: | Thesis (Diploma) |
|---|---|
| Uncontrolled Keywords: | Hoax news, classification, topic modelling, Latent Dirichlet Allocation, Vector Space Model. Berita hoax, klasifikasi, topic modelling, Latent Dirichlet Allocation, Vector Space Model |
| Subjects: | Skripsi Bidang Keilmuan > Teknik Informatika |
| Divisions: | Fakultas Telematika Energi > S1 Teknik Informatika |
| Depositing User: | Sudarman |
| Date Deposited: | 18 Sep 2025 08:01 |
| Last Modified: | 18 Sep 2025 08:01 |
| URI: | https://repository.itpln.ac.id/id/eprint/1243 |
