PENERAPAN DAMERAU LAVENSHTEIN DISTANCE NAÏVE BAYES CLASSIFIER DALAM IDENTIFIKASI SPAM PADA DOKUMEN SMS DALAM BAHASA INDONESIA

Ramadhan, Reza Wahyu and Palupiningsih, Pritasari and Purwanto, Yudhy S. (2020) PENERAPAN DAMERAU LAVENSHTEIN DISTANCE NAÏVE BAYES CLASSIFIER DALAM IDENTIFIKASI SPAM PADA DOKUMEN SMS DALAM BAHASA INDONESIA. Diploma thesis, IT PLN.

[thumbnail of 201631135_REZA WAHYU RAMADHAN_REVISI_SKRIPSI_REZA WAHYU RAMADHAN 2.pdf] Text
201631135_REZA WAHYU RAMADHAN_REVISI_SKRIPSI_REZA WAHYU RAMADHAN 2.pdf
Restricted to Registered users only

Download (1MB)

Abstract

Spam SMS is an sms document sent in the form of advertising news and other purposes in bulk. Typically like pornographic, fraudulent and gambling messages, spam displays content on a continuous basis without being asked and is often unwanted by the recipient. So an algorithm is needed to classify the SMS document. Naïve Bayes is a classification method that is quite popular in classifying a
document. The disadvantage of the naïve Bayes algorithm is that there is no process to normalize the words in the SMS document to their basic word forms using the Damerau-Levenshtein Distance algorithm. The results of the algorithm also often give rise to a probability value of 0, so laplace correction / laplace smoothing is needed to avoid a probability value of 0 in the training data. Before doing text calculations, first go through preprocessing text starting from tokenizing, filtering, and stemming. Accuration value from this method is 91,5 %

Sms spam merupakan suatu dokumen sms yang dikirim berupa berita iklan dan keperluan lainnya secara massal. Umumnya seperti pesan bersifat pornografi, penipuan dan perjudian, spam menampilkan konten secara bertubi-tubi tanpa
diminta dan sering kali tidak dikehendaki oleh penerimanya. Sehingga dibutuhkan algoritma untuk mengklasifikasikan dokumen SMS tersebut. Naïve bayes merupakan salah satu metode klasifikasi yang cukup populer digunakan untuk
mengklasifikasikan sesuatu dokumen. Kekurangan dari algoritma naïve bayes adalah tidak adanya proses untuk menormalisasi kata dalam dokumen SMS ke bentuk kata dasarnya dengan menggunakan algoritma Damerau-Levenshtein
Distance. Hasil dari algoritma tersebut juga seringkali menimbulkan nilai probabilitas 0, maka dibutukan laplace correction/ laplace smoothing untuk menghindari probabilitas nilai 0 pada data latih. Sebelum melakukan perhitungan
teks terlebih dahulu melewati teks preprocessing mulai dari tokenizing, filtering, dan stemming. Hasil akurasi pada penelitian ini sebesar 91,5%

Item Type: Thesis (Diploma)
Uncontrolled Keywords: Dokumen SMS, klasifikasi, model klasifikasi, Naïve Bayes, DamerauLevenshtein Distance, Laplace Correction SMS document, classification, classification model, Naïve Bayes, Damerau-Levenshtein Distance, Laplace Correction
Subjects: Skripsi
Bidang Keilmuan > Teknik Informatika
Divisions: Fakultas Telematika Energi > S1 Teknik Informatika
Depositing User: Sutrisno
Date Deposited: 26 Sep 2025 02:38
Last Modified: 26 Sep 2025 02:38
URI: https://repository.itpln.ac.id/id/eprint/1477

Actions (login required)

View Item
View Item