Farasi, Abdan Sholla and Siregar, Riki Ruli Affandi and Arianto, Rakhmat (2019) KLASIFIKASI KESALAHAN EJAAN KATA PADA ABSTRAK ARTIKEL ILMIAH MENGGUNAKAN METODE LEVENSHTEIN DISTANCE. Diploma thesis, ITPLN.
SKRIPSI_201531238_ABDAN SHOLLA FARASI.pdf
Restricted to Registered users only
Download (4MB)
Abstract
The purpose of this research is to make a spell checker application model for abstract documents of journal using the Levenshtein Distance calculation method. Levenshtein Distance is a text mining method used to correct the wrong words. Before calculating Levenshtein Distance, the first step to do is preprocessing text to reduce the number of dimensions of the matrix to make it easier when used as input parameters into the Levenshtein Distance method, which includes tokenizing and stemming. Then calculate between the 2 strings to get the value of the edit distance used to edit (insertion, deletion, substitution). The Levenshtein Distance performance test results using the Confusion Matrix method so that the accuracy value is 73.70%, the precision value is 25.89% and the recall value is 37.27%. Based on the presentation, the conclusion is the Levenshtein Distance method can be used as a spell checker of words.
Tujuan dari penelitian ini adalah membuat model aplikasi pemeriksaan ejaan kata pada dokumen abstrak artikel ilmiah dengan menggunakan metode perhitungan Levenshtein Distance. Levenshtein Distance merupakan salah satu metode text mining yang digunakan untuk melakukan koreksi terhadap kata yang salah. Sebelum perhitungan Levenshtein Distance dilakukan, terlebih dahulu tahap preprocessing text untuk mengurangi jumlah dimensi matriks agar lebih mudah ketika dijadikan parameter input ke dalam metode Levenshtein Distance yang meliputi tokenizing dan stemming. Kemudian dilakukan perhitungan antara 2 string untuk mendapatkan nilai edit distance yang digunakan untuk melakukan pengeditan (insertion, deletion, substitution). Pengujian kinerja hasil Levenshtein Distance menggunakan metode Confusion Matrix sehingga didapatkan nilai akurasi sebesar 73.70%, nilai precision sebesar 25.89% dan nilai recall sebesar 37.27%. Berdasarkan presentasi tersebut, dapat disimpulkan bahwa metode Levenshtein Distance dapat dijadikan sebagai pemeriksaan ejaan terhadap kata.
| Item Type: | Thesis (Diploma) |
|---|---|
| Uncontrolled Keywords: | Spelling Correction, Text Mining, Levenshtein Distance, Text Preprocessing Pemeriksaan Ejaan, Text Mining, Levenshtein Distance, Text Preprocessing |
| Subjects: | Skripsi Bidang Keilmuan > Teknik Informatika |
| Divisions: | Fakultas Telematika Energi > S1 Teknik Informatika |
| Depositing User: | Sudarman |
| Date Deposited: | 19 Sep 2025 08:23 |
| Last Modified: | 19 Sep 2025 08:23 |
| URI: | https://repository.itpln.ac.id/id/eprint/1330 |
