Metode Cosine Similarity Untuk Mendeteksi Kemiripan Pada Dokumen Teks

Authors

  • Supiyanto Supiyanto Cenderawasih University
  • Sriyono Sriyono Cenderawasih University

DOI:

https://doi.org/10.31957/sains.v23i1.3661

Abstract

Metode cosine similarity merupakan metode yang dapa digunakan untuk menghitung kemiripan antara dua buah objek yang dinyatakan dalam dua buah vector dengan menggunakan keywords (kata kunci) dari sebuah dokumen sebagai ukuran.  Tujuan dari penelitian ini yaitu mengimplementasikan metode cosine similarity dengan bahasa pemograman Python untuk mencari kemiripan dari dokumen. Data teks yang digunakan pada penelitian ini berupa file dengan ber-ektensi txt.  Tahapan metode penelitian yang dilakukan studi literatur, analisa algoritma, perancangan program dan pengujian. Metode yang digunakan pada penelitian ini yakni Metode cosine similarity. Tahapannya, semula sistem akan membaca data yang berupa teks, kemudian sistem akan melakukan pre-processing seperti case Folding, Tokenizing dan sebagainya guna menghasilkan kemiripan antar dokumen yang maksimal. Kemiripan dokumen dilakukan dengan cara membandingkan antara dokumen yang satu degan yang lainya menggunakan metode cosine similarity. Hasil aplikasi berupa angka kemiripan antara dokumen dalam bentuk porsentasr.  Luaran penelitian ini, terciptanya suatu aplikasi yang dapat digunakan untuk menentukan kemiripan antar suatu dokumen

Downloads

Download data is not yet available.

References

Firdaus, H. B. (2003). Algoritma Rabin-Karp. Ilmu Komputer Dan Teknologi Informasi III, III, 1–5.

Ismail, & Yunarso Eka, W. (2015). Aplikasi Berbasis Web Pendeteksi Plagiarisme Menggunakan Algoritma Himpunan Kata. Jurnal Informatika,Telekomunikasi Dan Elektronika, 6(2), 2–7. https://doi.org/10.20895/infotel.v6i2.79

Nugroho, K. S. (2019a). basic-text-preprocessing. Dasar Text Preprocessing Dengan Python. https://ksnugroho.medium.com/

Nugroho, K. S. (2019b). Dasar text preprocessing-dengan python. https://github.com/ksnugroho/basic-text-preprocessing/blob/master/text-preprocessing.ipynb

Nuramijaya. (2020). Menghitung Kemiripan Dokumen dengan TF-IDF Cosine Similarity.

Perdana, K. (2014). Pencarian dan perangkingan Obat Tradisional berdasarkan Gejala Penyakit Menggunakan Metode Cosine Similarity. Skripsi.

Pratama, R. P. (2018). Aplikasi deteksi plagiarisme menggunakan metode cosine similarity. http://etheses.uin-malang.ac.id/id/eprint/13894%0Ahttp://etheses.uin-malang.ac.id/13894/1/14650044.pdf

Rizki Tri Wahyuni, Dhidik Prastiyanto, E. S. (2017). Penerapan Algoritma Cosine Similarity dan Pembobotan TF-IDF pada Sistem Klasifikasi Dokumen Skripsi. Jurnal Teknik Elektro, Vol. 9 No., 18–23.

Sugiyamta. (2015). Sistem Deteksi kemiripan Dokumen Dengan Algoritma Cosine Similarity dan Single Pass Clustering. Dinamika Informatika, 7.

Wibowo, A. (2012). Mencegah dan menanggulangi plagiarisme di dunia. Departemen Administrasi Dan Kebijakan Kesehatan Fakultas Kesehatan Masyarakat Universitas Indonesia.

Downloads

Published

2024-02-26