Analisis Trending Topik untuk Percakapan Media Sosial dengan Menggunakan Topic Modelling Berbasis Algoritme LDA

Authors

  • Ahmad Syaifuddin Institut Sains dan Teknologi Terpadu Surabaya
  • Reddy Alexandro Harianto Institut Sains dan Teknologi Terpadu Surabaya
  • Joan Santoso Institut Sains dan Teknologi Terpadu Surabaya

DOI:

https://doi.org/10.52985/insyst.v2i1.150

Keywords:

Topic Modelling, Latent Dirichlet Allocation, LDA, Media Sosial

Abstract

Aplikasi WhatsApp merupakan salah satu aplikasi chatting yang sangat populer terutama di Indonesia. WhatsApp mempunyai data unik karena memiliki pola pesan dan topik yang beragam dan sangat cepat berubah, sehingga untuk mengidentifikasi suatu topik dari kumpulan pesan tersebut sangat sulit dan menghabiskan banyak waktu jika dilakukan secara manual. Salah satu cara untuk mendapatkan informasi tersirat dari media sosial tersebut yaitu dengan melakukan pemodelan topik. Penelitian ini dilakukan untuk menganalisis penerapan metode LDA (Latent Dirichlet Allocation) dalam mengidentifikasi topik apa saja yang sedang dibahas pada grup WhatsApp di Universitas Islam Majapahit serta melakukan eksperimen pemodelan topik dengan menambahkan atribut waktu dalam penyusunan dokumen. Penelitian ini menghasilkan model topic dan nilai evaluasi f-measure dari model topik berdasarkan uji coba yang dilakukan. Metode LDA dipilih untuk melakukan pemodelan topik dengan memanfaatkan library LDA pada python serta menerapkan standar text-preprocessing dan menambahkan slang words removal untuk menangani kata tidak baku dan singkatan pada chat logs. Pengujian model topik dilakukan dengan uji human in the loop menggunakan word instrusion task kepada pakar Bahasa Indonesia. Hasil evaluasi LDA didapatkan hasil percobaan terbaik dengan mengubah dokumen menjadi 10 menit dan menggabungkan dengan reply chat pada percakapan grup WhatsApp merupakan salah satu cara dalam meningkatkan hasil pemodelan topik menggunakan algoritma Latent Dirichlet Allocation (LDA), didapatkan nilai precision sebesar 0.9294, nilai recall sebesar 0.7900 dan nilai f-measure sebesar 0.8541.

References

B. T. Shambhu, “WhatsApp: Unlocking The Goldmine.” New Delhi, India: Educreation Publishing, 2016.

A. O. Afolaranmi, “Towards the Possibility of Internet Ministry as an Alternative Pastoral Ministry in Nigeria during the COVID-19 Pandemic,” Int. J. Inf. Technol. Lang. Stud., vol. 4, no. 2, 2020.

Z. Tong and H. Zhang, “A text mining research based on LDA topic modelling,” in International Conference on Computer Science, Engineering and Information Technology, 2016, pp. 201–210.

G. Xu, Y. Meng, Z. Chen, X. Qiu, C. Wang, and H. Yao, “Research on topic detection and tracking for online news texts,” IEEE access, vol. 7, pp. 58407–58418, 2019.

Y. Du, Y. Yi, X. Li, X. Chen, Y. Fan, and F. Su, “Extracting and tracking hot topics of micro-blogs based on improved Latent Dirichlet Allocation,” Eng. Appl. Artif. Intell., vol. 87, p. 103279, 2020.

D. Yu, D. Xu, D. Wang, and Z. Ni, “Hierarchical topic modeling of Twitter data for online analytical processing,” IEEE Access, vol. 7, pp. 12373–12385, 2019.

A. Piepenbrink and A. S. Gaur, “Topic models as a novel approach to identify themes in content analysis,” in Academy of Management Proceedings, 2017, vol. 2017, no. 1, p. 11335.

J.-F. Yeh, Y.-S. Tan, and C.-H. Lee, “Topic detection and tracking for conversational content by using conceptual dynamic latent Dirichlet allocation,” Neurocomputing, vol. 216, pp. 310–318, 2016.

M. H. Basri, “Identifikasi Topik Informasi Publik Media Sosial Di Kota Surabaya Berdasarkan Klasterisasi Teks Pada Twitter Dengan Menggunakan Algoritma K-means,” Institut Teknologi Sepuluh Nopember, 2015.

M. Cendana and S. D. H. Permana, “Pra-Pemrosesan Teks Pada Grup Whatsapp Untuk Pemodelan Topik,” J. Mantik Penusa, vol. 3, no. 3, 2019.

A. Rosenfeld, S. Sina, D. Sarne, O. Avidov, and S. Kraus, “WhatsApp usage patterns and prediction models,” 2016.

C. Premalatha and S. J. Rani, “SENTIMENTAL ANALYSIS OF WHATSAPP DATA USING DATA ANALYTICS TECHNIQUES,” J. Data Min. Manag. (e-ISSN 2456-9437), vol. 2, 2017, Accessed: Jul. 05, 2021. [Online]. Available: http://matjournals.in/index.php/JoDMM/article/view/1906.

S. Patil, “WhatsApp Group Data Analysis with R,” Int. J. Comput. Appl., vol. 154, no. 4, 2016, doi: 10.5120/ijca2016912116.

P. M. Prihatini, I. Putra, I. A. D. Giriantari, and M. Sudarma, “Fuzzy-gibbs latent dirichlet allocation model for feature extraction on Indonesian documents,” Contemp. Eng. Sci., vol. 10, pp. 403–421, 2017.

P. M. Prihatini, I. K. Suryawan, and I. N. Mandia, “Feature extraction for document text using Latent Dirichlet Allocation,” in Journal of Physics: Conference Series, 2018, vol. 953, no. 1, p. 12047.

A. Anjani, I. A. Ratnamulyani, and A. A. Kusumadinata, “Penggunaan Media Komunikasi Whatsapp terhadap Efektivitas Kinerja Karyawan,” J. Komun., vol. 4, no. 1, 2018.

L. Rahartri, “‘ WHATSAPP’ MEDIA KOMUNIKASI EFEKTIF MASA KINI (STUDI KASUS PADA LAYANAN JASA INFORMASI ILMIAH DI KAWASAN PUSPIPTEK,” VISI PUSTAKA Bul. Jar. Inf. Antar Perpust., vol. 21, no. 2, pp. 147–156, 2019.

Downloads

Published

2020-04-01