Analisis Trending Topik untuk Percakapan Media Sosial dengan Menggunakan Topic Modelling Berbasis Algoritme LDA

  • Ahmad Syaifuddin Institut Sains dan Teknologi Terpadu Surabaya
  • Reddy Alexandro Harianto Institut Sains dan Teknologi Terpadu Surabaya
  • Joan Santoso Institut Sains dan Teknologi Terpadu Surabaya
Keywords: Topic Modelling, Latent Dirichlet Allocation, LDA, Media Sosial

Abstract

Aplikasi WhatsApp merupakan salah satu aplikasi chatting yang sangat populer terutama di Indonesia. WhatsApp mempunyai data unik karena memiliki pola pesan dan topik yang beragam dan sangat cepat berubah, sehingga untuk mengidentifikasi suatu topik dari kumpulan pesan tersebut sangat sulit dan menghabiskan banyak waktu jika dilakukan secara manual. Salah satu cara untuk mendapatkan informasi tersirat dari media sosial tersebut yaitu dengan melakukan pemodelan topik. Penelitian ini dilakukan untuk menganalisis penerapan metode LDA (Latent Dirichlet Allocation) dalam mengidentifikasi topik apa saja yang sedang dibahas pada grup WhatsApp di Universitas Islam Majapahit serta melakukan eksperimen pemodelan topik dengan menambahkan atribut waktu dalam penyusunan dokumen. Penelitian ini menghasilkan model topic dan nilai evaluasi f-measure dari model topik berdasarkan uji coba yang dilakukan. Metode LDA dipilih untuk melakukan pemodelan topik dengan memanfaatkan library LDA pada python serta menerapkan standar text-preprocessing dan menambahkan slang words removal untuk menangani kata tidak baku dan singkatan pada chat logs. Pengujian model topik dilakukan dengan uji human in the loop menggunakan word instrusion task kepada pakar Bahasa Indonesia. Hasil evaluasi LDA didapatkan hasil percobaan terbaik dengan mengubah dokumen menjadi 10 menit dan menggabungkan dengan reply chat pada percakapan grup WhatsApp merupakan salah satu cara dalam meningkatkan hasil pemodelan topik menggunakan algoritma Latent Dirichlet Allocation (LDA), didapatkan nilai precision sebesar 0.9294, nilai recall sebesar 0.7900 dan nilai f-measure sebesar 0.8541.

References

[1] Banerjee, T. S. WhatsApp Unlocking the Goldmine. New Delhi: Education Publishing. 2016 pp 51
[2] Afolaranmi, A. WhatsApp Messenger: Timeline, Features, and Usages in Christian Ministries. United States of America: Lulu Pres. 2019. pp 12
[3] Zhou, T and Zhang, H. (2016, Aug). A Text Mining Research Based on LDA Topic Modeling. Computer Science & Information technology (CS & IT). [Online] 6(2) pp 201-210 Available https://airccj.org/CSCP/vol6/csit65316.pdf
[4] Xu, G., Meng, Y., Chen, Z., Qiu, X., Wang, C., & Yao, H. (2019, Apr). Research on Topic Detection and Tracking for Online News Texts. Journal Special Section on Artificial Intelligence and Cognitive, [Online] 7(1), pp 216-231. Available https://ieeexplore.ieee.org/document/8703401
[5] Du, Y., Yi, Y., Li, X., Chen, X., Fan, Y., & Su, F. (2020, Jan). Extracting and tracking hot topics of micro-blogs based on improved Latent Dirichlet Allocation. Engineering Applications of Artificial Intelligence, [Online] 87(1), pp 103-119. Available https://www.sciencedirect.com/science/article/abs/pii/S095219761930243X
[6] Yu, D., Xu, D., Wang, D., & Ni, Z. (2019, Jan). Hierarchical Topic Modeling of Twitter Data for Online Analytical Processing. Digital Object Identifier, [Online] 7(1), pp 209-216. Available https://ieeexplore.ieee.org/document/8607040
[7] Piepenbrink, A dan Gaur, A.S. (2017, Oct). Topic Models as A Novel Approach To Identify Themes In Content Analysis: The Example of Organizational Research Methods. Academy of Management Proceeding [Online] 2017(1) pp. 105-111. Available https://journals.aom.org/doi/abs/10.5465/AMBPP.2017.141
[8] Yeh, J., Tan, Y., & Lee, C. (2016, Des). Topic detection and tracking for conversational content by using conceptual dynamic latent Dirichlet allocation. Neurocomputing, [Online] 216(1), 310–318. Available https://www.sciencedirect.com/science/article/abs/pii/S0925231216308384
[9] Basri, M. H. "Identifikasi Topik Informasi Publik Media Sosial di Kota Surabaya Berdasarkan Klasterisasi Teks Pada Twitter dengan Menggunakan Algoritma K-Means". Masters Thesis. Institut Teknologi Sepuluh Nopember, Surabaya, Indonesia, 2015.
[10] Cendana, M., & Permana, S. H. (2019, Des). Pra-Pemrosesan Teks pada Grup WhatsApp untuk Pemodelan Topic. Jurnal Mantik Penusa, [Online] 3(3), pp 107-116. Available http://e-jurnal.pelitanusantara.ac.id/index.php/mantik/article/download/676/414
[11] Rosenfeld, A., Sina, S., Sarne, D., Avidov, O., & Kraus, S. (2016, Sep). Social Media and Demographic Research WhatsApp Usage Patterns and Prediction Models. Demographic Research [Online] 39(22). pp 647-670. Available https://www.demographic-research.org/Volumes/Vol39/22/
[12] Premalatha, C., & Rani, S. J. (2017, Jun). Sentimental Analysis of WhatsApp Data Using Data Analytics Techniques. Journal of Data Mining and Management, [Online] 2(3), 1-6. Available http://matjournals.in/index.php/JoDMM/article/view/1906
[13] Patil, S. (2016, Nov). WhatsApp Group Data Analysis with R. International Journal of Computer Applications, [Online] 4(1), pp 313-326. Available https://www.ijcaonline.org/archives/volume154/ number4/26482-2016912116
[14] Prihatini, P. M., Putra, I. D., Giriantari, I. D., & Sudarma, M. (2017, Jun). Fuzzy-Gibbs Latent Dirichlet Allocation Model for Feature Extraction on Indonesian Documents. Contemporary Engineering Sciences, [Online] 10(1), pp 403-421. Available https://doi.org/10.12988/ces.2017.7325
[15] Prihatini, P. M., Suryawan, I. K., & Mandia, I. N. "Feature Extraction for Document Text using Latent Dirichlet Allocation". presented at The 2nd International Joint Conderence on Science and Technology (IJCST) 2017, Bali, Indonesia, Sep. 27-28. 2017
[16] Andjani, A., Ratnamulyani, I. A., & Kusumadinata, A. A. (2018, Apr). Penggunaan Media Komunikasi Whatsapp terhadap Efektivitas Kinerja Karyawan. Jurnal Komunikatio, [Online] 4(1), pp 41-50. Available https://ojs.unida.ac.id/JK/article/view/1211
[17] Raharti. (2019). "WhatsApp" Media Komunikasi Efektif Masa Kini (Studi Kasus pada Layanan Jasa Informasi Ilmiah di Kawasan Puspiptek). Visi Pustaka: buletin Jaringan Informasi Antar Perpustakaan, [Online] 21(2), pp 147-155. Available https://ejournal.perpusnas.go.id/vp/article/view/552
Published
2020-10-31