Peringkasan Teks Ekstraktif pada Dokumen Tunggal Menggunakan Metode Restricted Boltzmann Machine

  • Rully Widiastutik Institut Sains dan Teknologi Terpadu Surabaya
  • Lukman Zaman P. C. S. W
  • Joan Santoso
Keywords: Natural Language Processing, Peringkasan Teks, Restricted Boltzmann Machine, Teks Berita Berbahasa Indonesia

Abstract

Penelitian yang dilakukan yaitu menghasilkan peringkasan teks ekstratif secara otomatis yang dapat membantu menghasilkan dokumen yang lebih pendek dari dokumen aslinya dengan cara mengambil kalimat penting dari dokumen sehingga pembaca dapat memahami isi dokumen dengan cepat tanpa membaca secara keseluruhan. Dataset yang digunakan sebanyak 30 dokumen tunggal teks berita berbahasa Indonesia yang diperoleh dari www.kompas.com pada kategori tekno. Dalam penelitian ini, digunakan sepuluh fitur yaitu posisi kalimat, panjang kalimat, data numerik, bobot kalimat, kesamaan antara kalimat dan centroid, bi-gram, tri-gram, kata benda yang tepat, kemiripan antar kalimat, huruf besar. Nilai fitur setiap kalimat dihitung. Nilai fitur yang dihasilkan ditingkatkan dengan menggunakan metode Restricted Boltzmann Machine (RBM) agar ringkasan yang dihasilkan lebih akurat. Untuk proses pengujian dalam penelitian ini menggunakan ROUGE-1. Hasil yang diperoleh dalam penelitian yaitu dengan menggunakan learning rate 0.06 menghasilkan recall, precision dan f-measure tertinggi yakni 0.744, 0.611 dan 0.669. Selain itu, semakin besar nilai compression rate yang digunakan maka hasil recall, precision dan f-measure yang dihasilkan akan semakin tinggi. Hasil peringkasan teks dengan menggunakan RBM memiliki nilai recall lebih tinggi 2.1%, precision lebih tinggi 1.6% dan f-measure lebih tinggi 1.8% daripada hasil peringkasan teks tanpa RBM. Hal ini menunjukkan bahwa peringkasan teks dengan menggunakan RBM hasilnya lebih baik daripada peringkasan teks tanpa RBM.

References

[1] J. S. Saputra, M. Fachrurrozi, Yunita, “Peringkasan Teks Berita Berbahasa Indonesia Menggunakan Metode Latent Semantic Analysis (LSA) dan Teknik Steinberger & Jezek,” in Prosiding Annual Research Seminar Computer Science and ICT, 2017.
[2] S. Irawan, Hermawan, Samsuryadi, “Studi Awal Peringkasan Dokumen Bahasa Indonesia Menggunakan Metode Latent Semantik Analysis dan Maximum Marginal Relevance,” in Prosiding Annual Research Seminar, 6 Desember 2016.
[3] I. P. G. H. Suputra. (2017, April). Peringkasan Teks Otomatis Untuk Dokumen Bahasa Bali Berbasis Metode Ektraktif. Jurnal Ilmu Komputer. X(1), pp. 33-38. Available: https://ojs.unud.ac.id/index.php/jik/article/view/39775/24171
[4] N. S. W. Gotami, Indriati, R. K. Dewi. (2018, September). Peringkasan Teks Otomatis Secara Ekstraktif Pada Artikel Berita Kesehatan Berbahasa Indonesia Dengan Menggunakan Metode Latent Semantic Analysis. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer. 2(9), pp. 2821-2828. Available: http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/2430/905
[5] A. Ambekar, K. Shah, M. Agrawal, S. Pawar, A. Shaikh. (2018, June). Text Summarization Using Restricted Boltzmann Machine: Unsupervised Deep Learning Approach. IJSART. 4(6), pp. 103-107. Available: http://ijsart.com/Content/PDFDocuments/IJSARTV4I623858.pdf
[6] M. Elgamal, Prof. Dr S. Hamada, Prof. Dr R. Aboelezz and Dr M. Abou-Kreisha. (2019, August). Better Results in Automatic Arabic Text Summarization System Using Deep Learning based RBM than by Using Clustering Algorithm based LSA. International Journal of Scientific & Engineering Research. 10(8), pp. 781-786. Available: https://www.ijser.org/researchpaper/Better-Results-in-Automatic-Arabic-Text-Summarization-System-Using-Deep-Learning-based-RBM-than-by-Using-Clustering-Algorithm-based-LSA.pdf
[7] S. P. Singh, A. Kumar, A. Mangal, S. Singhal. (2016). Bilingual Automatic Text Summarization Using Unsupervised Deep learning. IEEE International Conference on Electrical, Electronics, and Optimization Techniques (ICEEOT). pp. 1195-1200. Available: https://ieeexplore.ieee.org/document/7754874
[8] N. S. Shirwandkar, Dr. S. Kulkarni. (2018). Extractive Text Summarization using Deep Learning. IEEE Fourth International Conference on Computing Communication Control and Automation (ICCUBEA). Available: https://ieeexplore.ieee.org/document/8697465
[9] N. I. Widiastuti, W. K. Afnan. (2017). Fuzzy Logic dan Lexical Chains untuk Peringkasan Teks Otomatis. Jurnal Sistem Komputer. 7(1), pp. 5-12. Available: https://docplayer.info/91149501-Fuzzy-logic-dan-lexical-chains-untuk-peringkasan-teks-otomatis.html
[10] A. Ridok, T. C. Romadhona, “Peringkasan Dokumen Otomatis Menggunakan Metode Fuzzy Model Sistem Inferensi Mamdani,” in Seminar Nasional Teknologi Informasi dan Multimedia, Yogyakarta, 19 Januari 2013, pp. 19-24.
[11] Susilawati, “Algoritma Restricted Boltzmann Machines (RBM) untuk Pengenalan Tulisan Tangan Angka,” in Seminar Nasional Teknologi Informatika, “The Future of Computer Vision”, 2017, pp. 140-148.
[12] D. Branding (2019) “Ini Dia 7 Situs Berita Online di Indonesia yang Sering di Kunjungi,” [Online]. https://www.nataconnexindo.com/blog/ini-dia-7-situs-berita-online-di-indonesia-yang-sering-di-kunjungi, tanggal akses: 21-Mei-2020.
[13] J. Yadav, Dr. Y. K. Meena. (2016, Sept). Use of Fuzzy Logic and WordNet for Improving Performance of Extractive Automatic Text Sumarization. IEEE Intl. Conference on Advances in Computing, Communications and Informatics (ICACCI). pp. 2071-2077. Available: https://ieeexplore.ieee.org/document/7732356
Published
2020-07-15