Information Extraction Berbasis Rule untuk Laporan Keuangan Perusahaan

Authors

  • Terrence Pramono Universitas Ciputra Surabaya
  • Yosua Setyawan Soekamto Universitas Ciputra Surabaya

DOI:

https://doi.org/10.37823/insight.v6i1.316

Keywords:

information extraction, laporan keuangan, regular expression, rule-based

Abstract

Laporan keuangan merupakan salah satu sumber informasi penting bagi investor dalam membuat keputusan investasi. Namun, data yang terkandung di dalam laporan keuangan sangat besar sehingga proses untuk mencari informasi penting didalamnya perlu waktu yang cukup lama. Hal ini memunculkan kebutuhan perangkat yang bisa mengidentifikasi dan mengekstrak informasi yang relevan dari laporan keuangan secara otomatis. Oleh karena itu, sebuah model information extraction berbasis rule diusulkan dalam tugas akhir ini. Model ekstraksi informasi yang diusulkan, dirancang supaya dapat mengautomasi proses ekstraksi informasi yang relevan bagi investor seperti posisi keuangan, laba rugi, dan arus kas perusahaan. Model ini menggunakan rule yang sudah ditentukan sebelumnya oleh peneliti untuk mengekstrak informasi tersebut. Salah satu rule yang digunakan adalah regular expression, yang biasa digunakan untuk mengambil informasi yang terkandung dalam teks. Proses evaluasi model akan dilakukan dengan mengukur tingkat accuracy dan f1-score informasi yang didapatkan dari berbagai laporan keuangan. Penelitian ini menghasilkan model information extraction yang mampu mendapatkan nilai accuracy keseluruhan sebesar 86,07% dalam mendapatkan 16 label informasi finansial yang berbeda. Model ini, diharapkan dapat membantu investor dalam pengambilan keputusan investasi dengan memberikan akses yang mudah dan cepat ke informasi yang terdapat dalam laporan keuangan tanpa mengurangi tingkat akurasi informasi yang didapatkan secara signifikan.

References

W. W. Hidayat, DASAR-DASAR ANALISA LAPORAN KEUANGAN. Kab. Ponorogo: Uwais Inspirasi Indonesia, 2018.

M. Buana, “SURVEY PENTINGNYA LAPORAN KEUANGAN BAGI INVESTOR.,” MRBFinance Blog, 2021. https://www.mrbfinance.com/blog/survey-pentingnya-laporan-keuangan-bagi-investor (accessed Mar. 13, 2023).

H. Zhao, Y. Pan, and F. Yang, “Research on Information Extraction of Technical Documents and Construction of Domain Knowledge Graph,” IEEE Access, vol. 8, pp. 168087–168098, 2020, doi: 10.1109/ACCESS.2020.3024070.

A. Alamoudi, A. Alomari, S. Alwarthan, and Atta-Ur-rahman, “A rule-based information extraction approach for extracting metadata from pdf books,” ICIC Express Letters, Part B: Applications, vol. 12, no. 2, pp. 121–132, Feb. 2021, doi: 10.24507/icicelb.12.02.121.

A. Nurdin and N. U. Maulidevi, “5W1H Information Extraction with CNN-Bidirectional LSTM,” in Journal of Physics: Conference Series, Institute of Physics Publishing, Mar. 2018. doi: 10.1088/1742-6596/978/1/012078.

G. Zaman, H. Mahdin, K. Hussain, and Atta-Ur-Rahman, “Information extraction from semi and unstructured data sources: A systematic literature review,” ICIC Express Letters, vol. 14, no. 6. ICIC International, pp. 593–603, Jun. 01, 2020. doi: 10.24507/icicel.14.06.593.

N. Rasouli, L. Abedi, and S. Ghaei, “Designing an agent for information extraction from Persian E-shops,” Telkomnika (Telecommunication Computing Electronics and Control), vol. 16, no. 1, pp. 455–462, Feb. 2018, doi: 10.12928/TELKOMNIKA.v16i1.5943.

A. Kekare, A. Jachak, A. Gosavi, and P. S. Hanwate, “IRJET-Techniques for Detecting and Extracting Tabular Data from PDFs and Scanned Documents: A Survey Techniques for Detecting and Extracting Tabular Data from PDFs and Scanned Documents: A Survey,” International Research Journal of Engineering and Technology, 2020, [Online]. Available: www.irjet.net

Y. Shinyama, P. Guglielmetti, and P. Marsman, “Welcome to pdfminer.six’s documentation!,” pdfminer.six documentation, 2019. https://pdfminersix.readthedocs.io/en/latest/ (accessed Mar. 13, 2023).

M. Cui, R. Bai, Z. Lu, X. Li, U. Aickelin, and P. Ge, “Regular expression based medical text classification using constructive heuristic approach,” IEEE Access, vol. 7, pp. 147892–147904, 2019, doi: 10.1109/ACCESS.2019.2946622.

D. Jurafsky and J. H. Martin, Speech and language processing : an introduction to natural language processing, computational linguistics, and speech recognition. Prentice Hall, 2000.

A. Ariga, “FAQ : tabula-py,” tabula-py Documentation, 2019. https://tabula-py.readthedocs.io/en/latest/faq.html (accessed Mar. 13, 2023).

Downloads

Published

2024-04-18

How to Cite

Pramono, T., & Yosua Setyawan Soekamto. (2024). Information Extraction Berbasis Rule untuk Laporan Keuangan Perusahaan. Journal of Information System,Graphics, Hospitality and Technology, 6(1), 17–22. https://doi.org/10.37823/insight.v6i1.316