Ekstraksi Judul dan Abstrak Artikel Ilmiah Berbasis Rule
DOI:
https://doi.org/10.37823/insight.v2i01.69Keywords:
Information Extraction, Association Rules, Title Extraction, Abstract Extraction, Text Metadata ExtractionAbstract
Seiring perkembangan penelitian dan jumlah research paper yang dipublikasikan di berbagai Jurnal, maka kesulitan yang timbul adalah proses seleksi dan referensi oleh para peneliti dan pengelola jurnal. Dalam research paper bagian judul dan abstrak adalah ide utama dan ringkasan penelitian beserta metode yang digunakan dalam penelitian tersebut. Oleh karena itu, ekstraksi judul dan ringkasan research paper menjadi topik yang cukup banyak dibahas dengan berbagai metode dan umumnya terbatas dengan penggunaan bahasa dan gaya penulisan tiap-tiap jurnal. Dalam penelitian ini, ekstraksi judul dan abstrak akan menggunakan bentuk association rule dan diterapkan pada intuisi umum dalam penulisan research paper. Penelitian yang dilakukan akan menggunakan 2 dataset layout research paper, yaitu bentuk 1 kolom dan 2 kolom. Penelitian ini akan sangat membantu pengelola jurnal dan peneliti sehingga kedua pihak tersebut dapat melakukan proses referensi secara otomatis dan memudahkan seleksi untuk publikasi jurnal secara online. Rule akan diterapkan pada gaya penulisan research paper yang umum digunakan sehingga dapat diberlakukan pada berbagai jenis paper dengan berbagai bahasa. Salah satu contoh rule yang digunakan adalah “Judul paper merupakan sebuah kalimat (frase) dengan menggunakan ukuran teks yang paling besar”, “Judul paper ditulis pada awal halaman pertama”, “Judul paper mayoritas ditulis dengan menggunakan cetak tebal (bold)”, “Judul paper diikuti dengan nama penulis”, “Judul paper yang muncul di halaman kedua dan selanjutnya sebagai header atau footer memiliki letak yang tidak lazim dibanding isi paper (atau berada di margin halaman)”.
References
Frank, Eibe., Witten, Ian H., Paynter, Gordon W., Gutwin, Carl., Nevill-Manning ,Craig G., “Domain Specific Keyphrase Extraction”, Proceedings 16th International Joint Conference on Artificial Intelligence. 1999.
Bhowmik, Rekha., “Keyword Extraction from Abstracts and Titles”, Proceedings of the IEEE Southeastcon. 2008.
Kavila, Selvani Deepthi, Rajesh, B., Vyshnavi, N., Sushma, K. Moni., “Automatic Key Term Extraction from Research Article using Hybrid Approach”, International Journal of Computer Application, Volume 166 No. 6, May. 2017.
Kaur, Jasmeen., Gupta, Vishal., “Effective Approaches for Extraction of Keywords”, International Journal of Computer Science, Volume 7, Nov. 2010.
Rose, Stuart., Engel, Dave., Cramer, Nick., Cowley, Wendy., “Automatic Keyword Extraction from Individual Documents”, Text Mining: Applications and Theory, 2010.
Guo, Zhixin., Jin, Hai., “A Rule-Based Framework of Metadata Extraction from Scientific Papers”, 10th International Symposium on Distributed Computing and Applications to Business, Engineering and Science, 2011.
Soderland, S., “Learning Information Extraction Rules for Semi-Structured and Free Text”, Kluwer Academic Publishers, 1999.
Beel, Joran., Gipp, Bela., Shaker, Ammar., Friedrich, Nick., “SciPlore Xtract: Extracting Titles from Scientific PDF Documents by Analyzing Style Information (Font Size)”, Proceedings of the 14th European Conference on Digital Libraries, Volume 6273, Sept. 2010.
Hasan, H. M. Mahedi., Sanyal, Falguni., Chaki, Dipankar., Ali, Md. Haider., “An Empirical Study of Important Keyword Extraction Techniques from Documents”, International Conference on Intelligent System and Information Management, Oct. 2017.
Matsuo, Y., Ishizuka, M., “Keyword Extraction from a Single Document using Word Co-Occurrence Statistical Information”, International Journal on Artificial Intelligence Tools, Dec. 2003.
Zhang, Chengzhi., Wang, Huilin., Liu Yao., Wu, Dan., Liao, Yi., Wang, Bo., “Automatic Keyword Extraction from Document Using Conditional Random Fields”, Journal of Computational Information Systems, 2008.
Witten, Ian H., Paynter, Gordon W., Frank, Eibe., Gutwin, Carl., Nevill-Manning ,Craig G., “KEA: Practical Automatic Keyphrase Extraction”, in Proceedings of the 4th ACM Conference on Digital Libraries, 1998.