Ekstraksi Teks Pada Halaman Website Renungan Rohani Menggunakan HTML Agility Pack

Authors

  • James Wijaya Universitas Ciputra Surabaya

DOI:

https://doi.org/10.37823/insight.v1i02.43

Keywords:

Ekstraksi Informasi, Halaman Website, HTML Agility Pack, Renungan Rohani

Abstract

Dengan adanya perkembangan teknologi informasi, orang-orang dapat mengakses berbagai informasi dari berbagai halaman web dengan menggunakan internet. Web Santapan Rohani adalah salah satu contoh website yang dapat digunakan oleh orang-orang terlebih khusus umat Kristiani untuk membaca renungan harian atau untuk melakukan saat teduh. Penelitian ini bertujuan menciptakan suatu teknologi ekstraksi informasi dari web Santapan Rohani yang berisikan renungan harian sehingga dapat membantu untuk analisa bagi penelitian-penelitian berikutnya yang dapat dikembangkan dari kehadiran teknologi ini. Halaman web memiliki bentuk yang semi-structured dan berisikan informasi berupa teks, gambar, video, URL, dan sebagainya. Hal ini menjadi kendala untuk dapat melakukan ekstraksi informasi dari halaman web. HTML Agility Pack merupakan salah satu tools terbaik yang dapat digunakan untuk melakukan HTML Parser dari suatu halaman web. Dengan menggunakan HTML Agility Pack dapat mempermudah untuk melakukan ekstraksi informasi dari berbagai halaman web, terlebih khusus untuk melakukan ekstraksi informasi pada renungan harian dari Web Santapan Rohani.

References

[1] “Kisah Kami | Santapan Rohani.” [Online]. Available: https://santapanrohani.org/our-story/. [Accessed: 20-Jan-2019].
[2] “URLs.” [Online]. Available: https://moz.com/learn/seo/url. [Accessed: 27-Jan-2019].
[3] F. A. Sutanto, “Implementasi Search Engine Optimization (SEO) on Page pada Web UMKM Batik dan Handicraft,” pp. 978–979, 2015.
[4] C. Boyd, “The Ultimate Guide for an SEO-Friendly URL Structure,” 2017. [Online]. Available: https://www.searchenginejournal.com/seo-friendly-url-structure-2/202790/. [Accessed: 10-Jan-2019].
[5] “What is HTML?” [Online]. Available: https://www.w3schools.com/whatis/whatis_html.asp. [Accessed: 20-Jan-2019].
[6] “Document Object Model (DOM).” [Online]. Available: https://www.w3.org/DOM/. [Accessed: 20-Jan-2019].
[7] “JavaScript HTML DOM.” [Online]. Available: https://www.w3schools.com/js/js_htmldom.asp. [Accessed: 20-Jan-2019].
[8] “HtmlAgilityPack.” [Online]. Available: https://www.nuget.org/packages/HtmlAgilityPack/. [Accessed: 07-Jan-2019].
[9] M. T. Mahmoudi, “Automatic Creation of Semantic Schema for Accurate Retrieving of Education-Supportive Documents,” pp. 28–33, 2012.
[10] “WebRequest Class.” [Online]. Available: https://docs.microsoft.com/en-us/dotnet/api/system.net.webrequest?view=netframework-4.0. [Accessed: 18-Jan-2019].

Downloads

Published

2019-10-31

How to Cite

Wijaya, J. (2019). Ekstraksi Teks Pada Halaman Website Renungan Rohani Menggunakan HTML Agility Pack. Journal of Information System,Graphics, Hospitality and Technology, 1(02), 30–37. https://doi.org/10.37823/insight.v1i02.43