Credit Risk Analysis With Extreme Gradient Boosting and Adaptive Boosting Algorithm
DOI:
https://doi.org/10.37823/insight.v5i1.233Keywords:
Data mining, XGBoost, AdaBoost, Peer to Peer (P2P) LendingAbstract
Credit Risk Analysis digunakan untuk mengenali resiko terhadap pinjaman untuk mencegah penunggakan pembayaran utang. Pemberian uji kelayakan pinjaman dapat di analisis menggunakan model klasifikasi. Untuk menghasilkan model credit risk analysis yang sesuai, penulis mengajukan Algoritma Extreme Gradient Boosting (XGBoost) dan Adaptive Boosting (AdaBoost). Data yang digunakan dalam penelitian ini adalah data pinjaman platform Peer to Peer (P2P) Lending. Penelitian ini menerapkan data preprocessing yang bertujuan untuk menghasilkan data yang lebih baik dan melakukan analisis terhadap data. Analisis dilakukan berdasarkan fitur yang dimiliki oleh peminjam menggunakan algoritma klasifikasi berdasarkan historical data pinjaman peminjam. Fitur yang digunakan seperti jumlah pinjaman yang diajukan, total pinjaman yang ditawarkan, jumlah pembayaran pinjaman, jangka waktu pembayaran, suku bungan pinjaman, jumlah angsuran dan lain lain. Jumlah fitur sebelum dilakukan data reduksi 136 dan setelah direduksi 34 fitur. Fitur tersebut digunakan pada penerapan algoritma XGBoost dan AdaBoost untuk menghasilkan klasifikasi good borrower dan bad borrower. Penulis menggunakan metode evaluasi kurva ROC dan nilai AUC untuk menilai performa dari kedua algoritma. Pada kurva ROC, nilai AUC dari algoritma XGBoost 0,92 dan nilai AUC dari algrithma AdaBoost adalah 0,89. Berdasarkan perbandingan nilai AUC tersebut dapat disimpulkan algoritma XGBoost menghasilkan klasifikasi yang lebih baik untuk model klasifikasi pemberian pinjaman.
References
M. M. Bokhari, "Credit Risk Analysis in Peer to Peer Lending Dataset: Lending Club,”Senior Projects Spring, p. 1- 49, 2019.
V. S. E. S. A. Petropoulus, "A robust machine learning approach for credit risk analysis of large loan level datasets using deep learning and extreme gradient boosting," Irving Fisher Committee on Central Bank Statistics, 2018.
H. M. Flood, "Early identification of high-risk credit card customers based on behavioral data," NTNU, 2017.
E. R. Schapire and Y. Freund, “Boosting Foundations and Algorithms,” London: Massachusetts Institute of Technology, 2012.
D. G. d. B. H. P. . M. Addo, "Credit Risk Analysis Using Machine and Deep Learning Models," no. Risks, 2018. .
C. Joseph, Advanced Credit Risk Analysis and Management, Published 2013 by John Wiley & Sons, Ltd., 2013.
M. K. d. J. P. J. Han, Data Mining Concepts and Techniques, USA: Elsevier, 2011.
S. Raschha and V. mirjalili, "Performing one-hot encoding on nominal features," dalam python machine learning, pp. 116-118, 2017.
T. Chen dan C. Guestrin, “XGBoost: A Scalable Tree Boosting System,” 10 Jun 2016.
D. Berrar, “Cross-validation,” https://www.researchgate.net/publication/324701535, vol. 1, p. 9, 2018.
E. F. M. A. H. Ian H. Witten, “Data Mining Practical Machine Learning Tools and Techniques, Morgan Kaufmann Publishers is an imprint of Elsevier,” 2011.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2023 Journal of Information System,Graphics, Hospitality and Technology
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.