Rancang Bangun Model Machine Learning untuk Mendeteksi Malicious Webpage dengan Metode Wang, et al. (2017)

Authors

  • Mohamad Arifandy Alumni Poltek SSN
  • Septia Ulfa Sunaringtyas

DOI:

https://doi.org/10.56706/ik.v15i2.3

Keywords:

decision tree, machine learning, malicious webpage, naïve bayes, performa, SVM

Abstract

Penggunaan internet dengan mengakses suatu web kerap kali dilakukan untuk berbagai kepentingan. Akibatnya terdapat pihak tertentu yang memanfaatkannya untuk mendapatkan keuntungan. Keuntungan tersebut dilakukan dengan melakukan tindak kejahatan berupa penyisipan konten berbahaya pada suatu halaman web sehingga halaman tersebut dapat dikatakan sebagai malicious webpage. Machine learning yang saat ini sedang menjadi trend dapat digunakan untuk menanggulangi hal tersebut. Machine learning dapat digunakan sebagai cara untuk mendeteksi malicious webpage dengan melakukan klasifikasi terhadap suatu web berdasarkan ciri berupa fitur yang dimiliki dari halaman web. Performa terbaik dari machine learning dalam mendeteksi malicious webpage sangat diperlukan. Pada penelitian ini akan dilakukan rancang bangun model machine learning menggunakan metode Wang, et al. (2017) untuk mendeteksi malicious webpage. Hasil penelitian menunjukkan rancang bangun model machine learning terdiri dari tahapan mempersiapkan lingkungan, pembuatan dataset, dan training dan testing dataset menggunakan algoritme decision tree. Model machine learning memiliki performa berupa akurasi, precision, dan f-measure yang dihasilkan adalah 0.921, 0.925, dan 0.914. Penggunaan algoritme decision tree memberikan performa terbaik dibandingkan dengan menggunakan algoritme lain seperti naïve bayes dan support vector machine (SVM). Performa berupa akurasi, precision, dan f-measure  yang dihasilkan dari algoritme naïve bayes adalah 0.738, 0.645, dan 0.773. Performa berupa akurasi, precision, dan f-measure yang dihasilkan dari algoritme SVM adalah 0.802, 0.738, dan 0.807.

References

APJII, "PENETRASI & PROFIL PERILAKU PENGGUNA INTERNET INDONESIA TAHUN 2018," APJII (Asosiasi Penyelenggara Jasa Internet Indonesia), 2019.

S. Yoo and S. Kim, "Two-Phase Malicious Web Page Detection Scheme Using Misuse and Anomaly Detection," International Journal of Reliable Information and Assurance, pp. 1-9, 2014.

Securi, "Hacked Website Report 2018," Securi Inc., 2019.

B. Esthe and F. B. Kessler, "Effective Analysis, Characterization, and Detection of Malicious Web Pages," in International World Wide Web Conference Committee (IW3C2), Rio de Jeneiro, 2013.

R. Wang, Y. Zhu, J. Tan and B. Zhou, "Detection of malicious web pages based on hybrid analysis," Journal of Information Security and Applications, pp. 68-74, 2017.

H. B. Kazemian and S. Ahmed, "Comparisons of Machine Learning Tecniques for Detecting Malicious Webpages," Expert Systems with Applications, pp. 1166-1177, 2015.

Y.-T. Hou, Y. Chang, T. Chen, C.-S. Laih and C.-M. Chen, "Malicious web content detection by machine learning," Expert Systems with Applications, pp. 55-60, 2010.

J. Ma, L. Saul, S. Savage and G. Voelker, "Beyond blacklists: learning to detect malicious web sites from suspicious URLs," in Proceedings of the 15th ACM SIGKDD international conference on Knowledge , Paris, 2009.

D. Patil and Patil, "Detection of Malicious JavaScript Code in Web Pages," Indian Journal of Science and Technology, pp. 1-12, 2017.

G. A. Sandag, J. Leopold and V. F. Ong, "Klasifikasi Malicious Websites Menggunakan Algoritma K-NN Berdasarkan Application Layers dan Network Characteristics," Cogito Smart Journal, pp. 37-44, 2018.

J. Hurwitz and D. Kirsch, Machine Learning for Dummies, Hoboken: IBM , 2018.

E. Alpaydin, Introduction to Machine Learning, Cambridge: MIT Press, 2004.

C. Danilo and R. Basili, "Decision Tree Algorithm Short Weka Tutorial," 2009. [Online]. Available: http://art.uniroma2.it/basili/MLWM09/002_DecTree_Weka.pdf.

Wesley, "Implementasi Machine Learning pada Sistem Pendeteksi Situs yang Bermuatan Konten Negative," 2019. [Online]. Available: http://repositori.usu.ac.id/handle/123456789/16137.

A. Saleh, "Implementasi Metode Klasifikasi Naive Bayes Dalam Memprediksi Besarnya Pengunaan Listik Rumah Tangga," Citec Journal, pp. 207-217, 2015.

A. S. Nugroho, A. B. Witarto and D. Handoko, "Support Vector Machine dan Aplikasinya dalam Bionformatika," 2003.

P. S. and C. Thomas, "A Static Approach to Detect Drive-by-download Attacks on Webpages," in International Conference on Control Communication and Computing (ICCC), 2013.

J. H. Nezhad, M. V. Jahan, M. Tayarani-N and Z. Sadrnezhad, "Analyzing New Features of Infected Web Content in Detection of Malicious Webpages," Internation Journal of Information Security, pp. 161-180, 2017.

M. Hall, E. Frank, G. Holmes and B. Pfahringer, "The WEKA Data Mining Software: An Update," SIGKDD Explorations, pp. 10-18, 2009.

Alexa Internet, Inc, "Top Sites in Indonesia," 2019. [Online]. Available: https://www.alexa.com/topsites/countries/ID.

Malware Domain List, 2019. [Online]. Available: http://www.malwaredomainlist.com/mdlcsv.php.

Downloads

Submitted

31-03-2021

Accepted

31-07-2021

Published

18-08-2021

Issue

Section

Articles