PERBANDINGAN ALGORITMA MACHINE LEARNING PADA KLASIFIKASI JUDUL ARTIKEL JURNAL ILMIAH BIDANG KOMPUTER

Fadhillah, Muhammad (2025) PERBANDINGAN ALGORITMA MACHINE LEARNING PADA KLASIFIKASI JUDUL ARTIKEL JURNAL ILMIAH BIDANG KOMPUTER. Masters thesis, UNAMA.

[img] Text
BAB II.pdf
Restricted to Registered users only

Download (751kB)
[img] Text
BAB III.pdf
Restricted to Registered users only

Download (612kB)
[img] Text
BAB IV.pdf
Restricted to Registered users only

Download (901kB)
[img] Text
BAB V.pdf

Download (459kB)
[img] Text
DAFTAR PUSTAKA.pdf

Download (489kB)
[img] Text
BAB I.pdf

Download (472kB)

Abstract

Meningkatnya jumlah publikasi ilmiah di bidang komputer menimbulkan tantangan dalam klasifikasi otomatis judul artikel yang cenderung singkat, ambigu, dan mengandung istilah teknis spesifik. Penelitian ini bertujuan membandingkan kinerja tiga algoritma machine learning—k-Nearest Neighbor (kNN), Naïve Bayes, dan Random Forest—dalam mengklasifikasikan judul artikel jurnal ilmiah bidang komputer ke lima topik utama: AI & Machine Learning, UI/UX, IT Framework, IoT, dan Cybersecurity. Dataset berjumlah 2.449 judul artikel yang diambil dari portal SINTA, kemudian melalui proses text preprocessing meliputi tokenisasi, normalisasi huruf, penghapusan stopword, dan stemming, serta diubah menjadi representasi numerik menggunakan pembobotan TF-IDF. Model dibangun menggunakan pembagian data latih dan data uji, lalu dievaluasi berdasarkan akurasi, presisi, recall, dan F1-score. Hasil menunjukkan kNN (k=51) memberikan akurasi tertinggi sebesar 89,61% dengan performa presisi, recall, dan F1-score yang konsisten di seluruh kategori. Random Forest menempati peringkat kedua dengan akurasi 81,46% dan keunggulan pada kategori tertentu seperti Cybersecurity dan AI & Machine Learning, meskipun mengalami penurunan signifikan pada recall kategori Cybersecurity. Naïve Bayes mencatat akurasi terendah (71,35%) namun memiliki waktu eksekusi tercepat (12 detik). Temuan ini menegaskan bahwa pemilihan algoritma harus mempertimbangkan karakteristik data, terutama untuk klasifikasi teks pendek seperti judul artikel ilmiah, dan menunjukkan bahwa kNN merupakan pilihan paling stabil dan akurat untuk konteks ini.

Item Type: Thesis (Masters)
Subjects: Analisis Sistem Informasi
Divisions: Tesis > Magister Sistem Informasi > 2025
Depositing User: Digital Library
Date Deposited: 14 Nov 2025 01:51
Last Modified: 14 Nov 2025 01:51
URI: http://repository.unama.ac.id/id/eprint/5320

Actions (login required)

View Item View Item