PENERAPAN DATA MINING UNTUK MENGOPTIMASI KLASIFIKASI TINGKAT PENYEBARAN COVID-19 DI INDONESIA MENGGUNAKAN METODE NAÏVE BAYES DENGAN SELEKSI FITUR INFORMATION GAIN

Mardiana, Mardiana (2023) PENERAPAN DATA MINING UNTUK MENGOPTIMASI KLASIFIKASI TINGKAT PENYEBARAN COVID-19 DI INDONESIA MENGGUNAKAN METODE NAÏVE BAYES DENGAN SELEKSI FITUR INFORMATION GAIN. Skripsi thesis, UNAMA.

[img] Text
BAB I.pdf

Download (218kB)
[img] Text
BAB II.pdf

Download (757kB)
[img] Text
BAB III.pdf

Download (214kB)
[img] Text
BAB IV.pdf
Restricted to Registered users only

Download (426kB)
[img] Text
BAB V.pdf
Restricted to Registered users only

Download (290kB)
[img] Text
DAFTAR PUSTAKA.pdf
Restricted to Registered users only

Download (124kB)

Abstract

Perkara virus corona mulai muncul dan menyerang manusia pertama kali di provinsi Wuhan, China. Berdasarkan pernyataan yang dikeluarkan, virus corona mampu berkembang dengan cepat. Setiap harinya jumlah data terus mengalami peningkatan pada penyebaran kasus Covid-19. Jika jumlah data penyebaran terus meningkat hal ini tentu akan meningkatkan jumlah data penyebaran kasus Covid-19 di Indonesia. Oleh karena itu dibutuhkan solusi teknologi berbasis data secara otomatis yang dapat membantu mengklasifikasikan tingkat penyebaran kasus Covid-19 di Indonesia. Penelitian ini menerapkan teknik Data mining untuk mengklasifikasikan dataset Covid-19 menggunakan metode Naïve Bayes. Salah satu masalah pada klasifikasi adalah banyaknya atribut yang digunakan pada sebuah dataset. Atribut yang banyak membuat nilai akurasi menjadi rendah, maka atribut yang ada harus dipilih dengan algoritma yang tepat. Information Gain sering lebih unggul dibanding yang lainnya dan dapat mengukur berapa banyak kehadiran dan ketidakhadiran dari suatu kata yang berperan untuk membuat keputusan klasifikasi yang benar dalam class dan salah satu pendekatan filter yang sukses dalam pengklasifikasian. Disimpulkan bahwa metode Naïve Bayes memanfaatkan data training dan data testing untuk menghasilkan probabilitas setiap kriteria untuk class yang berbeda, sehingga nilai probabilitas dari kriteria tersebut dapat dioptimalkan untuk memprediksi Tingkat Penyebaran Covid-19 di Indonesia berdasarkan proses klasifikasi yang dilakukan oleh metode Naïve Bayes itu sendiri. Jika dikombinasikan dengan seleksi fitur nilai dengan hasil persentase tertinggi ialah hasil akurasi klasifikasi Naïve Bayes dengan seleksi fitur menggunakan metode Information Gain mendapatkan persentase data training 70% pada 10 Cross-Validation yaitu 91.37% dan data testing 30% pada 10 Cross-Validation yaitu 91.50%.

Item Type: Thesis (Skripsi)
Subjects: Aplikasi Sistem Pengolahan Data
Divisions: Skripsi > Teknik Informatika > 2023
Depositing User: Digital Library
Date Deposited: 22 Mar 2024 07:04
Last Modified: 22 Mar 2024 07:04
URI: http://repository.unama.ac.id/id/eprint/3511

Actions (login required)

View Item View Item