Garis besar topik
-
Assalamu'alaikum Wr. Wb
Pada pertemuan minggu 6 ini, kita akan membahas materi : Inducing modular rules for clasification
sub pokok bahasan :
Introduction to Classification
- Rule Post-pruning
- Conflict Resolution
- Problems with Decision Trees
- The Prism Algorithm
di Sesi kedua dengan bahasan : pratikum Problems with Decision Trees
Selamat belajar
Terima kasihWassalamu'alaikum Wr. Wb
Sri Karnila-
-
-
Silahkan kerjakan tugas pratikum berikut:
Studi Kasus: Klasifikasi Email Spam
Sebuah sistem ingin mengklasifikasikan email menjadi:
┬╖ Spam
┬╖ Not Spam
Link Akses Data : https://www.kaggle.com/datasets/yuliadp/data-spam
Soal :
1. Import dan load dataset ke dalam Python.
2. Lakukan preprocessing pada data teks, meliputi:
┬╖ Mengubah teks menjadi huruf kecil (lowercase)
┬╖ Menghapus tanda baca
3. Ubah data teks menjadi bentuk numerik menggunakan metode:
4. CountVectorizer atau TF-IDF
5. Gunakan metode k-Fold Cross Validation dengan k = 5 untuk membagi data.
6. Bangun model klasifikasi menggunakan algoritma Naive Bayes.
7. Lakukan evaluasi model menggunakan:
┬╖ Accuracy
┬╖ Precision
┬╖ Recall
8. Lakukan analisis dengan menjelaskan apakah algoritma Naive Bayes cocok digunakan pada kasus ini.
-