Silahkan kerjakan tugas pratikum berikut:
Studi Kasus: Klasifikasi Email Spam
Sebuah sistem ingin mengklasifikasikan email menjadi:
┬╖ Spam
┬╖ Not Spam
Link Akses Data : https://www.kaggle.com/datasets/yuliadp/data-spam
Soal :
1. Import dan load dataset ke dalam Python.
2. Lakukan preprocessing pada data teks, meliputi:
┬╖ Mengubah teks menjadi huruf kecil (lowercase)
┬╖ Menghapus tanda baca
3. Ubah data teks menjadi bentuk numerik menggunakan metode:
4. CountVectorizer atau TF-IDF
5. Gunakan metode k-Fold Cross Validation dengan k = 5 untuk membagi data.
6. Bangun model klasifikasi menggunakan algoritma Naive Bayes.
7. Lakukan evaluasi model menggunakan:
┬╖ Accuracy
┬╖ Precision
┬╖ Recall
8. Lakukan analisis dengan menjelaskan apakah algoritma Naive Bayes cocok digunakan pada kasus ini.