Garis besar topik

  • Assalamu'alaikum Wr. Wb

    Pada pertemuan minggu 6  ini,  kita akan membahas materi : Inducing modular rules for clasification

    sub pokok bahasan :

    Introduction to Classification

    - Rule Post-pruning

    -  Con∩¼éict Resolution

    -  Problems with Decision Trees

    -  The Prism Algorithm

     di Sesi kedua dengan bahasan :  pratikum Problems with Decision Trees

    Selamat belajar
    Terima kasih

    Wassalamu'alaikum Wr. Wb
    Sri Karnila


    • Silahkan kerjakan tugas pratikum berikut:

      Studi Kasus: Klasifikasi Email Spam

      Sebuah sistem ingin mengklasifikasikan email menjadi:

      ┬╖       Spam

      ┬╖       Not Spam

      Link Akses Data : https://www.kaggle.com/datasets/yuliadp/data-spam

       

      Soal :

      1.     Import dan load dataset ke dalam Python.

      2.     Lakukan preprocessing pada data teks, meliputi:

      ┬╖       Mengubah teks menjadi huruf kecil (lowercase)

      ┬╖       Menghapus tanda baca

      3.     Ubah data teks menjadi bentuk numerik menggunakan metode:

      4.     CountVectorizer atau TF-IDF

      5.     Gunakan metode k-Fold Cross Validation dengan k = 5 untuk membagi data.

      6.     Bangun model klasifikasi menggunakan algoritma Naive Bayes.

      7.     Lakukan evaluasi model menggunakan:

      ┬╖       Accuracy

      ┬╖       Precision

      ┬╖       Recall

      8.     Lakukan analisis dengan menjelaskan apakah algoritma Naive Bayes cocok digunakan pada kasus ini.