Garis besar topik

    • Apa itu Penambangan Teks

      • Proses mengekstraksi pengetahuan dari data teks tidak terstruktur.
      • Sumber data: dokumen, artikel, email, media sosial, ulasan produk.
      • Fokus: menemukan pola, hubungan, tren, informasi bermakna.


    • Pertemuan 2 ΓÇö Pengantar Penambangan Teks

      Subjudul:

      • Definisi dan konsep dasar text mining

      • Perbedaan text mining, NLP, dan data mining

      • Tantangan dalam mengolah data teks

      Keterangan Singkat:

      Membahas dasar-dasar penambangan teks, ruang lingkup, manfaat, dan contoh aplikasi dalam berbagai industri.


    • Pertemuan 3 ΓÇö Representasi Data Teks

      Subjudul:

      • Bag-of-Words (BoW)

      • TF-IDF

      • N-gram modeling

      Keterangan Singkat:

      Mengenalkan cara mengubah teks menjadi format numerik yang bisa diproses oleh mesin.


    • Pertemuan 4 ΓÇö Pra-pemrosesan Teks

      Subjudul:

      • Tokenisasi

      • Stopword removal

      • Stemming dan lemmatization

      Keterangan Singkat:

      Membahas teknik dasar pembersihan data teks agar siap digunakan dalam model analisis.


    • Pertemuan 5 ΓÇö Normalisasi & Ekstraksi Fitur Lanjutan

      Subjudul:

      • Normalisasi karakter dan angka

      • POS Tagging

      • Word Embeddings (Word2Vec, GloVe, FastText)

      Keterangan Singkat:

      Memahami teknik untuk mengoptimalkan fitur teks melalui embedding dan analisis linguistik.


    • Pertemuan 6 ΓÇö Text Classification (Klasifikasi Teks)

      Subjudul:

      • Klasifikasi supervised

      • Algoritma: Naive Bayes, Logistic Regression, SVM

      • Evaluasi performa model

      Keterangan Singkat:

      Belajar membangun model untuk mengelompokkan teks ke dalam kategori tertentu.


    • Pertemuan 7 ΓÇö Text Clustering (Pengelompokan Teks)

      Subjudul:

      • K-Means, Hierarchical Clustering

      • Evaluasi Clustering

      Keterangan Singkat:

      Mengelompokkan teks tanpa label untuk menemukan pola dan tema tersembunyi.


    • Pertemuan 8 ΓÇö Topic Modeling

      Subjudul:

      • LDA (Latent Dirichlet Allocation)

      • LSA (Latent Semantic Analysis)

      • Visualisasi topik

      Keterangan Singkat:

      Mengidentifikasi struktur topik dalam kumpulan dokumen besar.