Garis besar topik
-
-
Apa itu Penambangan Teks
- Proses mengekstraksi pengetahuan dari data teks tidak terstruktur.
- Sumber data: dokumen, artikel, email, media sosial, ulasan produk.
- Fokus: menemukan pola, hubungan, tren, informasi bermakna.
-
-
-
-
Pertemuan 2 ΓÇö Pengantar Penambangan Teks
Subjudul:
-
Definisi dan konsep dasar text mining
-
Perbedaan text mining, NLP, dan data mining
-
Tantangan dalam mengolah data teks
Keterangan Singkat:
Membahas dasar-dasar penambangan teks, ruang lingkup, manfaat, dan contoh aplikasi dalam berbagai industri.
-
-
-
-
Pertemuan 3 ΓÇö Representasi Data Teks
Subjudul:
-
Bag-of-Words (BoW)
-
TF-IDF
-
N-gram modeling
Keterangan Singkat:
Mengenalkan cara mengubah teks menjadi format numerik yang bisa diproses oleh mesin.
-
-
-
-
Pertemuan 4 ΓÇö Pra-pemrosesan Teks
Subjudul:
-
Tokenisasi
-
Stopword removal
-
Stemming dan lemmatization
Keterangan Singkat:
Membahas teknik dasar pembersihan data teks agar siap digunakan dalam model analisis.
-
-
-
-
Pertemuan 5 ΓÇö Normalisasi & Ekstraksi Fitur Lanjutan
Subjudul:
-
Normalisasi karakter dan angka
-
POS Tagging
-
Word Embeddings (Word2Vec, GloVe, FastText)
Keterangan Singkat:
Memahami teknik untuk mengoptimalkan fitur teks melalui embedding dan analisis linguistik.
-
-
-
-
Pertemuan 6 ΓÇö Text Classification (Klasifikasi Teks)
Subjudul:
-
Klasifikasi supervised
-
Algoritma: Naive Bayes, Logistic Regression, SVM
-
Evaluasi performa model
Keterangan Singkat:
Belajar membangun model untuk mengelompokkan teks ke dalam kategori tertentu.
-
-
-
-
Pertemuan 7 ΓÇö Text Clustering (Pengelompokan Teks)
Subjudul:
-
K-Means, Hierarchical Clustering
-
Evaluasi Clustering
Keterangan Singkat:
Mengelompokkan teks tanpa label untuk menemukan pola dan tema tersembunyi.
-
-
-
-
Pertemuan 8 ΓÇö Topic Modeling
Subjudul:
-
LDA (Latent Dirichlet Allocation)
-
LSA (Latent Semantic Analysis)
-
Visualisasi topik
Keterangan Singkat:
Mengidentifikasi struktur topik dalam kumpulan dokumen besar.
-
-