Tahapan pembersihan data teks seperti noise removal, case folding, tokenization, stopword removal, stemming, serta transformasi data menjadi format yang siap dianalisis.