Setelah sebelumnya kita mempelajari apa yang dimaksud dengan decision tree atau pohon keputusan, ada baiknya kita kembali mempelajari metode yang juga erat kaitannya dengan metode tersebut. Adalah classification and regression tree (CART), kedua metode algoritma ini sangat berkaitan dengan proses data dalam pengambilan keputusan.
Kedua metode ini dikembangkan oleh oleh Leo Breiman, Jerome H. Fridman, Richard S. Olshen dan Charles J. Metode klasifikasi CART merupakan metode nonparametrik yang berguna untuk mendapatkan suatu kelompok data yang akurat sebagai penciri dari suatu pengklasifikasian.
Metode klasifikasi CART terdiri dari dua metode yaitu metode regression dan pohon klasifikasi. Jika variabel dependen yang dimiliki bertipe kategorik maka CART menghasilkan pohon klasifikasi (classification trees). Sedangkan jika variabel dependen yang dimiliki bertipe kontinu atau numerik maka CART menghasilkan pohon regresi (regression trees). Namun, jika dijabarkan secara garis besar, classification adalah metode yang paling umum pada data mining.
Persoalan bisnis seperti Churn Analysis, dan Risk Management biasanya lebih melibatkan metode classification dibandingkan regression. Metode ini bekerja dengan mengelompokan setiap pola atau data dalam sebuah kelas-kelas tertentu. Tujuan dari metode classification adalah untuk menemukan model yang dapat menjelaskan class attribute yang terdapat dalam pola yang sudah dikelompokkan tersebut.

Sementara itu, untuk metode regression sendiri memang secara keseluruhan tidak jauh berbeda dengan metode classification. Namun, yang membedakannya hanyalah metode regression tidak bisa mencari pola yang dijabarkan sebagai sebuah kelompok atau kelas.
Metoda regression sendiri bertujuan untuk mecari pola dan menentukan sebuah nilai numerik. Sebuah Teknik Linear Line-fitting sederhana adalah sebuah contoh dari metode regression, dimana hasilnya adalah sebuah fungsi untuk menentukan hasil yang berdasarkan nilai dari input.
Bentuk yang lebih canggih dari regression sudah mendukung input berupa kategori, jadi tidak hanya input berupa numerik. Teknik paling popular yang digunakan untuk regression adalah linear regression dan logistic regression. Teknik lain yang didukung oleh SQL Server Data mining adalah Regression Trees (bagian dari dari algoritma Microsoft Decission Trees) dan Neural Network.
Regression digunakan untuk memecahkan banyak problem bisnis ΓÇö misalnya dilakukan dengan metode Analisis Rasio Keuangan, Sumber Penggunaan Kas, Perbandingan Laporan Keuangan dalam memperkirakan Kinerja Keuangan berdasarkan temperatur, tekanan udara, dan kelembaban.