Identifikasi objek merupakan sebuah aktivitas kualitas data yang penting, hal ini dikarenakan proses perubahan data yang beragam dan kemungkinan kesalahan dalam entri data dan proses saat pengupdatean, objek memiliki representasi dan nilai yang berbeda dalam database yang berbeda. Sebagai akibatnya, hilangnya identitas yang jelas dapat memengaruhi objek, sehingga membahayakan kemungkinan rekonstruksu ulang informasi yang tersebar dimana-mana pada sumber-sumber yang berbeda. Teknik identifikasi objek bertujuan memperbaiki identitas yang hilang, teknik ini menggunakan informasi konteks yang tersedia pada kesamaan representasi objek dalam hal daftar elemen-elemen sebuah objek, hubungan hierarkis, dan file XML. Konsep "informasi konteks yang tersedia" dan "kemiripan" diformalkan dalam berbagai cara dalam teknik berbasis probabilistik, empiris, dan pengetahuan. Selain itu, teknik yang diusulkan dalam tiga bidang dapat dikarakteristikkan secara berbeda sehubungan dengan tingkat adopsi, efisiensinya, dan efektivitasnya. Teknik probabilistik muncul sebagai yang paling banyak diadopsi, karena keunggulan relatifnya dan pengalaman yang diperoleh dari aplikasi yang menggunakan teknik ini. Teknik empiris memiliki efisiensi sebagai tujuan utama, dan dengan demikian sangat cocok untuk aplikasi yang kritis waktu. Teknik berbasis pengetahuan memiliki potensi efektivitas terbaik, karena pemodelan eksplisit pengetahuan domain.