Kesimpulan Data Quality Issues in Data Integration

Kesimpulan Data Quality Issues in Data Integration

oleh Randy Raharja -
Jumlah balasan: 0

Data integrasi dan kualitas data adalah dua buah konsep yang saling terkaitan antar satu sama lain. Kualitas data adalah bagian penting dari setiap proses integrasi data. Hal ini dapat dianggap sebagai langkah pertama untuk proses integrasi, karena data berkualitas adalah kunci untuk mendapatkan informasi yang berguna. Analisis integrasi data tidak akan berhasil sampai proses kualitas data yang baik sudah ada. Di satu sisi, integrasi data dapat mengambil manfaat dari kualitas data. Teknik pemrosesan query yang didasarkan oleh kualitas bertujuan untuk memilih dan mengakses data dengan kualitas tertinggi, sehingga memperoleh manfaat maksimum dari konteks dengan berbagai sumber dengan berbagai aset kualitas datanya. Dalam konteks umum, seperti sistem P2P, teknik ini menjadi semakin dibutuhkan. Di sisi lain, secara intuitif sebagian besar masalah kualitas data menjadi jelas ketika data di satu sumber dibandingkan dengan data serupa yang disimpan di sumber yang berbeda. Setelah terdeteksi, ada kebutuhan untuk sebuah mekanisme yang memungkinkan sistem integrasi data untuk melakukan fungsi pemrosesan query yang tepat. Teknik-teknik ini adalah teknik resolusi konflik yang memainkan peran penting dalam mendukung pemrosesan query dalam sistem integrasi data virtual. Perhatikan bahwa pilihan penyelesaian konflik pada saat pemrosesan query merupakan alternatif dari pilihan pembersih sumber data yang lebih membutuhkan resource sebelum benar-benar terintegrasi. Hal ini memerlukan proses peningkatan kualitas data yang dilakukan secara independen oleh masing-masing sumber, dan karenanya kompleksitas dan biayanya akan tumbuh pula. Dalam praktiknya, integrasi data, misalnya, pada data warehouse, proses pembersihan dilakukan saat pengisian global.