Integrasi Data

Integrasi Data

oleh Mohamad Dafa Alfian Kurniawan -
Jumlah balasan: 0

1. * Ekstraksi Data (Extraction): PDI memungkinkan pengguna untuk mengambil data dari berbagai sumber, seperti database relasional, file CSV, XML, JSON, API, atau bahkan data tak terstruktur.

   * Transformasi Data (Transformation): Transformasi ini memastikan data dari berbagai sumber dikonsolidasikan dalam format yang konsisten dan sesuai dengan kebutuhan analisis.

   * Pemuatan Data (Loading): Setelah transformasi, data dapat dimuat ke dalam berbagai target, seperti data warehouse, database lain, atau sistem analitik.

PDI sangat penting karena Mendukung Integrasi Data Multisumber Efesiensi operasional dan juga Kualitas data yang lebih baik.

2. * Langkah-Langkah dalam membuat transformation:

  1. Buat Transformation Baru:

    • Buka Spoon (antarmuka grafis PDI).
    • Pilih File > New > Transformation.
  2. Tambahkan Input Data:

    • Tambahkan step untuk mengambil data dari sumber, misalnya Table Input, CSV Input, atau JSON Input.
    • Konfigurasikan koneksi ke sumber data, seperti database atau file.
  3. Tambahkan Step Transformasi:

    • Gunakan step seperti Filter Rows, Sort Rows, Calculator, atau String Operations untuk memodifikasi data sesuai kebutuhan.
    • Anda dapat menambahkan dan menghubungkan beberapa step untuk membuat alur data.
  4. Tambahkan Output Data:

    • Tambahkan step untuk memuat data ke tujuan, seperti Table Output, CSV Output, atau Excel Output.
    • Konfigurasikan koneksi dan pengaturan penyimpanan.
  5. Jalankan Transformation:

  • Klik ikon Run untuk menjalankan transformation dan melihat log proses.

    * Langkah-Langkah membuat Job:

  1. Buat Job Baru:

    • Buka Spoon.
    • Pilih File > New > Job.
  2. Tambahkan Start Step:

    • Drag-and-drop step Start untuk menandai titik awal eksekusi job.
  3. Tambahkan Transformation:

    • Tambahkan step Transformation untuk mengeksekusi transformation yang sudah dibuat.
    • Tautkan step ini dengan Start menggunakan panah.
  4. Tambahkan Langkah Orkestrasi:

    • Gunakan langkah seperti File Exists, Job, atau Script untuk memvalidasi, memproses, atau menjalankan tugas tambahan.
    • Konfigurasikan dependensi antara langkah-langkah untuk menciptakan alur kerja.
  5. Jalankan Job:

  • Klik ikon Run untuk menjalankan job dan melihat log proses.
  • Bisa mencakup penanganan kesalahan, percabangan logika (conditional flows), dan pengulangan proses.

Cara bagaimana Job dan Transformation bekerja sama dalam ETL:

a. Ekstraksi (Extract):

> Transformation mengambil data dari berbagai sumber menggunakan step seperti Table Input atau CSV Input.

b. Transformasi (Transform):

> Transformation memproses data, membersihkannya, dan menerapkan aturan bisnis.

c. Pemuatan (Load):

> Data yang telah ditransformasikan dimuat ke dalam target seperti data warehouse atau file menggunakan step seperti Table Output.

d. Otomasi dan Orkestrasi:

> Job mengelola eksekusi transformation secara otomatis, misalnya dengan menjadwalkannya untuk berjalan pada waktu tertentu atau mengelola alur kerja yang kompleks.