Apa itu Arsitektur Gudang Data?

Arsitektur gudang data adalah desain yang merangkum semua aspek pergudangan data untuk lingkungan perusahaan. Data warehousing adalah pembuatan domain pusat untuk menyimpan data perusahaan yang kompleks dan terdesentralisasi dalam unit logis yang memungkinkan penambangan data , intelijen bisnis, dan akses keseluruhan ke semua data yang relevan dalam suatu organisasi. Arsitektur gudang data mencakup semua persyaratan pelaporan, manajemen data , persyaratan keamanan, persyaratan lebar pita, dan persyaratan penyimpanan.

Data warehousing adalah pembuatan domain pusat untuk menyimpan data perusahaan yang kompleks dan terdesentralisasi dalam unit logis yang memungkinkan penambangan data, intelijen bisnis, dan akses keseluruhan ke semua data yang relevan dalam suatu organisasi.

Saat membuat arsitektur gudang data, penting untuk memecah arsitektur menjadi domain tertentu yang digabungkan menjadi desain akhir holistik. Desain ini harus dipertimbangkan sebagai cetak biru untuk arsitektur data perusahaan . Secara khusus, beberapa area utama harus dikembangkan ketika mempertimbangkan arsitektur gudang data. Area-area ini adalah akses sistem sumber, proses area pementasan, proses pengayaan data, arsitektur data, proses intelijen bisnis, dan persyaratan penyimpanan.

Gudang data yang terstruktur dengan baik dapat ‘ditambang’ nanti untuk wawasan yang berharga.

Data warehousing membutuhkan data sumber yang akan ditransfer dari transaksional atau database record ke dalam data warehouse. Proses ini disederhanakan menjadi istilah Extract Transform and Load ( ETL ), yang pada dasarnya merangkum area akses sistem sumber, pengayaan data, dan arsitektur data. Demi kejelasan, lebih baik untuk merancang area arsitektur ini secara detail, yang menguraikan bagaimana proses ETL akan dicapai. Sementara beberapa data diperlukan dari sistem sumber, semua data tidak diinginkan karena akan membebani gudang perusahaan. Area utama yang menjadi perhatian saat menangani lapisan sistem sumber adalah metodologi akses data, data yang diperlukan dari sistem sumber, dan persyaratan penyegaran.

Lapisan arsitektur pergudangan data berikutnya yang perlu dipertimbangkan adalah proses staging area. Karena sebagian besar data dari sistem sumber akan memerlukan validasi dan pembersihan data , penting untuk membuat zona pendaratan agar data sumber berada sebelum dimuat ke lapisan aturan bisnis gudang data. Area pementasan mempertahankan umpan data mentah dari sistem sumber yang biasanya diberi cap waktu untuk memastikan keterkinian data.

Proses pengayaan data atau aturan bisnis adalah tempat data dibersihkan untuk memenuhi hasil yang diinginkan dari gudang data. Contoh yang baik dari pendekatan pembersihan ini adalah menggunakan alat pembersihan alamat; dalam hal sistem sumber memiliki data yang salah, proses pengayaan data akan menjalankan alamat dari kumpulan data mentah ke dalam sistem aturan bisnis yang akan memperbaiki alamat yang tidak valid. Ini juga merupakan waktu di mana data yang tidak akurat dihapus atau dimodifikasi untuk memastikan kelengkapan dalam gudang data.

Lapisan berikutnya yang perlu dipertimbangkan adalah lapisan arsitektur data. Area ini adalah tempat desain atau skema sebenarnya dari gudang data perusahaan selesai. Data warehousing bukan merupakan kombinasi dari semua kumpulan data dalam suatu perusahaan, melainkan database baru yang dibuat untuk memungkinkan tinjauan umum semua entitas bisnis di dalam perusahaan.

Ini membutuhkan arsitektur data untuk menjawab pertanyaan yang akan diajukan oleh bisnis di bidang intelijen bisnis dan penambangan data. Dengan membuat arsitektur data dengan cara ini, kumpulan data mentah akan diubah menjadi tabel fakta yang akan memungkinkan pengguna untuk melakukan pelaporan ad-hoc pada seluruh tampilan perusahaan daripada database tertentu. Ini juga merupakan area yang akan memelihara metadata tentang data dari sistem mentah, yang dapat mencakup nama sistem sumber atau kunci utama.

Area berikutnya yang perlu dipertimbangkan adalah intelijen bisnis dan persyaratan pelaporan. Lapisan ini dapat dianggap sebagai persyaratan yang dihadapi pengguna untuk pergudangan data. Biasanya, area ini berisi laporan kalengan, kemampuan pelaporan ad-hoc, dan papan dasbor atau peringatan perusahaan. Lapisan intelijen bisnis biasanya mendapatkan pertimbangan paling banyak, karena merupakan satu-satunya komponen yang menghadap ke luar dalam gudang data.

Lapisan terakhir untuk dipertimbangkan adalah persyaratan dan pemeliharaan penyimpanan data secara keseluruhan . Karena gudang data terus tumbuh dan berkembang, penyimpanan data basis pengguna harus dikelola dan dipelihara dengan ketat. Selain itu, saat membuat arsitektur gudang data, desain harus membuat perkiraan realistis tentang apa yang akan dibutuhkan dari kapasitas penyimpanan data serta band dengan kapasitas akses data. Persyaratan ini akan sangat penting karena gudang data digunakan secara luas di seluruh perusahaan.