Pembersihan data, juga dikenal sebagai penggosokan data , adalah proses untuk memastikan bahwa sekumpulan data benar dan akurat. Selama proses ini, catatan diperiksa untuk akurasi dan konsistensi, dan mereka dikoreksi atau dihapus seperlunya. Ini dapat terjadi dalam satu kumpulan rekaman atau di antara beberapa kumpulan data yang perlu digabungkan atau yang akan bekerja bersama.
Sebuah program dapat diatur untuk menghapus semua catatan yang belum diperbarui dalam lima tahun sebelumnya.
Proses Sederhana
Pada bentuknya yang paling sederhana, pembersihan data melibatkan seseorang atau beberapa orang membaca serangkaian catatan dan memverifikasi keakuratannya. Kesalahan pengetikan dan ejaan diperbaiki, data yang salah diberi label diberi label dan diarsipkan dengan benar, dan entri yang tidak lengkap atau hilang dilengkapi. Operasi ini sering membersihkan arsip yang kedaluwarsa atau tidak dapat dipulihkan sehingga tidak memakan tempat dan menyebabkan operasi yang tidak efisien.
Proses Kompleks
Dalam operasi yang lebih kompleks, pembersihan data dapat dilakukan oleh program komputer. Program-program ini dapat memeriksa data dengan berbagai aturan dan prosedur yang diputuskan oleh pengguna. Sebuah program dapat diatur untuk menghapus semua catatan yang belum diperbarui dalam lima tahun sebelumnya, mengoreksi kata-kata yang salah eja dan menghapus salinan duplikat. Program yang lebih kompleks mungkin dapat mengisi kota yang hilang berdasarkan kode pos yang benar atau mengubah harga semua item dalam database ke jenis mata uang lain.
Manfaat
Pembersihan data sangat penting untuk efisiensi bisnis yang bergantung pada data. Jika beberapa klien dalam database tidak memiliki nomor telepon yang akurat, misalnya, karyawan tidak dapat dengan mudah menghubungi mereka. Jika alamat email klien tidak diformat dengan benar, sebagai contoh lain, sistem email otomatis tidak akan dapat mengirimkan kupon terbaru dan penawaran khusus. Tugas pembersihan data adalah untuk memastikan bahwa data dalam suatu sistem sudah benar, sehingga sistem dapat menggunakan data tersebut. Catatan yang tidak akurat atau tidak lengkap tidak banyak berguna bagi siapa pun.
Kapan pun dua sistem data perlu bekerja bersama, pembersihan data menjadi lebih penting. Jika sebuah perusahaan memiliki dua cabang yang bekerja dengan banyak pelanggan yang sama, tidak hanya data di setiap cabang harus lengkap dan akurat, kedua cabang juga harus memiliki data yang cocok. Ketika pelanggan memperbarui nomor teleponnya dengan satu cabang, data di cabang lain perlu diperbarui dengan informasi yang sama untuk memastikan efisiensi tertinggi. Pembersihan data berfungsi tidak hanya untuk memastikan bahwa data akurat tetapi juga konsisten di antara catatan yang berbeda.
Setiap kali banyak data disimpan, kesalahan pasti akan merayap ke dalam sistem. Tujuan pembersihan data adalah untuk meminimalkan kesalahan ini dan membuat data menjadi berguna dan bermakna mungkin. Tanpa proses ini dilakukan secara teratur, kesalahan dan kesalahan dapat bertambah, menyebabkan pekerjaan yang kurang efisien dan lebih banyak komplikasi.