Bila menjalankan pembersihan dan penyusunan data adalah disarankan untuk membuat nota-nota mengenai langkah-langkah yang diambil dalam menyelesaikan kerja. Ini adalah sebagai nasihat berkenaan dengan aliran kerja yang boleh dibuat supaya rujukan akan lebih jelas dan senang untuk dipakai beberapa kali.

Bahagikan kerja-kerja menyusun dan membersikan data kepada bahagian seperti berikut:

  1. Data asal (raw data)
  2. Pemeriksaan (validation)
  3. Pembetulan tambahan (additional info.)

Data asal

Bahagian ini ialah berkaitan dengan kerja-kerja secara langusung dari data asal. Dimana data tersebut diambil dan sekiranya terdapat kerja-kerja menggabungkan dengan data-data lain. Selain itu pembersihan teknikal seperti kode yang salah.

Pemeriksaan

Ini adalah kumpulan kerja-kerja berkaitan dengan pemeriksaan data. Contohnya umur yang melebihi 150 tahun atau ketinggian 3 meter. Adakah informasi tersebut betul atau kesalahan semasa pendaftaran data.

Pembetulan tambahan

Data juga boleh bertukar disebabkan informasi tambahan yang diberikan selepas kerja-kerja pembersihan dari data asal dan pemeriksaan data yang tidak logik dibuat. Kebanyakkan pembetulan yang dibuat di sini dijalankan secara manual dan berasaskan kepada informasi tambahan yang tidak terdapat di data asal.

code 
comments powered by Disqus