Bila menjalankan pembersihan dan penyusunan data adalah disarankan untuk membuat nota-nota mengenai langkah-langkah yang diambil dalam menyelesaikan kerja. Ini adalah sebagai nasihat berkenaan dengan aliran kerja yang boleh dibuat supaya rujukan akan lebih jelas dan senang untuk dipakai beberapa kali.
Bahagikan kerja-kerja menyusun dan membersikan data kepada bahagian seperti berikut:
- Data asal (raw data)
- Pemeriksaan (validation)
- Pembetulan tambahan (additional info.)
Data asal
Bahagian ini ialah berkaitan dengan kerja-kerja secara langusung dari data asal. Dimana data tersebut diambil dan sekiranya terdapat kerja-kerja menggabungkan dengan data-data lain. Selain itu pembersihan teknikal seperti kode yang salah.
Pemeriksaan
Ini adalah kumpulan kerja-kerja berkaitan dengan pemeriksaan data. Contohnya umur yang melebihi 150 tahun atau ketinggian 3 meter. Adakah informasi tersebut betul atau kesalahan semasa pendaftaran data.
Pembetulan tambahan
Data juga boleh bertukar disebabkan informasi tambahan yang diberikan selepas kerja-kerja pembersihan dari data asal dan pemeriksaan data yang tidak logik dibuat. Kebanyakkan pembetulan yang dibuat di sini dijalankan secara manual dan berasaskan kepada informasi tambahan yang tidak terdapat di data asal.