pre-prosesing

 DATA COLLECTION





Data collection adalah proses pengumpulan informasi dari berbagai sumber untuk keperluan analisis. Sumber data bisa berupa survei, sensor, database, dan lain-lain.




DATA CLEANING
Data cleaning adalah proses untuk memastikan bahwa data yang digunakan bersih dan bebas dari kesalahan atau inkonsistensi. Proses ini termasuk menghapus data duplikat, menangani missing values, mengoreksi kesalahan data, dll.


DATA TRANSFORM


Data transformation adalah proses mengubah format atau struktur data untuk memudahkan analisis. Ini bisa melibatkan scaling, normalisasi, encoding, dll.



DATA REDUCTION
Data reduction adalah proses untuk mengurangi jumlah data yang perlu dianalisis dengan tetap mempertahankan informasi penting. Metode umum termasuk PCA (Principal Component Analysis), seleksi fitur, dll.
















Komentar

Postingan populer dari blog ini

Cross-Industry Standard Process for Data Mining (CRISP-DM)

Sample, Explore, Modify, Model, dan Assess