Postingan

30 algoritma untuk prediksi

Gambar
 Berikut adalah daftar 30 algoritma prediksi yang umum digunakan dalam machine learning beserta penjelasan singkat masing-masing: Regresi Linear Regression Mencari hubungan linear antara variabel independen dan dependen. Ridge Regression Linear regression dengan regularisasi L2 untuk mengurangi overfitting. Lasso Regression Linear regression dengan regularisasi L1 yang menghasilkan model sparsity. Elastic Net Kombinasi dari Lasso dan Ridge regression untuk mengatasi kelemahan masing-masing. Support Vector Regression (SVR) Ekstensi SVM untuk masalah regresi dengan margin error yang diizinkan. Decision Tree Regression Membuat model regresi dengan pohon keputusan yang membagi dataset menjadi subset. Random Forest Regression Menggabungkan beberapa pohon keputusan untuk meningkatkan akurasi dan mengurangi overfitting. AdaBoost Regression Meningkatkan performa model sederhana dengan menggabungkan beberapa model untuk mengurangi error. Gradient Boosting Regression Membangun model secara b...

pre-prosesing

Gambar
 DATA COLLECTION Data collection adalah proses pengumpulan informasi dari berbagai sumber untuk keperluan analisis. Sumber data bisa berupa survei, sensor, database, dan lain-lain. DATA CLEANING Data cleaning adalah proses untuk memastikan bahwa data yang digunakan bersih dan bebas dari kesalahan atau inkonsistensi. Proses ini termasuk menghapus data duplikat, menangani missing values, mengoreksi kesalahan data, dll. DATA TRANSFORM Data transformation adalah proses mengubah format atau struktur data untuk memudahkan analisis. Ini bisa melibatkan scaling, normalisasi, encoding, dll. DATA REDUCTION Data reduction adalah proses untuk mengurangi jumlah data yang perlu dianalisis dengan tetap mempertahankan informasi penting. Metode umum termasuk PCA (Principal Component Analysis), seleksi fitur, dll.

QUIZ DATA MINING

Gambar
 1. Integrasi dan pembersihan data Cari IPS setiap semester permahasiswa. ini bisa memudahkan untuk normalisasi data 1) Perkalian SKS dengan Nilai: Pertama, dilakukan perhitungan nilai total untuk setiap mata kuliah dengan mengalikan jumlah SKS (Satuan Kredit Semester) dari setiap mata kuliah dengan nilai grade yang diperoleh mahasiswa dalam mata kuliah tersebut. Ini dilakukan dengan menggunakan kode df_transkip_nilai['nilai_total'] = df_transkip_nilai['sks_mk'] * df_transkip_nilai['nilai_grade']. 2) Pengelompokkan Data: Data kemudian dikelompokkan berdasarkan NIM (Nomor Induk Mahasiswa) dan semester. Ini dilakukan dengan menggunakan fungsi groupby pada dataframe df_transkip_nilai, dengan kolom-kolom 'nim' dan 'semester' sebagai kunci pengelompokan. 3) Aggregasi Data: Setelah pengelompokkan, dilakukan agregasi data untuk setiap kelompok. Jumlah SKS dan nilai total dijumlahkan untuk setiap kelompok menggunakan fungsi sum() pada kolom 'sks_mk...

DATA VISUALIZATION

Gambar
  Data visualization, atau visualisasi data, adalah proses representasi visual dari data. Ini membantu dalam mengidentifikasi pola, tren, dan outlier dalam data. Berikut adalah beberapa jenis visualisasi data yang umum: Histogram: Menunjukkan distribusi frekuensi dari sebuah dataset. Line Chart: Menunjukkan tren data sepanjang waktu. Bar Chart: Digunakan untuk membandingkan jumlah/nilai antar kategori. Scatter Plot: Menunjukkan hubungan antara dua variabel. Heatmap: Menampilkan intensitas fenomena sebagai warna dalam dua dimensi. Berikut contoh dalam google collab:

DATA PREPARATION

Gambar
  Data preparation, atau persiapan data, melibatkan proses membersihkan dan mengorganisir data agar siap untuk dianalisis. Langkah ini sangat penting karena kualitas data yang baik merupakan kunci untuk mendapatkan insight yang akurat. Berikut adalah beberapa tugas yang biasa dilakukan dalam proses persiapan data: 1. Pembersihan Data: Mengidentifikasi dan mengoreksi kesalahan atau inkonsistensi dalam data, seperti nilai yang hilang, typo, atau format yang salah. 2. Penanganan Nilai yang Hilang: Menentukan strategi untuk mengatasi nilai yang hilang, misalnya dengan menghapus baris/kolom yang memiliki nilai hilang atau menggantinya dengan nilai tertentu seperti rata-rata atau median. 3. Transformasi Data: Mengubah data ke dalam format yang lebih sesuai untuk analisis, misalnya mengubah tipe data, normalisasi, atau standarisasi nilai. 4. Pengurangan Dimensi: Mengurangi jumlah variabel/fitur yang digunakan dalam analisis, misalnya melalui seleksi fitur atau ekstraksi fitur. berikut con...

Computational, Cognitive, dan Communication

Gambar
 Dalam dunia teknologi dan ilmu pengetahuan, istilah "computational", "cognitive", dan "communication" sering muncul, masing-masing merujuk pada area yang berbeda tetapi saling terkait. Mari kita jelajahi definisi dari ketiga istilah tersebut beserta contohnya untuk memahami perbedaan dan aplikasinya dalam berbagai konteks. 1. Computational Definisi: Computational berkaitan dengan proses yang menggunakan komputer untuk melakukan perhitungan atau pemrosesan data. Ini meliputi pengembangan algoritma, pemodelan dan simulasi sistem, serta analisis data menggunakan teknik komputasi. Computational sering kali berhubungan dengan pemecahan masalah matematis dan ilmiah yang kompleks yang sulit atau tidak mungkin dipecahkan dengan cara manual. Contoh: Pemodelan Cuaca dan Iklim: Penggunaan superkomputer untuk menjalankan model kompleks yang memprediksi perubahan cuaca dan iklim. Bioinformatika: Penggunaan teknik komputasi untuk menganalisis data biologis, seperti uru...

Sample, Explore, Modify, Model, dan Assess

Gambar
 SEMMA merupakan singkatan dari Sample, Explore, Modify, Model, dan Assess. Ini adalah metodologi yang dikembangkan oleh SAS Institute untuk melakukan proses data mining yang efektif. SEMMA menyediakan panduan langkah demi langkah untuk memindai data besar dan mengubahnya menjadi pengetahuan yang berharga. Berikut ini adalah penjelasan setiap tahap dalam SEMMA, beserta contohnya. 1. Sample (Sampel) Definisi: Tahap ini melibatkan pemilihan sampel data dari kumpulan data yang lebih besar. Tujuannya adalah untuk membuat kumpulan data yang lebih kecil dan lebih manajemen untuk analisis awal, tanpa mengorbankan representasi statistik dari data tersebut. Contoh: Sebuah perusahaan e-commerce ingin menganalisis perilaku pembelian pelanggan. Dari jutaan transaksi, perusahaan tersebut memilih 10.000 transaksi secara acak dari setiap kategori produk sebagai sampel untuk analisis awal. 2. Explore (Eksplorasi) Definisi: Tahap eksplorasi data melibatkan pemeriksaan awal dari data sampel untuk me...