30 algoritma untuk prediksi



 Berikut adalah daftar 30 algoritma prediksi yang umum digunakan dalam machine learning beserta penjelasan singkat masing-masing:

Regresi

  1. Linear Regression

    • Mencari hubungan linear antara variabel independen dan dependen.
  2. Ridge Regression

    • Linear regression dengan regularisasi L2 untuk mengurangi overfitting.
  3. Lasso Regression

    • Linear regression dengan regularisasi L1 yang menghasilkan model sparsity.
  4. Elastic Net

    • Kombinasi dari Lasso dan Ridge regression untuk mengatasi kelemahan masing-masing.
  5. Support Vector Regression (SVR)

    • Ekstensi SVM untuk masalah regresi dengan margin error yang diizinkan.
  6. Decision Tree Regression

    • Membuat model regresi dengan pohon keputusan yang membagi dataset menjadi subset.
  7. Random Forest Regression

    • Menggabungkan beberapa pohon keputusan untuk meningkatkan akurasi dan mengurangi overfitting.
  8. AdaBoost Regression

    • Meningkatkan performa model sederhana dengan menggabungkan beberapa model untuk mengurangi error.
  9. Gradient Boosting Regression

    • Membangun model secara bertahap, mengoptimalkan fungsi loss pada setiap iterasi.
  10. K-Nearest Neighbors Regression (KNN)

    • Menggunakan k tetangga terdekat untuk memprediksi nilai output.

Klasifikasi

  1. Logistic Regression

    • Model linier untuk klasifikasi biner.
  2. Support Vector Machine (SVM)

    • Mencari hyperplane yang memisahkan kelas dengan margin terbesar.
  3. Decision Tree Classifier

    • Membuat model klasifikasi berbasis pohon keputusan.
  4. Random Forest Classifier

    • Menggabungkan beberapa pohon keputusan untuk meningkatkan akurasi dan stabilitas.
  5. AdaBoost Classifier

    • Menggabungkan model sederhana dengan bobot yang berbeda untuk meningkatkan performa.
  6. Gradient Boosting Classifier

    • Membuat model secara bertahap dengan mengoptimalkan fungsi loss pada setiap iterasi.
  7. K-Nearest Neighbors Classifier (KNN)

    • Menggunakan k tetangga terdekat untuk menentukan kelas dari sample.
  8. Naive Bayes

    • Menggunakan teorema Bayes dengan asumsi independensi antar fitur.
  9. Linear Discriminant Analysis (LDA)

    • Mencari kombinasi linear dari fitur yang paling memisahkan kelas.
  10. Quadratic Discriminant Analysis (QDA)

    • Mirip dengan LDA, tetapi menggunakan permukaan kuadratik untuk pemisahan.

Clustering

  1. K-Means Clustering

    • Mengelompokkan data ke dalam k cluster berdasarkan centroid.
  2. Hierarchical Clustering

    • Mengelompokkan data dengan pendekatan hierarki (agglomerative atau divisive).
  3. DBSCAN (Density-Based Spatial Clustering of Applications with Noise)

    • Mengelompokkan data berdasarkan kepadatan titik.
  4. Mean Shift Clustering

    • Mengelompokkan data dengan memindahkan centroid menuju kepadatan yang lebih tinggi.
  5. Gaussian Mixture Model (GMM)

    • Mengelompokkan data dengan asumsi bahwa data berasal dari distribusi Gaussian campuran.

Dimensionality Reduction

  1. Principal Component Analysis (PCA)

    • Mengurangi dimensi data dengan mencari komponen utama yang paling bervariasi.
  2. t-Distributed Stochastic Neighbor Embedding (t-SNE)

    • Mengurangi dimensi data untuk visualisasi dengan mempertahankan jarak lokal.
  3. Linear Discriminant Analysis (LDA)

    • Selain untuk klasifikasi, LDA juga digunakan untuk reduksi dimensi dengan mempertahankan informasi kelas.

Neural Networks

  1. Artificial Neural Networks (ANN)

    • Model jaringan saraf tiruan dengan satu atau lebih lapisan tersembunyi untuk menangkap hubungan non-linear.
  2. Convolutional Neural Networks (CNN)

    • Jaringan saraf yang dirancang khusus untuk pengolahan data grid seperti gambar, dengan lapisan konvolusi.

Komentar

Postingan populer dari blog ini

Cross-Industry Standard Process for Data Mining (CRISP-DM)

Sample, Explore, Modify, Model, dan Assess