30 algoritma untuk prediksi

Berikut adalah daftar 30 algoritma prediksi yang umum digunakan dalam machine learning beserta penjelasan singkat masing-masing:

Linear Regression
- Mencari hubungan linear antara variabel independen dan dependen.
Ridge Regression
- Linear regression dengan regularisasi L2 untuk mengurangi overfitting.
Lasso Regression
- Linear regression dengan regularisasi L1 yang menghasilkan model sparsity.
Elastic Net
- Kombinasi dari Lasso dan Ridge regression untuk mengatasi kelemahan masing-masing.
Support Vector Regression (SVR)
- Ekstensi SVM untuk masalah regresi dengan margin error yang diizinkan.
Decision Tree Regression
- Membuat model regresi dengan pohon keputusan yang membagi dataset menjadi subset.
Random Forest Regression
- Menggabungkan beberapa pohon keputusan untuk meningkatkan akurasi dan mengurangi overfitting.
AdaBoost Regression
- Meningkatkan performa model sederhana dengan menggabungkan beberapa model untuk mengurangi error.
Gradient Boosting Regression
- Membangun model secara bertahap, mengoptimalkan fungsi loss pada setiap iterasi.
K-Nearest Neighbors Regression (KNN)
- Menggunakan k tetangga terdekat untuk memprediksi nilai output.

Logistic Regression
- Model linier untuk klasifikasi biner.
Support Vector Machine (SVM)
- Mencari hyperplane yang memisahkan kelas dengan margin terbesar.
Decision Tree Classifier
- Membuat model klasifikasi berbasis pohon keputusan.
Random Forest Classifier
- Menggabungkan beberapa pohon keputusan untuk meningkatkan akurasi dan stabilitas.
AdaBoost Classifier
- Menggabungkan model sederhana dengan bobot yang berbeda untuk meningkatkan performa.
Gradient Boosting Classifier
- Membuat model secara bertahap dengan mengoptimalkan fungsi loss pada setiap iterasi.
K-Nearest Neighbors Classifier (KNN)
- Menggunakan k tetangga terdekat untuk menentukan kelas dari sample.
Naive Bayes
- Menggunakan teorema Bayes dengan asumsi independensi antar fitur.
Linear Discriminant Analysis (LDA)
- Mencari kombinasi linear dari fitur yang paling memisahkan kelas.
Quadratic Discriminant Analysis (QDA)
- Mirip dengan LDA, tetapi menggunakan permukaan kuadratik untuk pemisahan.

K-Means Clustering
- Mengelompokkan data ke dalam k cluster berdasarkan centroid.
Hierarchical Clustering
- Mengelompokkan data dengan pendekatan hierarki (agglomerative atau divisive).
DBSCAN (Density-Based Spatial Clustering of Applications with Noise)
- Mengelompokkan data berdasarkan kepadatan titik.
Mean Shift Clustering
- Mengelompokkan data dengan memindahkan centroid menuju kepadatan yang lebih tinggi.
Gaussian Mixture Model (GMM)
- Mengelompokkan data dengan asumsi bahwa data berasal dari distribusi Gaussian campuran.

Principal Component Analysis (PCA)
- Mengurangi dimensi data dengan mencari komponen utama yang paling bervariasi.
t-Distributed Stochastic Neighbor Embedding (t-SNE)
- Mengurangi dimensi data untuk visualisasi dengan mempertahankan jarak lokal.
Linear Discriminant Analysis (LDA)
- Selain untuk klasifikasi, LDA juga digunakan untuk reduksi dimensi dengan mempertahankan informasi kelas.

Artificial Neural Networks (ANN)
- Model jaringan saraf tiruan dengan satu atau lebih lapisan tersembunyi untuk menangkap hubungan non-linear.
Convolutional Neural Networks (CNN)
- Jaringan saraf yang dirancang khusus untuk pengolahan data grid seperti gambar, dengan lapisan konvolusi.

wildan amin