Metode ensemble: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
Arifahrezi (bicara | kontrib)
Menambahkan keuntungan dan kekurangan dari metode ensemble serta jenis metode ensemble
Baris 4:
 
Algoritma cepat(''fast algorithms'') seperti ''decision trees'' biasanya dipakai dalam metode ensemble ini seperti ''[[random forest]]'', meskipun algoritma yang lebih lambat dapat memperoleh manfaat dari teknik ensemble juga.
 
== Jenis Metode Ensemble ==
Beberapa konsep dasar pada metode ini sebelum dibahas lebih lanjut adalah:
 
Rata-rata: Ini didefinisikan sebagai mengambil rata-rata prediksi dari model dalam kasus masalah regresi atau saat memprediksi probabilitas untuk masalah klasifikasi.
 
{| class="wikitable"
|+
!Sampel1
!Sampel2
!Sampel3
!AvgPredict
|-
|44
|39
|67
|50
|}
Vote: Ini didefinisikan sebagai mengambil prediksi dengan suara / rekomendasi maksimum dari berbagai model prediksi sambil memprediksi hasil dari masalah klasifikasi.
 
{| class="wikitable"
|+
!Sampel1
!Sampel2
!Sampel3
!VotePredict
|-
|1
|0
|1
|1
|}
Weight Rata-rata: Dalam hal ini, bobot yang berbeda diterapkan pada prediksi dari beberapa model kemudian mengambil rata-rata yang berarti memberikan manfaat tinggi atau rendah ke keluaran model tertentu.
 
{| class="wikitable"
|+
!
!Sampel1
!Sampel2
!Sampel3
!WeightAvgPredict
|-
|Weight
|0.4
|0.3
|0.3
|
|-
|Predict
|44
|39
|67
|48
|}
 
== Klasifikasi ==
Baris 23 ⟶ 77:
 
=== Stacking ===
Stacking merupakan cara untuk mengkombinasi beberapa model, dengan konsep meta learner. dipakai setelah bagging dan boosting. tidak seperti bagging dan boosting, stacking memungkinkan mengkombinasikan model dari tipe yang berbeda.
 
<gallery>
Stacking.png|thumb|Figure Stacking
</gallery>
 
== Keuntungan dan Kekurangan ==
Keuntungan
 
* Ensembling adalah metode yang terbukti untuk meningkatkan akurasi model dan bekerja di sebagian besar kasus.
 
* Ini adalah bahan utama untuk memenangkan hampir semua hackathon pembelajaran mesin.
 
* Ensembling membuat model lebih kuat dan stabil sehingga memastikan kinerja yang layak pada uji kasus di sebagian besar skenario.
 
* Untuk menangkap hubungan kompleks linier dan sederhana serta non-linear dalam data. Ini dapat dilakukan dengan menggunakan dua model yang berbeda dan membentuk ensemble dua.
 
Kekurangan
 
* Ensembling mengurangi interpretability model dan membuatnya sangat sulit untuk menarik wawasan bisnis penting di akhir.
 
* Memakan waktu dan dengan demikian mungkin bukan ide terbaik untuk aplikasi real-time.
 
* Pemilihan model untuk menciptakan ensemble adalah seni yang benar-benar sulit untuk dikuasai.
 
== Referensi ==
 
* {{cite book |last=[[Zhou Zhihua]] |first= |date=2012 |title=Ensemble Methods: Foundations and Algorithms |url= |location= |publisher= Chapman and Hall/CRC |isbn=978-1-439-83003-1 }}
* {{cite book |last1=[[Robert Schapire]] |last2=[[Yoav Freund]] |date=2012 |title=Boosting: Foundations and Algorithms |url= |location= |publisher=MIT |isbn=978-0-262-01718-3 }}