Pemelajaran terarah: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
k Fitur saranan suntingan: 2 pranala ditambahkan.
Gombang (bicara | kontrib)
k copyedit
Tag: Suntingan visualeditor-wikitext
 
(2 revisi perantara oleh satu pengguna lainnya tidak ditampilkan)
Baris 1:
{{Refimprove}}
{{pemelajaran mesin|Paradigma}}
Dalam '''pembelajaran terarah''' ({{lang-en|supervised learning}}), seseorang dapat melatih mesin dengan menggunakan data yang "diberi label". Artinya beberapa data sudah diberi label dengan jawaban yang benar. Ini dapat dibandingkan dengan pembelajaran yang berlangsung di hadapan pengawas atau guru. Algoritma pembelajaran yang terarah dapat mempelajari pola tersembunyi dari data pelatihan yang telah berlabel, hal ini akan membantu kita memprediksi hasil untuk data yang belum pernah dipelajari sebelumnya. Untuk dapat berhasil membangun, mengatur, dan menerapkan model mesin pembelajar yang terarah dengan akurasi tinggi, dibutuhkan waktu dan keahlian teknis dari tim peneliti-data (data scientist) yang sangat terampil. Selain itu, para peneliti data sebaiknya harus mampu membangun kembali model untuk memastikan prediksi yang dihasilkan tetap benar walaupun datanya berganti.
'''Pemelajaran terarah''' atau '''pemelajaran terbimbing''' ([[bahasa Inggris]]: ''supervised learning'') adalah sebuah paradigma dalam [[pemelajaran mesin]] yang mana objek masukan (seperti vektor dari variabel prediktor) dan nilai keluaran yang diinginkan (disebut juga sebagai sinyal pengarah yang dilabeli manusia atau ''human-labeled supervisory signal'') digunakan untuk melatih suatu model <ref>{{Cite book|last=Mohri|first=Mehryar|last2=Rostamizadeh|first2=Afshin|last3=Talwalkar|first3=Ameet|date=2012|title=Foundations of machine learning|location=Cambridge, Mass. London|publisher=The MIT Press|isbn=978-0-262-01825-8|series=Adaptive computation and machine learning}}</ref>. Data pelatihan (''training data'') diolah sehingga memungkinkan untuk dapat membangun suatu fungsi yang dapat memetakan data baru ke nilai keluaran yang diharapkan. Situasi yang optimal akan memungkinkan algoritma yang digunakan untuk dengan tepat menentukan nilai keluaran pada contoh yang belum pernah dilihat sebelumnya. Untuk mencapai hal ini, diperlukan algoritma pembelajaran untuk dapat menggeneralisasi data latih ke situasi baru dengan cara yang "masuk akal" (lihat: [[kecenderungan induktif]]). Kualitas statistik dari suatu algoritma diukur melalui apa yang disebut sebagai [[kesalahan generalisasi]] (''generalization error'').
 
PembelajaranPemelajaran terarah memungkinkan kita untuk mengumpulkan data atau menghasilkan keluaran data berdasarkan dari pengalaman sebelumnya. Hal ini dapat membantu mengoptimalkan kriteria kinerja berdasarkan pengalaman mesin. PembelajaranPemelajaran terarah juga dapat membantu memecahkan berbagai jenis masalah komputasi dunia nyata.<ref>{{Cite web|title=Supervised vs Unsupervised Learning: Key Differences|url=https://www.guru99.com/supervised-vs-unsupervised-learning.html|website=www.guru99.com|access-date=2020-11-19}}</ref>
 
Pada tahun 2006, Caruana, Rich <ref>{{Cite journal|last=Caruana|first=Rich|last2=Niculescu-Mizil|first2=Alexandru|date=2006-06-25|title=An empirical comparison of supervised learning algorithms|url=https://doi.org/10.1145/1143844.1143865|journal=Proceedings of the 23rd international conference on Machine learning|series=ICML '06|location=Pittsburgh, Pennsylvania, USA|publisher=Association for Computing Machinery|pages=161–168|doi=10.1145/1143844.1143865|isbn=978-1-59593-383-6}}</ref> mempublikasikan hasil penelitiannya mengenai perbandingan secara empiris pemelajaran terarah dengan adanya Proyek Statlog di tahun 90-an. Mereka membandingakan beberapa pemelajaran terarah seperti Support Vector Machine (SVM), Jaringan Syaraf Tiruan (Neural Nets), regresi logistik, naive bayes, pemelajaran berbasis memori, Hutan Acak (Random Forest), Decision Tree (Pohon Keputusan), Bagged Trees, Boosted Trees dan Boosted Stumps. Mereka melakukan pengujian performa terhadap efek [[kalibrasi]] model melalui Platt Scaling dan Regresi Isotonik. Hal yang perlu diangkat dari kary mereka adalah penggunaan berbagai macam kriteria pengujian performa mesin pemelajar.
Baris 11 ⟶ 12:
== Jenis ==
 
* '''Regresi:''' tenikteknik regresi memprediksi nilai keluaran tunggal dengan menggunakan data pelatihan. Contohnya: kita dapat menggunakan regresi untuk memprediksi harga rumah dari data pelatihan. Variabel masukan adalah lokasi, ukuran rumah, dan lain sebagainya.
* '''Klasifikasi:''' mengelompokkan keluaran ke dalam kelas tertentu. Jika algoritma mencoba memberi label masukan ke dalam dua kelas yang berbeda, maka disebut klasifikasi biner. Pemilihan di antara lebih dari dua kelas yang berbeda dapat disebut sebagai klasifikasi multikelas. Contohnya: bagaimana memprediksi apakah seseorang akan membatalkan pinjaman ataukah tidak.