Pemelajaran mesin: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
kTidak ada ringkasan suntingan
Penggantian kata pembelajaran menjadi pemelajaran sesuai dengan padanan kata yang lebih benar
Baris 1:
{{Pemelajaran mesin}}
'''Pemelajaran mesin''', cabang dari [[kecerdasan buatan]] adalah suatu bidang kajian yang berfokus pada pengembangan dan studi mengenai [[Statistika komputasi|algoritma statistik]] yang dapat secara efektif melakukan [[generalisasi]] dan sebagai hasilnya, dapat mengerjakan tugas-tugas yang diberikan tanpa instruksi secara eksplisit.{{refn|Definisi "tanpa harus diprogram secara eksplisit" sering dikaitkan dengan [[Arthur Samuel]], pencipta istilah "machine learning" pada tahun 1959. Namun, frasa ini tidak ditemukan secara harfiah dalam publikasi tersebut dan mungkin merupakan parafrase yang muncul kemudian. Rujuk "Parafrase Arthur Samuel (1959), the question is: How can computers learn to solve problems without being explicitly programmed?" dalam {{Cite conference |chapter=Automated Design of Both the Topology and Sizing of Analog Electrical Circuits Using Genetic Programming |conference=Artificial Intelligence in Design '96 |last1=Koza |first1=John R. |last2=Bennett |first2=Forrest H. |last3=Andre |first3=David |last4=Keane |first4=Martin A. |title=Artificial Intelligence in Design '96 |date=1996 |publisher=Springer, Dordrecht |pages=151–170 |language=en |doi=10.1007/978-94-009-0279-4_9 |isbn=978-94-010-6610-5 }}}} Baru-baru ini, [[jaringan syaraf tiruan]] generatif telah mampu melampaui banyak pendekatan sebelumnya dari segi kinerja.<ref name="ibm">{{Cite web |title=What is Machine Learning? |url=https://www.ibm.com/topics/machine-learning |access-date=2023-06-27 |website=IBM |language=en-us}}</ref><ref name=":6">{{Cite web |last=Zhou |first=Victor |date=2019-12-20 |title=Machine Learning for Beginners: An Introduction to Neural Networks |url=https://towardsdatascience.com/machine-learning-for-beginners-an-introduction-to-neural-networks-d49f22d238f9 |url-status=live |access-date=2021-08-15 |website=Medium |language=en |archive-date=2022-03-09 |archive-url=https://web.archive.org/web/20220309053518/https://towardsdatascience.com/machine-learning-for-beginners-an-introduction-to-neural-networks-d49f22d238f9 }}</ref> Pendekatan pembelajaranpemelajaran mesin ini telah diterapkan di banyak bidang, seperti [[model bahasa besar|model bahasa besar]] (''large language model'' (LLM)), [[penglihatan komputer|visi komputer]], [[pengenalan ucapan]], [[penyaringan email]], [[agrikultur]], dan [[kedokteran]], di mana biaya yang diperlukan untuk mengembangkan algoritma secara manual untuk melaksanakan tugas-tugas tersebut menjadi terlalu tinggi.<ref name="tvt">{{Cite journal |last1=Hu |first1=Junyan |last2=Niu |first2=Hanlin |last3=Carrasco |first3=Joaquin |last4=Lennox |first4=Barry |last5=Arvin |first5=Farshad |date=2020 |title=Voronoi-Based Multi-Robot Autonomous Exploration in Unknown Environments via Deep Reinforcement Learning |journal=IEEE Transactions on Vehicular Technology |volume=69 |issue=12 |pages=14413–14423 |doi=10.1109/tvt.2020.3034800 |s2cid=228989788 |issn=0018-9545 |doi-access=free }}</ref><ref name=":7">{{cite journal |last1=Yoosefzadeh-Najafabadi|first1=Mohsen |last2=Hugh |first2=Earl |last3=Tulpan |first3=Dan |last4=Sulik |first4=John |last5=Eskandari |first5=Milad |title=Application of Machine Learning Algorithms in Plant Breeding: Predicting Yield From Hyperspectral Reflectance in Soybean? |journal=Front. Plant Sci. |volume=11 |year=2021 |pages=624273|doi=10.3389/fpls.2020.624273 |pmid=33510761 |pmc=7835636 |doi-access=free }}</ref>
 
Landasan matematis dari pembelajaranpemelajaran mesin diambil dari metode [[Optimisasi|optimisasi matematis]] (pemrograman matematis). [[Penggalian data]] (''data mining'') adalah bidang studi terkait (paralel) yang berfokus pada [[analisis data eksploratif]] melalui [[pemelajaran tak terarah|pembelajaranpemelajaran tak terarah]].{{refn|Machine learning dan pengenalan pola "dapat dilihat sebagai dua aspek dari satu bidang yang sama".<ref name="bishop2006" />{{rp|vii}}}}<ref>{{cite journal |last=Friedman |first=Jerome H. |author-link = Jerome H. Friedman|title=Data Mining and Statistics: What's the connection? |journal=Computing Science and Statistics |volume=29 |issue=1 |year=1998 |pages=3–9}}</ref>
 
Pemelajaran mesin dikenal dalam aplikasinya dalam menyelesaikan masalah bisnis dengan nama [[analisis prediktif]]. Meskipun tidak semua algoritma pembelajaranpemelajaran mesin didasarkan pada statistik, [[statistik komputasional]] adalah sumber penting dari metode-metode di bidang ini.
 
== Definisi ==
Mesin yang dimaksud di sini adalah mesin dalam pengertian lebih mendekati kepada ‘sistem’, bukan mesin 'mekanik'. Istilah pembelajaranpemelajaran pertama kali muncul dalam disiplin ilmu [[kecerdasan buatan]]. PembelajaranPemelajaran berarti menambah pengetahuan, memahami dengan belajar, dan mengikuti perintah. Pemelajaran mesin merupakan salah satu cabang dari kecerdasan buatan yang membahas mengenai pembangunan sistem yang didapat berdasarkan pada pembelajaranpemelajaran data, atau sebuah studi yang mempelajari cara untuk memprogram sebuah komputer untuk belajar. Inti dari pembelajaranpemelajaran mesin adalah representasi dan generalisasi. Pada tahun 1959, Arthur Samuel mendefinisikan bahwa pembelajaranpemelajaran mesin adalah bidang studi yang memberikan kemampuan untuk belajar tanpa diprogram secara eksplisit. Kemampuan belajar yang menjadi dominan ditentukan oleh kemampuan [[perangkat lunak]] atau alogaritmanya. Implementasi kemampuan belajar dapat dicapai dengan berbagai teknik, ada yang menggunakan kaidah (''rule''), ada yang menggunakan [[statistika]], ada yang menggunakan pendekatan [[fisiologi]] yaitu sistem saraf manusia atau disebut dengan ANN ([[artificial neural network]]) atau [[jaringan saraf tiruan]]. Pemelajaran mesin dapat berfungsi untuk beradaptasi dengan suatu keadaan yang baru, serta untuk mendeteksi dan memperkirakan suatu pola.
 
== Sejarah ==
Pada tahun 1951, [[John McCarthy]] yang baru saja mendapatkan gelar PhD meyakinkan Minsky, [[Claude Shannon]], dan [[Nathaniel Rochester]] untuk membantunya membawa peneliti [[Amerika Serikat]] yang memiliki ketertarikan pada teori automata, jaring saraf, dan studi mengenai kecerdasan menjadi satu. Mereka mengorganisir sebuah lokakarya di [[Dartmouth College]] di Hanover, New [[Hampshire]] pada tahun 1956. Pada saat itulah dianggap menjadi tahun lahirnya kecerdasan buatan. Sejak awal, para peneliti kecerdasan buatan tidak segan membuat prediksi mengenai keberhasilan dari kecerdasan buatan ini. Pada awalnya kecerdasan buatan berkembang cukup pesat, hal ini disebabkan karena ekspektasi yang terlalu tinggi dari para peneliti di bidang ini. Hingga pada tahun 1974, bidang kecerdasan buatan mulai kurang diminati. Sampai pada tahun 1980, ketertarikan terhadap kecerdasan buatan sebagai bidang penelitian mulai bangkit kembali. Salah satu yang mendukung hal ini adalah hasil kerja Yarowsky (1995), ia melakukan percobaan menggunakan pembelajaranpemelajaran mesin dan mendapatkan hasil diatas 96% untuk ke akuratan dari percobaannya. Setelah Yarowsky banyak orang-orang yang melakukan percobaan menggunakan pembelajaranpemelajaran mesin dan mendapatkan hasil yang memuaskan, dari sinilah pembelajaranpemelajaran mesin dapat semakin berkembang hingga hari ini.<ref name=":0">S. J. Russell, P. Norvig, J. F. Canny, J. M. Malik, and D. D. Edwards, ''Artificial'' ''Intelligence: A Modern Approach'', vol. 2. Prentice hall Englewood Cliffs'','' 1995.</ref>
 
== Perbedaan dengan penggalian data ==
[[Penggalian data]] (''data mining'') adalah sebuah proses untuk menemukan pengetahuan, ketertarikan, dan pola baru dalam bentuk model yang deskriptif, dapat dimengerti, dan prediktif dari data dalam skala besar.<ref>M. J. Zaki, W. Meira Jr., ''Data Mining and Analysis: Fundamental Concepts and Algorithms'', Cambridge University Press, 2014.</ref> Dengan kata lain ''data mining'' merupakan ekstraksi atau penggalian pengetahuan yang diinginkan dari data dalam jumlah yang sangat besar.<ref>J. Han, M. Kamber, ''Data Mining: Concepts and Techniques'', Morgan Kaufmann, 2006.</ref>
 
Dari definisi diatas dapat disimpulkan bahwa pada pembelajaranpemelajaran mesin berkaitan dengan studi, desain dan pengembangan dari suatu algoritma yang dapat memungkinkan sebuah komputer dapat belajar tanpa harus diprogram secara eksplisit. Sedangkan pada ''data mining'' dilakukan proses yang dimulai dari data yang tidak terstruktur lalu diekstrak agar mendapatkan suatu pengetahuan ataupun sebuah pola yang belum diketahui. Selama proses ''data mining'' itulah algoritma dari pembelajaranpemelajaran mesin digunakan.
 
== Tipe algoritma ==
[[Algoritme|algoritma]] dalam pembelajaranpemelajaran mesin dapat dikelompokkan berdasarkan masukan dan keluaran yang diharapkan dari algoritma.
 
* [[Pemelajaran terarah|PembelajaranPemelajaran terarah]] (''supervised learning'') membuat fungsi yang memetakan masukan ke keluaran yang dikehendaki, misalnya pada pengelompokan (klasifikasi).
:PembelajaranPemelajaran terarah merupakan algoritma yang mempelajari sekumpulan contoh pasangan masukan-keluaran yang diinginkan dalam jumlah yang cukup besar. algoritma ini menggunakan data latih (''data train''), yaitu data-data yang sudah diberi label untuk melakukan pembelajaranpemelajaran. Metode ini bertujuan agar mesin mampu mengidentifikasi label input baru dengan menggunakan fitur yang ada untuk melakukan prediksi maupun klasifikasi. Dengan mengamati data-data tersebut, metode ini akan menghasilkan sebuah model yang mampu memetakan masukan yang baru menjadi keluaran yang tepat.<ref name=":0" />
:Salah satu contoh yang paling sederhana adalah terdapat sekumpulan contoh masukan berupa umur seseorang dan contoh keluaran yang berupa tinggi badan orang tersebut. algoritma pembelajaranpemelajaran melalui contoh mengamati contoh-contoh tersebut dan kemudian mempelajari sebuah fungsi yang pada akhirnya dapat "memperkirakan" tinggi badan seseorang berdasarkan masukan umur orang tersebut.
:Contoh implementasi dengan metode ini adalah pada kasus deteksi spam pada surel. Data latih yang digunakan akan diberi label berupa spam dan bukan spam. Mesin akan mempelajari data-data tersebut melalui proses ''learning'' sehingga dapat menghasilkan keluaran berupa mesin yang sudah terlatih untuk mengelompokkan surel yang spam dan bukan spam.
 
* [[Pemelajaran tak terarah|PembelajaranPemelajaran tak terarah]] (''unsupervised learning'') memodelkan himpunan masukan, seperti penggolongan (''clustering'').
:Algoritma ini mempunyai tujuan untuk mempelajari dan mencari pola-pola menarik pada masukan yang diberikan.<ref>K. P. Murphy, ''Machine Learning: A Probabilistic Perspective'', The MIT Press, Cambridge, Massachusetts, London, England.</ref> Meskipun tidak disediakan keluaran yang tepat secara eksplisit. Salah satu algoritma ''unsupervised learning'' yang paling umum digunakan adalah ''clustering'' atau pengelompokan.<ref name=":0" />
:Berbeda dengan metode sebelumnya, metode ini tidak menggunakan data latih dalam melakukan pembelajaranpemelajaran. Dengan kata lain, data-data yang diberikan kepada mesin adalah data-data yang tidak berlabel sehingga mesin dapat mempelajari data-data tersebut berdasarkan fitur-fiturnya. algoritma ini tidak memiliki variabel target dan bertujuan untuk mengelompokkan objek yang serupa dalam suatu area tertentu.
:Contoh ''unsupervised learning'' dalam dunia nyata, misalnya seorang supir taksi yang secara perlahan-lahan menciptakan konsep "macet" dan "tidak macet" tanpa pernah diberikan contoh oleh siapapun.<ref name=":0" />
* PembelajaranPemelajaran semi terarah (''semi-supervised learning''), yakni tipe yang menggabungkan antara ''supervised'' dan ''unsupervised'' untuk menghasilkan suatu fungsi.
:Algoritma pembelajaranpemelajaran semi terarah menggabungkan kedua tipe algoritma di atas, di mana diberikan contoh masukan-keluaran yang tepat dalam jumlah sedikit dan sekumpulan masukan yang keluarannya belum diketahui. algoritma ini harus membuat sebuah rangkaian kesatuan antara dua tipe algoritma di atas untuk dapat menutupi kelemahan pada masing-masing algoritma.<ref name=":0" />
:Misalnya sebuah sistem yang dapat menebak umur seseorang berdasarkan foto orang tersebut. Sistem tersebut membutuhkan beberapa contoh, misalnya yang didapatkan dengan mengambil foto seseorang dan menanyakan umurnya (pembelajaranpemelajaran terarah). Akan tetapi, pada kenyataannya beberapa orang sering kali berbohong tentang umur mereka sehingga menimbulkan ''noise'' pada data. Oleh karena itu, digunakan juga pembelajaranpemelajaran tak terarah agar dapat saling menutupi kelemahan masing-masing, yaitu ''noise'' pada data dan ketiadaan contoh masukan-keluaran.<ref name=":0" />
* Reinforcement learning: Tipe ini mengajarkan bagaimana cara bertindak untuk menghadapi suatu masalah, yang suatu tindakan itu mempunyai dampak. Adalah sebuah algoritma pembelajaranpemelajaran yang diterapkan pada agen cerdas agar ia dapat menyesuaikan dengan kondisi dilingkungannya, hal ini dicapai dengan cara memaksimalkan nilai dari hadiah ‘''reward''’ yang dapat dicapai. Suatu hadiah didefinisikan sebuah tanggapan balik ‘''feedback''’ dari tindakan agen bahwa sesuatu baik terjadi <ref name=":0" />.Sebagai contoh, sangatlah sulit untuk memrogram sebuah agen untuk menerbangkan sebuah helikopter, tetapi dengan memberikan beberapa nilai negatif untuk menabrak, bergoyang-goyang, serta melenceng dari jalur tujuan perlahan-lahan agen tersebut dapat belajar menerbangkan helikopter dengan lebih baik.<ref name=":0" />
 
* PembelajaranPemelajaran berkembang (''developmental learning algorithm'') adalah sebuah bidang yang bertujuan untuk mempelajari mekanisme pengembangan, arsiterktur, dan batasan yang memungkinkan dibuatnya metode pembelajaranpemelajaran yang berlaku seumur hidup, serta bersifat terbuka terhadap kemampuan dan pengetahuan untuk dipasangkan kepada mesin.<ref>https://en.wiki-indonesia.club/wiki/Machine_learning</ref>
* Transduction: Tipe ini hampir mirip dengan Supervised Learning, tapi tidak secara jelas untuk membangun suatu fungsi melainkan mencoba memprediksi output baru yang berdasarkan dari input baru, masukan pelatihan input dan output
* Learning to learn: Tipe ini menggunakan algoritma untuk mempelajari yang sebelumnya.
Baris 41:
 
=== Pohon keputusan ===
PembelajaranPemelajaran pohon keputusan bisa dijadikan sebagai model prediktif yang dapat memetakan pengamatan sebuah pilihan ke kesimpulan target dari pilihan tersebut. Pohon keputusan memiliki pendekatan pemodelan prediksi menggunakan statistik, ''data mining'', dan pembelajaranpemelajaran mesin. Pada pohon keputusan ini ''node''-''node'' daunnya akan merepresentasikan label kelas, sedangkan cabangnya merepresentasikan kaitan dari fitur-fitur yang dapat menuntun menuju label kelas yang ada. PembelajaranPemelajaran pohon keputusan merupakan representasi sederhana untuk contoh pengklasifikasian. pembelajaranpemelajaran pohon keputusan merupakan salah satu teknik dari ''supervised learning''. Terdapat banyak algoritma pohon keputusan, diantaranya adalah id3 (''iterative'' ''dichotomiser'' 3), c4.5, ''cart'' (''classification'' ''and'' ''regression'' ''tree''), CHAID (''CHi''-''squared'' ''Automatic'' ''Interaction'' ''Detector''), MARS, dan lain-lain.
 
Sebagai contoh pohon keputusan dapat digunakan untuk penyaringan ''email''. Dengan memasukan fitur-fitur dari ''email'' yang telah ditentukan menjadi cabangnya, dan nantinya cabang-cabang tersebut memiliki daun yang dapat menentukan ''email'' tersebut masuk ke label yang mana yang telah tersedia.
Baris 49:
 
=== Pengelompokan ===
Pengelompokan (''clustering'') merupakan salah satu pembelajaranpemelajaran yang tergolong dalam pembelajaranpemelajaran yang tidak memerlukan contoh (''unsupervised learning''). Definisi sederhana dari pengelompokan adalah sebuah proses untuk mengorganisasikan objek menjadi beberapa kelompok yang memiliki anggota yang mirip dalam hal tertentu.<ref>B. R. Jipkate, V. V. Gohokar, ''A Comparative Analysis of Fuzzy C-Means Clustering and K Means Clustering Algorithms'', International Journal of Computational Engineering Research, ISSN: 2250-3005.</ref> algoritma pengelompokan menerima sekumpulan masukan dan kemudian membuat sebuah pembagian (kelompok-kelompok) dari masukan tersebut. Dua masukan yang berada pada kelompok yang sama seharusnya memiliki banyak kesamaan dibandingkan dengan dua masukan yang berada pada kelompok yang berbeda.<ref>T. Finley, T. Joachims, ''Supervised Clustering with Support Vector Machine'', Department of Computer Science, Cornell University, Ithaca, NY 14853 USA.</ref>
 
Sebagai contoh, para astronom harus melakukan pengelompokan untuk menentukan tipe dari bintang-bintang berdasarkan data spektrum dari ratusan ribu bintang sehingga pada akhirnya mendapatkan istilah seperti “''red giant''” dan “''white dwarf''”.<ref name=":0" />
Baris 57:
 
=== Pemrograman logika induktif ===
Pemrograman logika induksi (''inductive logic programming'') merupakan salah satu pendekatan pembelajaranpemelajaran mesin yang mempelajari konstruksi induktif dalam bentuk ''first-order'' berdasarkan contoh dan latar belakang pengetahuan yang ada.<ref>S. Muggleton, L. D. Raedt, ''Inductive Logic Programming: Theory and Methods'', Journal of Logic Programming, 1994: 19, 20: 629-679.</ref> Pendekatan ini menekankan pada representasi dari hipotesis sebagai program logika.
 
Contohnya pada pembelajaranpemelajaran relasi keluarga dari data yang diberikan. Proses klasifikasi dilakukan dengan memproses latar belakang pengetahuan, hipotesis, dan deskripsi yang diberikan. Deskripsi akan terdiri dari istilah seperti ''Father(Philip, Charles)'', ''Mother(Mum, Margaret)'', dan lainnya. Pada awalnya, belum latar belakang pengetahuan yang dapat digunakan. Sehingga memunculkan beberapa hipotesis seperti ''Grandparent(x,y)''. Seiring berjalannya waktu, latar belakang pengetahuan akan terus meningkat dan menemukan bahwa ''Parent(x,y) ''⟺'' ''[''Mother(x,y) ''V'' Father(x,y)'']. Dengan demikian, definisi dari ''Grandparent'' dapat dikurangi menjadi ''Grandparent(x,y)'' ⟺ [∃''z Parent(x,z)'' ∧ ''Parent(z,y)''].<ref name=":0" />
 
== Manfaat dan implementasi ==
Pemelajaran mesin menjaganya agar tetap sederhana, sebuah algoritma dikembangkan untuk mencatat perubahan dalam data dan berevolusi dalam desain itu untuk mengakomodasi temuan baru. Seperti diterapkan untuk analisis prediktif, fitur ini memiliki dampak luas mulai pada kegiatan yang biasanya dilakukan untuk mengembangkan, menguji, dan memperbaiki algoritma untuk tujuan tertentu.
Aplikasi untuk pembelajaranpemelajaran mesin termasuk:
* Machine perception
* Computer vision, including object recognition
Baris 91:
 
== Penerapan pada masa depan ==
Meskipun Machine Learning tidak dapat secara efektif memprediksi jengkel pengguna, kita masih percaya bahwa masih banyak yang bisa dilakukan untuk mencapai hasil yang lebih baik pada proyek ini. Pertama-tama, kumpulan data kami adalah kecil untuk metode pembelajaranpemelajaran mesin, kami ingin mengumpulkan lebih banyak data untuk melihat apakah meningkatkan hasil kami sama sekali.
Hal lain yang kita ingin mencoba adalah mengubah permainan yang memainkan pengguna . Karena kita menggunakan jenis permainan penembak, banyak " menumbuk tombol " adalah terlibat. Sesuatu yang lebih seperti permainan balap dapat bekerja lebih baik untuk mendeteksi gangguan dengan sensor gaya, karena ada lebih banyak tombol memegang terlibat daripada dengan game jenis shooter. Sebuah permainan balap juga dapat memperkenalkan lebih terkait game stres dari sebuah permainan yang melibatkan menembak.
 
== Lihat pula ==
* [[Pengenalan pola]]
* [[Pemelajaran dalam|PembelajaranPemelajaran dalam]]
 
== Referensi ==