You Only Look Once: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
Fitur saranan suntingan: 2 pranala ditambahkan.
 
(2 revisi perantara oleh satu pengguna lainnya tidak ditampilkan)
Baris 4:
| programming language = [[Python (bahasa pemrograman)|Python]]
| genre = {{ indented plainlist |
*[[Deteksi objek]]
*[[Jaringan saraf konvolusional]]
*[[Visi komputer]]
Baris 11:
}}
[[Berkas:Detected-with-YOLO--Schreibtisch-mit-Objekten.jpg|thumb|Objek yang dideteksi dengan modul Deep Neural Network OpenCV menggunakan model YOLOv3 yang dilatih pada dataset COCO yang mampu mendeteksi objek dari 80 kelas umum]]
'''You Only Look Once (YOLO)''' adalah serangkaian sistem [[deteksi objek]] langsung (''real-time'') berdasarkan [[Jaringan saraf konvolusional]]. Sejak pertama kali diperkenalkan oleh Jasoph Redmon dkk. pada tahun 2015,<ref name=":2">{{cite arXiv |eprint=1506.02640 |class=cs.CV |first1=Joseph |last1=Redmon |first2=Santosh |last2=Divvala |title=You Only Look Once: Unified, Real-Time Object Detection |date=2016-05-09 |last3=Girshick |first3=Ross |last4=Farhadi |first4=Ali}}</ref> YOLO terus mengalami beberapa iterasi dan perbaikan, menjadikannya sebagai salah satu kerangka kerja deteksi objek yang paling populer.<ref name=":0">{{Cite journal |last1=Terven |first1=Juan |last2=Córdova-Esparza |first2=Diana-Margarita |last3=Romero-González |first3=Julio-Alejandro |date=2023-11-20 |title=A Comprehensive Review of YOLO Architectures in Computer Vision: From YOLOv1 to YOLOv8 and YOLO-NAS |journal=Machine Learning and Knowledge Extraction |language=en |volume=5 |issue=4 |pages=1680–1716 |doi=10.3390/make5040083 |doi-access=free |issn=2504-4990|arxiv=2304.00501 }}</ref>
 
Nama "You Only Look Once" atau yang dalam bahasa Indonesia diterjemahkan menjadi "Anda Hanya Melihat Sekali" mengacu pada fakta bahwa algoritma tersebut hanya memerlukan satu lintasan propagasi maju melalui jaringan saraf untuk membuat prediksi, tidak seperti teknik berbasis proposal wilayah terdahulu seperti [[Jaringan Syaraf Tiruan Berbasis Wilayah]] (R-CNN) yang memerlukan ribuan lintasan untuk satu gambar.
Baris 36:
 
* <math>p_i</math> adalah probabilitas bersyarat (''conditional'') bahwa sel tersebut berisi objek kelas <math>i</math>, bersyarat pada sel yang berisi setidaknya satu objek.
* <math>x_j, y_j, w_j, h_j</math> adalah koordinat pusat, lebar, dan tinggi ke-<math>j</math> kotak pembatas ke-yang diprediksi yang berpusat di dalam sel. Beberapa kotak pembatas diprediksi untuk memungkinkan setiap prediksi mengkhususkan diri dalam satu jenis kotak pembatas. Misalnya, objek ramping mungkin diprediksi oleh <math>j = 2</math> sementara benda-benda yang kuat mungkin diprediksi oleh <math> j= 1</math>.
* <math>c_j</math> adalah prediksi [[Indeks Jaccard|irisan atas gabungan]] (IoU) dari setiap kotak pembatas dengan dasar kebenarannya yang bersesuaian.
Arsitektur jaringan memiliki 24 lapisan konvolusional diikuti oleh 2 lapisan yang terhubung penuh.
Baris 45:
 
=== YOLOv2 ===
Dirilis pada tahun 2016, YOLOv2 (juga dikenal sebagai YOLO9000)<ref>{{cite arXiv |eprint=1612.08242 |class=cs.CV |first1=Joseph |last1=Redmon |first2=Ali |last2=Farhadi |title=YOLO9000: Better, Faster, Stronger |date=2016-12-25}}</ref><ref>{{Cite web |title=YOLOv2: Real-Time Object Detection |url=https://pjreddie.com/darknet/yolov2/ |access-date=2024-09-12 |website=pjreddie.com}}</ref> menyempurnakan model asli dengan menggabungkan normalisasi batch, pengklasifikasi resolusi yang lebih tinggi, dan menggunakan kotak jangkar untuk memprediksi kotak pembatas. Model ini dapat mendeteksi lebih dari 9000 kategori objek. Model ini juga dirilis di [[GitHub]] di bawah [[lisensi Apache]] 2.0.<ref>{{Citation |last=Rémy |first=Philippe |title=philipperemy/yolo-9000 |date=2024-09-05 |url=https://github.com/philipperemy/yolo-9000 |access-date=2024-09-12}}</ref>
 
=== YOLOv3 ===