Diagram kotak garis: Perbedaan antara revisi
Konten dihapus Konten ditambahkan
k Menghapus Kategori:Category:Statistika; Menambah Kategori:Statistika menggunakan HotCat |
Fitur saranan suntingan: 3 pranala ditambahkan. Tag: VisualEditor Suntingan perangkat seluler Suntingan peramban seluler Tugas pengguna baru Disarankan: tambahkan pranala |
||
(3 revisi perantara oleh 3 pengguna tidak ditampilkan) | |||
Baris 1:
[[Berkas:Michelsonmorley-boxplot.svg|jmpl|300x300px| Gambar 1. Diagram kotak garis dari data yang didapatkan melalui [[Percobaan Michelson-Morley|percobaan Michelson–Morley]] ]]
Dalam [[statistika deskriptif]], '''diagram kotak garis''' atau '''''boxplot''''' adalah metode grafis untuk menggambarkan kumpulan data numerik berdasarkan nilai kuartilnya.<ref>{{Cite book|last=Mason|first=Robert D.|last2=Lind|first2=Douglas A.|date=|url=|title=Teknik Statistika untuk BISNIS & EKONOMI|location=Jakarta|publisher=Penerbit Erlangga|isbn=979-411-387-5|pages=148-150|translator-last=Sitompul|translator-first=Ellen Gunawan|url-status=live}}</ref> Diagram kotak garis bersifat [[Statistika nonparametrik|nonparametrik]], artinya diagram ini menampilkan variasi sampel [[Populasi (statistika)|populasi statistik]] tanpa membuat asumsi apa pun tentang [[Sebaran probabilitas|distribusi statistik]] yang mendasarinya. Jarak antara bagian-bagian kotak yang berbeda menunjukkan derajat dispersi (sebaran), kemiringan, dan pencilan dari data tersebut. Diagram kotak garis dapat digambarkan secara horizontal maupun vertikal.
== Elemen diagram kotak garis ==
[[Berkas:Box-Plot_mit_Min-Max_Abstand.png|jmpl|
[[Berkas:Box-Plot_mit_Interquartilsabstand.png|jmpl|
Diagram kotak garis merupakan salah satu cara sederhana untuk menampilkan kumpulan data berdasarkan ringkasan lima angka dari data tersebut. Ringkasan lima angka yang dimaksud yakni:
'''Minimum''' : nilai terendah dari kumpulan data, tidak termasuk pencilan.
'''Maksimum''' : nilai terbesar dari kumpulan data, tidak termasuk pencilan.
'''Median ''(Q''<sub>2</sub> / persentil ke-50):''' nilai tengah kumpulan data.
'''Kuartil pertama ''(Q''<sub>1</sub> / persentil ke-25):''' juga dikenal sebagai ''kuartil bawah'' ''q''<sub>''n''</sub>(0.25), adalah median dari bagian bawah kumpulan data.
'''Kuartil ketiga ''(Q''<sub>3</sub> / persentil ke-75):''' juga dikenal sebagai ''kuartil'' ''q''<sub>''n''</sub>(0.75), adalah median dari bagian atas kumpulan data.<ref>{{Cite web|last=Holmes|first=Alexander|last2=Illowsky|first2=Barbara|title=Introductory Business Statistics|url=https://opentextbc.ca/introbusinessstatopenstax/chapter/measures-of-the-location-of-the-data/|website=OpenStax|last3=Dean|first3=Susan|10=|access-date=2020-08-22|archive-date=2020-07-27|archive-url=https://web.archive.org/web/20200727025431/https://opentextbc.ca/introbusinessstatopenstax/chapter/measures-of-the-location-of-the-data/|dead-url=yes}}</ref>
Elemen penting lain dalam pembuatan diagram kotak garis adalah '''jangkauan interkuartil''' (Interquartile range, IQR). Jangkauan interkuartil adalah jarak antara kuartil atas dan bawah, dinotasikan sebagai:
: <math>\text{IQR} = Q_3 - Q_1 = q_n(0.75) - q_n(0.25)</math>
Diagram kotak garis terdiri atas dua bagian, yakni sebuah kotak dan satu pasang garis (seperti pada Gambar 2). Titik terendah dalam diagram merupakan nilai minimum dari dataset, sementara titik tertingginya merupakan nilai maksimum dari dataset. Sebuah kotak digambar dari ''Q''<sub>1</sub> ke ''Q''<sub>3</sub> kemudian garis horizontal digambar di tengahnya untuk menunjukkan median.
kumpulan data yang sama juga dapat direpresentasikan sebagai diagram kotak garis seperti yang ditunjukkan pada Gambar 3. Pertama, lakukan pengukuran sejauh 1,5 kali IQR dari kuartil atas. Kemudian sebuah garis ditarik dari kuartil atas menuju nilai terbesar dalam dataset yang berada dalam jarak 1,5 kali IQR. Hal yang sama juga dilakukan pada bagian bawah. Sebuah garis ditarik dari kuartil bawah menuju nilai terkecil dalam dataset yang berada dalam jarak 1,5 kali IQR, diukur dari bawah kuartil bawah. Semua titik lainnya dianggap sebagai pencilan.<ref>{{Cite book|last=Dekking|first=F.M.|year=2005|url=https://archive.org/details/modernintroducti00dekk_722|title=A Modern Introduction to Probability and Statistics|location=|publisher=Springer|isbn=1-85233-896-2|pages=[https://archive.org/details/modernintroducti00dekk_722/page/n240 234]–238|url-access=limited}}</ref>
Meskipun demikian, garis dalam diagram ini dapat mewakili beberapa kemungkinan nilai lainnya, seperti:
* minimum dan maksimum dari semua data (seperti pada gambar 2)
* satu [[Simpangan baku|deviasi standar]] di atas dan di bawah rata-rata data
* persentil ke-9 dan persentil ke-91
* persentil ke-2 dan persentil ke-98.
Data apapun yang tidak termasuk dalam garis harus diplot sebagai pencilan dengan simbol titik, lingkaran kecil, atau bintang, meskipun terkadang hal ini tidak dilakukan. Selain itu, beberapa diagram kotak turut menyertakan simbol tambahan untuk menunjukkan nilai rata-rata data.<ref name="frigge hoaglin iglewicz2">{{Cite journal|last=Frigge|first=Michael|last2=Hoaglin|first2=David C.|last3=Iglewicz|first3=Boris|date=February 1989|title=Some Implementations of the Boxplot|journal=[[The American Statistician]]|volume=43|issue=1|pages=50–54|doi=10.2307/2685173|jstor=2685173}}</ref><ref>{{Cite journal|last=Marmolejo-Ramos|first=F.|last2=Tian|first2=S.|date=2010|title=The shifting boxplot. A boxplot based on essential summary statistics around the mean|journal=International Journal of Psychological Research|volume=3|issue=1|pages=37–46|doi=10.21500/20112084.823}}</ref>
== Variasi ==
Diagram ini telah memiliki banyak variasi sejak dipopulerkan oleh matematikawan John W. Tukey pada tahun 1969. Dua varian paling umum adalah diagram kotak lebar variabel dan plot kotak berlekuk (lihat Gambar 4).
Plot kotak lebar variabel menggambarkan ukuran setiap grup yang datanya sedang diplot dengan membuat lebar kotak proporsional dengan ukuran grup. Konvensi yang populer adalah membuat lebar kotak proporsional dengan [[akar kuadrat]] dari ukuran grup.
== Contoh ==
=== Contoh diagram kotak garis tanpa pencilan ===
[[Berkas:No_Outlier.png|jmpl|328x328px| Gambar 5. Diagram kotak garis yang menggambarkan contoh di sebelah kiri tanpa pencilan.
Temperatur udara di suatu tempat diukur tiap jam dalam satuan Fahrenheit. Temperatur yang terukur kemudian disajikan dalam urutan data: 50, 50, 55, 58, 63, 66, 66, 67, 67, 68, 69, 70, 70, 70, 70, 72, 73, 75, 75, 76, 76, 78, 79, 81.
Sebuah diagram kotak garis kemudian dibuat menggunakan patokan nilai minimum, maksimum, median, kuartil pertama, dan kuartil ketiga dari data temperatur tersebut.
Pada kasus ini, temperatur minimum hari itu adalah 50
Jangkauan interkuartil, atau IQR, kemudian dapat dihitung:
: <math>\text{IQR} = Q_3 - Q_1=75^\circ F-66^\circ F=9^\circ F.</math>
Oleh karena itu, didapatkan bahwa
: <math>1.5\text{IQR}=1.5 \cdot 9^\circ F=13.5 ^\circ F.</math>
1.5 IQR di atas kuartil ketiga adalah:
: <math>Q3+1.5\text{ IQR}=75^\circ F+13.5^\circ F=88.5^\circ F.</math>
Sementara 1.5IQR di bawah kuartil pertama adalah:
: <math>Q_1-1.5\text{ IQR}=66^\circ F-13.5^\circ F=52.5^\circ F.</math>
Garis bagian atas dari diagram kotak garis memanjang dari kuartil ketiga hingga nilai data terbesar yang lebih kecil dari 1.5IQR di atas kuartil ketiga. Pada persoalan ini, 1,5IQR di atas kuartil ketiga adalah 88,5
Serupa dengan garis bagian atas, garis bagian bawah dari diagram kotak garis memanjang dari kuartil pertama hingga nilai data terkecil yang lebih besar dari 1.5IQR di bawah kuartil pertama. Pada persoalan ini, 1,5IQR di bawah kuartil pertama adalah 52,5
=== Contoh dengan pencilan ===
[[Berkas:Boxplot_with_outlier.png|jmpl|318x318px| Gambar 6. Diagram kotak garis yang dihasilkan dari contoh di sebelah kiri dengan pencilan.
Pada contoh ini, diberikan kumpulan data terurut: 52, 57, 57, 58, 63, 66, 66, 67, 67, 68, 69, 70, 70, 70, 70, 72, 73, 75, 75, 76, 76, 78, 79, 89. Nilai median, kuartil pertama, dan kuartil ketiga sama dengan contoh sebelumnya. Sementara itu, ditambahkan data tambahan pada awal dan akhir sehingga nilai minimum dan maksimumnya berubah menjadi 52 dan 89 berturut-turut.
Pada persoalan ini, nilai maksimum kumpulan data adalah 89
Hal yang serupa juga berlaku pada bagian bawah. Nilai minimum kumpulan data ini adalah 52
=== Dalam kasus kumpulan data besar ===
Baris 87 ⟶ 86:
: <math>\text{with } k = [p(n+1)] \text{ and } \alpha = p(n+1) - k</math>
Contoh data di atas merupakan kumpulan data dengan 24 titik data, artinya ''n'' = 24. Anda juga dapat menghitung median, kuartil pertama, dan kuartil ketiga secara matematis:
'''Median''' : <math>q_n(0.5) = q_{(12)} + (0.5\cdot25-12)\cdot(x_{(13)}-x_{(12)})
Baris 96 ⟶ 95:
'''Kuartil ketiga''' : <math>q_n(0.75) = q_{(18)} + (0.75\cdot25-18)\cdot(x_{(19)}-x_{(18)})
=75 + (0.75\cdot25-18)\cdot(75-75) = 75</math>
== Visualisasi ==
[[Berkas:Boxplot_vs_PDF.svg|jmpl| Gambar 7. Diagram kotak garis dan [[Fungsi kepekatan probabilitas|fungsi kepadatan probabilitas]] (pdf) dari Populasi N Normal (0,1σ <sup>2</sup>) ]]
Diagram kotak garis memungkinkan pemeriksaan grafis yang cepat dari satu atau lebih kumpulan data. Diagram kotak garis mungkin tampak lebih primitif daripada [[histogram]] atau perkiraan kerapatan kernel. Meskipun demikian, diagram ini membutuhkan lebih sedikit ruang sehingga sangat berguna untuk membandingkan distribusi antara beberapa kelompok atau kumpulan data (lihat Gambar 1 sebagai contoh). Pemilihan teknik [[Histogram|jumlah dan lebar batang]] dapat sangat memengaruhi tampilan histogram, sementara pilihan [[lebar pita]] dapat sangat memengaruhi tampilan perkiraan kepadatan kernel.
Salah satu cara untuk memahami diagram kotak garis adalah membandingkannya dengan fungsi kepadatan probabilitas (histogram teoritis) untuk [[distribusi normal]] N (0,''σ''<sup>2</sup>). Hal ini karena distribusi statistik lebih umum ditemukan daripada diagram kotak (Gambar 7).
[[Berkas:Boxplots_with_skewness.png|jmpl|
== Lihat pula ==
* [[Bijeksi]]
* [[Diagram Venn]]
== Referensi ==
Baris 128 ⟶ 122:
* [http://www.physics.csbsju.edu/stats/box2.html Kalkulator diagram kotak daring beserta penjelasan dan contoh]
* [http://www.r-statistics.com/2011/03/beeswarm-boxplot-and-plotting-it-with-r/ Beeswarm Boxplot]
* [https://web.archive.org/web/20171001193540/http://boxplot.bio.ed.ac.uk/ Pembuat diagram kotak daring yang kompleks dengan contoh data] - lihat juga BoxPlotR: perkakas web untuk membuat diagram kotak ''Spitzer et al.'' Nature Methods 11, 121–122 (2014)
[[Kategori:Statistika]]
|