Jangkauan interkuartil
Dalam statistika deskriptif, jangkauan interkuartil (IQR), adalah selisih antara persentil ke-75 (kuartil atas) dan persentil ke-25 (kuartil bawah).[1][2] Dengan kata lain, IQR adalah kuartil pertama dikurangi kuartil ketiga. Kuartil dapat diketahui dengan jelas melalui diagram kotak garis.
IQR adalah ukuran variabilitas yang didasarkan pada pembagian kumpulan data menjadi kuartil. Kuartil membagi kumpulan data terurut menjadi empat bagian yang sama besar. Nilai yang memisahkan bagian-bagian ini disebut kuartil pertama, kedua (median), dan ketiga yang masing-masing dilambangkan dengan Q1, Q2, dan Q3.[3]
Penggunaan
IQR digunakan untuk membuat diagram kotak garis, sebuah representasi grafis sederhana yang menunjukkan distribusi probabilitas. Untuk sebuah distribusi simetris (median sama dengan rata-rata kuartil pertama dan ketiga), setengah IQR sama dengan deviasi absolut median (MAD). IQR juga dapat digunakan untuk mengidentifikasi pencilan (lihat di bawah) dan mencari deviasi kuartil / jangkauan semi-interkuartil.[4]
Algoritma
IQR dari suatu kumpulan data merupakan selisih antara kuartil atas (Q3) dan bawah (Q1). Setiap kuartil adalah median[5] dari sebagian data, seperti yang ditunjukkan oleh contoh berikut.
Misal, terdapat kumpulan data berjumlah genap (2n) atau ganjil (2n + 1), maka
- kuartil pertama Q1 = median dari n data terkecil
- kuartil ketiga Q3 = median dari n data terbesar [5]
Kuartil kedua Q 2 sama dengan median kumpulan data yang sesungguhnya.[5]
Contoh
Kumpulan data dalam sebuah tabel
Tabel berikut memiliki 13 baris yang tiap barisnya berisi sebuah data.
i | x[i] | Median | Kuartil |
---|---|---|---|
1 | 7 | Q2 = 87 (median seluruh data pada tabel) |
Q1 = 31 (median paruh atas, dari baris 1 hingga 6) |
2 | 7 | ||
3 | 31 | ||
4 | 31 | ||
5 | 47 | ||
6 | 75 | ||
7 | 87 | ||
8 | 115 | Q3 = 119 (median paruh bawah, dari baris 8 hingga 13) | |
9 | 116 | ||
10 | 119 | ||
11 | 119 | ||
12 | 155 | ||
13 | 177 |
Jangkauan interkuartil data di atas adalah:
.
Kumpulan data dalam diagram kotak polos
+−−−−−+−+ * |−−−−−−−−−−−| | |−−−−−−−−−−−| +−−−−−+−+ +−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+ garis bilangan 0 1 2 3 4 5 6 7 8 9 10 11 12
Kumpulan data pada diagram kotak ini memiliki:
- kuartil bawah (pertama) Q1 = 7
- median (kuartil kedua) Q2 = 8.5
- kuartil atas (ketiga) Q3 = 9
- jangkauan interkuartil, IQR = Q3 - Q1 = 2
- lebih rendah 1,5 * kumis IQR = Q 1 - 1,5 * IQR = 7 - 3 = 4. (Jika tidak ada titik data di 4, maka titik terendah lebih besar dari 4. )
- atas 1,5 * kumis IQR = Q 3 + 1,5 * IQR = 9 + 3 = 12. (Jika tidak ada titik data di 12, maka titik tertinggi kurang dari 12. )
Hal ini menunjukkan bahwa satu garis 1,5*IQR dengan garis 1,5*IQR lainnya bisa jadi memiliki panjang yang tidak sama.
Distribusi
Jangkauan interkuartil dari distribusi kontinu dapat dihitung dengan mengintegrasikan fungsi kepadatan probabilitas. Kuartil bawah (Q1) adalah bilangan sedemikian rupa sehingga integral PDF dari -∞ ke Q1 sama dengan 0,25, sedangkan kuartil atas (Q3) adalah bilangan sedemikian rupa sehingga integral dari -∞ ke Q3 sama dengan 0,75. Pada distribusi fungsi kumulatif (CDF), kuartil dapat didefinisikan sebagai:
dengan CDF−1 adalah fungsi kuantil .
Jangkauan interkuartil dan median dari beberapa distribusi umum ditunjukkan pada tabel di bawah ini
Distribusi | Median | IQR |
---|---|---|
Normal | μ | 2 Φ − 1 (0,75) σ ≈ 1,349σ ≈ (27/20) σ |
Laplace | μ | 2 b ln (2) ≈ 1.386 b |
Cauchy | μ | 2γ |
Uji jangkauan interkuartil untuk normalitas distribusi
IQR, rata-rata, dan deviasi standar dari populasi P dapat digunakan dalam uji sederhana untuk menentukan apakah P terdistribusi normal atau tidak. Jika P terdistribusi normal, maka skor standar kuartil pertama, z1, adalah −0.67, dan skor standar kuartil ketiga, z3, adalah +0.67. Diberikan rata-rata = X dan standar deviasi = σ untuk P, jika P berdistribusi normal, maka kuartil pertama dapat dinyatakan sebagai
dan kuartil ketiga
Pencilan
Jangkauan interkuartil sering digunakan untuk mencari pencilan dalam data. Pada contoh berikut, pencilan didefinisikan sebagai data yang ditemukan berada di bawah Q1 - 1.5 IQR atau di atas Q3 + 1.5 IQR. Dalam diagram kotak, nilai tertinggi dan terendah dalam batas ini ditandai oleh ujung dari garis (sering pula ditambahkan bilah tambahan di ujung garis) dan pencilan sebagai titik-titik individual.
Referensi
- ^ Upton, Graham; Cook, Ian (1996). Understanding Statistics. Oxford University Press. hlm. 55. ISBN 0-19-914391-9.
- ^ Zwillinger, D., Kokoska, S. (2000) CRC Standard Probability and Statistics Tables and Formulae, CRC Press. ISBN 1-58488-059-7 page 18.
- ^ A modern introduction to probability and statistics : understanding why and how . Dekking, Michel, 1946–. London: Springer. 2005. hlm. 234–238. ISBN 978-1-85233-896-1. OCLC 262680588.
- ^ Yule, G. Udny (1911). An Introduction to the Theory of Statistics. Charles Griffin and Company. hlm. 147–148.
- ^ a b c Bertil., Westergren (1988). Beta [beta] mathematics handbook : concepts, theorems, methods, algorithms, formulas, graphs, tables. Studentlitteratur. hlm. 348. ISBN 9144250517. OCLC 18454776.
Pranala luar
- Media tentang Interquartile range di Wikimedia Commons