Jangkauan interkuartil
Dalam statistika deskriptif, jangkauan interkuartil (IQR), adalah selisih antara persentil ke-75 (kuartil atas) dan persentil ke-25 (kuartil bawah).[1][2] Dengan kata lain, IQR adalah kuartil ketiga dikurangi kuartil pertama. Kuartil dapat diketahui dengan jelas melalui diagram kotak garis.
IQR adalah ukuran variabilitas yang didasarkan pada pembagian kumpulan data menjadi kuartil. Kuartil membagi kumpulan data terurut menjadi empat bagian yang sama besar. Nilai yang memisahkan bagian-bagian ini disebut kuartil pertama, kedua (median), dan ketiga yang masing-masing dilambangkan dengan Q1, Q2, dan Q3.[3]
Sejarah
suntingIstilah kuartil bawah dan kuartil atas pertama kali diperkenalkan oleh Sir Donald MacAlister pada tahun 1879 pada publikasi berjudul The Law of the Geometric Mean. Sementara itu, istilah jangkauan interdesil dan interkuartil pertama kali dicetuskan oleh Francis Galton pada tahun 1882 pada publikasi berjudul Report of the Anthropometric Committee, meskipun ide tentang jangkauan interkuartil sebenarnya pernah dicetuskan oleh Carl Friedrich Gauss dan Adolphe Quételet.
Penggunaan
suntingIQR digunakan untuk membuat diagram kotak garis, sebuah representasi grafis sederhana yang menunjukkan distribusi probabilitas. Untuk sebuah distribusi simetris (median sama dengan rata-rata kuartil pertama dan ketiga), setengah IQR sama dengan deviasi absolut median (MAD). IQR juga dapat digunakan untuk mengidentifikasi pencilan (lihat di bawah).[4][5] Selain itu, terdapat pula jangkauan semi-interkuartil yang dapat ditentukan melalui persamaan: .[6]
Algoritma
suntingIQR dari suatu kumpulan data merupakan selisih antara kuartil atas (Q3) dan bawah (Q1). Setiap kuartil adalah median[7] dari sebagian data, seperti yang ditunjukkan oleh contoh berikut.
Misal, terdapat kumpulan data berjumlah genap (2n) atau ganjil (2n + 1), maka
- kuartil pertama Q1 = median dari n data terkecil
- kuartil ketiga Q3 = median dari n data terbesar [7]
Kuartil kedua Q 2 sama dengan median kumpulan data yang sesungguhnya.[7]
Contoh
suntingKumpulan data dalam sebuah tabel
suntingTabel berikut memiliki 13 baris yang tiap barisnya berisi sebuah data.
i | x[i] | Median | Kuartil |
---|---|---|---|
1 | 7 | Q2 = 87 (median seluruh data pada tabel) |
Q1 = 31 (median paruh atas, dari baris 1 hingga 6) |
2 | 7 | ||
3 | 31 | ||
4 | 31 | ||
5 | 47 | ||
6 | 75 | ||
7 | 87 | ||
8 | 115 | Q3 = 119 (median paruh bawah, dari baris 8 hingga 13) | |
9 | 116 | ||
10 | 119 | ||
11 | 119 | ||
12 | 155 | ||
13 | 177 |
Jangkauan interkuartil data di atas adalah:
.
Kumpulan data dalam diagram kotak polos
sunting+−−−−−+−+ * |−−−−−−−−−−−| | |−−−−−−−−−−−| +−−−−−+−+ +−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+ garis bilangan 0 1 2 3 4 5 6 7 8 9 10 11 12
Kumpulan data pada diagram kotak ini memiliki:
- kuartil bawah (pertama) Q1 = 7
- median (kuartil kedua) Q2 = 8.5
- kuartil atas (ketiga) Q3 = 9
- jangkauan interkuartil, IQR = Q3 - Q1 = 2
- lebih rendah 1,5 * kumis IQR = Q 1 - 1,5 * IQR = 7 - 3 = 4. (Jika tidak ada titik data di 4, maka titik terendah lebih besar dari 4. )
- atas 1,5 * kumis IQR = Q 3 + 1,5 * IQR = 9 + 3 = 12. (Jika tidak ada titik data di 12, maka titik tertinggi kurang dari 12. )
Hal ini menunjukkan bahwa satu garis 1,5*IQR dengan garis 1,5*IQR lainnya bisa jadi memiliki panjang yang tidak sama.
Distribusi
suntingJangkauan interkuartil dari distribusi kontinu dapat dihitung dengan mengintegrasikan fungsi kepadatan probabilitas. Kuartil bawah (Q1) adalah bilangan sedemikian rupa sehingga integral PDF dari -∞ ke Q1 sama dengan 0,25, sedangkan kuartil atas (Q3) adalah bilangan sedemikian rupa sehingga integral dari -∞ ke Q3 sama dengan 0,75. Pada distribusi fungsi kumulatif (CDF), kuartil dapat didefinisikan sebagai:
dengan adalah fungsi kuantil.[8]
Jangkauan interkuartil dan median dari beberapa distribusi umum ditunjukkan pada tabel di bawah ini
Distribusi | Median | IQR |
---|---|---|
Normal | μ | 2 Φ − 1 (0,75) σ ≈ 1,349σ ≈ (27/20) σ |
Laplace | μ | 2 b ln (2) ≈ 1.386 b |
Cauchy | μ | 2γ |
Uji jangkauan interkuartil untuk normalitas distribusi
suntingIQR, rata-rata, dan deviasi standar dari populasi P dapat digunakan dalam uji sederhana untuk menentukan apakah P terdistribusi normal atau tidak. Jika P terdistribusi normal, maka skor standar kuartil pertama, z1, adalah −0.67, dan skor standar kuartil ketiga, z3, adalah +0.67. Diberikan rata-rata = X dan standar deviasi = σ untuk P, jika P berdistribusi normal, maka kuartil pertama dapat dinyatakan sebagai
dan kuartil ketiga
Pencilan
suntingJangkauan interkuartil sering digunakan untuk mencari pencilan dalam data. Pada contoh berikut, pencilan didefinisikan sebagai data yang ditemukan berada di bawah Q1 - 1.5 IQR atau di atas Q3 + 1.5 IQR. Dalam diagram kotak, nilai tertinggi dan terendah dalam batas ini ditandai oleh ujung dari garis (sering pula ditambahkan bilah tambahan di ujung garis) dan pencilan sebagai titik-titik individual.
Referensi
sunting- ^ Upton, Graham; Cook, Ian (1996). Understanding Statistics. Oxford University Press. hlm. 55. ISBN 0-19-914391-9.
- ^ Zwillinger, D., Kokoska, S. (2000) CRC Standard Probability and Statistics Tables and Formulae, CRC Press. ISBN 1-58488-059-7 page 18.
- ^ A modern introduction to probability and statistics : understanding why and how . Dekking, Michel, 1946–. London: Springer. 2005. hlm. 234–238. ISBN 978-1-85233-896-1. OCLC 262680588.
- ^ Yule, G. Udny (1911). An Introduction to the Theory of Statistics. Charles Griffin and Company. hlm. 147–148.
- ^ (Inggris) Weisstein, Eric W. "Quartile Deviation". MathWorld.
- ^ Spiegel, Murray R. (2006). Pearson, ed. Estatística. São Paulo. hlm. 643.
- ^ a b c Bertil., Westergren (1988). Beta [beta] mathematics handbook : concepts, theorems, methods, algorithms, formulas, graphs, tables. Studentlitteratur. hlm. 348. ISBN 9144250517. OCLC 18454776.
- ^ "Introdução à Estatística" (PDF). Universidade Federal do Pernambuco. hlm. 49. Diarsipkan dari versi asli (PDF) tanggal 2021-12-01. Diakses tanggal 25/04/2017.
Pranala luar
sunting- Media tentang Interquartile range di Wikimedia Commons