Jangkauan interkuartil

Dalam statistika deskriptif, jangkauan interkuartil (IQR), adalah selisih antara persentil ke-75 (kuartil atas) dan persentil ke-25 (kuartil bawah).[1][2] Dengan kata lain, IQR adalah kuartil pertama dikurangi kuartil ketiga. Kuartil dapat diketahui dengan jelas melalui diagram kotak garis.

Diagram kotak garis (dengan rentang interkuartil) dan fungsi kepadatan probabilitas (pdf) dari Populasi Normal N(0,σ2)

IQR adalah ukuran variabilitas yang didasarkan pada pembagian kumpulan data menjadi kuartil. Kuartil membagi kumpulan data terurut menjadi empat bagian yang sama besar. Nilai yang memisahkan bagian-bagian ini disebut kuartil pertama, kedua (median), dan ketiga yang masing-masing dilambangkan dengan Q1, Q2, dan Q3.[3]

Penggunaan

IQR digunakan untuk membuat diagram kotak garis, sebuah representasi grafis sederhana yang menunjukkan distribusi probabilitas. Untuk sebuah distribusi simetris (median sama dengan rata-rata kuartil pertama dan ketiga), setengah IQR sama dengan deviasi absolut median (MAD). IQR juga dapat digunakan untuk mengidentifikasi pencilan (lihat di bawah) dan mencari deviasi kuartil / jangkauan semi-interkuartil.[4][5]

Algoritma

IQR dari suatu kumpulan data merupakan selisih antara kuartil atas (Q3) dan bawah (Q1). Setiap kuartil adalah median[6] dari sebagian data, seperti yang ditunjukkan oleh contoh berikut.

Misal, terdapat kumpulan data berjumlah genap (2n) atau ganjil (2n + 1), maka

kuartil pertama Q1 = median dari n data terkecil
kuartil ketiga Q3 = median dari n data terbesar [6]

Kuartil kedua Q 2 sama dengan median kumpulan data yang sesungguhnya.[6]

Contoh

Kumpulan data dalam sebuah tabel

Tabel berikut memiliki 13 baris yang tiap barisnya berisi sebuah data.

i x[i] Median Kuartil
1 7 Q2 = 87
(median seluruh data pada tabel)
Q1 = 31
(median paruh atas, dari baris 1 hingga 6)
2 7
3 31
4 31
5 47
6 75
7 87
8 115 Q3 = 119
(median paruh bawah, dari baris 8 hingga 13)
9 116
10 119
11 119
12 155
13 177

Jangkauan interkuartil data di atas adalah:

 .

Kumpulan data dalam diagram kotak polos

                    
                             +−−−−−+−+     
               * |−−−−−−−−−−−|     | |−−−−−−−−−−−|
                             +−−−−−+−+    
                    
 +−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+   garis bilangan
 0   1   2   3   4   5   6   7   8   9   10  11  12
  

Kumpulan data pada diagram kotak ini memiliki:

  • kuartil bawah (pertama) Q1 = 7
  • median (kuartil kedua) Q2 = 8.5
  • kuartil atas (ketiga) Q3 = 9
  • jangkauan interkuartil, IQR = Q3 - Q1 = 2
  • lebih rendah 1,5 * kumis IQR = Q 1 - 1,5 * IQR = 7 - 3 = 4. (Jika tidak ada titik data di 4, maka titik terendah lebih besar dari 4. )
  • atas 1,5 * kumis IQR = Q 3 + 1,5 * IQR = 9 + 3 = 12. (Jika tidak ada titik data di 12, maka titik tertinggi kurang dari 12. )

Hal ini menunjukkan bahwa satu garis 1,5*IQR dengan garis 1,5*IQR lainnya bisa jadi memiliki panjang yang tidak sama.

Distribusi

Jangkauan interkuartil dari distribusi kontinu dapat dihitung dengan mengintegrasikan fungsi kepadatan probabilitas. Kuartil bawah (Q1) adalah bilangan sedemikian rupa sehingga integral PDF dari -∞ ke Q1 sama dengan 0,25, sedangkan kuartil atas (Q3) adalah bilangan sedemikian rupa sehingga integral dari -∞ ke Q3 sama dengan 0,75. Pada distribusi fungsi kumulatif (CDF), kuartil dapat didefinisikan sebagai:

 
 

dengan CDF−1 adalah fungsi kuantil .

Jangkauan interkuartil dan median dari beberapa distribusi umum ditunjukkan pada tabel di bawah ini

Distribusi Median IQR
Normal μ 2 Φ − 1 (0,75) σ ≈ 1,349σ ≈ (27/20) σ
Laplace μ 2 b   ln (2) ≈ 1.386 b
Cauchy μ

Uji jangkauan interkuartil untuk normalitas distribusi

IQR, rata-rata, dan deviasi standar dari populasi P dapat digunakan dalam uji sederhana untuk menentukan apakah P terdistribusi normal atau tidak. Jika P terdistribusi normal, maka skor standar kuartil pertama, z1, adalah −0.67, dan skor standar kuartil ketiga, z3, adalah +0.67. Diberikan rata-rata = X dan standar deviasi = σ untuk P, jika P berdistribusi normal, maka kuartil pertama dapat dinyatakan sebagai

 

dan kuartil ketiga

 

Pencilan

 
Diagram kotak garis dengan empat pencilan ringan dan satu pencilan ekstrim. Dalam bagan ini, pencilan digolongkan sebagai ringan apabila pencilan berada Q3 + 1.5 IQR di atas kuartil atas dan pencilan ekstrim apabila pencilan berada lebih dari Q3 + 3 IQR di atas kuartil atas.

Jangkauan interkuartil sering digunakan untuk mencari pencilan dalam data. Pada contoh berikut, pencilan didefinisikan sebagai data yang ditemukan berada di bawah Q1 - 1.5 IQR atau di atas Q3 + 1.5 IQR. Dalam diagram kotak, nilai tertinggi dan terendah dalam batas ini ditandai oleh ujung dari garis (sering pula ditambahkan bilah tambahan di ujung garis) dan pencilan sebagai titik-titik individual.

Referensi

  1. ^ Upton, Graham; Cook, Ian (1996). Understanding Statistics. Oxford University Press. hlm. 55. ISBN 0-19-914391-9. 
  2. ^ Zwillinger, D., Kokoska, S. (2000) CRC Standard Probability and Statistics Tables and Formulae, CRC Press. ISBN 1-58488-059-7 page 18.
  3. ^ A modern introduction to probability and statistics : understanding why and how . Dekking, Michel, 1946–. London: Springer. 2005. hlm. 234–238. ISBN 978-1-85233-896-1. OCLC 262680588. 
  4. ^ Yule, G. Udny (1911). An Introduction to the Theory of Statistics. Charles Griffin and Company. hlm. 147–148. 
  5. ^ (Inggris) Weisstein, Eric W. "Quartile Deviation". MathWorld. 
  6. ^ a b c Bertil., Westergren (1988). Beta [beta] mathematics handbook : concepts, theorems, methods, algorithms, formulas, graphs, tables. Studentlitteratur. hlm. 348. ISBN 9144250517. OCLC 18454776. 

Pranala luar