Hoofdstuk 1: Beschrijvende statistiek: Variabiliteit
Identificeren van uitschieters met de interkwartielafstand-regel
Een veelgebruikte methode voor het identificeren van uitschieters is de interkwartielafstand-regel.
Interkwartielafstand-regel
Volgens de interkwartielafstand-regel wordt een score #X# als een uitschieter beschouwd indien:
- De score meer dan #1.5\cdot IQR\,# onder het eerste kwartiel ligt: \[X < (Q_1 - 1.5\cdot IQR)\]
- De score meer dan #1.5\cdot IQR\,# boven het derde kwartiel ligt: \[X > (Q_3 + 1.5\cdot IQR)\]
Gegeven is de onderstaande steekproef van #13# scores:
\[52,\,\,\,63,\,\,\,59,\,\,\,62,\,\,\,55,\,\,\,56,\,\,\,52,\,\,\,29,\,\,\,25,\,\,\,49,\,\,\,68,\,\,\,63,\,\,\,65\]
Op basis van de interkwartielafstand regel, hoeveel uitschieters zijn er in deze steefproef?
Om de interkwartielafstand te berekenen, sorteer je eerst de waardes in oplopende volgorde:
\[25,\,\,\,29,\,\,\,49,\,\,\,52,\,\,\,52,\,\,\,55,\,\,\,56,\,\,\,59,\,\,\,62,\,\,\,63,\,\,\,63,\,\,\,65,\,\,\,68\]
Vervolgens bereken je het eerste kwartiel. Om de index #i_1# van het eerste kwartiel (#Q=1#) te vinden, gebruik je de volgende formule:
\[\begin{array}{rcl}
i_1 &=& \cfrac{Q}{4}(n-1)+1\\
&=& \cfrac{1}{4}(13 - 1) + 1=4
\end{array}\]
Omdat #i_1=4# een geheel getal is, is het eerste kwartiel de score op de #4^{e}# positie van de gesorteerde data:ordered data:
\[X_{4} = 52\]
Vervolgens bereken je het derde kwartiel. Om de index #i_3# van het derde kwartiel (#Q=3#) te vinden, gebruik je de volgende formule:
\[\begin{array}{rcl}
i_3 &=& \cfrac{Q}{4}(n-1)+1\\
&=& \cfrac{3}{4}(13 - 1) + 1=10
\end{array}\]
Omdat #i_3=10# een geheel getal is, is het derde kwartiel de score op de #10^{e}# positie van de gesorteerde data:
\[X_{10} = 63\]
Bereken je de interkwartielafstand:
\[\text{IQR}=Q_3-Q_1=63-52=11\]
Volgends de interkwartielafstand regel, is een score #X# een uitschieter als:
- De score meer dan #1.5\cdot IQR\,# onder het eerste kwartiel ligt: #X < (Q_1 - 1.5\cdot IQR)#
\[Q_1 - 1.5\cdot IQR = 52 - 1.5 \cdot 11 = 35.5\] - De score meer dan #1.5\cdot IQR\,# boven het derde kwartiel ligt: #X > (Q_3 + 1.5\cdot IQR)#
\[Q_3 + 1.5\cdot IQR = 63 + 1.5 \cdot 11 = 79.5\]
Dit betekent dat een score #X<35.5# or #X>79.5# een uitschieter is, waarvan er #2# zijn in de steekproef, namelijk: #29# and #25#.
omptest.org als je een OMPT examen moet maken.