Hoofdstuk 1: Beschrijvende statistiek: Centrummaten
Gevoeligheid voor uitschieters
Een belangrijke eigenschap van de drie behandelde centrummaten is de mate waarin zij gevoelig zijn voor uitschieters.
Een uitschieter is een uitzonderlijk hoge of lage score die niet lijkt te passen in het patroon van overige waarnemingen.
Het kan zijn dat een uitschieter het resultaat is van een meetfout of van een fout gemaakt tijdens het invoeren van de data, maar over het algemeen gaan we ervan uit dat een uitschieter een legitiem uitzonderlijk geval is.
Een statistische maat is gevoelig voor uitschieters wanneer de berekening van deze maat sterk beïnvloed wordt door de aanwezigheid van extreem hoge of lage scores in de dataset.
Zowel de modus en de mediaan zijn zijn ongevoelig zijn voor de aanwezigheid van uitschieters in de dataset. Het gemiddelde, daarentegen, is zeer gevoelig voor de aanwezigheid van uitschieters.
Maten voor de Centraliteit en Gevoeligheid
Het onderstaande voorbeeld illustreert de mate waarin de drie behandelde centrumaten gevoelig zijn voor uitschieters.
#\phantom{000000000000}# Dataset
Bekijk de volgende dataset met #n=13# scores:
#\,\,\,\,\,\,\,1,\, 1,\, 2,\, 4,\, 5,\, 5,\, 6,\, 8,\, 8,\, 8,\, 9,\, 10,\, 11#
Centrummaten
- Modus #= 8#
- Mediaan #= X_7 = 6#
- Gemiddelde #= \dfrac{78}{13} = 6#
Overweeg nu wat er gebeurt als we de score #X = 11# veranderen in een uitschieter, namelijk #X=76#.
#\phantom{000000000000}# Dataset
De nieuwe dataset van #n=13# scores wordt:
#\,\,\,\,\,\,\,1,\, 1,\, 2,\, 4,\, 5,\, 5,\, 6,\, 8,\, 8,\, 8,\, 9,\, 10,\, \boldsymbol{76}#
Centrummaten
- Modus #= 8#
- Mediaan #= X_7 = 6#
- Gemiddelde #= \dfrac{143}{13} = 11#
Zoals je kan zien blijven zowel de modus als de mediaan onveranderd:
- De meest voorkomende waarde in de dataset blijft hetzelfde, namelijk #X=8#.
- Daarnaast blijft ook de middelste score hetzelfde, namelijk #X_7=6#.
Dit toont aan dat zowel de modus en de mediaan ongevoelig zijn voor de aanwezigheid van uitschieters in de dataset.
In tegenstelling tot de modus en de mediaan, is het gemiddelde van de dataset door het toevoegen van de uitschieter bijna verdubbeld. Dit komt doordat elke score in de dataset, ongeacht zijn waarde, evenveel bijdraagt aan het gemiddelde. Hierdoor kan de aanwezigheid van één enkele extreem hoge of lage score een drastisch effect op het gemiddelde hebben, met name als de dataset relatief klein is.
omptest.org als je een OMPT examen moet maken.