Hoofdstuk 7: Hypothese toetsen: T-Toets voor één steekproef
Betrouwbaarheidsinterval voor μ wanneer σ onbekend is
Tot nu toe hebben we de volgende formule gebruikt om een #C\%\,CI# te berekenen voor een populatiegemiddelde #\mu#:
\[CI_{\mu}=\bigg(\bar{X} - z^*\cdot \cfrac{\sigma}{\sqrt{n}},\,\,\,\, \bar{X} + z^*\cdot \cfrac{\sigma}{\sqrt{n}} \bigg)\]
Net als de berekening van de #Z#-statistiek, vereist deze berekening dat de populatiestandaardafwijking #\sigma# bekend is.
Wanneer #\sigma# onbekend is, zullen we moeten vertrouwen op de #t#-verdeling en de steekproefstandaardafwijking #s# om het betrouwbaarheidsinterval te berekenen.
#\phantom{0}#
Betrouwbaarheidsinterval voor een Populatiegemiddelde wanneer σ Onbekend is
Ervan uitgaande dat de steekproefverdeling van het steekproefgemiddelde (ongeveer) normaal is, is de algemene formule voor het berekenen van een #C\%# CI voor een populatiegemiddelde #\mu#, gebaseerd op een willekeurige steekproef met grootte #n#, wanneer σ onbekend is:
\[CI_{\mu}=\bigg(\bar{X} - t^*\cdot \cfrac{s}{\sqrt{n}},\,\,\,\, \bar{X} + t^*\cdot \cfrac{s}{\sqrt{n}} \bigg)\]
Waar #t^*# de kritieke waarde is van de #t_{n-1}# verdeling, zodat #\mathbb{P}(-t^* \leq t \leq t^*)=\frac{C}{100}#.
t* Berekenen met Statistische Software
Laat #C# het betrouwbaarheidsniveau in #\%# zijn.
Gebruik de functie T.INV() om de kritische waarde #t^*# in Excel te berekenen:
\[=\text{T.INV}((100+C)/200, n \text{ - } 1)\]
Gebruik de functie qt() om de kritische waarde #t^*# in R te berekenen:
\[\text{qt}(p=(100+C)/200, df=n \text{ - } 1,lower.tail = \text{WAAR})\]
Hij verzamelt een willekeurige steekproef van #74# studenten. Gemiddeld besteedden deze studenten #8.0# uur per week aan hun huiswerk met een standaardafwijking van #s=1.1# uur.
Construeer een #95\%# betrouwbaarheidsinterval voor het populatiegemiddelde #\mu#. Rond je antwoorden af op #3# decimalen.
Er zijn een aantal verschillende manieren waarop we het betrouwbaarheidsinterval kunnen berekenen. Klik op een van de panelen om naar een specifieke oplossing te gaan.
Aangezien de standaardafwijking van de populatie #\sigma# onbekend is, moeten we de #t#-verdeling en de standaardafwijking van de steekproef #s# gebruiken om het betrouwbaarheidsinterval te construeren.
Een steekproefgrootte van #n=74# wordt groot genoeg geacht om de Centrale Limietstelling toe te passen.
Dit betekent dat, hoewel de steekproef in kwestie afkomstig is van een populatie met een onbekende verdeling, de steekproefverdeling van het steekproefgemiddelde bij benadering normaal is.
Ervan uitgaande dat de steekproefverdeling van het steekproefgemiddelde (ongeveer) normaal is, is de algemene formule voor het berekenen van een #C\%\, CI# voor het populatiegemiddelde #\mu#, gebaseerd op een willekeurige steekproef van grootte #n#:
\[CI_{\mu}=\bigg(\bar{X} - t^*\cdot \cfrac{s}{\sqrt{n}},\,\,\,\, \bar{X} + t^*\cdot \cfrac{s}{\sqrt{n}} \bigg)\]
Voor een gegeven betrouwbaarheidsniveau #C# (in #\%#), is de kritische waarde #t^*# van de #t_{n-1}#-verdeling de waarde zodanig dat #\mathbb{P}(-t^* \leq t \leq t^*)=\cfrac{C}{100}#.
Om deze kritische waarde #t^*# in Excel te berekenen, gebruik je de volgende functie:
T.INV(probability, deg_freedom)
- probability: Een kans die overeenkomt met de #t#-verdeling.
- deg_freedom: Een geheel getal dat het aantal vrijheidsgraden aangeeft
We hebben hier dat #C=95#. Dus om #t^*# te berekenen zodanig dat #\mathbb{P}(-t^* \leq t \leq t^*)=0.95#, voer je het volgende commando uit:
\[\begin{array}{c}
=\text{T.INV}((100+C)/200, n - 1)\\
\downarrow\\
=\text{T.INV}(195/200, 74 \text{ - } 1)
\end{array}\]
Dit geeft:
\[t^* = 1.99300\]
Bereken de ondergrens #L# van het betrouwbaarheidsinterval:
\[L = \bar{X} - t^* \cdot \cfrac{s}{\sqrt{n}} = 8.0 - 1.99300 \cdot \cfrac{1.1}{\sqrt{74}}=7.745\]
Bereken de bovengrens #U# van het betrouwbaarheidsinterval:
\[U = \bar{X} + t^* \cdot \cfrac{s}{\sqrt{n}} = 8.0 + 1.99300 \cdot \cfrac{1.1}{\sqrt{74}}=8.255\]
Dus het #95\%# betrouwbaarheidsinterval voor het populatiegemiddelde #\mu# is:
\[CI_{\mu,\,95\%}=(7.745,\,\,\, 8.255)\]
Aangezien de standaardafwijking van de populatie #\sigma# onbekend is, moeten we de #t#-verdeling en de standaardafwijking van de steekproef #s# gebruiken om het betrouwbaarheidsinterval te construeren.
Een steekproefgrootte van #n=74# wordt groot genoeg geacht om de Centrale Limietstelling toe te passen.
Dit betekent dat, hoewel de steekproef in kwestie afkomstig is van een populatie met een onbekende verdeling, de steekproefverdeling van het steekproefgemiddelde bij benadering normaal is.
Aannemende dat de steekproefverdeling van het steekproefgemiddelde (ongeveer) normaal is, is de algemene formule voor het berekenen van een #C\%\, CI# voor het populatiegemiddelde #\mu#, gebaseerd op een willekeurige steekproef van grootte #n#:
\[CI_{\mu}=\bigg(\bar{X} - t^*\cdot \cfrac{s}{\sqrt{n}},\,\,\,\, \bar{X} + t^*\cdot \cfrac{s}{\sqrt{n}} \bigg)\]
Voor een gegeven betrouwbaarheidsniveau #C# (in #\%#), is de kritische waarde #t^*# van de #t_{n-1}#-verdeling de waarde zodanig dat #\mathbb{P}(-t^* \leq t \leq t^*)=\cfrac{C}{100}#.
Om deze kritische waarde #t^*# in R te berekenen, gebruik je de volgende functie:
qt(p, df, lower.tail)
- p: Een kans die overeenkomt met de #t#-verdeling.
- df: Een geheel getal dat het aantal vrijheidsgraden aangeeft.
- lower.tail: Indien TRUE (standaard), is de kans #\mathbb{P}(X \leq x)#, anders #\mathbb{P}(X \gt x)#.
We hebben hier dat #C=95#. Dus, om #t^*# te berekenen zodanig dat #\mathbb{P}(-t^* \leq t \leq t^*)=0.95#, voer je het volgende commando uit:
\[\begin{array}{c}
\text{qt}(p = (100+C)/200, df = n \text{ - } 1, lower.tail = \text{TRUE})\\
\downarrow\\
\text{qt}(p =195/200, df = 74 \text { - } 1, lower.tail = \text{TRUE})
\end{array}\]
Dit geeft:
\[t^* = 1.99300\]
Bereken de ondergrens #L# van het betrouwbaarheidsinterval:
\[L = \bar{X} - t^* \cdot \cfrac{s}{\sqrt{n}} = 8.0 - 1.99300 \cdot \cfrac{1.1}{\sqrt{74}}=7.745\]
Bereken de bovengrens #U# van het betrouwbaarheidsinterval:
\[U = \bar{X} + t^* \cdot \cfrac{s}{\sqrt{n}} = 8.0 + 1.99300 \cdot \cfrac{1.1}{\sqrt{74}}=8.255\]
Dus het #95\%# betrouwbaarheidsinterval voor het populatiegemiddelde #\mu# is:
\[CI_{\mu,\,95\%}=(7.745,\,\,\, 8.255)\]
#\phantom{0}#
Verbinding met hypothesetoetsen
Er bestaat een direct verband tussen een tweezijdige #t#-test met één steekproef voor #\mu# en een #(1-\alpha)\cdot 100\%# betrouwbaarheidsinterval voor #\mu# op basis van de #t#-verdeling:
- Als #\mu_0# binnen het #(1 - \alpha)\cdot 100\%\,CI# valt, dan moet #H_0: \mu=\mu_0# niet worden verworpen met een #\alpha# significantieniveau.
- Als #\mu_0# buiten het #(1 - \alpha)\cdot 100\%\,CI# valt, moet #H_0: \mu=\mu_0# worden verworpen met een #\alpha# significantieniveau.
Stel dat je dezelfde steekproef gebruikt om #H_0: \mu = 0# te testen tegen #H_a: \mu \neq 0# op het significantieniveau van #\alpha = 0.09#.
Wat zou de conclusie zijn?
Omdat het #91\%# betrouwbaarheidsinterval de waarde #\mu_0 = 0# #(3.994,\,\,6.888)# niet bevat, zouden we #H_0: \mu = 0# verwerpen op het #\alpha = 0.09#-significantieniveau.
omptest.org als je een OMPT examen moet maken.