z-test Beregner

Hvad er z-testen

Z-testen er en hypotesetest, der sammenligner gennemsnittet af en stikprøve med en kendt referenceværdi. Den svarer på et direkte spørgsmål: er forskellen mellem det gennemsnit, du har observeret, og den forventede værdi stor nok til at være reel, eller kan det blot være tilfældig variation hos dem, der kom med i stikprøven?

Z-testens kendetegn er en forudsætning: du skal kende populationens standardafvigelse (repræsenteret med det græske bogstav σ, sigma). Ikke stikprøvens standardafvigelse — men den i hele den population, stikprøven kommer fra. Den viden er det, der gør det muligt at bruge standardnormalfordelingen direkte til at beregne sandsynlighederne uden korrektion.

Bag navnet ligger z-scoren: ideen, der er central i al statistik, om at måle en afstand i "antal standardafvigelser". Z-testen anvender det samme begreb på stikprøvens gennemsnit. Når resultatet ligger langt fra referenceværdien — målt i standardfejl — bliver det usandsynligt, at afstanden er opstået ved tilfældighed.

Hvornår skal man bruge z-testen

Z-testen for et gennemsnit er den rigtige procedure, når to betingelser er opfyldt:

Populationens standardafvigelse er kendt. Det er mere almindeligt, end man tror: standardiserede psykometriske tests (IQ, store eksamener), kalibrerede måleinstrumenter og veldokumenterede industriprocesser har typisk et σ, som er fastlagt ud fra mange års historiske data.
Stikprøven kommer fra en tilnærmelsesvis normalfordelt population — eller er stor. Med en stor stikprøve (typisk n over ~30) sikrer den centrale grænseværdisætning, at stikprøvegennemsnittet følger nogenlunde en normalfordeling, selv hvis de oprindelige data ikke er normale.

Det første spørgsmål

Inden du vælger z-testen, så stil dig selv et ærligt spørgsmål: kommer standardafvigelsen, du vil bruge, fra populationen (fra en norm, en teknisk manual, mange års historik), eller blev den beregnet ud fra denne stikprøve? Hvis den er beregnet fra stikprøven, er den rigtige test t-testen.

z-test eller t-test?

Det er det mest almindelige spørgsmål — og svaret er enkelt. De to tests sammenligner gennemsnit og følger samme logik; forskellen ligger i, hvor standardafvigelsen kommer fra:

Z-test — bruger populationens standardafvigelse (σ), behandlet som et fast og kendt tal. Sandsynlighederne kommer fra standardnormalfordelingen.
T-test — bruger standardafvigelsen estimeret fra stikprøven (s). Da det estimat bærer en usikkerhed, anvender t-testen t-fordelingen, der ligner normalfordelingen, men har lidt bredere haler — mere konservativ.

I praksis er populationens standardafvigelse næsten aldrig kendt, og derfor er t-testen (Student) den, der bruges mest i dagligdagens forskning. Z-testen er reserveret til de tilfælde, hvor σ virkelig er kendt. Der er også et beroligende punkt: efterhånden som stikprøven vokser, nærmer t-fordelingen sig normalfordelingen mere og mere. Med store stikprøver giver z- og t-tests praktisk talt identiske resultater.

Den hyppigste fejl

At bruge z-testen med standardafvigelsen beregnet fra selve stikprøven undervurderer usikkerheden og gør p-værdien kunstigt lille. I små stikprøver kan det forvandle et ikke-signifikant resultat til "signifikant". I tvivlstilfælde: brug t-testen.

Sådan virker beregningen

Z-testen for et gennemsnit har tre trin. Først er der standardfejlen af gennemsnittet — hvor meget tilfældig variation der kan forventes fra én stikprøve til en anden. Den er populationens standardafvigelse divideret med kvadratroden af stikprøvestørrelsen:

SF = σ ÷ √n Jo større stikprøve, jo mindre standardfejl — gennemsnit fra store stikprøver er mere stabile.

Andet trin er z-statistikken: afstanden mellem stikprøvens gennemsnit (x̄) og sammenligningsværdien (μ₀), målt i antal standardfejl.

z = (x̄ − μ₀) ÷ (σ ÷ √n) Jo større |z|, jo længere er du fra hypotesen om "ingen forskel".

Tredje trin er at oversætte z til en p-værdi. Her kommer standardnormalfordelingen ind, og dens fordelingsfunktion, repræsenteret med Φ (det græske bogstav fi). Φ(z) angiver sandsynligheden for, at standardnormalfordelingen ligger under z. P-værdien kombinerer det med typen af test:

p-værdi (tosidet) = 2 · [ 1 − Φ(|z|) ]

I den tosidede test spørger du, om gennemsnittet simpelthen er forskelligt fra referenceværdien. I den ensidede test spørger du, om det er større (eller mindre) — og p-værdien er halvdelen af den tosidede. Beregneren returnerer også den kritiske z, grænseværdien i normalfordelingen for det valgte konfidensniveau: ved 95% tosidet er den cirka 1,96.

Sådan fortolker du resultatet

Beregneren returnerer seks nøgletal. Her er, hvad hvert af dem betyder:

z-statistik — forskellen mellem gennemsnittet og sammenligningsværdien, i antal standardfejl.
P-værdi — sandsynligheden for at observere en så stor forskel ved tilfældighed. Hvis den er mindre end signifikansniveauet (α, typisk 0,05), er resultatet signifikant.
Standardfejl — den tilfældige variation, der kan forventes i estimatet af gennemsnittet.
Gennemsnit af stikprøven — punktestimatet: dit bedste gæt på det sande gennemsnit ud fra dine data.
Kritisk z — grænseværdien i normalfordelingen for det valgte konfidensniveau. Hvis det beregnede |z| overstiger den, er resultatet signifikant.
Konfidensinterval — det sandsynlige interval for populationens sande gennemsnit. Hvis sammenligningsværdien μ₀ ligger uden for intervallet, er forskellen signifikant.

P-værdi og konfidensinterval fortæller samme historie ad to veje. P-værdien sammenligner en sandsynlighed med α; intervallet viser intervallet af plausible værdier. Når μ₀ falder uden for intervallet, ligger p-værdien under α — de to er altid enige.

Løst eksempel

En skole gennemfører en standardiseret IQ-test i en klasse på 60 elever. Det observerede gennemsnit blev 104. Testen er standardiseret til at have et populationsgennemsnit på 100 og en standardafvigelse på 15 — altså er σ kendt. Har klassen et gennemsnit, der adskiller sig fra populationsreferencen?

Standardfejl: SF = 15 ÷ √60 ≈ 1,936.
z-statistik: z = (104 − 100) ÷ 1,936 ≈ 2,07.
Tosidet p-værdi for z = 2,07: ≈ 0,039.
95% konfidensinterval for gennemsnittet: 104 ± 1,96 · 1,936, altså fra ≈ 100,2 til ≈ 107,8.

Da 0,039 < 0,05, er forskellen statistisk signifikant ved 95% konfidens: klassen har faktisk en gennemsnits-IQ over populationsreferencen. Bemærk, at værdien 100 ligger uden for konfidensintervallet — de to kriterier er enige. Brug knappen "Brug eksempeldata" for at se beregningen i beregneren.

Ofte stillede spørgsmål

Hvornår skal jeg bruge z-testen?

Brug z-testen til at sammenligne et gennemsnit med en referenceværdi, når populationens standardafvigelse er kendt — fx ved standardiserede tests, kalibrerede instrumenter eller processer med lang datahistorik. Vil du sammenligne proportioner, så brug A/B-testen eller proportionstesten.

Hvad er forskellen mellem z-test og t-test?

Z-testen bruger populationens standardafvigelse og standardnormalfordelingen. T-testen bruger standardafvigelsen estimeret fra stikprøven og t-fordelingen, med bredere haler for at kompensere for usikkerheden i det estimat. Når σ er ukendt — det almindelige tilfælde — er det t-testen, der skal bruges. Med store stikprøver giver de to næsten identiske resultater.

Hvad er z-statistikken?

Det er afstanden mellem stikprøvens gennemsnit og sammenligningsværdien, målt i antal standardfejl. Et z på 2 betyder fx, at det observerede gennemsnit ligger to standardfejl fra referenceværdien. Jo større |z|, jo stærkere belæg mod hypotesen om ingen forskel.

Hvad er p-værdien i z-testen?

Det er sandsynligheden for at observere en så stor eller større forskel, hvis det sande gennemsnit var lig med sammenligningsværdien. Hvis p-værdien er mindre end signifikansniveauet (typisk 0,05), er resultatet statistisk signifikant.

Hvad betyder kritisk z?

Det er grænseværdien i standardnormalfordelingen for det valgte konfidensniveau. I en tosidet test ved 95% er den kritiske z cirka 1,96; ved 99%, cirka 2,576. Hvis det beregnede |z| overstiger den kritiske z, er resultatet signifikant på det niveau.

Giver tosidet og ensidet z-test samme p-værdi?

Nej. Den ensidede p-værdi er halvdelen af den tosidede. Den tosidede test undersøger, om gennemsnittet blot er forskelligt fra referenceværdien; den ensidede undersøger en bestemt retning (større eller mindre) og er kun gyldig, hvis den retning blev fastlagt før dataindsamlingen.

z-test Beregner

Beregn z-testen

Hvad er z-testen

Hvornår skal man bruge z-testen

z-test eller t-test?

Sådan virker beregningen

Sådan fortolker du resultatet

Løst eksempel

Ofte stillede spørgsmål

Brug for statistik inden for dit felt?

z-test Beregner

Beregn z-testen

Hvad er z-testen

Hvornår skal man bruge z-testen

z-test eller t-test?

Sådan virker beregningen

Sådan fortolker du resultatet

Løst eksempel

Ofte stillede spørgsmål

Relaterede beregnere

t-test (Student)

Konfidensinterval

Proportionstest

Brug for statistik inden for dit felt?