Hvornår skal man bruge t-testen (Student)?

Brug t-testen til at sammenligne gennemsnit, når populationens standardafvigelse er ukendt og standardafvigelsen estimeres ud fra data. Det er det mest almindelige tilfælde i praksis.

Hvad er frihedsgrader i en t-test?

Det er antallet af værdier, der frit kan variere i beregningen. For én stikprøve er det n minus 1. De afgør formen på den t-fordeling, der bruges til at finde p-værdien.

Hvad er en parret t-test?

Det er testen til gentagne målinger på de samme personer, fx før og efter en behandling. Den analyserer gennemsnittet af de individuelle forskelle.

t-test-beregner (Student)

Hvad er t-testen (Student)

T-testen (Student) er den mest brugte statistiske procedure til at sammenligne gennemsnit. Den svarer på et direkte spørgsmål: er forskellen mellem to gennemsnit — eller mellem et gennemsnit og en referenceværdi — stor nok til at blive opfattet som reel, eller kan det bare være tilfældig variation i stikprøven?

Navnet stammer fra William Sealy Gosset, der offentliggjorde metoden i 1908 under pseudonymet "Student", mens han arbejdede på Guinness-bryggeriet. Hans problem var praktisk: at drage konklusioner ud fra små stikprøver, uden at kende populationens sande standardafvigelse. Det er præcis det, t-testen er til — og det er derfor, den er så udbredt i sundhedsforskning, psykologi, undervisning og kvalitetsstyring.

Forskellen i forhold til z-testen ligger der: z-testen kræver, at du kender populationens standardafvigelse; t-testen arbejder med standardafvigelsen estimeret ud fra selve stikprøven. For at kompensere for den ekstra usikkerhed bruger den t-fordelingen, der ligner normalfordelingen, men har lidt bredere haler — mere konservativ.

De tre typer t-test

At vælge den rigtige type er det vigtigste trin. Denne beregner tilbyder alle tre:

1. t-test for én stikprøve

Sammenligner gennemsnittet af én enkelt gruppe med en kendt referenceværdi (μ₀). Eksempel: er gennemsnitsvægten af pakkerne fra en produktionslinje virkelig 500 g? Afviger en klasses gennemsnitskarakter fra skolens historiske gennemsnit?

2. t-test for to uafhængige stikprøver

Sammenligner gennemsnittene fra to forskellige, uafhængige grupper. Eksempel: er restitueringstiden forskellig mellem dem, der fik behandling A, og dem, der fik B? Denne beregner bruger Welchs test, som ikke kræver, at de to grupper har samme varians — den moderne anbefaling som standard.

3. Parret t-test

Sammenligner to målinger foretaget på de samme personer, typisk før og efter en intervention. Da hver person er sin egen kontrol, analyseres gennemsnittet af de individuelle forskelle. Eksempel: er de samme patienters blodtryk faldet efter otte ugers medicin?

Parret eller uafhængig?

Hvis de samme personer er målt to gange, er testen parret — at bruge den som uafhængig spilder information og statistisk styrke. Hvis det er to forskellige grupper af personer, er den uafhængig.

Sådan virker beregningen

Trods de tre typer er ideen altid den samme: divider den observerede forskel med standardfejlen — et mål for, hvor meget tilfældig variation der kan forventes. Resultatet er t-statistikken:

t = (observeret forskel) ÷ (standardfejl) Jo større |t|, jo længere er du fra hypotesen om "ingen forskel".

For testen med én stikprøve er den observerede forskel f.eks. (gennemsnit − μ₀), og standardfejlen er standardafvigelsen divideret med kvadratroden af n:

t = (x̄ − μ₀) ÷ (s ÷ √n)

Derefter har beregneren brug for frihedsgraderne (df) — for én stikprøve er df = n − 1. De bestemmer den nøjagtige form af t-fordelingen. Til sidst omsætter p-værdien t og df til en sandsynlighed via t-fordelingens fordelingsfunktion (her beregnet med den ufuldstændige beta-funktion for høj præcision).

Forudsætninger for t-testen

T-testen er robust, men der er betingelser for, at den fungerer godt:

Kvantitative data: den målte variabel er numerisk (vægt, tid, karakter, blodtryk).
Tilfældig stikprøve: data repræsenterer den ønskede population.
Tilnærmelsesvis normalitet: data (eller forskellene i den parrede version) følger nogenlunde en normalfordeling. Med stikprøver større end ~30 er små afvigelser ikke længere et problem.
Uafhængighed: i to-stikprøvetesten må de to grupper ikke påvirke hinanden.

Når forudsætningerne svigter alvorligt — meget skæve data eller meget små stikprøver — er ikke-parametriske tests (som Mann-Whitney eller Wilcoxon) gode alternativer.

Sådan fortolker du resultatet

Beregneren returnerer seks nøgletal:

t-statistik — forskellen målt i antal standardfejl.
Frihedsgrader — bestemmer den fordeling, der bruges til p-værdien.
P-værdi — sandsynligheden for at observere en så stor forskel ved tilfældighed. Hvis den er mindre end signifikansniveauet (typisk 0,05), er resultatet signifikant.
Standardfejl — den tilfældige variation, der kan forventes i estimatet.
Punktestimat — gennemsnittet (én stikprøve) eller forskellen i gennemsnit (to stikprøver og parret).
Konfidensinterval — det sandsynlige interval for den sande værdi. Hvis et interval for forskellen indeholder nul, er forskellen ikke signifikant.

Løst eksempel

Et sundhedsteam måler det systoliske blodtryk hos 40 patienter på en klinik. Gennemsnittet blev 138 mmHg med en standardafvigelse på 16 mmHg. Referenceværdien, der betragtes som sund, er 130 mmHg. Afviger gruppens gennemsnitstryk fra referenceværdien?

Standardfejl: SF = 16 ÷ √40 ≈ 2,53.
t-statistik: t = (138 − 130) ÷ 2,53 ≈ 3,16.
Frihedsgrader: df = 40 − 1 = 39.
Tosidet p-værdi for t = 3,16 og df = 39: ≈ 0,003.

Da 0,003 < 0,05, er forskellen statistisk signifikant: gruppens gennemsnitstryk er faktisk højere end referenceværdien. Brug knappen "Brug eksempeldata" for at se beregningen i beregneren.

Ofte stillede spørgsmål

Hvornår skal jeg bruge t-testen?

Når du vil sammenligne gennemsnit, og populationens standardafvigelse er ukendt — hvilket er stort set altid tilfældet i praksis. Vil du sammenligne proportioner eller rater, så brug A/B-testen eller proportionstesten.

Hvad er forskellen mellem t-test og z-test?

Z-testen kræver, at populationens standardafvigelse er kendt, og bruger normalfordelingen. T-testen bruger standardafvigelsen estimeret fra stikprøven og t-fordelingen, der har bredere haler for at kompensere for den usikkerhed. Med store stikprøver giver de to næsten identiske resultater.

Hvad er frihedsgrader?

Det er antallet af værdier, der frit kan variere, når man estimerer en statistik. For én stikprøve er det n − 1. De bestemmer formen af t-fordelingen: jo flere frihedsgrader, jo mere ligner t-fordelingen normalfordelingen.

Kan jeg bruge t-testen med små stikprøver?

Ja — den blev faktisk skabt netop til det. Men med meget små stikprøver bliver antagelsen om normalitet vigtigere, og testen mister styrke til at opdage reelle forskelle.

t-test-beregner (Student)

Beregn t-testen

Hvad er t-testen (Student)

De tre typer t-test

1. t-test for én stikprøve

2. t-test for to uafhængige stikprøver

3. Parret t-test

Sådan virker beregningen

Forudsætninger for t-testen

Sådan fortolker du resultatet

Løst eksempel

Ofte stillede spørgsmål

Brug for statistik inden for dit felt?

t-test-beregner (Student)

Beregn t-testen

Hvad er t-testen (Student)

De tre typer t-test

1. t-test for én stikprøve

2. t-test for to uafhængige stikprøver

3. Parret t-test

Sådan virker beregningen

Forudsætninger for t-testen

Sådan fortolker du resultatet

Løst eksempel

Ofte stillede spørgsmål

Relaterede beregnere

z-test

Konfidensinterval

A/B-test

Brug for statistik inden for dit felt?