Hvad er chi-i-anden testen
Chi-i-anden uafhængighedstesten (χ²) svarer på et meget almindeligt spørgsmål i forskning: er to kategoriske variabler forbundet, eller er de uafhængige? Med andre ord — ændrer kendskab til den ene variabels værdi sandsynligheden for den anden?
Tænk på situationer som: påvirker personens køn præferencen for et produkt? Er regionen i landet forbundet med stemmeintentionen? Er behandlingstypen relateret til det kliniske udfald? I alle disse tilfælde har du ikke tal at måle med — du har kategorier at tælle. Chi-i-anden testen er det rette værktøj til den slags data.
Logikken er elegant. Hvis de to variabler var fuldstændig uafhængige, kunne man forudsige, hvor mange tilfælde der ville falde i hver kombination af kategorier, alene ud fra totalerne. Testen sammenligner disse forventede frekvenser med de faktisk observerede frekvenser. Hvis forskellen mellem det observerede og det forventede er for stor til at være tilfældig, konkluderer man, at der findes en sammenhæng.
Hvornår skal man bruge den
Chi-i-anden uafhængighedstesten er den rigtige, når:
- De to variabler er kategoriske — køn, region, aldersgruppe, foretrukket mærke, udfald (helbredt / ikke helbredt). Kontinuerte numeriske variabler duer ikke.
- Du har optællinger, ikke gennemsnit — data er "hvor mange personer i hver kombination", ikke "hvad er gennemsnittet i hver gruppe". Vil du sammenligne gennemsnit, så brug t-testen eller ANOVA.
- Observationerne er uafhængige — hver person indgår i én eneste celle i tabellen, og én person påvirker ikke en anden.
Vil du blot sammenligne to proportioner (for eksempel succesraten i to grupper), så når proportionstesten og chi-i-anden samme konklusion — i en 2×2-tabel er χ² matematisk ækvivalent med z-testen for to proportioner.
Krydstabellen
Testens udgangspunkt er krydstabellen (også kaldet kontingenstabel). Den krydser kategorierne for de to variabler: hver række er en kategori for den første variabel, hver kolonne er en kategori for den anden, og hver celle indeholder antallet af tilfælde i den kombination.
Beregneren ovenfor bygger tabellen for dig. Start med størrelsen 2×2, og brug knapperne til at tilføje rækker og kolonner, alt efter dine kategorier. Læg altid optællinger ind — antal personer, antal svar, antal tilfælde — aldrig procenter eller gennemsnit.
Sådan virker beregningen
Testen har fire trin. Det første er at beregne, for hver celle, den forventede frekvens under uafhængighedshypotesen. Den afhænger kun af række- og kolonnetotalerne:
Andet trin er at måle, hvor meget hver observeret celle (O) afviger fra dens forventede værdi (E). Chi-i-anden statistikken summerer disse forskelle i anden potens, vægtet med den forventede værdi:
Tredje trin er frihedsgraderne, som kun afhænger af tabellens form:
Til sidst omdanner beregneren χ² og frihedsgraderne til en p-værdi ved hjælp af chi-i-anden fordelingen. En lille p-værdi betyder, at et så stort misforhold ville være meget sjældent, hvis variablerne var uafhængige — altså er der en sammenhæng.
Forudsætninger for testen
Chi-i-anden er praktisk, men dens præcision afhænger af en vigtig betingelse om størrelsen af de forventede frekvenser:
Chi-i-anden tilnærmelsen er pålidelig, når alle forventede frekvenser er mindst 5. Beregneren viser den mindste forventede frekvens i tabellen; hvis den ligger under 5, bør resultatet fortolkes med varsomhed. I så fald er Fishers eksakte test det anbefalede alternativ, særligt for 2×2-tabeller.
Derudover kræver testen uafhængige observationer (hvert tilfælde tæller én gang) og absolutte optællinger i cellerne. Brug aldrig chi-i-anden på procenter, gennemsnit eller data, hvor samme person optræder i mere end én celle.
Sådan fortolker du resultatet
Beregneren returnerer et kort med konklusionen og seks nøgletal:
- Chi-i-anden (χ²) — den samlede størrelse af misforholdet mellem observeret og forventet. Alene siger det lidt; det skal sammenlignes med fordelingen.
- Frihedsgrader — afgør, hvilken chi-i-anden fordeling der bruges til at finde p-værdien.
- P-værdi — sandsynligheden for at se et så stort misforhold ved tilfældighed. Hvis den er mindre end signifikansniveauet (typisk 0,05), er der en signifikant sammenhæng.
- Cramérs V — effektstørrelsen. Går fra 0 til 1 og måler styrken af sammenhængen: omkring 0,1 er svag, 0,3 er moderat og 0,5 eller mere er stærk.
- Antal tilfælde i alt — summen af alle celler i tabellen.
- Mindste forventede frekvens — til at tjekke forudsætningen: hvis den er under 5, fortolk med varsomhed.
En lille p-værdi bekræfter, at der findes en sammenhæng, men siger ikke, om den er stærk. Med meget store stikprøver bliver trivielle sammenhænge "signifikante". Kig derfor altid på Cramérs V: den svarer på det spørgsmål, der virkelig betyder noget — hvor stor er sammenhængen?
Løst eksempel
Et hospital testede en ny vejledningsprotokol til patienter. Af 60 patienter, der modtog protokollen, forbedrede 45 deres efterlevelse af behandlingen; af 60 patienter i kontrolgruppen forbedrede 30 sig. Er forbedringen forbundet med protokollen?
| Forbedrede sig | Forbedrede sig ikke | I alt | |
|---|---|---|---|
| Gruppe med protokol | 45 | 15 | 60 |
| Kontrolgruppe | 30 | 30 | 60 |
| I alt | 75 | 45 | 120 |
- Forventede frekvenser: for cellen "protokol × forbedrede sig" er E = (60 × 75) ÷ 120 = 37,5. Alle fire forventede celleværdier er 37,5 eller 22,5.
- χ²-statistik: ved at lægge (O − E)² ÷ E sammen for de fire celler: 1,5 + 2,5 + 1,5 + 2,5 = 8,0.
- Frihedsgrader: df = (2 − 1) × (2 − 1) = 1.
- P-værdi: for χ² = 8,0 og df = 1 er p-værdien ≈ 0,0047.
Da 0,0047 < 0,05, er sammenhængen statistisk signifikant: forbedringen i efterlevelse er forbundet med protokollen. Cramérs V ≈ 0,26 indikerer en sammenhæng af moderat styrke. Brug knappen "Brug eksempeldata" for at se beregningen i beregneren.
Ofte stillede spørgsmål
Hvad er chi-i-anden testen?
Det er en hypotesetest, der undersøger, om to kategoriske variabler er forbundet. Den sammenligner de observerede frekvenser i en krydstabel med de frekvenser, der ville være forventet, hvis variablerne var uafhængige.
Hvornår skal jeg bruge chi-i-anden?
Hvad er frihedsgrader i chi-i-anden?
De beregnes som (antal rækker − 1) × (antal kolonner − 1). En 2×2-tabel har 1 frihedsgrad; en 3×4-tabel har 6. De afgør den fordeling, der bruges til p-værdien.
Hvad hvis de forventede frekvenser er mindre end 5?
Chi-i-anden tilnærmelsen mister præcision. Beregneren advarer, når den mindste forventede frekvens er under 5. I de tilfælde bør du vælge Fishers eksakte test, særligt i 2×2-tabeller.
Beviser chi-i-anden årsag og virkning?
Nej. Testen viser, at der er en sammenhæng mellem variablerne, men sammenhæng er ikke kausalitet. Andre variabler kan forklare den observerede relation.
Hvad er forskellen mellem chi-i-anden og proportionstesten?
I en 2×2-tabel er de ækvivalente — de når frem til samme p-værdi. Chi-i-anden er mere generel: den fungerer med tabeller af enhver størrelse og sammenligner mange kategorier på én gang.