Hvornår skal man bruge chi-i-anden testen?

Brug chi-i-anden uafhængighedstesten, når du har to kategoriske variabler og vil vide, om de er relaterede — for eksempel køn og præference, behandling og udfald, region og holdning.

Hvad er den mindste forventede værdi pr. celle?

Chi-i-anden tilnærmelsen fungerer godt, når alle forventede frekvenser er mindst 5. Med lavere forventede værdier bør man vælge Fishers eksakte test.

Det er et mål for effektstørrelse, der går fra 0 til 1. Det angiver styrken af sammenhængen mellem variablerne: omkring 0,1 er svag, 0,3 er moderat og 0,5 eller mere er stærk.

chi-i-anden-beregner (Uafhængighedstest)

Hvad er chi-i-anden testen

Chi-i-anden uafhængighedstesten (χ²) svarer på et meget almindeligt spørgsmål i forskning: er to kategoriske variabler forbundet, eller er de uafhængige? Med andre ord — ændrer kendskab til den ene variabels værdi sandsynligheden for den anden?

Tænk på situationer som: påvirker personens køn præferencen for et produkt? Er regionen i landet forbundet med stemmeintentionen? Er behandlingstypen relateret til det kliniske udfald? I alle disse tilfælde har du ikke tal at måle med — du har kategorier at tælle. Chi-i-anden testen er det rette værktøj til den slags data.

Logikken er elegant. Hvis de to variabler var fuldstændig uafhængige, kunne man forudsige, hvor mange tilfælde der ville falde i hver kombination af kategorier, alene ud fra totalerne. Testen sammenligner disse forventede frekvenser med de faktisk observerede frekvenser. Hvis forskellen mellem det observerede og det forventede er for stor til at være tilfældig, konkluderer man, at der findes en sammenhæng.

Hvornår skal man bruge den

Chi-i-anden uafhængighedstesten er den rigtige, når:

De to variabler er kategoriske — køn, region, aldersgruppe, foretrukket mærke, udfald (helbredt / ikke helbredt). Kontinuerte numeriske variabler duer ikke.
Du har optællinger, ikke gennemsnit — data er "hvor mange personer i hver kombination", ikke "hvad er gennemsnittet i hver gruppe". Vil du sammenligne gennemsnit, så brug t-testen eller ANOVA.
Observationerne er uafhængige — hver person indgår i én eneste celle i tabellen, og én person påvirker ikke en anden.

Vil du blot sammenligne to proportioner (for eksempel succesraten i to grupper), så når proportionstesten og chi-i-anden samme konklusion — i en 2×2-tabel er χ² matematisk ækvivalent med z-testen for to proportioner.

Krydstabellen

Testens udgangspunkt er krydstabellen (også kaldet kontingenstabel). Den krydser kategorierne for de to variabler: hver række er en kategori for den første variabel, hver kolonne er en kategori for den anden, og hver celle indeholder antallet af tilfælde i den kombination.

Beregneren ovenfor bygger tabellen for dig. Start med størrelsen 2×2, og brug knapperne til at tilføje rækker og kolonner, alt efter dine kategorier. Læg altid optællinger ind — antal personer, antal svar, antal tilfælde — aldrig procenter eller gennemsnit.

Sådan virker beregningen

Testen har fire trin. Det første er at beregne, for hver celle, den forventede frekvens under uafhængighedshypotesen. Den afhænger kun af række- og kolonnetotalerne:

E_ij = (række i's total × kolonne j's total) ÷ samlet total

Andet trin er at måle, hvor meget hver observeret celle (O) afviger fra dens forventede værdi (E). Chi-i-anden statistikken summerer disse forskelle i anden potens, vægtet med den forventede værdi:

χ² = Σ (O_ij − E_ij)² ÷ E_ij Summen løber over alle celler i tabellen. Jo større χ², jo større misforhold mellem observeret og forventet.

Tredje trin er frihedsgraderne, som kun afhænger af tabellens form:

df = (antal rækker − 1) × (antal kolonner − 1)

Til sidst omdanner beregneren χ² og frihedsgraderne til en p-værdi ved hjælp af chi-i-anden fordelingen. En lille p-værdi betyder, at et så stort misforhold ville være meget sjældent, hvis variablerne var uafhængige — altså er der en sammenhæng.

Forudsætninger for testen

Chi-i-anden er praktisk, men dens præcision afhænger af en vigtig betingelse om størrelsen af de forventede frekvenser:

Reglen om forventede frekvenser

Chi-i-anden tilnærmelsen er pålidelig, når alle forventede frekvenser er mindst 5. Beregneren viser den mindste forventede frekvens i tabellen; hvis den ligger under 5, bør resultatet fortolkes med varsomhed. I så fald er Fishers eksakte test det anbefalede alternativ, særligt for 2×2-tabeller.

Derudover kræver testen uafhængige observationer (hvert tilfælde tæller én gang) og absolutte optællinger i cellerne. Brug aldrig chi-i-anden på procenter, gennemsnit eller data, hvor samme person optræder i mere end én celle.

Sådan fortolker du resultatet

Beregneren returnerer et kort med konklusionen og seks nøgletal:

Chi-i-anden (χ²) — den samlede størrelse af misforholdet mellem observeret og forventet. Alene siger det lidt; det skal sammenlignes med fordelingen.
Frihedsgrader — afgør, hvilken chi-i-anden fordeling der bruges til at finde p-værdien.
P-værdi — sandsynligheden for at se et så stort misforhold ved tilfældighed. Hvis den er mindre end signifikansniveauet (typisk 0,05), er der en signifikant sammenhæng.
Cramérs V — effektstørrelsen. Går fra 0 til 1 og måler styrken af sammenhængen: omkring 0,1 er svag, 0,3 er moderat og 0,5 eller mere er stærk.
Antal tilfælde i alt — summen af alle celler i tabellen.
Mindste forventede frekvens — til at tjekke forudsætningen: hvis den er under 5, fortolk med varsomhed.

Signifikans og styrke er to ting

En lille p-værdi bekræfter, at der findes en sammenhæng, men siger ikke, om den er stærk. Med meget store stikprøver bliver trivielle sammenhænge "signifikante". Kig derfor altid på Cramérs V: den svarer på det spørgsmål, der virkelig betyder noget — hvor stor er sammenhængen?

Løst eksempel

Et hospital testede en ny vejledningsprotokol til patienter. Af 60 patienter, der modtog protokollen, forbedrede 45 deres efterlevelse af behandlingen; af 60 patienter i kontrolgruppen forbedrede 30 sig. Er forbedringen forbundet med protokollen?

	Forbedrede sig	Forbedrede sig ikke	I alt
Gruppe med protokol	45	15	60
Kontrolgruppe	30	30	60
I alt	75	45	120

Forventede frekvenser: for cellen "protokol × forbedrede sig" er E = (60 × 75) ÷ 120 = 37,5. Alle fire forventede celleværdier er 37,5 eller 22,5.
χ²-statistik: ved at lægge (O − E)² ÷ E sammen for de fire celler: 1,5 + 2,5 + 1,5 + 2,5 = 8,0.
Frihedsgrader: df = (2 − 1) × (2 − 1) = 1.
P-værdi: for χ² = 8,0 og df = 1 er p-værdien ≈ 0,0047.

Da 0,0047 < 0,05, er sammenhængen statistisk signifikant: forbedringen i efterlevelse er forbundet med protokollen. Cramérs V ≈ 0,26 indikerer en sammenhæng af moderat styrke. Brug knappen "Brug eksempeldata" for at se beregningen i beregneren.

Ofte stillede spørgsmål

Hvad er chi-i-anden testen?

Det er en hypotesetest, der undersøger, om to kategoriske variabler er forbundet. Den sammenligner de observerede frekvenser i en krydstabel med de frekvenser, der ville være forventet, hvis variablerne var uafhængige.

Hvornår skal jeg bruge chi-i-anden?

Når du har to kategoriske variabler og vil vide, om de er relaterede — som køn og præference, behandling og udfald, uddannelse og holdning. Vil du sammenligne gennemsnit, så brug t-testen eller ANOVA.

Hvad er frihedsgrader i chi-i-anden?

De beregnes som (antal rækker − 1) × (antal kolonner − 1). En 2×2-tabel har 1 frihedsgrad; en 3×4-tabel har 6. De afgør den fordeling, der bruges til p-værdien.

Hvad hvis de forventede frekvenser er mindre end 5?

Chi-i-anden tilnærmelsen mister præcision. Beregneren advarer, når den mindste forventede frekvens er under 5. I de tilfælde bør du vælge Fishers eksakte test, særligt i 2×2-tabeller.

Beviser chi-i-anden årsag og virkning?

Nej. Testen viser, at der er en sammenhæng mellem variablerne, men sammenhæng er ikke kausalitet. Andre variabler kan forklare den observerede relation.

Hvad er forskellen mellem chi-i-anden og proportionstesten?

I en 2×2-tabel er de ækvivalente — de når frem til samme p-værdi. Chi-i-anden er mere generel: den fungerer med tabeller af enhver størrelse og sammenligner mange kategorier på én gang.

chi-i-anden-beregner

Beregn chi-i-anden testen

Hvad er chi-i-anden testen

Hvornår skal man bruge den

Krydstabellen

Sådan virker beregningen

Forudsætninger for testen

Sådan fortolker du resultatet

Løst eksempel

Ofte stillede spørgsmål

I tvivl om hvilken test du skal bruge?

chi-i-anden-beregner

Beregn chi-i-anden testen

Hvad er chi-i-anden testen

Hvornår skal man bruge den

Krydstabellen

Sådan virker beregningen

Forudsætninger for testen

Sådan fortolker du resultatet

Løst eksempel

Ofte stillede spørgsmål

Relaterede beregnere

Proportionstest

ANOVA og k stikprøver

Hvilken test skal jeg bruge?

I tvivl om hvilken test du skal bruge?