chi-i-anden-beregner

Find ud af, om to kategoriske variabler er forbundet — uafhængighedstesten ud fra en krydstabel, med p-værdi og effektstørrelse.

Beregn chi-i-anden testen

Byg krydstabellen med de observerede frekvenser (optællinger). Brug knapperne til at justere antallet af rækker og kolonner.

Krydstabel

Overskrifterne kan redigeres. Hver celle skal indeholde en optælling (antal tilfælde).

Indstillinger

Hvad er chi-i-anden testen

Chi-i-anden uafhængighedstesten (χ²) svarer på et meget almindeligt spørgsmål i forskning: er to kategoriske variabler forbundet, eller er de uafhængige? Med andre ord — ændrer kendskab til den ene variabels værdi sandsynligheden for den anden?

Tænk på situationer som: påvirker personens køn præferencen for et produkt? Er regionen i landet forbundet med stemmeintentionen? Er behandlingstypen relateret til det kliniske udfald? I alle disse tilfælde har du ikke tal at måle med — du har kategorier at tælle. Chi-i-anden testen er det rette værktøj til den slags data.

Logikken er elegant. Hvis de to variabler var fuldstændig uafhængige, kunne man forudsige, hvor mange tilfælde der ville falde i hver kombination af kategorier, alene ud fra totalerne. Testen sammenligner disse forventede frekvenser med de faktisk observerede frekvenser. Hvis forskellen mellem det observerede og det forventede er for stor til at være tilfældig, konkluderer man, at der findes en sammenhæng.

Hvornår skal man bruge den

Chi-i-anden uafhængighedstesten er den rigtige, når:

  • De to variabler er kategoriske — køn, region, aldersgruppe, foretrukket mærke, udfald (helbredt / ikke helbredt). Kontinuerte numeriske variabler duer ikke.
  • Du har optællinger, ikke gennemsnit — data er "hvor mange personer i hver kombination", ikke "hvad er gennemsnittet i hver gruppe". Vil du sammenligne gennemsnit, så brug t-testen eller ANOVA.
  • Observationerne er uafhængige — hver person indgår i én eneste celle i tabellen, og én person påvirker ikke en anden.

Vil du blot sammenligne to proportioner (for eksempel succesraten i to grupper), så når proportionstesten og chi-i-anden samme konklusion — i en 2×2-tabel er χ² matematisk ækvivalent med z-testen for to proportioner.

Krydstabellen

Testens udgangspunkt er krydstabellen (også kaldet kontingenstabel). Den krydser kategorierne for de to variabler: hver række er en kategori for den første variabel, hver kolonne er en kategori for den anden, og hver celle indeholder antallet af tilfælde i den kombination.

Beregneren ovenfor bygger tabellen for dig. Start med størrelsen 2×2, og brug knapperne til at tilføje rækker og kolonner, alt efter dine kategorier. Læg altid optællinger ind — antal personer, antal svar, antal tilfælde — aldrig procenter eller gennemsnit.

Sådan virker beregningen

Testen har fire trin. Det første er at beregne, for hver celle, den forventede frekvens under uafhængighedshypotesen. Den afhænger kun af række- og kolonnetotalerne:

Eij = (række i's total × kolonne j's total) ÷ samlet total

Andet trin er at måle, hvor meget hver observeret celle (O) afviger fra dens forventede værdi (E). Chi-i-anden statistikken summerer disse forskelle i anden potens, vægtet med den forventede værdi:

χ² = Σ (Oij − Eij)² ÷ Eij Summen løber over alle celler i tabellen. Jo større χ², jo større misforhold mellem observeret og forventet.

Tredje trin er frihedsgraderne, som kun afhænger af tabellens form:

df = (antal rækker − 1) × (antal kolonner − 1)

Til sidst omdanner beregneren χ² og frihedsgraderne til en p-værdi ved hjælp af chi-i-anden fordelingen. En lille p-værdi betyder, at et så stort misforhold ville være meget sjældent, hvis variablerne var uafhængige — altså er der en sammenhæng.

Forudsætninger for testen

Chi-i-anden er praktisk, men dens præcision afhænger af en vigtig betingelse om størrelsen af de forventede frekvenser:

Reglen om forventede frekvenser

Chi-i-anden tilnærmelsen er pålidelig, når alle forventede frekvenser er mindst 5. Beregneren viser den mindste forventede frekvens i tabellen; hvis den ligger under 5, bør resultatet fortolkes med varsomhed. I så fald er Fishers eksakte test det anbefalede alternativ, særligt for 2×2-tabeller.

Derudover kræver testen uafhængige observationer (hvert tilfælde tæller én gang) og absolutte optællinger i cellerne. Brug aldrig chi-i-anden på procenter, gennemsnit eller data, hvor samme person optræder i mere end én celle.

Sådan fortolker du resultatet

Beregneren returnerer et kort med konklusionen og seks nøgletal:

  • Chi-i-anden (χ²) — den samlede størrelse af misforholdet mellem observeret og forventet. Alene siger det lidt; det skal sammenlignes med fordelingen.
  • Frihedsgrader — afgør, hvilken chi-i-anden fordeling der bruges til at finde p-værdien.
  • P-værdi — sandsynligheden for at se et så stort misforhold ved tilfældighed. Hvis den er mindre end signifikansniveauet (typisk 0,05), er der en signifikant sammenhæng.
  • Cramérs V — effektstørrelsen. Går fra 0 til 1 og måler styrken af sammenhængen: omkring 0,1 er svag, 0,3 er moderat og 0,5 eller mere er stærk.
  • Antal tilfælde i alt — summen af alle celler i tabellen.
  • Mindste forventede frekvens — til at tjekke forudsætningen: hvis den er under 5, fortolk med varsomhed.
Signifikans og styrke er to ting

En lille p-værdi bekræfter, at der findes en sammenhæng, men siger ikke, om den er stærk. Med meget store stikprøver bliver trivielle sammenhænge "signifikante". Kig derfor altid på Cramérs V: den svarer på det spørgsmål, der virkelig betyder noget — hvor stor er sammenhængen?

Løst eksempel

Et hospital testede en ny vejledningsprotokol til patienter. Af 60 patienter, der modtog protokollen, forbedrede 45 deres efterlevelse af behandlingen; af 60 patienter i kontrolgruppen forbedrede 30 sig. Er forbedringen forbundet med protokollen?

Forbedrede sigForbedrede sig ikkeI alt
Gruppe med protokol451560
Kontrolgruppe303060
I alt7545120
  1. Forventede frekvenser: for cellen "protokol × forbedrede sig" er E = (60 × 75) ÷ 120 = 37,5. Alle fire forventede celleværdier er 37,5 eller 22,5.
  2. χ²-statistik: ved at lægge (O − E)² ÷ E sammen for de fire celler: 1,5 + 2,5 + 1,5 + 2,5 = 8,0.
  3. Frihedsgrader: df = (2 − 1) × (2 − 1) = 1.
  4. P-værdi: for χ² = 8,0 og df = 1 er p-værdien ≈ 0,0047.

Da 0,0047 < 0,05, er sammenhængen statistisk signifikant: forbedringen i efterlevelse er forbundet med protokollen. Cramérs V ≈ 0,26 indikerer en sammenhæng af moderat styrke. Brug knappen "Brug eksempeldata" for at se beregningen i beregneren.

Ofte stillede spørgsmål

Hvad er chi-i-anden testen?

Det er en hypotesetest, der undersøger, om to kategoriske variabler er forbundet. Den sammenligner de observerede frekvenser i en krydstabel med de frekvenser, der ville være forventet, hvis variablerne var uafhængige.

Hvornår skal jeg bruge chi-i-anden?

Når du har to kategoriske variabler og vil vide, om de er relaterede — som køn og præference, behandling og udfald, uddannelse og holdning. Vil du sammenligne gennemsnit, så brug t-testen eller ANOVA.

Hvad er frihedsgrader i chi-i-anden?

De beregnes som (antal rækker − 1) × (antal kolonner − 1). En 2×2-tabel har 1 frihedsgrad; en 3×4-tabel har 6. De afgør den fordeling, der bruges til p-værdien.

Hvad hvis de forventede frekvenser er mindre end 5?

Chi-i-anden tilnærmelsen mister præcision. Beregneren advarer, når den mindste forventede frekvens er under 5. I de tilfælde bør du vælge Fishers eksakte test, særligt i 2×2-tabeller.

Beviser chi-i-anden årsag og virkning?

Nej. Testen viser, at der er en sammenhæng mellem variablerne, men sammenhæng er ikke kausalitet. Andre variabler kan forklare den observerede relation.

Hvad er forskellen mellem chi-i-anden og proportionstesten?

I en 2×2-tabel er de ækvivalente — de når frem til samme p-værdi. Chi-i-anden er mere generel: den fungerer med tabeller af enhver størrelse og sammenligner mange kategorier på én gang.

I tvivl om hvilken test du skal bruge?

Se guiden, der hjælper dig med at vælge den rigtige statistiske test til din datatype.

Åbn valgguiden