Hvad er proportionstesten
Proportionstesten er den statistiske procedure, der bruges til at drage konklusioner om procenttal og rater. Den svarer på et enkelt spørgsmål: er den proportion, du har observeret i en stikprøve, forenelig med en forventet værdi — eller er forskellen stor nok til at blive opfattet som reel?
Forskellen i forhold til t-testen (Student) ligger i datatypen. T-testen håndterer kvantitative variabler som vægt, tid eller karakter: hver observation er et tal på en kontinuert skala. Proportionstesten håndterer kategoriske data af typen succes eller fiasko: hver observation er simpelthen et "ja" eller "nej". Du måler ikke hvor meget, du tæller hvor mange.
Eksempler på proportioner findes overalt: den procentdel af vælgere, der støtter en kandidat, andelen af patienter, der reagerer på en behandling, brøkdelen af besøgende, der klikker på en knap, andelen af defekte emner på en produktionslinje. Hver gang dine data er en optælling af hændelser i forhold til en sum, er proportionstesten det rigtige værktøj.
Teknisk bruger denne beregner en z-test for proportioner. Når stikprøven er rimeligt stor, ligger fordelingen af den observerede proportion meget tæt på en normalkurve — og det gør det muligt at beregne p-værdien hurtigt og præcist uden tabeller.
Én proportion vs to proportioner
Proportionstesten optræder i to forskellige situationer, og beregneren tilbyder dem begge i separate tilstande. At vælge den rigtige tilstand er første skridt.
1. Test for én proportion
Sammenligner den observerede proportion i én enkelt gruppe med en kendt referenceværdi (p₀). Du har én stikprøve og en fast hypotese at sammenligne med. Eksempler: adskiller andelen af vælgere, der støtter et forslag, sig fra 50%? Er fejlraten i et parti virkelig 2% som målsætningen? Adskiller andelen af beståede til en eksamen sig fra det historiske gennemsnit på 70%?
2. Test for to proportioner
Sammenligner proportionerne for to forskellige, uafhængige grupper, uden nogen ekstern referenceværdi. Her er der ingen p₀: det, der testes, er, om den ene gruppes rate er forskellig fra den andens. Eksempler: er helbredelsesraten forskellig mellem dem, der fik medicinen, og dem, der fik placebo? Adskiller andelen af kunder, der køber igen, sig mellem to salgskanaler?
Hvis du sammenligner din stikprøve med et fast, kendt tal — en målsætning, et historisk gennemsnit, de 50% fra "plat eller krone" — så brug tilstanden én proportion. Hvis du har to grupper indsamlet parallelt og vil vide, hvem der har den højeste rate, så brug tilstanden to proportioner.
Hvornår skal man bruge den
Proportionstesten er den rigtige, når alle disse betingelser er opfyldt:
- Binære optællingsdata: hver observation kan kun være succes eller fiasko — der er ingen mellemværdier.
- Tilfældig stikprøve: observationerne repræsenterer den ønskede population (eller proces).
- Uafhængige observationer: resultatet af én observation påvirker ikke de andre.
- Tilstrækkelig stikprøve: normaltilnærmelsen fungerer godt, når der er mindst cirka 5-10 forventede succeser og 5-10 forventede fiaskoer. Med proportioner meget tæt på 0% eller 100% eller meget små stikprøver bør man vælge en eksakt binomialtest.
Hvis du i stedet for en proportion vil sammenligne gennemsnit — tid, vægt, omsætning, karakter — er det rigtige valg t-testen (eller z-testen, når populationens standardafvigelse er kendt). Og hvis du blot vil estimere det sandsynlige interval for en proportion uden at teste en hypotese, så brug konfidensintervallet.
Sådan virker beregningen
Logikken er den samme som i enhver hypotesetest: mål afstanden mellem det, der er observeret, og det, nulhypotesen forudsiger, i enheder af standardfejl. Resultatet er z-statistikken.
I tilstanden én proportion er nulhypotesen "den sande proportion er lig med p₀". Beregneren sammenligner den observerede proportion (p̂ = succeser ÷ n) med p₀:
I tilstanden to proportioner er nulhypotesen "de to grupper har samme proportion". Da begge grupper under den hypotese kommer fra samme population, samles de to i én pooled rate (p̄) for at estimere standardfejlen:
z = (p̂₂ − p̂₁) ÷ √[ p̄ · (1 − p̄) · (1/n₁ + 1/n₂) ]
Derefter omdanner beregneren z til p-værdi ved hjælp af standardnormalfordelingen. Jo større |z|, jo længere fra scenariet "ingen forskel", og jo mindre p-værdi. Til slut returnerer den et konfidensinterval: i tilstanden én proportion bruges Wilson-intervallet for den observerede proportion; i tilstanden to proportioner intervallet for forskellen mellem grupperne.
Forholdet til A/B-testen
Hvis du allerede kender A/B-testen, har du måske bemærket, at tilstanden to proportioner beskriver præcis det, en A/B-test gør. Det er ikke tilfældigt: en A/B-test er en proportionstest med to grupper.
I en A/B-test er "succes" konverteringen — et køb, en tilmelding, et klik — og "stikprøvestørrelse" er antallet af besøgende i hver variant. At sammenligne konverteringsraten i variant A med den i variant B er ord for ord at sammenligne to proportioner. Z-statistikken, den poolede proportion og p-værdien beregnes med samme formel som vist ovenfor.
De to veje ender med samme resultat. Hvis din kontekst er konverteringsoptimering — sider, e-mails, annoncer — bruger A/B-test-beregneren det rigtige sprog og de rigtige metrikker (besøgende, konverteringer, uplift). Til en mere generel kontekst — sundhed, forskning, kvalitet — taler tilstanden "to proportioner" her om succeser og stikprøver.
Sådan fortolker du resultatet
Når du har beregnet, ser du et farvet kort med konklusionen og seks nøgletal. Beslutningens kerne er sammenligningen mellem p-værdien og signifikansniveauet (α, alfa) — komplementet til konfidensniveauet: 95% konfidens svarer til α = 0,05.
- P-værdi < α → statistisk signifikant resultat. Den observerede forskel — mellem din proportion og p₀, eller mellem de to grupper — er sandsynligvis reel.
- P-værdi ≥ α → ikke signifikant resultat. Der er ikke tilstrækkelige belæg for at sige, at der er en forskel; det kan bare være tilfældig variation.
De øvrige nøgletal hjælper med at forstå effektens størrelse:
- Observeret proportion — den målte rate i din stikprøve (tilstand én proportion) eller raten for hver gruppe (tilstand to proportioner).
- Z-statistik — forskellen målt i standardfejl. I en tosidet test ved 95% indikerer |z| over 1,96 signifikans.
- Konfidensinterval — det sandsynlige interval for den sande værdi. I tilstanden to proportioner: hvis intervallet for forskellen indeholder nul, er forskellen ikke signifikant.
Et signifikant resultat garanterer ikke, at forskellen er stor eller relevant. Med en enorm stikprøve kan selv en lillebitte forskel mellem proportioner blive "signifikant". Kig altid på forskellens størrelse og på konfidensintervallet, ikke kun p-værdiens dom.
Løst eksempel
En meningsmåling interviewede 1.000 vælgere om et nyt forslag. 540 erklærede sig som tilhængere. Inden målingen var forventningen et delt billede med 50% opbakning. Adskiller den observerede proportion sig fra denne referenceværdi?
Det er et klassisk tilfælde for tilstanden én proportion: én stikprøve sammenlignet med et fast tal, p₀ = 0,50.
- Observeret proportion: p̂ = 540 ÷ 1000 = 0,540 (54%).
- Standardfejl under nulhypotesen: SF = √[0,50 · 0,50 ÷ 1000] = √0,00025 ≈ 0,01581.
- Z-statistik: z = (0,540 − 0,500) ÷ 0,01581 ≈ 2,53.
- Tosidet p-værdi: for z ≈ 2,53 er p-værdien ≈ 0,011 — under 0,05.
Da 0,011 < 0,05, er forskellen statistisk signifikant: opbakningen til forslaget er faktisk større end de forventede 50%. De 4 procentpoint over referencen er næppe et resultat af tilfældig variation. Brug knappen "Brug eksempeldata" for at se beregningen i beregneren.
Ofte stillede spørgsmål
Hvad er proportionstesten?
Det er en hypotesetest, der undersøger, om en proportion observeret i en stikprøve adskiller sig fra en referenceværdi, eller om to proportioner fra forskellige grupper er forskellige fra hinanden. Den arbejder med optællingsdata af typen succes eller fiasko.
Hvad er forskellen mellem proportionstest og t-test?
Proportionstesten sammenligner rater og procenttal beregnet ud fra optælling af succes og fiasko. T-testen sammenligner gennemsnit af kvantitative variabler som vægt, tid eller karakter. Hvis dine data er en procentdel af personer eller emner, så brug proportionstesten.
Er proportionstesten det samme som A/B-testen?
A/B-testen er præcis en proportionstest med to grupper: den sammenligner konverteringsraten for to varianter. Tilstanden "to proportioner" i denne beregner laver samme udregning — kun sproget på felter og resultater er anderledes.
Hvad betyder et signifikant resultat?
Det betyder, at p-værdien er under det valgte signifikansniveau, typisk 5%. Det er usandsynligt, at forskellen mellem den observerede proportion og referenceværdien — eller mellem de to grupper — er opstået ved ren tilfældighed.
Hvad er den mindste stikprøvestørrelse til testen?
Normaltilnærmelsen fungerer godt, når der er mindst cirka 5-10 forventede succeser og 5-10 forventede fiaskoer i hver gruppe. Ved meget små stikprøver eller proportioner tæt på 0% eller 100% bør man vælge eksakte tests, som binomialtesten.
Skal jeg bruge tosidet eller ensidet test?
Brug tosidet, når du vil opdage enhver forskel — opadgående eller nedadgående. Det er den sikreste mulighed og anbefales. Den ensidede tester kun én retning og er kun gyldig, hvis den retning blev fastlagt før dataindsamlingen.