Forestil dig at du har lavet en undersøgelse, hvor du har spurgt en række mennesker om deres månedlige opsparing. Du har i den forbindelse også spurgt om andre ting her i blandt deres alder. Besvarelserne kan samles i følgende krydstabel.
| Aldersgruppe | 0–500 kr | 501–2000 kr | 2001–5000 kr | 5001+ kr |
|---|---|---|---|---|
| 18–29 år | 40 | 25 | 10 | 5 |
| 30–44 år | 20 | 35 | 25 | 10 |
| 45–60 år | 15 | 30 | 30 | 15 |
| 60+ år | 25 | 20 | 15 | 10 |
Du er interesseret i at undersøge, om der er en sammenhæng. Om de to spørgsmål om alder og månedlig opsparing er afhængige af hinanden. Men hvordan kan man afgøre, om forskellene bare skyldes tilfældigheder, eller om der faktisk er en sammenhæng.
Til at undersøge dette kan vi benytte en χ2-test (chi-i-anden test). Denne test ser på, hvor meget svarene i stikprøven afviger fra de forventede værdier. De forventede værdier er det antal svar vi ville forvente hvis der var uafhængighed mellem svarene, det vil sige, at det ikke har nogen betydning hvilken alder man har i forhold til den månedlige opsparing. De forventede værdier beregnes ud fra række- og søjleværdierne. Vi ville forvente at antallet af svar ville følge det samlede antal svar for en given kategori. Vi kan beregne de forventede værdier ud på følgende måde
\(E_{ij}=\frac{S_i\cdot R_j}{n}\)
hvor \(S_i\) og \(R_j\) er summen for den \(i\)’te søjle og \(j\)’te række.
Til at måle hvor meget de observerede værdier afviger fra det vi ville forvente, hvis der var uafhængighed, beregner vi det der kaldes for teststørrelsen
\[\chi^2=Q=\sum_{i=1}^{R}\sum_{j=1}^{S} \frac{(O_{ij}-E_{ij})^2}{E_{ij}}\]
Hvis teststørrelsen er præcis nul betyder det at vi observere præcis det vi ville hvis der var uafhængighed. Men det er ikke sikker at vi får præcis nul. Det kan være vi for teststørrelsen får 0,01 eller 0,5 eller måske 4. Men er en teststørrelse på 0,01 nok til at afvise at der er uafhængighed? Eller skal den være 0,5 eller er 4 måske stadig bevis for at der er uafhængighed?
Vi skal have et mål som fortæller os om der er uafhængighed eller ej. Dette mål kaldes for den kritiske værdi og den kan vi slå op i en tabel.

Tabel med kritiske værdier for \(\chi^2\) (Butler, Christopher. 1985. Statistics in Linguistics. Oxford: Blackwell. s 176)
For at finde den kritiske værdi som vi skal holde vores teststørrelse op i mod skal vi kende to ting: frihedsgraden og signifikansniveauet. Vi vil som udgangspunkt altid vælge et signifikansniveau på 5% (eller 0,05). Man kan godt benytte andre signifikansniveauer, men for nu så er det 5%. Man kan se på de 5% som at vi ser bort fra de 5% højeste \(\chi^2\) værdier. Sandsynligheden for at vi får en meget høj værdi for teststørrelsen (\(\chi^2\)) er meget lille hvis der er uafhængighed. Vi vælger derfor at se bort fra dem. Vi vil vende tilbage til dette på et senere tidspunkt når vi skal se på konfidensintervaller.
Frihedgraden er bestem af vores krydstabel. Frihedsgraden (forkortet df for degrees of freedom) som er et mål for hvor mange felter vi tilfældigt kan udfylde inden alle felter er låst for en værdi. Vi kan beregne antallet af frihedsgrader som
\(df=(antal\,rækker\,-\,1)\cdot(antal\,kolonner\,-\,1)\)
Vi vil altid teste for uafhængighed, så vores nulhypotese (H0) vil altid være at der er uafhængighed (altså ikke sammenhæng) mellem svarene. Den alternative hypotese (H1) vil da være at der er afhængighed (altså sammenhæng) mellem svarene.
I dette tilfælde med alder og månedlig opsparing kunne det en hypotese være.
“Der er ingen sammenhæng mellem alder og månedlig opsparing”
eller
”Der er uafhængighed mellem alder og månedlig opsparing”
eller
“Hvor gammel man er har ingen betydning for hvor stor den månedlige opsparing er”
Man kan formulere ens hypotese på mange måde, men det er vigtig at nulhypotesen fortæller at der er uafhængighed mellem de to undersøgte kategorier.
Hvis der er uafhængighed mellem vores kategorier ville vi forvente en lille teststørrelse (\(\chi^2\)), da vores observationer ligger tæt på vores forventede værdier. Til gengæld så vil vi have store teststørrelser, hvis der er afhængighed, da de adspurgte vil have en tendens til at give et specifikt svar an på hvilken kategori de tilhører. Da vi fjerner de 5% største teststørrelser vil vi have, at hvis vores bidrag ligger over den kritiske værdi vil det ligge uden for hvad vi forventede som er vores nulhypotese og vi vil derfor forkaste vores nulhypotese om uafhængighed.
Det vil sige, at
- hvis teststørrelsen \(\chi^2\) < kritisk værdi så beholder vi H0
- hvis teststørrelsen \(\chi^2\) > kritisk værdi så forkaster vi H0
Vi vil her ofte have en tendens til at acceptere den alternative hypotese om afhængighed. Dette vil også i de fleste tilfælde være rigtig, men da vi ikke har testet for om der er afhængighed kan vi teknisk set ikke konkludere dette ud fra testen, selvom vi alligevel ofte gør det.
Vi vil her se nærmere på dette med et eksempel, men i kan læse mere i bogen (https://matematikb-hhx.systime.dk/?id=174) både hvad angår teori og eksempler.
Vi starter med at se på et eksempel hvor vi regner det i hånden for at få en forståelse for hvad der sker.
Vi kan nu beregne dette i hånden, men hvad hvis vi gerne vil benytte os af CAS. Lad os se på hvorledes vi kan benytte Excel til at udregne en χ2-test.
Der er også mulighed for at benytte GeoGebra. Lad os se på hvorledes vi kan benytte GeoGebra til at beregne en χ2-test.
Denne pdf fra Danske Science Gymnasier viser også hvorledes man kan gøre det i GeoGebra
Der er også mulighed for at lave en χ2-test i WordMat som denne video fra Mitfyns gymnasium viser