Copy Link Button

Normalfordelingen

Udgivet den

Redigeret den

Udgivet den

Redigeret den


Vi skal se på normalfordelingen og hvorfor tæthedsfunktionen for normalfordelingen har formen

$$f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\cdot \mathrm{e}^{-\frac{(x-\mu)^2}{2\sigma^2}}$$

Vi starter med at se om vi kan finde en måde at lave klokkeformen på.

Hvis vi ser på højresiden så er en aftagende og kunne, hvis man ser bort fra inde omkring y-aksen, godt ligne en eksponentielt aftagende funktion.

$$f(x)=\mathrm{e}^{-x^2}$$

Den passer dog ikke på venstre side af y-aksen fordi eksponenten bliver positiv og derfor vokser f(x) når vi går mod højre. Det kan vi dog godt gøre noget ved, da vi kan “lave x-værdierne positive” ved at kvadrere dem. Vi for nu

$$f(x)=\mathrm{e}^{-x^2}$$

Nu har vi fået klokkeformen men den ligner stadigvæk ikke helt.

Vi starter med at huske, at en tæthedsfunktion fortæller hvad frekvensen (eller sandsynligheden) er for en given x-værdi.hvis alle sandsynlighederne ligges sammen skulle vi gerne får 100% eller 1 som vi ofte i sandsynlighedsregningen hellere vil sige. Det vil sige at for en kontinuert funktion skal arealet under kurven være 1.

Hvis vi tager integralet af tæthedspunktionen fra $-\infty$ til $\infty$ så får vi

$$\int^\infty_{-\infty} \mathrm{e}^{-x^2}=1,77245385091$$

Det er ikke lige til at vide med dette tal svare til $\sqrt{\pi}$.

Hvis vi gerne vil have at arealet er 1 så normalisere vi ved at dividere med $\sqrt{\pi}$ og derfor har vi at tæthedsfunktionen bliver

$$f(x)=\frac{\mathrm{e}^{-x^2}}{\sqrt{\pi}}$$

Denne funktion har en klokke form og har et areal under kurven på 1 så den opfylder mange af de kriterier vi har for at det er en normalfordelingskurve. Men, denne funktion har ikke en varians der svare til kvadratet på spredningen. Vi skal derfor sørge for at vores funktion har en specifik spredning. Vi skal derfor introducere spredningen.

Vi tager derfor og regner variansen på funktionen. Til at gøre dette introducere vi en konstant i potensen. Man kan sige at den heletiden har været der, den har bare været 1.

Vi arbejder derfor videre med

$$f(x)=\frac{\mathrm{e}^{-ax^2}}{\sqrt{\frac{\pi}{a}}}$$

Det kan vises at

$$Var(X)=E[X^2]-(E[X])^2$$

hvor $E[X]=\mu$, altså middelværdien.

Vi kan huske fra statestikken at middelværdien kan beregnes som

$$\mu=\Sigma_{i=1}^n x_i\cdot p(x_i)$$

for diskret data. For kontinuert data som vi har her bliver summerne til integraler og vi har derfor at

$$E[X]=\int_{-\infty}^\infty x\cdot f(x) dx$$

hvor $f(x)$ er tæthedspunktionen som netop fortæller hvad sandsynligheden for hændelsen x er. Da funktionen $x$ er en ulige funktion, mens $f(x)$ er en lige funktion så vil produktet mellem dem være en ulige funktion og derved vil integralet, da både $x$ og $f(x)$ er symmetrisk omkring y-aksen, være nul. Vi har derfor at

$$E[X]=\int_{-\infty}^\infty x\cdot f(x) dx=0$$

Derved bliver variansen forenklet til

$$Var(X)=E[X^2]=\int_{-\infty}^\infty x^2f(x)dx$$

Indsætte tæthedsfunktionen i udtrykket fåes

$$Var(X) = E[X^2] = \int_{-\infty}^\infty x^2 \cdot \frac{\mathrm{e}^{-ax^2}}{\sqrt{\frac{\pi}{a}}} dx = \frac{1}{\sqrt{\frac{\pi}{a}}}\cdot \int_{-\infty}^\infty x^2 \cdot \mathrm{e}^{-ax^2} dx$$

Vi ved allerede at

$$\int_{-\infty}^\infty \mathrm{e}^{-ax^2} dx = \sqrt{\frac{\pi}{a}}$$

Vi differentiere nu begge sider med hensn til a

$$\frac{d}{da} \int_{-\infty}^\infty \mathrm{e}^{-ax^2} dx = \frac{d}{da} \sqrt{\frac{\pi}{a}}$$

På venstresiden har vi lov til at differentiere under integralet og på højresiden omskriver vi til potenser. Dette giver derfor

$$\int_{-\infty}^\infty \frac{d}{da} \mathrm{e}^{-ax^2} dx = \frac{d}{da} \pi^\frac{1}{2}\cdot a^{-\frac{1}{2}}$$

Differentialet på venstresiden er en sammensat funktion. Hvis vi udregner differentialerne på begge sider fåes

$$\int_{-\infty}^\infty (-x^2)\cdot \mathrm{e}^{-ax^2}dx = \pi^\frac{1}{2}\cdot (-\frac{1}{2})\cdot a^{-\frac{3}{2}}$$

Højresiden er netop integralet i udtrykket for variansen. Dette dette erstattes med højresiden har vi at

$$Var(X) = E[X^2] = \frac{1}{\sqrt{\frac{\pi}{a}}}\cdot\pi^\frac{1}{2}\cdot (-\frac{1}{2})\cdot a^{-\frac{3}{2}} = \frac{1}{2}a^\frac{1}{2}a^{-\frac{3}{2}}=\frac{1}{2}a^{-1}=\frac{1}{2a}$$

Da vi har at variansen er spredningen kvadreret så har vi også at

$$\frac{1}{2a}=\sigma^2$$

Vi isolere for a

$$a=\frac{1}{2\sigma^2}$$

Indsættes det i vores udtryk for tæthedsfunktionen for vi at

$$f(x)=\frac{\mathrm{e}^{-\frac{1}{2\sigma^2}x^2}}{\sqrt{\frac{\pi}{\frac{1}{2\sigma^2}}}}=\frac{\mathrm{e}^{-\frac{x^2}{2\sigma^2}}}{\sqrt{2\pi\sigma^2}}=\frac{1}{\sqrt{2\pi\sigma^2}}\cdot \mathrm{e}^{-\frac{x^2}{2\sigma^2}}$$

Dette er netop det udtryk som vi gerne ville finde lige på nær at det ligger centreret omkring y-aksen. Det vil sige at middelværdien for funktionen er 0. Hvis vi gerne vil have at middelværdien af tæthedspunktionen er anderledes skal vi forskyde den langs x-aksen. Dette gøres ved at trække middelværdien $\mu$ fra x hvilket giver

$$f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\cdot \mathrm{e}^{-\frac{(x-\mu)^2}{2\sigma^2}}$$

Som netop beskriver en tæthedsfunktion der er klokkeformet, har en middelværdi på $\mu$, en spredning på $\sigma$ og et areal under kurven på 1.

, ,