Matematik A matematik a
Kapitel Overblik Normalfordeling og tæthedsfunktioner
🔮 Matematik A

Normalfordelingen er den vigtigste sandsynlighedsfordeling i statistikken. Den symmetriske klokkeformel opstår naturligt i utallige situationer og er grundlaget for næsten al statistisk inferens.

Du lærer at:
  • Identificere og fortolke normalfordelingens parametre μ og σ
  • Beregne sandsynligheder med normalfordelingens tæthedsfunktion og standardisering
  • Anvende 68-95-99,7%-reglen for intervalsandsynligheder
  • Standardisere observationer til z-scores
💡
Intuitionen

"Normalfordelingen opstår, når mange uafhængige tilfældige faktorer adderes (Centralgrænsesætningen). Derfor ser vi den overalt: højder, testresultater, målefejl – alt følger denne klokkeform."

Normalfordeling og tæthedsfunktioner 🎯

Har du nogensinde undret dig over, hvorfor gennemsnitshøjden i en befolkning altid samler sig omkring ét tal, mens ekstreme højder er sjældne? Eller hvorfor eksamenskarakterer ofte danner en symmetrisk “klokke”? Svaret er normalfordelingen — naturens mest elegante mønster.

I dette kapitel går vi fra diskrete sandsynligheder (som du kender fra terningkast) til den kontinuerte verden, hvor sandsynlighed måles som arealer under kurver. Det er et fundamentalt skift i tankegang — og det åbner døren til kraftfulde statistiske metoder.

Gør dig klar til at level up din statistikforståelse! 🚀


Teori: Fra diskret til kontinuert sandsynlighed

Når vi arbejder med en diskret stokastisk variabel (fx antal 6’ere i tre terningkast), kan vi angive sandsynligheden for hvert enkelt udfald: P(X=0)P(X = 0), P(X=1)P(X = 1) osv.

Men hvad gør vi, når den stokastiske variabel er kontinuert? Fx “hvad er sandsynligheden for, at en tilfældigt valgt person er præcis 178,000… cm høj?” — svaret er faktisk 00! Der er uendeligt mange mulige værdier.

Nøgleindsigt: For kontinuerte variable giver det kun mening at tale om sandsynligheden for, at værdien falder i et interval:

P(aXb)P(a \leq X \leq b)

Denne sandsynlighed beregnes som arealet under en kurve — og den kurve kalder vi en tæthedsfunktion.


Teori: Tæthedsfunktionen f(x)f(x)

En tæthedsfunktion f(x)f(x) for en kontinuert stokastisk variabel XX opfylder to krav:

Krav 1: Funktionen er aldrig negativ:

f(x)0for alle xf(x) \geq 0 \quad \text{for alle } x

Krav 2: Det samlede areal under kurven er præcis 1:

f(x)dx=1\int_{-\infty}^{\infty} f(x) \, dx = 1

Dette svarer til, at den samlede sandsynlighed er 100 % — noget skal jo ske!

Sandsynlighed som areal:

P(aXb)=abf(x)dxP(a \leq X \leq b) = \int_a^b f(x) \, dx

Sandsynligheden for at XX lander mellem aa og bb er altså arealet under f(x)f(x) fra aa til bb.

Vigtigt: Værdien f(x)f(x) er ikke en sandsynlighed i sig selv — den er en tæthed. Tænk på det som en “sandsynlighedstæthed”: jo højere f(x)f(x) er i et punkt, desto mere sandsynligt er det at XX lander tæt på det punkt.


Vis Eksempel: Simpel tæthedsfunktion ⚡

Opgave: En kontinuert stokastisk variabel XX har tæthedsfunktionen:

f(x)={14xfor 0x210ellersf(x) = \begin{cases} \frac{1}{4}x & \text{for } 0 \leq x \leq 2\sqrt{1} \\ 0 & \text{ellers} \end{cases}

Vent — lad os bruge en endnu simplere: f(x)=12xf(x) = \frac{1}{2}x for 0x20 \leq x \leq 2 og 00 ellers.

Tjek at det er en gyldig tæthedsfunktion:

0212xdx=12[x22]02=1242=122=1\int_0^2 \frac{1}{2}x \, dx = \frac{1}{2} \cdot \left[\frac{x^2}{2}\right]_0^2 = \frac{1}{2} \cdot \frac{4}{2} = \frac{1}{2} \cdot 2 = 1 \quad \checkmark

Beregn P(1X2)P(1 \leq X \leq 2):

P(1X2)=1212xdx=12[x22]12=12(4212)=1232=34=0,75\begin{aligned} P(1 \leq X \leq 2) &= \int_1^2 \frac{1}{2}x \, dx \\ &= \frac{1}{2} \cdot \left[\frac{x^2}{2}\right]_1^2 \\ &= \frac{1}{2} \cdot \left(\frac{4}{2} - \frac{1}{2}\right) \\ &= \frac{1}{2} \cdot \frac{3}{2} \\ &= \frac{3}{4} = 0{,}75 \end{aligned}

Fortolkning: Der er 75 % sandsynlighed for, at XX lander mellem 1 og 2. Bemærk at tætheden er størst ved x=2x = 2, så store værdier er mere sandsynlige end små.


Teori: Normalfordelingen N(μ,σ2)N(\mu, \sigma^2)

Normalfordelingen er den vigtigste kontinuerte sandsynlighedsfordeling i hele statistikken. Den opstår naturligt, når mange små, uafhængige faktorer bidrager til en samlet effekt (fx genetik, miljø og kost påvirker tilsammen en persons højde).

Tæthedsfunktionen for normalfordelingen N(μ,σ2)N(\mu, \sigma^2) er:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}} \cdot e^{-\frac{(x - \mu)^2}{2\sigma^2}}

Denne formel ser vild ud — men du behøver ikke at huske den! Det vigtige er at forstå, hvad de to parametre gør:

ParameterSymbolBetydning
Middelværdiμ\muKurvens centrum — det mest sandsynlige område
Spredningσ\sigmaKurvens bredde — hvor spredt data er

Egenskaber ved normalfordelingskurven:

  • Den er symmetrisk omkring μ\mu
  • Den er klokkeformet — højest ved μ\mu, falder mod begge sider
  • Den nærmer sig 0, men rører aldrig xx-aksen
  • Arealet under hele kurven er præcis 1
  • σ\sigma bestemmer, hvor “bred” eller “smal” klokken er

Interaktiv Normalfordeling & Areal

Flyt middelværdien μ og spredningen σ for at transformere klokkekurven, og se arealet (sandsynligheden) opdateret live.

0102030405060708090100a = 40b = 65
Areal = P(X ∈ interval) Middelværdi (μ)
Middelværdi (μ):50
Spredning (σ):10
Sandsynlighedsberegner
Nedre grænse a:z_a = -1.00
40
Øvre grænse b:z_b = 1.50
65
Areal (Sandsynlighed):
77.45 %

Vis Eksempel: Normalfordeling i praksis ⚡

Situation: Højden for voksne danske mænd er tilnærmelsesvist normalfordelt med μ=181\mu = 181 cm og σ=7\sigma = 7 cm. Vi skriver:

XN(181,72)X \sim N(181, 7^2)

Det betyder:

  • De fleste mænd har en højde tæt på 181 cm
  • En spredning på 7 cm fortæller os, at de fleste ligger inden for ca. 7 cm af gennemsnittet
  • Meget få mænd er over 200 cm eller under 160 cm

Hvad fortæller kurven os?

Tæthedsfunktionen er højest ved x=181x = 181 — det er det mest “tætte” område. Når vi bevæger os væk fra 181, falder kurven symmetrisk. Det svarer til, at de fleste mænd har en højde tæt på gennemsnittet, og ekstreme højder er sjældne.


Teori: Standardnormalfordelingen N(0,1)N(0, 1)

Standardnormalfordelingen er den specielle normalfordeling med:

μ=0ogσ=1\mu = 0 \quad \text{og} \quad \sigma = 1

Vi skriver ZN(0,1)Z \sim N(0, 1) og kalder ZZ en standardnormalfordelt variabel.

Hvorfor er den vigtig?

Enhver normalfordelt variabel XN(μ,σ2)X \sim N(\mu, \sigma^2) kan omregnes til en standardnormalfordelt variabel. Det betyder, at vi kun behøver én tabel (standardnormaltabellen) til at beregne sandsynligheder for alle normalfordelinger!

Tæthedsfunktionen for N(0,1)N(0,1) skrives traditionelt φ(z)\varphi(z):

φ(z)=12πez22\varphi(z) = \frac{1}{\sqrt{2\pi}} \cdot e^{-\frac{z^2}{2}}

Og den kumulative fordelingsfunktion (arealet til venstre for zz) skrives Φ(z)\Phi(z):

Φ(z)=P(Zz)=zφ(t)dt\Phi(z) = P(Z \leq z) = \int_{-\infty}^{z} \varphi(t) \, dt

Det er netop Φ(z)\Phi(z) vi slår op i tabellen!


Teori: Z-transformation — broen til tabellen

For at bruge standardnormaltabellen skal vi z-transformere. Formlen er:

z=xμσz = \frac{x - \mu}{\sigma}

Hvad gør formlen?

  1. xμx - \mu: Forskyder fordelingen, så centrum ligger i 0
  2. Division med σ\sigma: Skalerer, så spredningen bliver 1

Resultat: Hvis XN(μ,σ2)X \sim N(\mu, \sigma^2), så er:

Z=XμσN(0,1)Z = \frac{X - \mu}{\sigma} \sim N(0, 1)

Sandsynligheder beregnes nu via tabellen:

P(Xx)=P ⁣(Zxμσ)=Φ ⁣(xμσ)P(X \leq x) = P\!\left(Z \leq \frac{x - \mu}{\sigma}\right) = \Phi\!\left(\frac{x - \mu}{\sigma}\right)

Vis Eksempel: Z-transformation med højdedata ⚡

Opgave: Højden for voksne danske kvinder er normalfordelt: XN(168,62)X \sim N(168, 6^2). Find sandsynligheden for, at en tilfældigt valgt kvinde er højst 174 cm høj.

Løsning:

Vi z-transformerer x=174x = 174:

z=xμσ=1741686=66=1,00\begin{aligned} z &= \frac{x - \mu}{\sigma} \\ &= \frac{174 - 168}{6} \\ &= \frac{6}{6} \\ &= 1{,}00 \end{aligned}

Nu slår vi op i tabellen:

P(X174)=Φ(1,00)=0,8413P(X \leq 174) = \Phi(1{,}00) = 0{,}8413

Svar: Der er ca. 84,1 % sandsynlighed for, at en tilfældigt valgt dansk kvinde er højst 174 cm.

Fortolkning: En zz-værdi på 1,00 betyder, at 174 cm ligger præcis én spredning over gennemsnittet. Ifølge 68-95-99.7-reglen (som vi ser om lidt) er ca. 84 % af alle værdier under dette punkt — og det passer!


Vis Eksempel: Sandsynlighed for et interval ⚡

Opgave: Med XN(168,62)X \sim N(168, 6^2) — find P(162X174)P(162 \leq X \leq 174).

Løsning:

Vi z-transformerer begge grænser:

z1=1621686=66=1,00z_1 = \frac{162 - 168}{6} = \frac{-6}{6} = -1{,}00z2=1741686=66=1,00z_2 = \frac{174 - 168}{6} = \frac{6}{6} = 1{,}00

Nu bruger vi formlen for intervalsandsynlighed:

P(162X174)=P(1,00Z1,00)=Φ(1,00)Φ(1,00)=0,84130,1587=0,6826\begin{aligned} P(162 \leq X \leq 174) &= P(-1{,}00 \leq Z \leq 1{,}00) \\ &= \Phi(1{,}00) - \Phi(-1{,}00) \\ &= 0{,}8413 - 0{,}1587 \\ &= 0{,}6826 \end{aligned}

Svar: Ca. 68,3 % af danske kvinder har en højde mellem 162 cm og 174 cm.

Bemærk: Φ(1,00)=1Φ(1,00)=10,8413=0,1587\Phi(-1{,}00) = 1 - \Phi(1{,}00) = 1 - 0{,}8413 = 0{,}1587 på grund af symmetrien!


Teori: 68-95-99.7-reglen (den empiriske regel)

68-95-99.7-reglen er en fantastisk tommelfingerregel, der gælder for alle normalfordelinger:

IntervalAndel af data
μ±1σ\mu \pm 1\sigmaca. 68,3 %
μ±2σ\mu \pm 2\sigmaca. 95,4 %
μ±3σ\mu \pm 3\sigmaca. 99,7 %

I formler:

P(μσXμ+σ)0,683P(\mu - \sigma \leq X \leq \mu + \sigma) \approx 0{,}683P(μ2σXμ+2σ)0,954P(\mu - 2\sigma \leq X \leq \mu + 2\sigma) \approx 0{,}954P(μ3σXμ+3σ)0,997P(\mu - 3\sigma \leq X \leq \mu + 3\sigma) \approx 0{,}997

Hvad betyder det i praksis?

  • Ca. 2 ud af 3 observationer ligger inden for ±1σ\pm 1\sigma af gennemsnittet
  • Næsten alle (95 %) ligger inden for ±2σ\pm 2\sigma
  • Kun ca. 3 ud af 1000 observationer falder uden for ±3σ\pm 3\sigma — disse er ekstremt usædvanlige!

Denne regel er utrolig nyttig til hurtigt at vurdere, om en observation er “normal” eller “usædvanlig”.


Vis Eksempel: 68-95-99.7-reglen med IQ-scores ⚡

Situation: IQ-scores er normalfordelt med μ=100\mu = 100 og σ=15\sigma = 15, altså XN(100,152)X \sim N(100, 15^2).

Spørgsmål: Mellem hvilke værdier ligger de midterste 95 % af IQ-scorerne?

Løsning med 68-95-99.7-reglen:

De midterste 95 % svarer til intervallet μ±2σ\mu \pm 2\sigma:

Nedre grænse:μ2σ=100215=10030=70Øvre grænse:μ+2σ=100+215=100+30=130\begin{aligned} \text{Nedre grænse:} \quad &\mu - 2\sigma = 100 - 2 \cdot 15 = 100 - 30 = 70 \\ \text{Øvre grænse:} \quad &\mu + 2\sigma = 100 + 2 \cdot 15 = 100 + 30 = 130 \end{aligned}

Svar: Ca. 95 % af alle IQ-scores ligger mellem 70 og 130.

Fortolkning: En person med IQ over 130 tilhører de øverste 2,5 % — det er ret usædvanligt. En IQ under 70 er tilsvarende sjælden (de nederste 2,5 %).

Hvad med de midterste 68 %?

μ±1σ=100±15=[85,115]\mu \pm 1\sigma = 100 \pm 15 = [85, 115]

Altså har ca. 2 ud af 3 mennesker en IQ mellem 85 og 115.


Teori: Aflæsning i standardnormaltabellen

Standardnormaltabellen giver dig Φ(z)=P(Zz)\Phi(z) = P(Z \leq z) — altså arealet til venstre for zz under N(0,1)N(0,1)-kurven.

Sådan bruger du tabellen:

  1. Find zz-værdiets heltal og første decimal i rækken (fx 1,0)
  2. Find anden decimal i kolonnen (fx 0,05 for z=1,05z = 1{,}05)
  3. Aflæs sandsynligheden i krydsfeltet

Nyttige regneregler:

SituationFormel
P(Zz)P(Z \leq z)Φ(z)\Phi(z) — aflæs direkte
P(Zz)P(Z \geq z)1Φ(z)1 - \Phi(z)
P(Zz)P(Z \leq -z)1Φ(z)1 - \Phi(z) (symmetri)
P(aZb)P(a \leq Z \leq b)Φ(b)Φ(a)\Phi(b) - \Phi(a)

Symmetriegenskaben er nøglen til at håndtere negative zz-værdier:

Φ(z)=1Φ(z)\Phi(-z) = 1 - \Phi(z)

Dette gælder fordi normalfordelingen er symmetrisk om 0.

Eksempel på tabelaflæsning:

For z=1,96z = 1{,}96:

  • Række: 1,9
  • Kolonne: 0,06
  • Aflæsning: Φ(1,96)=0,9750\Phi(1{,}96) = 0{,}9750

Det vil sige, at 97,5 % af alle værdier i en standardnormalfordeling er mindre end 1,96.


Vis Eksempel: Komplet opgave med tabelaflæsning ⚡

Opgave: En maskine producerer skruer med en længde, der er normalfordelt: XN(50,0,42)X \sim N(50, 0{,}4^2) mm. En skrue kasseres, hvis den er kortere end 49,2 mm eller længere end 50,6 mm. Hvor stor en andel kasseres?

Løsning:

Vi skal finde P(X<49,2)+P(X>50,6)P(X < 49{,}2) + P(X > 50{,}6).

Trin 1: Z-transformér begge grænser:

z1=49,2500,4=0,80,4=2,00z_1 = \frac{49{,}2 - 50}{0{,}4} = \frac{-0{,}8}{0{,}4} = -2{,}00z2=50,6500,4=0,60,4=1,50z_2 = \frac{50{,}6 - 50}{0{,}4} = \frac{0{,}6}{0{,}4} = 1{,}50

Trin 2: Slå op i tabellen:

Φ(2,00)=0,9772Φ(2,00)=10,9772=0,0228\Phi(2{,}00) = 0{,}9772 \quad \Rightarrow \quad \Phi(-2{,}00) = 1 - 0{,}9772 = 0{,}0228Φ(1,50)=0,9332\Phi(1{,}50) = 0{,}9332

Trin 3: Beregn kasseringsandelen:

P(kasseret)=P(X<49,2)+P(X>50,6)=Φ(2,00)+(1Φ(1,50))=0,0228+(10,9332)=0,0228+0,0668=0,0896\begin{aligned} P(\text{kasseret}) &= P(X < 49{,}2) + P(X > 50{,}6) \\ &= \Phi(-2{,}00) + (1 - \Phi(1{,}50)) \\ &= 0{,}0228 + (1 - 0{,}9332) \\ &= 0{,}0228 + 0{,}0668 \\ &= 0{,}0896 \end{aligned}

Svar: Ca. 9,0 % af skruerne kasseres. Bemærk at flere kasseres for at være for lange (6,7%6{,}7\%) end for korte (2,3%2{,}3\%), fordi grænsen er skævt placeret i forhold til middelværdien.


Vis Bevis: Symmetriegenskaben Φ(z)=1Φ(z)\Phi(-z) = 1 - \Phi(z)

Påstand: Φ(z)=1Φ(z)\Phi(-z) = 1 - \Phi(z)

Bevis:

Vi udnytter at tæthedsfunktionen φ(t)=12πet2/2\varphi(t) = \frac{1}{\sqrt{2\pi}}e^{-t^2/2} er en lige funktion: φ(t)=φ(t)\varphi(-t) = \varphi(t).

Φ(z)=zφ(t)dt=u=tzφ(u)(du)=zφ(u)du=1zφ(u)du=1Φ(z)\begin{aligned} \Phi(-z) &= \int_{-\infty}^{-z} \varphi(t) \, dt \\ &\overset{u = -t}{=} \int_{\infty}^{z} \varphi(-u)(-du) \\ &= \int_z^{\infty} \varphi(u) \, du \\ &= 1 - \int_{-\infty}^{z} \varphi(u) \, du \\ &= 1 - \Phi(z) \quad \blacksquare \end{aligned}

🏋️ Træningsopgaver

Opgave 1 — Grundlæggende z-transformation: Vægten af nyfødte børn er normalfordelt med μ=3,5\mu = 3{,}5 kg og σ=0,5\sigma = 0{,}5 kg. a) Z-transformér værdien x=4,0x = 4{,}0 kg. b) Z-transformér værdien x=2,8x = 2{,}8 kg. c) Beregn P(X4,0)P(X \leq 4{,}0) ved hjælp af tabellen.

Opgave 2 — Intervalsandsynlighed: En elevator har en maksimal belastning, der modelleres som XN(800,502)X \sim N(800, 50^2) kg. a) Find sandsynligheden for, at belastningen er mellem 750 kg og 850 kg. b) Find sandsynligheden for, at belastningen overstiger 900 kg. c) Brug 68-95-99.7-reglen til at verificere dit svar i a).

Opgave 3 — Kassering: Længden af producerede søm er normalfordelt: XN(30,0,32)X \sim N(30, 0{,}3^2) mm. Et søm kasseres, hvis det afviger mere end 0,5 mm fra 30 mm. a) Opskriv kasseringsbetingelsen som en sandsynlighed. b) Beregn kasseringsandelen.

Opgave 4 — Omvendt opslag: En stokastisk variabel XN(200,252)X \sim N(200, 25^2). Find den værdi x0x_0, så P(Xx0)=0,95P(X \leq x_0) = 0{,}95. Hint: Find først z0z_0 fra tabellen, og brug derefter x0=μ+z0σx_0 = \mu + z_0 \cdot \sigma.

Opgave 5 — 68-95-99.7-reglen: Dagligt salg i en butik er normalfordelt med μ=12.000\mu = 12{.}000 kr og σ=2.000\sigma = 2{.}000 kr. a) Mellem hvilke beløb ligger de midterste 68 % af dagene? b) Hvad er sandsynligheden for en dag med salg over 16.000 kr? c) Hvor usædvanligt er et salg på 18.000 kr?


Quiz – Test din forståelse

Matematik Boss-Kamp ⚔️

Løs opgavesættet

Op til +50 XP
Hvad angiver værdien f(x) i en tæthedsfunktion?