Matematik B avanceret statistik
Kapitel Overblik Binomialfordeling
📘 Matematik B

Binomialfordelingen modellerer eksperimenter med to mulige udfald (succes/fiasko), der gentages n gange. Det er den vigtigste diskrete sandsynlighedsfordeling i gymnasiematematik.

Du lærer at:
  • Identificere binomialfordelingssituationer med n forsøg og sandsynlighed p
  • Beregne sandsynligheder med binomialformlen P(X=k) = C(n,k)·pᵏ·(1-p)^(n-k)
  • Beregne middelværdi og standardafvigelse for B(n,p)
  • Bruge binomialfordelingen til at løse sandsynlighedsopgaver
💡
Intuitionen

"Forestil dig n møntkast, og du vil vide sandsynligheden for præcis k plat. Binomialformlen beregner det eksakt – ved at tælle alle de mulige måder k succeser kan forekomme."

Binomialfordeling 🎯

Forestil dig, at du kaster en mønt 10 gange og tæller antallet af “plat”. Eller at du gætter på 20 multiple-choice-spørgsmål og tæller, hvor mange du rammer rigtigt. I begge tilfælde gentager du det samme forsøg flere gange og tæller succeser. Det er præcis det, binomialfordelingen beskriver – og den er dit stærkeste værktøj, når du skal beregne sandsynligheder i denne type situationer.

Lad os bygge forståelsen op trin for trin – fra det enkelte forsøg til den fulde fordeling. 🚀


Teori: Bernoulli-forsøg

Et Bernoulli-forsøg er den simpleste byggesten i sandsynlighedsregning. Det er et forsøg med præcis to mulige udfald:

  • Succes (det udfald vi er interesserede i) – med sandsynlighed pp
  • Fiasko (det andet udfald) – med sandsynlighed 1p1-p

Vi kalder ofte 1p1-p for qq, så q=1pq = 1-p.

Eksempler på Bernoulli-forsøg:

ForsøgSuccesFiaskopp
MøntkastPlatKrone0,50{,}5
Terningkast (slå 6)Slår 6Slår ikke 616\frac{1}{6}
Multiple choice (4 valg)Rigtigt svarForkert svar0,250{,}25
KvalitetskontrolDefekt produktOK produkt0,020{,}02

Et enkelt Bernoulli-forsøg har:

  • Middelværdi: μ=p\mu = p
  • Varians: σ2=p(1p)=pq\sigma^2 = p(1-p) = pq

Teori: Fra Bernoulli til Binomial

Når vi gentager et Bernoulli-forsøg nn gange uafhængigt af hinanden, og vi tæller antallet af succeser XX, så følger XX en binomialfordeling.

Vi skriver:

Xb(n,p)X \sim b(n, p)

og læser det som: ”XX er binomialfordelt med nn forsøg og succesandsynlighed pp”.

De fire betingelser for en binomialfordeling:

  1. Fast antal forsøg: Vi udfører præcis nn forsøg.
  2. To udfald: Hvert forsøg har kun to mulige udfald (succes/fiasko).
  3. Konstant sandsynlighed: Sandsynligheden pp for succes er den samme i hvert forsøg.
  4. Uafhængighed: Udfaldene af de enkelte forsøg påvirker ikke hinanden.

Den stokastiske variabel XX kan antage værdierne 0,1,2,,n0, 1, 2, \ldots, n.


Vis Eksempel: Er det binomialfordelt? ⚡

Afgør om følgende situationer kan beskrives med en binomialfordeling:

Situation 1: Du kaster en terning 12 gange og tæller antallet af 6’ere.

Ja! Her er n=12n=12, succes = “slå 6”, p=16p = \frac{1}{6}, og kastene er uafhængige. Alle fire betingelser er opfyldt, så Xb ⁣(12,16)X \sim b\!\left(12, \frac{1}{6}\right).

Situation 2: Du trækker 5 kort fra en bunke på 52 kort (uden tilbagelægning) og tæller antallet af esser.

Nej! Sandsynligheden ændrer sig efter hvert træk (uden tilbagelægning), så betingelse 3 og 4 er ikke opfyldt. Her ville man i stedet bruge den hypergeometriske fordeling.

Situation 3: En fabrik producerer pærer, hvor 3% er defekte. Du tester 50 tilfældigt udvalgte pærer.

Ja! (tilnærmet) Her er n=50n=50, p=0,03p=0{,}03. Selvom vi teknisk set trækker uden tilbagelægning, er produktionen så stor, at sandsynligheden næsten er konstant. Vi bruger Xb(50;0,03)X \sim b(50;\, 0{,}03).


Teori: Binomialkoefficienten

Før vi kan beregne sandsynligheder, har vi brug for at tælle: På hvor mange måder kan vi vælge kk succeser blandt nn forsøg?

Svaret er binomialkoefficienten, som skrives:

(nk)=n!k!(nk)!\binom{n}{k} = \frac{n!}{k!(n-k)!}

hvor n!n! (udtales ”nn fakultet”) er produktet af alle positive hele tal op til nn:

n!=n(n1)(n2)21n! = n \cdot (n-1) \cdot (n-2) \cdots 2 \cdot 1

Vi definerer desuden 0!=10! = 1.

Vigtigt: Binomialkoefficienten (nk)\binom{n}{k} angiver antallet af kombinationer – altså antallet af måder at vælge kk elementer ud af nn uden hensyn til rækkefølge.


Vis Eksempel: Beregning af binomialkoefficienter ⚡

Beregn (52)\binom{5}{2}:

(52)=5!2!(52)!=5!2!3!\binom{5}{2} = \frac{5!}{2!(5-2)!} = \frac{5!}{2! \cdot 3!}

Vi udregner fakulteterne:

5!=54321=1202!=21=23!=321=6\begin{aligned} 5! &= 5 \cdot 4 \cdot 3 \cdot 2 \cdot 1 = 120 \\ 2! &= 2 \cdot 1 = 2 \\ 3! &= 3 \cdot 2 \cdot 1 = 6 \end{aligned}

Altså:

(52)=12026=12012=10\binom{5}{2} = \frac{120}{2 \cdot 6} = \frac{120}{12} = 10

Der er altså 10 måder at vælge 2 elementer ud af 5.

Beregn (83)\binom{8}{3}:

(83)=8!3!5!=876321=3366=56\binom{8}{3} = \frac{8!}{3! \cdot 5!} = \frac{8 \cdot 7 \cdot 6}{3 \cdot 2 \cdot 1} = \frac{336}{6} = 56

Her brugte vi et smart trick: vi behøver kun at udregne de øverste faktorer, da resten forkortes med 5!5! i nævneren.


Teori: Sandsynlighedsfunktionen P(X=k)P(X=k)

Nu kan vi samle det hele! Sandsynligheden for at opnå præcis kk succeser i nn uafhængige Bernoulli-forsøg er:

P(X=k)=(nk)pk(1p)nkP(X=k) = \binom{n}{k} \cdot p^k \cdot (1-p)^{n-k}

Lad os forstå de tre faktorer:

FaktorBetydning
(nk)\binom{n}{k}Antal måder at placere kk succeser i nn forsøg
pkp^kSandsynlighed for kk succeser
(1p)nk(1-p)^{n-k}Sandsynlighed for (nk)(n-k) fiaskoer

Formlen giver altså: (antal gunstige rækkefølger) × (sandsynlighed for én bestemt rækkefølge).

For at beregne P(Xk)P(X \leq k) (den kumulative sandsynlighed) summerer vi:

P(Xk)=i=0k(ni)pi(1p)niP(X \leq k) = \sum_{i=0}^{k} \binom{n}{i} \cdot p^i \cdot (1-p)^{n-i}

I praksis bruger vi tabeller eller CAS-værktøjer til dette.

Interaktiv Binomialfordeling

Juster antal forsøg n og succes-sandsynlighed p, og beregn sandsynligheden for et udvalgt interval.

0%3%6%9%12%
Valgt område Middelværdi (μ)
Antal forsøg (n):20
Succes-sandsynlighed (p):30%
Sandsynlighedsberegner
Værdi k:
6
Resultat:
0.00 %
Middelværdi (μ = np): 6.00
Spredning (σ): 2.049

Vis Eksempel: Møntkast – beregning af P(X=k) ⚡

Opgave: Du kaster en fair mønt 6 gange. Hvad er sandsynligheden for at få præcis 4 plat?

Her er n=6n=6, p=0,5p=0{,}5 (plat), og vi søger P(X=4)P(X=4).

Trin 1: Beregn binomialkoefficienten

(64)=6!4!2!=6521=15\binom{6}{4} = \frac{6!}{4! \cdot 2!} = \frac{6 \cdot 5}{2 \cdot 1} = 15

Trin 2: Beregn sandsynlighedsfaktorerne

pk=0,54=0,0625p^k = 0{,}5^4 = 0{,}0625(1p)nk=0,564=0,52=0,25(1-p)^{n-k} = 0{,}5^{6-4} = 0{,}5^2 = 0{,}25

Trin 3: Gang det hele sammen

P(X=4)=(64)0,540,52=150,06250,25=150,015625=0,234375\begin{aligned} P(X=4) &= \binom{6}{4} \cdot 0{,}5^4 \cdot 0{,}5^2 \\ &= 15 \cdot 0{,}0625 \cdot 0{,}25 \\ &= 15 \cdot 0{,}015625 \\ &= 0{,}234375 \end{aligned}

Sandsynligheden for præcis 4 plat i 6 kast er ca. 23,4%.


Vis Eksempel: Multiple choice-gætteri ⚡

Opgave: En test har 10 spørgsmål med 4 svarmuligheder hver. Du gætter tilfældigt. Hvad er sandsynligheden for at ramme mindst 5 rigtige?

Her er n=10n=10, p=0,25p=0{,}25 (tilfældigt gæt), og vi søger P(X5)P(X \geq 5).

Vi bruger komplementet:

P(X5)=1P(X4)P(X \geq 5) = 1 - P(X \leq 4)

Vi beregner P(X=k)P(X=k) for k=0,1,2,3,4k = 0, 1, 2, 3, 4:

P(X=0)=(100)0,2500,7510=110,0563=0,0563P(X=1)=(101)0,2510,759=100,250,0751=0,1877P(X=2)=(102)0,2520,758=450,06250,1001=0,2816P(X=3)=(103)0,2530,757=1200,01560,1335=0,2503P(X=4)=(104)0,2540,756=2100,00390,1780=0,1460\begin{aligned} P(X=0) &= \binom{10}{0} \cdot 0{,}25^0 \cdot 0{,}75^{10} = 1 \cdot 1 \cdot 0{,}0563 = 0{,}0563 \\ P(X=1) &= \binom{10}{1} \cdot 0{,}25^1 \cdot 0{,}75^{9} = 10 \cdot 0{,}25 \cdot 0{,}0751 = 0{,}1877 \\ P(X=2) &= \binom{10}{2} \cdot 0{,}25^2 \cdot 0{,}75^{8} = 45 \cdot 0{,}0625 \cdot 0{,}1001 = 0{,}2816 \\ P(X=3) &= \binom{10}{3} \cdot 0{,}25^3 \cdot 0{,}75^{7} = 120 \cdot 0{,}0156 \cdot 0{,}1335 = 0{,}2503 \\ P(X=4) &= \binom{10}{4} \cdot 0{,}25^4 \cdot 0{,}75^{6} = 210 \cdot 0{,}0039 \cdot 0{,}1780 = 0{,}1460 \end{aligned}P(X4)=0,0563+0,1877+0,2816+0,2503+0,1460=0,9219P(X \leq 4) = 0{,}0563 + 0{,}1877 + 0{,}2816 + 0{,}2503 + 0{,}1460 = 0{,}9219P(X5)=10,9219=0,0781P(X \geq 5) = 1 - 0{,}9219 = 0{,}0781

Sandsynligheden for at gætte mindst 5 rigtige er ca. 7,8%. Tilfældigt gætteri betaler sig altså sjældent! 😅


Teori: Middelværdi og varians

Når Xb(n,p)X \sim b(n, p), kan vi beregne fordelingsparametre med elegante formler:

Middelværdi (det forventede antal succeser):

μ=E(X)=np\mu = E(X) = n \cdot p

Varians (et mål for spredningen):

σ2=Var(X)=np(1p)\sigma^2 = \text{Var}(X) = n \cdot p \cdot (1-p)

Spredning (standardafvigelse):

σ=np(1p)\sigma = \sqrt{n \cdot p \cdot (1-p)}

Hvorfor disse formler giver mening:

Middelværdien npnp er intuitiv – hvis du kaster en terning 60 gange og håber på 6’ere, forventer du 6016=1060 \cdot \frac{1}{6} = 10 styk.

Variansen np(1p)np(1-p) er størst, når p=0,5p = 0{,}5 (maks usikkerhed) og mindst, når pp er tæt på 0 eller 1 (resultatet er næsten sikkert).


Vis Eksempel: Middelværdi og varians i praksis ⚡

Opgave: En medicin helbreder 70% af patienterne. 20 patienter behandles. Bestem middelværdi, varians og spredning for antallet af helbredte.

Her er Xb(20;0,70)X \sim b(20;\, 0{,}70).

Middelværdi:

μ=np=200,70=14\mu = n \cdot p = 20 \cdot 0{,}70 = 14

Vi forventer altså, at 14 ud af 20 patienter helbredes.

Varians:

σ2=np(1p)=200,700,30=4,2\sigma^2 = n \cdot p \cdot (1-p) = 20 \cdot 0{,}70 \cdot 0{,}30 = 4{,}2

Spredning:

σ=4,22,05\sigma = \sqrt{4{,}2} \approx 2{,}05

Det typiske antal helbredte ligger altså i intervallet 14±22,0514 \pm 2 \cdot 2{,}05, dvs. mellem ca. 10 og 18 patienter.


Vis Bevis: Udledning af middelværdien μ=np\mu = np

Vi kan se XX som en sum af nn uafhængige Bernoulli-variable X1,X2,,XnX_1, X_2, \ldots, X_n, hvor:

Xi={1hvis forsøg i er succes0hvis forsøg i er fiaskoX_i = \begin{cases} 1 & \text{hvis forsøg } i \text{ er succes} \\ 0 & \text{hvis forsøg } i \text{ er fiasko} \end{cases}

Da er X=X1+X2++XnX = X_1 + X_2 + \cdots + X_n.

For hver XiX_i gælder:

E(Xi)=1p+0(1p)=pE(X_i) = 1 \cdot p + 0 \cdot (1-p) = p

Ved lineariteten af forventningsværdien:

E(X)=E(X1+X2++Xn)=E(X1)+E(X2)++E(Xn)=p+p++pn led=np\begin{aligned} E(X) &= E(X_1 + X_2 + \cdots + X_n) \\ &= E(X_1) + E(X_2) + \cdots + E(X_n) \\ &= \underbrace{p + p + \cdots + p}_{n \text{ led}} \\ &= n \cdot p \end{aligned}

Tilsvarende kan variansen udledes ved brug af uafhængigheden:

Var(X)=Var(X1)++Var(Xn)=np(1p)\text{Var}(X) = \text{Var}(X_1) + \cdots + \text{Var}(X_n) = n \cdot p(1-p)

da Var(Xi)=E(Xi2)(E(Xi))2=pp2=p(1p)\text{Var}(X_i) = E(X_i^2) - (E(X_i))^2 = p - p^2 = p(1-p).


Teori: Binomialtest

En binomialtest bruges til at undersøge, om en observeret succesandsynlighed afviger signifikant fra en antaget (forventet) sandsynlighed p0p_0.

Fremgangsmåde for en binomialtest:

1. Opstil hypoteser:

  • H0H_0: p=p0p = p_0 (nulhypotesen – den værdi vi tester imod)
  • H1H_1: pp0p \neq p_0 (tosidet test) eller p>p0p > p_0 / p<p0p < p_0 (ensidet test)

2. Vælg signifikansniveau:

  • Typisk α=0,05\alpha = 0{,}05 (5%)

3. Beregn teststørrelsen:

  • Observér antallet af succeser kk i nn forsøg.
  • Beregn P(Xk)P(X \geq k) eller P(Xk)P(X \leq k) under H0H_0, dvs. med Xb(n,p0)X \sim b(n, p_0).

4. Beslutningsregel:

  • Hvis p-værdiαp\text{-værdi} \leq \alpha: Forkast H0H_0 – resultatet er statistisk signifikant.
  • Hvis p-værdi>αp\text{-værdi} > \alpha: Forkast ikke H0H_0 – der er ikke tilstrækkelig evidens.

pp-værdien er sandsynligheden for at observere et resultat mindst lige så ekstremt som det observerede, givet at H0H_0 er sand.


Vis Eksempel: Binomialtest – er terningen fair? ⚡

Opgave: Du kaster en terning 60 gange og observerer 18 seksere. Er terningen fair? (Brug α=0,05\alpha = 0{,}05)

Trin 1: Hypoteser

H0:p=160,1667(fair terning)H_0: p = \frac{1}{6} \approx 0{,}1667 \quad \text{(fair terning)}H1:p>16(terningen favoriserer 6)H_1: p > \frac{1}{6} \quad \text{(terningen favoriserer 6)}

Vi bruger en ensidet test, da vi mistænker for mange 6’ere.

Trin 2: Signifikansniveau

α=0,05\alpha = 0{,}05

Trin 3: Under H0H_0 er Xb(60;0,1667)X \sim b(60;\, 0{,}1667)

Forventet antal: μ=6016=10\mu = 60 \cdot \frac{1}{6} = 10

Vi observerede k=18k = 18, som er langt over forventningen.

Vi beregner pp-værdien:

p-værdi=P(X18)=i=1860(60i)0,1667i0,833360ip\text{-værdi} = P(X \geq 18) = \sum_{i=18}^{60} \binom{60}{i} \cdot 0{,}1667^i \cdot 0{,}8333^{60-i}

Med CAS finder vi: p-værdi0,0043p\text{-værdi} \approx 0{,}0043.

Trin 4: Konklusion

p-værdi=0,0043<0,05=αp\text{-værdi} = 0{,}0043 < 0{,}05 = \alpha

Vi forkaster H0H_0. Der er statistisk signifikant evidens for, at terningen ikke er fair – den giver for mange 6’ere. 🎲


Vis Eksempel: Binomialtest – virker medicinen? ⚡

Opgave: En medicin påstås at virke i 80% af tilfældene. I en undersøgelse af 25 patienter virker den kun på 16. Er der grund til at tvivle på påstanden? (Brug α=0,05\alpha = 0{,}05)

Trin 1: Hypoteser

H0:p=0,80(medicinen virker som pa˚sta˚et)H_0: p = 0{,}80 \quad \text{(medicinen virker som påstået)}H1:p<0,80(medicinen virker da˚rligere)H_1: p < 0{,}80 \quad \text{(medicinen virker dårligere)}

Trin 2: α=0,05\alpha = 0{,}05

Trin 3: Under H0H_0 er Xb(25;0,80)X \sim b(25;\, 0{,}80)

Forventet antal: μ=250,80=20\mu = 25 \cdot 0{,}80 = 20

Observeret: k=16k = 16

p-værdi=P(X16)=i=016(25i)0,80i0,2025ip\text{-værdi} = P(X \leq 16) = \sum_{i=0}^{16} \binom{25}{i} \cdot 0{,}80^i \cdot 0{,}20^{25-i}

Med CAS finder vi: p-værdi0,0468p\text{-værdi} \approx 0{,}0468.

Trin 4: Konklusion

p-værdi=0,0468<0,05=αp\text{-værdi} = 0{,}0468 < 0{,}05 = \alpha

Vi forkaster H0H_0. Der er statistisk signifikant evidens for, at medicinen virker dårligere end påstået. Dog er pp-værdien tæt på grænsen, så resultatet bør tolkes med forsigtighed.


🏋️ Træningsopgaver

Opgave 1: Grundlæggende beregning En skydespiller rammer målet med sandsynlighed p=0,40p = 0{,}40. Hun skyder 8 gange. Beregn sandsynligheden for, at hun rammer præcis 3 gange.

Opgave 2: Middelværdi og varians I en by er 15% af alle biler elbiler. En trafiktæller registrerer 40 tilfældige biler. Lad XX betegne antallet af elbiler.

  • a) Bestem middelværdi og spredning for XX.
  • b) Beregn P(X=6)P(X = 6).
  • c) Beregn P(X10)P(X \geq 10) med CAS.

Opgave 3: Kvalitetskontrol En fabrik producerer chips, og 5% er defekte. Et parti på 100 chips kontrolleres.

  • a) Beregn det forventede antal defekte chips.
  • b) Beregn sandsynligheden for, at der er højst 3 defekte chips.
  • c) Beregn sandsynligheden for, at der er mere end 8 defekte chips.

Opgave 4: Binomialtest En producent hævder, at 90% af deres batterier holder mindst 1000 timer. Du tester 30 batterier, og kun 24 holder. Udfør en binomialtest med α=0,05\alpha = 0{,}05. Opstil hypoteser, beregn pp-værdien, og drag en konklusion.

Opgave 5: Modelvalidering En terning kastes 120 gange, og man observerer følgende antal seksere: 28. Undersøg med en binomialtest om terningen er fair. Brug signifikansniveauet α=0,01\alpha = 0{,}01.


Quiz – Test din forståelse

Matematik Boss-Kamp ⚔️

Løs opgavesættet

Op til +50 XP
Hvad er middelværdien for en binomialfordelt stokastisk variabel X ~ b(20, 0.3)?