Grupperet data opstår når mange observationer sorteres i klasser eller intervaller. Du lærer at beregne approksimative deskriptorer og aflæse sumkurven til kvartilbestemmelse.
Du lærer at:
Opstille frekvenstavle og beregne relative frekvenser for grupperet data
Beregne approksimativ middelværdi og standardafvigelse for grupperet data
Tegne og aflæse sumkurver (ogiver)
Bestemme kvartiler fra sumkurven
💡
Intuitionen
"Når du grupperer data mister du information om de præcise værdier, men du vinder overblik over fordelingen. Det er en afvejning – og sumkurven er dit vigtigste redskab."
Grupperet data 📊
Når du har mange observationer — fx 200 elevers resultater på en prøve — giver det sjældent mening at liste hvert enkelt tal. I stedet grupperer vi data i intervaller. Det giver overblik, men vi mister information om de præcise værdier.
I dette kapitel lærer du at arbejde med grupperet dataData der er organiseret i klasser/intervaller, hvor man kender antallet af observationer i hvert interval, men ikke de individuelle værdier.: beregne gennemsnit, tegne sumkurver og aflæse kvartiler. Level up! 🚀
Teori: Fra ugrupperet til grupperet data
Når vi grupperer data, opdeler vi tallinjen i klasser (intervaller) og tæller, hvor mange observationer der falder i hver klasse.
Eksempel på en frekvensoversigt:
Klasse (interval)
Hyppighed
[0;10[
5
[10;20[
12
[20;30[
18
[30;40[
10
[40;50]
5
Notationen [10;20[ betyder “fra og med 10 til, men ikke med 20”. Det sikrer, at hvert interval er entydigt.
Klassebredden er længden af hvert interval. I eksemplet ovenfor er klassebredden 10 for alle klasser.
Fordele: Overskueligt, let at visualisere i histogrammer.
Ulemper: Vi kender ikke de præcise observationer — kun hvilke intervaller de ligger i.
Teori: Intervalmidtpunkter
Da vi ikke kender de præcise værdier i hvert interval, antager vi, at observationerne er jævnt fordelt. Vi repræsenterer derfor alle observationer i et interval med intervalmidtpunktetMidten af et interval, beregnet som gennemsnittet af intervallets nedre og øvre grænse.:
mi=2nedre grænse+øvre grænse
For intervallet [10;20[ er midtpunktet:
m=210+20=15
Intervalmidtpunktet bruges som “repræsentant” for alle observationer i intervallet, når vi beregner gennemsnit og andre mål.
Vis Eksempel: Beregning af intervalmidtpunkter ⚡
Vi har følgende gruppering af data:
Klasse
Nedre grænse
Øvre grænse
Midtpunkt mi
[0;10[
0
10
20+10=5
[10;20[
10
20
210+20=15
[20;30[
20
30
220+30=25
[30;40[
30
40
230+40=35
[40;50]
40
50
240+50=45
Disse midtpunkter bruger vi nu i beregninger, som om alle observationer i intervallet havde netop den værdi.
Teori: Gennemsnit for grupperet data
Når data er grupperet, kan vi ikke beregne det præcise gennemsnit — men vi kan give et godt estimat ved at bruge intervalmidtpunkterne.
Formlen for det estimerede gennemsnitEt tilnærmet gennemsnit beregnet ud fra grupperet data ved at bruge intervalmidtpunkter som repræsentanter for observationerne. er:
Kumuleret hyppighedDen samlede (opadderede) hyppighed op til og med en bestemt klasse. Viser hvor mange observationer der ligger under en given grænse. er den løbende sum af hyppigheder: for hver klasse tæller du alle observationer fra starten op til og med den pågældende klasse.
SumkurvenEn graf der viser den kumulerede frekvens (eller hyppighed) som funktion af klassernes øvre grænser. Bruges til at aflæse median og kvartiler. (også kaldet den kumulative frekvensfunktion) er en grafisk fremstilling af den kumulerede hyppighed (eller kumulerede frekvens).
Sådan tegner du en sumkurve:
Beregn den kumulerede hyppighed for hver klasse.
Plot punkterne (øvre grænse,kumuleret hyppighed).
Forbind punkterne med rette linjer (lineær interpolation).
Start altid i (xmin,0) — ingen observationer er kumuleret ved datasættets start.
En virksomhed har registreret medarbejdernes daglige transporttid (i minutter):
Transporttid (min)
Hyppighed
[0;15[
8
[15;30[
15
[30;45[
22
[45;60[
12
[60;90]
3
I alt
60
a) Estimeret gennemsnit:
Klasse
mi
hi
mi⋅hi
[0;15[
7,5
8
60
[15;30[
22,5
15
337,5
[30;45[
37,5
22
825
[45;60[
52,5
12
630
[60;90]
75
3
225
I alt
60
2077,5
xˉ≈602077,5≈34,6 minutter
b) Kumuleret hyppighed og median:
Klasse
Hyppighed
Kumuleret
[0;15[
8
8
[15;30[
15
23
[30;45[
22
45
[45;60[
12
57
[60;90]
3
60
Medianen svarer til 0,50⋅60=30 observationer. Kumuleret 23 ved x=30 og 45 ved x=45. Medianen er i [30;45[:
Q2=30+45−2330−23⋅15=30+227⋅15≈30+4,8=34,8 min
Teori: Histogram
Et histogramEn søjlediagram for grupperet data, hvor søjlernes areal (ikke højde) repræsenterer hyppigheden i hvert interval. er den grafiske fremstilling af grupperet data.
Vigtige regler:
Søjlerne rører hinanden (ingen mellemrum) — for at vise, at data er kontinuert.
Hvis alle klasser har samme bredde: søjlens højde viser hyppigheden direkte.
Hvis klasserne har forskellig bredde: det er arealet af søjlen, der repræsenterer hyppigheden. Højden er da hyppighedstætheden: klassebreddehi.
Histogrammet og sumkurven supplerer hinanden: histogrammet viser fordelingens form, sumkurven gør det nemt at aflæse kvartiler.
🏋️ Træningsopgaver
Opgave 1: Et datasæt er grupperet som følger:
Klasse
Hyppighed
[0;5[
4
[5;10[
9
[10;15[
14
[15;20[
8
[20;25]
5
a) Beregn intervalmidtpunkterne.
b) Estimér gennemsnittet.
c) Lav en tabel over kumuleret hyppighed.
Opgave 2: Brug tabellen fra opgave 1 til at bestemme Q1, medianen og Q3 ved lineær interpolation.
Opgave 3: 100 elever har fået deres springhøjde (i cm) grupperet:
Klasse
Hyppighed
[100;110[
10
[110;120[
25
[120;130[
35
[130;140[
20
[140;150]
10
a) Estimér gennemsnittet.
b) Tegn sumkurven og aflæs medianen.
c) Bestem kvartilbredden.
Opgave 4: Forklar med egne ord, hvorfor gennemsnittet for grupperet data kun er et estimat og ikke den præcise værdi.
Quiz – Test din forståelse
Matematik Boss-Kamp ⚔️
Løs opgavesættet
Op til +50 XP
Hvad er intervalmidtpunktet for klassen [20 ; 30[?