De wet van de grote aantallen - PO, 4 havo/ 4 vwo.

In de statistiek valt er vaak niets te zeggen over een bepaalde afzonderlijke gebeurtenis als bijvoorbeeld het gooien met een dobbelsteen of muntstuk terwijl er wel wat valt te zeggen over wat er in totaal of gemiddeld over een groot aantal gevallen gebeurt.

Als je met een muntstuk gooit is het volledig onvoorspelbaar of er kop of munt gegooid zal worden. Terwijl er wel te voorspellen is dat er uit honderd worpen (of een nog groter aantal) ongeveer de helft kop en de helft munt zal zijn.

Dit wordt in de statistiek ook ‘De wet van de grote aantallen’ genoemd.

In deze praktische opdracht (download pdf) gaan aan de hand van een dobbelsteen en met behulp van Excel© deze wet controleren, maar voordat we daarmee gaan beginnen verdiepen we ons iets meer in de theorie.

Kansen
Om kansen weer te geven is de volgende notatie gebruikelijk P(gebeurtenis). Bijvoorbeeld bij het gooien met een dobbelsteen betekent P(4) de kans op een 4.

Kansverdeling
Een variabele waarvan de waarde afhangt van het toeval noemen we een stochast. Een stochast is een variabele dat vaak wordt aangegeven met een hoofdletter (bv X, V, S, enz).

Voorbeeld:
• De stochast X is het aantal ogen bij een worp met één dobbelsteen.
• De stochast V is het verschil in ogen bij de worp met twee dobbelstenen.

De kansverdeling van een stochast X is een overzicht van alle aan te nemen waarden van X met de bijbehorende kans.

x P(X=x)
0
1
2
0,25
0,5
0,25


Stochast X: het aantal keren kop bij twee keer gooien met een muntstuk.
De kansverdeling is dan de volgende:

Verwachtingswaarde
De gemiddelde waarde die je kunt verwachten als je een kansexperiment oneindig vaak zou herhalen, noem je de verwachtingswaarde.
De verwachtingswaarde bij een kansverdeling kun je uitrekenen door elke uitkomst van de stochast te vermenigvuldigen met de bijbehorende kans en deze resultaten op te tellen. De verwachtingswaarde van de stochast X noteer je als E(X).


Opgaven
1. Stochast X is het aantal ogen dat je met één dobbelsteen gooit.
a. Wat zijn de mogelijke waarden die X aan kan nemen?
b. Wat is de kans op een 4?
c. Stel de kansverdeling van X op.
d. Bereken met behulp van deze kansverdeling de verwachtingswaarde van X.

2. Stochast Y is het totaal aantal ogen dat je met twee dobbelstenen gooit.
a. Wat zijn de mogelijke waarden die Y aan kan nemen?
b. Wat is de kans op een 9?
c. Stel de kansverdeling van Y op.
d. Bereken met behulp van deze kansverdeling de verwachtingswaarde van Y.

3. Met behulp van zijn grafische rekenmachine gaat Simon de worpen van een dobbelsteen simuleren. Dit doet hij door gebruik te maken van de functie Ran# die in het menuutje PROB staat. Deze functie genereert een willekeurig getal tussen de 0 en 1 met tien decimalen.
Als je 1+6Ran# intikt, dan genereert je rekenmachine een willekeurig getal tussen de 1 en de 6 ook met tien decimalen. Als we deze getallen met de functie INT (onder het menuutje NUM) afronden op gehele getallen dan hebben we een manier om een dobbelsteen te simuleren: Int(1+6Ran#) (probeer dit!).
Op deze manier genereert Simon de volgende getallen:
4 6 1 6 3 4 3 4 1 3 2 5 6 2 4 1 5 3 1 6 5 2 1 1 2 1 3 4 1 6 2 3 2 3 2 3 3 4 5 4 4 5 5 6

x frequentie
1
2
3
4
5
6
8
.
.
.
.
.


a. Neem de frequentietabel hiernaast over en vul deze verder in.
b. Hoeveel procent van deze getallen is een 1?
c. Leg uit waarom het aantal procenten van elke waarde van x bij elkaar opgeteld een goede benadering is voor de verwachtingswaarde.
d. Bereken deze verwachtingswaarde.

De praktische opdracht.

In deze praktische opdracht gaan we de wet van de grote aantallen controleren aan de hand van worpen met een dobbelsteen.
Het is, zoals je weet, onvoorspelbaar hoeveel ogen je gooit als je met een dobbelsteen werpt. Wat je wel kunt voorspellen is wat je gemiddeld zult gooien per worp, als je heel vaak met een dobbelsteen gooit. Dat heb je in de opgaven van de theorie hiervoor al gezien.

We gaan Excel© als dobbelsteen gebruiken.

- Maak met behulp van Excel 20 kolommen met 100 rijen willekeurige getallen van 1 t/m 6. Gebruik hiervoor de functie ASELECT en de functie AFRONDEN om de gegenereerde getallen af te ronden (zoek zelf mbv de help functie van Excel hoe de functie ASELECT werkt).
- Maak onder elke kolom een frequentietabel. De Excel functie AANTAL.ALS die kan je werk sterk reduceren! Zoek uit hoe deze functie werkt.
- Bepaal het gemiddelde van elke rij met behulp van de frequentietabel. Merk op dat dit een benadering is van de verwachtingswaarde.
- Geef deze 20 benaderingen van de verwachtingswaarde weer in een puntenwolk (invoegen -->grafiek).
- Maak een tabel waarin je het gemiddelde van de eerste twee kolommen, de eerste drie kolommen, de eerste vier kolommen, enz, weergeeft en maak hier ook een puntenwolk van (dit noemen we in de wiskunde het voortschrijdende gemiddelde).
- Trek je conclusies.