Randomisatie 2.0: controle afleiding

Moderators: dirkwb, Xilvo

Forumregels
(Middelbare) school-achtige vragen naar het forum "Huiswerk en Practica" a.u.b.
Zie eerst de Huiswerkbijsluiter
Berichten: 403

Randomisatie 2.0: controle afleiding

Dag,

In het verlengde van het vorige topic (Randomisatie), dit keer niet de vraag om zelf met ideeën te komen, maar om het onderstaande wiskundig te controleren.

1. Combinatorisch kan een groep van N in twee gelijke groepen van N/2 verdeeld worden op N!/2((N/2)!)^2 manieren

2. Als je uitgaat van een kans van p = 1/2 om in de ene groep te komen en een kans van 1 - p = 1 - 1/2 = 1/2 om in de andere groep te komen, dan zou de binominaalverdeling als volgt zijn voor de kans P op één specifieke verdeling/“husseling” binnen alle mogelijke opties: P = (N!/2((N/2)!)^2)(1/2)^N = N!/(2^(N+1)((N/2)!)^2)

3. Als ik de Stirling-benadering voor N! gebruik voor de teller en noemer, kom ik uit op: P ≈ sqrt(2πN)(N/e)^N/(2^(N+1)⋅(sqrt(2πN/2)(N/2e)^N/2)^2) = sqrt(2πN)(N/e)^N/(2^(N+1)⋅1/2^N⋅πN(N/e)^N) = sqrt(2πN)/2πN.
Hieruit volgt: P ≈ 1/sqrt(2πN)

Klopt dit? Dank alvast. Het is in ieder geval overzichtelijk. Je kunt dan op basis van een eenvoudige relatie inschatten hoe groot de populatie N moet zijn om de kans P op één specifieke verdeling/“husseling” van deze N personen beneden een bepaalde streefwaarde te brengen.

Gebruikersavatar
Berichten: 2.642

Re: Randomisatie 2.0: controle afleiding

Als je eerst schrijft dat er N!/2((N/2)!)^2 manieren zijn om te verdelen in 2 gelijke groepen (wat juist is), dan is de kans op 1 specifieke verdeling 1 / [N!/2((N/2)!)^2].

Punt 2 lijkt mij niet te kloppen of er is in elk geval onduidelijk geformuleerd wat er bedoeld wordt.

Berichten: 403

Re: Randomisatie 2.0: controle afleiding

Ja, ik zat even na te denken bij 2. of ik deze situatie kon zien als een binomiaalverdeling met kans op randomisatie naar groep A = 1/2 en kans op randomisatie naar groep B = 1/2, dan krijg je: P = aantal combinaties x p^k x (1-p)^n-k
Maar goed, de ene persoon is natuurlijk de andere niet, zoals bij een muntworp of een dobbelsteenworp (die onderling uitwisselbaar zijn).
Je suggestie: 1/combinaties was mijn aanvankelijke gedachte (zie vorig topic), maar ik kreeg de suggestie om dit als binomiaalverdeling te beschouwen

Gebruikersavatar
Moderator
Berichten: 10.224

Re: Randomisatie 2.0: controle afleiding

Je kunt de binomiale verdeling uitstekend benaderen met een normale verdeling indien \(N\ge20\) en \(Np\ge 5\) en \(N(1-p)\ge 5\).
Voor het gemiddelde neem je dan \(\mu=N p\), voor de standaarafwijking \(\sigma=\sqrt{ N p (1-p)}\)
Daarmee zijn meteen cumulatieve waardes makkelijker te berekenen.

Berichten: 403

Re: Randomisatie 2.0: controle afleiding

Nieuwe ronde, nieuwe kansen. Dan maak ik er via Stirling van voor de kans op één specifieke husseling: P = sqrt(2πN)/2^N

Gebruikersavatar
Moderator
Berichten: 10.224

Re: Randomisatie 2.0: controle afleiding

PhilipVoets schreef: do 20 jun 2024, 09:17 Nieuwe ronde, nieuwe kansen. Dan maak ik er via Stirling van voor de kans op één specifieke husseling: P = sqrt(2πN)/2^N
Als je onder een husseling verstaat dat je van iedere deelnemer weet of die in groep A of groep B belandt, dan is de kans \(\frac{1}{2^N}\)
Als het er alleen om gaat hoeveel in A terechtkomen, dan is de kans afhankelijk van het aantal in (bijvoorbeeld) A en dan is jouw formule niet goed omdat daar dat aantal niet in voorkomt.

Berichten: 403

Re: Randomisatie 2.0: controle afleiding

PhilipVoets schreef: do 20 jun 2024, 08:33 Ja, ik zat even na te denken bij 2. of ik deze situatie kon zien als een binomiaalverdeling met kans op randomisatie naar groep A = 1/2 en kans op randomisatie naar groep B = 1/2, dan krijg je: P = aantal combinaties x p^k x (1-p)^n-k
Maar goed, de ene persoon is natuurlijk de andere niet, zoals bij een muntworp of een dobbelsteenworp (die onderling uitwisselbaar zijn).
Je suggestie: 1/combinaties was mijn aanvankelijke gedachte (zie vorig topic), maar ik kreeg de suggestie om dit als binomiaalverdeling te beschouwen
Nog voortbordurend op het bovenstaande: afzonderlijke personen zijn weliswaar niet “onderling uitwisselbaar”, dus niet geschikt voor de “succes/mislukking”-insteek van een binomiale verdeling, maar eigenschappen van deze personen (man/vrouw, dik/dun, lang/kort, etc.), waar het eigenlijk om gaat bij randomisatie (niet of het nu precies Piet of Jan is), zijn dat wél. Stel dat je al deze eigenschappen definieert als dichotoom met een kans van 1/2 op één van beiden (als je uitgaat van een normaalverdeling voor deze eigenschappen en alles links van μ is gedefinieerd als bijvoorbeeld dun/kort/arm/etc. en alles rechts van μ is gedefinieerd als bijvoorbeeld dik/lang/rijk/etc., dan geldt ook (nogmaals, uitgaand van een symmetrische normaalverdeling van deze eigenschappen) de kans op een zekere “eigenschap” is 1/2. Voor geslacht geldt natuurlijk sowieso al de dichotome 1/2 om 1/2. Mag je dan stellen dat voor iedere afzonderlijke eigenschap die je wilt randomiseren de kans op een éxacte 50/50-verdeling van deze eigenschappen over de twee groepen van N/2 wel gelijk is aan de hierboven afgeleide 1/sqrt(2πN)? En mag je dan de productregel gebruiken om bijvoorbeeld voor randomisatie van drie eigenschappen te zeggen dat een exacte 50/50-verdeling van deze drie eigenschappen over twee groepen van N/2 gelijk is aan (1/sqrt(2πN))^3?

Gebruikersavatar
Moderator
Berichten: 10.224

Re: Randomisatie 2.0: controle afleiding

PhilipVoets schreef: do 20 jun 2024, 10:04 Stel dat je al deze eigenschappen definieert als dichotoom met een kans van 1/2 op één van beiden (als je uitgaat van een normaalverdeling voor deze eigenschappen en alles links van μ is gedefinieerd als bijvoorbeeld dun/kort/arm/etc. en alles rechts van μ is gedefinieerd als bijvoorbeeld dik/lang/rijk/etc.,
Ik denk dat je de zaak nu omdraait. De eigenschap hoeft geen kans van een half te hebben, de kans dat iemand met die eigenschap in groep A dan wel in groep B valt is een haf, mits A en B even groot zijn.

Berichten: 403

Re: Randomisatie 2.0: controle afleiding

Xilvo schreef: do 20 jun 2024, 09:47
PhilipVoets schreef: do 20 jun 2024, 09:17 Nieuwe ronde, nieuwe kansen. Dan maak ik er via Stirling van voor de kans op één specifieke husseling: P = sqrt(2πN)/2^N
Als je onder een husseling verstaat da je van iedere deelnemer weet of die in groep A of groep B belandt, dan is de kans \(\frac{1}{2^N}\)
Als het er alleen om gaat hoeveel in A terechtkomen, dan is de kans afhankelijk van het aantal in (bijvoorbeeld) A en dan is jouw formule niet goed omdat daar dat aantal niet in voor komt.
Ik denk dat er bij een van ons iets niet goed gaat/we langs elkaar heen praten, want die sqrt(2πN)/2^N is niet anders dan de eerder al correct bevonden 1/(N!/(2((N/2)!)^2)) herschreven via Stirling-benadering.

Berichten: 403

Re: Randomisatie 2.0: controle afleiding

Xilvo schreef: do 20 jun 2024, 10:08
PhilipVoets schreef: do 20 jun 2024, 10:04 Stel dat je al deze eigenschappen definieert als dichotoom met een kans van 1/2 op één van beiden (als je uitgaat van een normaalverdeling voor deze eigenschappen en alles links van μ is gedefinieerd als bijvoorbeeld dun/kort/arm/etc. en alles rechts van μ is gedefinieerd als bijvoorbeeld dik/lang/rijk/etc.,
Ik denk dat je de zaak nu omdraait. De eigenschap hoeft geen kans van een half te hebben, de kans dat iemand met die eigenschap in groep A dan wel in groep B valt is een haf, mits A en B even groot zijn.
Ligt dat niet aan hoe de eigenschap gedefinieerd wordt? Als je uitgaat van een symmetrische normaalverdeling (en die geldt voor de meeste demografische en biologische eigenschappen (zoals IQ, lengte, gewicht, etc.) en je definieert die eigenschap dichotoom als links van μ of rechts van μ zit je toch op 1/2? Het is puur wat je als μ kiest, lijkt mij..

Gebruikersavatar
Moderator
Berichten: 10.224

Re: Randomisatie 2.0: controle afleiding

PhilipVoets schreef: do 20 jun 2024, 10:11
Ik denk dat er bij een van ons iets niet goed gaat/we langs elkaar heen praten, want die sqrt(2πN)/2^N is niet anders dan de eerder al correct bevonden 1/(N!/(2((N/2)!)^2)) herschreven via Stirling-benadering.
\(\frac{N!}{\frac{N}{2}!\frac{N}{2}!}(\frac{1}{2})^N\) is de kans dat precies de helft in A, de andere in B valt.
Anders krijg je \(\frac{N!}{(N-M)! M!}(\frac{1}{2})^N\), met M het aantal dat in één groep valt.

Gebruikersavatar
Moderator
Berichten: 10.224

Re: Randomisatie 2.0: controle afleiding

PhilipVoets schreef: do 20 jun 2024, 10:14 Ligt dat niet aan hoe de eigenschap gedefinieerd wordt? Als je uitgaat van een symmetrische normaalverdeling (en die geldt voor de meeste demografische en biologische eigenschappen (zoals IQ, lengte, gewicht, etc.) en je definieert die eigenschap dichotoom als links van μ of rechts van μ zit je toch op 1/2? Het is puur wat je als μ kiest, lijkt mij..
Voor veel eigenschappen werkt dat niet. Bijvoorbeeld het hebben van diabetes, of overgewicht.

Omgekeerd, welk deel met diabetes in A of B valt is altijd symmetrisch, als A en B even groot zijn.

Berichten: 403

Re: Randomisatie 2.0: controle afleiding

Ja, terecht punt. Moet je eigenlijk niet nog een keer door 2 delen omdat geldt A,B = B,A? Zo ja, dan is jouw formule dezelfde als waar ik in mijn eerste bericht in deze post op uitkwam (onder 2), maar daar leek Wnvl1 zich niet in te kunnen vinden.

Gebruikersavatar
Moderator
Berichten: 10.224

Re: Randomisatie 2.0: controle afleiding

PhilipVoets schreef: do 20 jun 2024, 10:29 Ja, terecht punt. Moet je eigenlijk niet nog een keer door 2 delen omdat geldt A,B = B,A? Zo ja, dan is jouw formule dezelfde als waar ik in mijn eerste bericht in deze post op uitkwam (onder 2), maar daar leek Wnvl1 zich niet in te kunnen vinden.
Als je precies evenveel in A en B krijgt (alleen mogelijk bij even N, natuurlijk), dat krijg je \(\frac{N!}{\frac{N}{2}!\frac{N}{2}!}(\frac{1}{2})^N\).
Dus zonder een 2 in de noemer.

Krijg je M in A óf M in B (beide mag), met \(M \ne \frac{N}{2}\)dan krijg je een 2 erbij in de teller:
\(2\frac{N!}{(N-M)! M!}(\frac{1}{2})^N\)

Berichten: 403

Re: Randomisatie 2.0: controle afleiding

Xilvo schreef: do 20 jun 2024, 11:06
PhilipVoets schreef: do 20 jun 2024, 10:29 Ja, terecht punt. Moet je eigenlijk niet nog een keer door 2 delen omdat geldt A,B = B,A? Zo ja, dan is jouw formule dezelfde als waar ik in mijn eerste bericht in deze post op uitkwam (onder 2), maar daar leek Wnvl1 zich niet in te kunnen vinden.
Als je precies evenveel in A en B krijgt (alleen mogelijk bij even N, natuurlijk), dat krijg je \(\frac{N!}{\frac{N}{2}!\frac{N}{2}!}(\frac{1}{2})^N\).
Dus zonder een 2 in de noemer.

Krijg je M in A óf M in B, met \(M \ne \frac{N}{2}\)dan krijg je een 2 erbij in de teller:
\(2\frac{N!}{(N-M)! M!}(\frac{1}{2})^N\)
Dank! Ja, aangezien het hier natuurlijk wel gaat om gelijke groepen is dat tweede minder van toepassing. Dat eerste is dan gewoon een binomiaalverdeling met aantal combinaties x (1/2)^k x (1-1/2)^n-k = aantal combinaties x (1/2)^n? Enige rare is dat als je kijkt hoeveel combinaties er zijn (volgorde niet van belang) voor bijvoorbeeld N = 4 met a, b, c en d, dan kom ik uit op ab:cd, ac:bd en ad:bc (ab:cd is immers hetzelfde als cd:ab), dus drie opties = 4!/2((4/2)!)^2 = 3, vandaar eerder de factor 2 in de noemer, maar ik begrijp dat die niet nodig is dan?

Reageer