Randomisatie

Moderators: dirkwb, Xilvo

Forumregels
(Middelbare) school-achtige vragen naar het forum "Huiswerk en Practica" a.u.b.
Zie eerst de Huiswerkbijsluiter
Reageer
Berichten: 400

Randomisatie

Voor een placebo-gecontroleerde randomized clinical trial (RCT) wordt een totale (even) groep van N personen random in twee delen verdeeld (om selectiebias te voorkomen) en de ene groep van N/2 personen krijgt een bepaald test-geneesmiddel en de andere N/2 personen een placebo; vervolgens wordt een bepaalde uitkomst bepaald in beide groepen en vergeleken.
Ik vroeg me af hoe groot N moet zijn om de randomisatie “zinvol” te maken. Neem je bijvoorbeeld N = 4 (A, B, C, D), dan zijn er drie manieren om twee gelijke groepen te maken (AB en CD, AC en BD en AD en BC; volgorde maakt niet uit); volgens mij -corrigeer me vooral- kom je dan uit op N!/2((N/2)!)^2 manieren om twee gelijke groepen te selecteren volgens combinatoriek; in dit geval: 4!/2(2!)^2 = 3. De kans P op één specifieke verdeling van N is dan 1/(N!/2((N/2)!)^2) = 2((N/2)!)^2/N!
Ik kan me voorstellen dat je een criterium kunt opstellen waarbij randomisatie “zinvol” is als P < bepaalde afkapwaarde (e.g., P <1%) is, maar ik ben nog beetje zoekende wat handig is. Hebben jullie ideeën? Of bestaat zoiets al?

Gebruikersavatar
Berichten: 2.619

Re: Randomisatie

Het aantal manieren waarop je de groep in 2 kan verdelen is niet rechtstreeks van belang. Stel groep A krijgt een vermageringspil en groep B is placebo. Je doet nadien een t-toets om de het gewichtsverlies van beide groepen te vergelijken. Het aantal manieren waarop je de groep in 2 kan delen speelt dat toch geen effect bij het inschatten van de benodigde steekproefgrootte of het bepalan van het onderscheidingsvermogen (power) van de test . Dat doe je op basis van de verwachtte effectgrootte en de de type 1 fout die je toelaat.

Berichten: 400

Re: Randomisatie

Ja, ik ken de relatie tussen power, uitkomstmaat en N, daar werd ik mee doodgegooid bij statistiek; aantonen van een klein verschil met hoge power vergt een grote N en vice versa, maar vroeg me vooral af (los van een RCT of de grootte van de uitkomst, dat was puur context) wanneer een randomisatie in algemene zin een “zinvolle exercitie” is en twee voldoende “random” groepen zijn ontstaan t.a.v. enkele eigenschappen/kenmerken (zoals leefstijl, BMI, geslacht, etc.) om ze eerlijk te kunnen vergelijken t.a.v een bepaalde uitkomst. Het aantal eigenschappen ten aanzien waarvan gerandomiseerd wordt speelt vermoedelijk dan ook een rol. Dat is wel een andere vraag dan hoe groot de groep moet zijn om een uitkomst met bepaalde significantie aan te tonen. Gevoelsmatig is randomisatie niet zinvol bij bijvoorbeeld N = 4 t.a.v vijf eigenschappen, maar wel bij bijvoorbeeld N = 50000 t.a.v drie eigenschappen, dus ergens daar tussenin moet een waarde voor N liggen dat het fenomeen randomisatie van een groep een “meerwaarde” heeft. Maar het was gewoon een hersenspinsel, wellicht ook een dood spoor

Gebruikersavatar
Berichten: 2.619

Re: Randomisatie

Handigste lijkt mij om dan terug te koppelen naar een lineaire regressie. In de grond zijn t-toetsen en ANOVA's ook allemaal regressies. Je zorgt er dan voor dat er in elk van beide groepen voldoende variatie is van BMI, geslacht etc, dan kan je die effecten wel wegrekenen en dan lijkt het mij ok. Typisch ga je kijken na de opdeling met bvb een chi kwadraat test dat de verdelingen van bvb geslacht of leeftijd in beide groepen gelijk is. Als dat ok is, dan is het goed.

Ik denk dat het in die context niet zinnig om te denken in termen van het aantal manieren om in 2 groepen te verdelen. Maar misschien heeft iemand anders daar nog een ander idee over?

Berichten: 400

Re: Randomisatie

Dank, het is natuurlijk mogelijk om bij een bepaalde bekende groep te kijken of deze (voldoende) random verdeeld is, maar de vraag is of je ook al op voorhand zou kunnen zeggen hoe groot N moet zijn bij hoeveel eigenschappen voor randomisatie om twee “voldoende random” groepen te krijgen. Misschien inderdaad terugrekenen vanuit die verdelingen.
Suggesties zijn welkom!

Berichten: 400

Re: Randomisatie

En (als kleine bijvraag, los van de eigenlijke vraag); klopte mijn combinatoriek?

Gebruikersavatar
Berichten: 2.619

Re: Randomisatie

De combinatoriek lijkt mij juist. N objecten kan je op

$$\frac{N!}{2((N/2)!)^2}$$

manieren in 2 gelijke groepen splitsen.

Berichten: 400

Re: Randomisatie

Dank! Iemand anders nog een suggestie t.a.v. de oorspronkelijke vraag (zie hierboven)? Als je weet hoeveel opties er zijn voor een randomisatie van een populatie van grootte N, hoe zou je dan kunnen beslissen wanneer er voldoende “random” spreiding t.a.v van bijvoorbeeld M eigenschappen?
Nogmaals, heb je bijvoorbeeld een groep van N = 10 en je wil een voldoende random spreiding van bijvoorbeeld gewicht, lengte en geslacht (dus M = 3), dan is het aantal combinaties gevoelsmatig te klein, maar bij een groep van N = 10.000 is het aantal combinaties zodanig groot dat je haar wel van voldoende toevallige verdeling van M over beide groepen van N/2 kunt spreken. Waar ligt ergens dat kantelpunt? En hoe verwerk je M daar wiskundig in?

Berichten: 400

Re: Randomisatie

Nog even voortbordurend; als je er vanuit gaat dat de kans op randomisatie naar groep A gelijk is aan naar groep B, namelijk 1/2, dan volgt uit de binomiaalverdeling met p = 1/2 en 1-p = 1/2 en aantal combinaties zoals in mijn eerste post genoemd voor de kans P op één specifieke verdeling van N personen in twee groepen van N/2 volgens mij:

P = N!/2((N/2)!)^2 x (1/2)^N = N!/(2^(N+1)((N/2)!)^2)

Klopt dat? Misschien als je dan stelt dat je P < een zekere grenswaarde wilt hebben (e.g., P <0,001), dat je dan terug kunt rekenen hoe groot N tenminste moet zijn. Ik zit me af te vragen of dat mijn vraag voldoende beantwoordt/een praktische toepassing zou kunnen hebben. Ik zat nog te kijken of ik het bovenstaande middels de Stirling-vergelijking kon vereenvoudigen, maar dat kwadraat in de noemer van ((N/2)!)^2 zit me in de weg, haha.

Misschien iemand n.a.v het bovenstaande nieuwe gedachten?

Berichten: 400

Re: Randomisatie

PhilipVoets schreef: wo 19 jun 2024, 13:56 Nog even voortbordurend; als je er vanuit gaat dat de kans op randomisatie naar groep A gelijk is aan naar groep B, namelijk 1/2, dan volgt uit de binomiaalverdeling met p = 1/2 en 1-p = 1/2 en aantal combinaties zoals in mijn eerste post genoemd voor de kans P op één specifieke verdeling van N personen in twee groepen van N/2 volgens mij:

P = N!/2((N/2)!)^2 x (1/2)^N = N!/(2^(N+1)((N/2)!)^2)

Klopt dat? Misschien als je dan stelt dat je P < een zekere grenswaarde wilt hebben (e.g., P <0,001), dat je dan terug kunt rekenen hoe groot N tenminste moet zijn. Ik zit me af te vragen of dat mijn vraag voldoende beantwoordt/een praktische toepassing zou kunnen hebben. Ik zat nog te kijken of ik het bovenstaande middels de Stirling-vergelijking kon vereenvoudigen, maar dat kwadraat in de noemer van ((N/2)!)^2 zit me in de weg, haha.

Misschien iemand n.a.v het bovenstaande nieuwe gedachten?
Klein addendum: nog beetje zitten knutselen met Stirling-benadering en dan kan ik het bovenstaande vereenvoudigen tot: P ≈ 1/sqrt(2πN). Dat is al stukken overzichtelijker

Reageer