Tabloul lui Galton

Multe cantități statistice rezultă din combinația unui număr mare de parametri fără legătură. De exemplu, dimensiunea unei persoane depinde de mai mulți factori genetici, dar și de dieta sa, de orice probleme de sănătate și de îngrijirea pe care a primit-o., etc. Când reprezentăm distribuția statistică a unei astfel de cantități sub forma unei histograme, vedem adesea că formează un fel de clopot centrat în jurul valorii medii.

scândură
Placa Galton, numită după inventatorul său Sir Francis Galton (1822-1911), este un dispozitiv destinat vizualizării legii abaterilor de la medie într-o serie de un număr mare de experimente aleatorii independente.

Bilele se rostogolesc pe suprafața unei scânduri înclinate pe care sunt cuie eșalonate (de unde și denumirea în engleză „quincunx”). Bilele trec aleator pe o parte sau pe alta a unghiilor, iar cantitatea de bile este măsurată la sosire în funcție de poziția lor la ieșirea din tablă. Această poziție rezultă din adăugarea tuturor abaterilor pe care le-au suferit prin căderea pe aceste unghii: fiecare dintre aceste abateri este o experiență aleatorie independentă de celelalte. Deoarece abaterile spre dreapta sunt la fel de probabile ca cele spre stânga, traiectoria „medie” este verticală.

Distribuția bilelor în coloanele de sosire este guvernată de două rezultate fundamentale ale teoriei probabilității: legea numerelor mari și teorema limitei centrale, care sunt astfel demonstrate concret.

Probabilitatea sosirii mingii și teorema limitei centrale

O minge fiind eliberată în partea de sus a tabloului, distribuția probabilităților în funcție de care va ajunge într-o astfel de coloană este un clasic în teoria probabilităților discrete: este ceea ce se numește legea binomială. Toate traiectoriile posibile fiind la fel de probabile, probabilitatea ca mingea să-și finalizeze cursul într-o coloană dată este proporțională cu numărul de căi care duc de la partea de sus a tabloului la coloana țintă. Acest număr de căi este un coeficient binomial, dat de triunghiul lui Pascal.

În figura de mai jos, am reprezentat grafic pentru fiecare coloană probabilitatea ca o minge care începe din partea de sus a plăcii să-și termine cursul în această coloană (aici sunt 60 de rânduri de cuie). Rețineți că toate coloanele sunt teoretic accesibile, dar dacă ne abatem puțin de la mijloc, probabilitatea devine atât de mică încât nu mai este vizibilă la scara utilizată! Motivul este simplu: există mult mai multe căi care duc la coloanele centrale decât la cele care duc departe de centru. Deci, există o singură cale care duce la fiecare dintre coloanele extreme, în timp ce există miliarde de moduri de a ajunge la coloana centrală.

Vedem pe acest grafic că distribuția probabilității de sosire în coloane pare să deseneze o curbă de clopot foarte regulată. Teorema limitei centrale spune precis că cu cât numărul de rânduri de cuie de pe tablă este mai mare, cu atât distribuția probabilităților de sosire se apropie de această curbă a clopotului, numită curbă Gaussiană. (De fapt, acest caz precis este un caz special de aplicare a teoremei limitei centrale, care poartă numele teoremei lui Moivre-Laplace.) Lățimea clopotului variază în funcție de dimensiunea plăcii: este ordinea rădăcina pătrată a numărului de rânduri. Deci, înmulțirea numărului de rânduri cu 4 dublează doar lățimea clopotului. Distribuția de probabilitate care corespunde acestei curbe limită se numește distribuție normală.

Distribuția observată a bilelor și legea numărului mare

În partea de sus a tabloului, fiecare minge are deci o probabilitate de sosire care urmează forma clopotului prezentată mai sus. Dar, după coborârea sa, atinge, evident, doar una dintre coloane! Pentru a vizualiza în practică distribuția sosirii, trebuie să repetați de multe ori experimentul, adică să aruncați un număr mare de bile. Fiecare urmează o traiectorie independentă de celelalte și aici intervine legea numărului mare: cu cât numărul de bile utilizate este mai mare, cu atât proporția bilelor care sosesc în fiecare coloană se apropie de probabilitatea teoretică.

În figura de mai jos, unde au fost lansate puțin mai mult de 300 de bile, observăm o distribuție empirică urmând aproximativ curba clopotului. Prin utilizarea multor mai multe margele, rezultatul s-ar apropia de distribuția teoretică.