68-95-99 Pravilo - normalna raspodjela objašnjeno na običnom engleskom jeziku

Upoznajte Masona. Prosječan je Amerikanac, 40-godišnjak: visok 5 centimetara i zarađuje 47 000 američkih dolara godišnje prije oporezivanja.

Koliko biste često očekivali upoznati nekoga tko zaradi 10 puta više od Masona?

A sada, koliko biste često očekivali da upoznate nekoga tko je 10x visok kao Mason?

Vaši su odgovori na dva gornja pitanja različiti, jer je distribucija podataka različita. U nekim je slučajevima uobičajeno 10 puta iznad prosjeka. Dok je u drugima, to uopće nije uobičajeno.

Pa što su normalne distribucije?

Danas nas zanimaju normalne distribucije. Prikazani su krivuljom zvona: u sredini imaju vrh koji se sužava prema svakom rubu. Mnogo stvari prati ovu raspodjelu, poput vaše visine, težine i IQ-a.

Ova je distribucija uzbudljiva jer je simetrična - što olakšava rad s njom. Mnogo složene matematike možete svesti na nekoliko osnovnih pravila, jer ne trebate brinuti o čudnim rubnim slučajevima.

Na primjer, vrh uvijek dijeli raspodjelu na pola. Jednaka je masa prije i poslije vrhunca.

Sljedeće je važno svojstvo da nam ne treba puno podataka da bismo opisali normalnu distribuciju.

Zapravo, trebamo samo dvije stvari:

  1. Sredstvo. Većina ljudi to naziva samo "prosjekom". To ćete dobiti ako zbrojite vrijednost svih svojih zapažanja, a zatim podijelite taj broj s brojem opažanja. Na primjer, prosjek ova tri broja:1, 2, 3 = (1 + 2 + 3) / 3 = 2
  2. I standardno odstupanje. Ovo vam govori koliko bi rijetko bilo promatranje. Većina opažanja spada u jedno standardno odstupanje srednje vrijednosti. Manje opažanja su dva standardna odstupanja od srednje vrijednosti. A još su manje tri standardna odstupanja (ili dalje).

Zajedno, srednja vrijednost i standardna devijacija čine sve što trebate znati o raspodjeli.

Pravilo 68-95-99

Pravilo 68-95-99 temelji se na srednjoj i standardnoj devijaciji. Kaže:

68% populacije nalazi se unutar 1 standardne devijacije srednje vrijednosti.

95% populacije nalazi se unutar 2 standardne devijacije srednje vrijednosti.

99,7% stanovništva nalazi se unutar 3 standardne devijacije srednje vrijednosti.

Kako izračunati normalne raspodjele

Da nastavimo s našim primjerom, prosječna američka visina mužjaka je 5 stopa 10 inča, uz standardno odstupanje 4 inča. To znači:

Sada zabavni dio: Primijenimo ono što smo upravo naučili.

Kakva je šansa da vidite nekoga tko ima visinu između 5 inča 10 inča 2 inča? (To jest, između 70 i 74 inča.)

To je 34%! Koristimo oba svojstva: raspodjela je simetrična, što znači da su šanse za (66-70) inča i (70-74) inča 68/2 = 34%.

Pokušajmo s težim. Kakva je šansa da vidite nekoga tko ima visinu između 62 i 66 inča?

To je (95-68) / 2 = 13,5%. Oba vanjska ruba imaju isti%.

A sada vaš posljednji (i najteži test): Kolika je šansa vidjeti nekoga tko je viši od 82 inča?

Ovdje koristimo i konačno svojstvo: sve mora iznositi 100%. Dakle, vanjski rubovi (odnosno visine ispod 58 i visine iznad 82) zajedno čine (100% - 99,7%) = 0,3%.

Zapamtite, ovo možete primijeniti na bilo kojoj uobičajenoj distribuciji. Pokušajte učiniti isto za ženske visine: srednja vrijednost je 65 inča, a standardno odstupanje je 3,5 inča.

Dakle, šansa da vidite nekoga tko ima visinu između 65 i 68,5 inča bila bi: ___.

...

...

34%! Potpuno je isti kao i naš prvi primjer. To je +1 standardno odstupanje.

Zaključak

Poznavanje ovog pravila olakšava kalibraciju osjetila. Budući da je za opis normalne raspodjele potrebna srednja vrijednost i standardna devijacija, ovo pravilo vrijedi za svaku normalnu raspodjelu na svijetu!

Doista je izazovno otkriti je li distribucija normalna ili nije.

Želite li naučiti više o kalibraciji svojih osjetila i kritičkom razmišljanju? Pogledajte Bayesovu teoremu: Okvir za kritičko razmišljanje.