Kako izračunati prosjek popisa - Detaljno su objašnjene statistika i Pythonova srednja funkcija

Matematika i programiranje idu ruku pod ruku. Ako ste programer, u jednom ćete trenutku morati koristiti matematiku.

Znanost o podacima, strojno učenje, umjetna inteligencija i kriptovalute temelje se na složenim temeljnim matematičkim načelima.

Međutim, korištenje matematičkih funkcija ne mora biti složeno! Python apstrahira sve, tako da nakon što shvatite koncepte, nećete trebati razumjeti sve detalje implementacije.

Matematika ne mora biti zastrašujuća

Puno je matematičkih funkcija s kojima ćete se susresti. Ako radite s podacima ili analitikom, važno je da razumijete neke matematičke principe i funkcije.

Jedna takva funkcija koju morate razumjeti je meanfunkcija.

Neka vas ime ne zastraši - u meanfunkciji u Pythonu ne postoji ništa zločesto (namijenjeno igri riječi) .

Ovaj je post samostalan, ali pretpostavljam da imate neko iskustvo u radu s Pythonom i da znate što je Python popis. Ako nije, provjerite ovaj članak prije nego što nastavite.

Kad završite, vratite se i pridružite mi se i duboko zaronite u meanfunkciju.

Statistika

Dakle, želite saznati više o meanfunkciji. To je odlično! No prije nego što pogledamo ovu funkciju, važno je pogledati disciplinu iz koje potječe: statistiku.

Na gornjoj slici vidimo graf. Graf je slikovni prikaz koji prikazuje odnos jedne varijable u odnosu na drugu.

Grafovi su korisni jer nam omogućuju organiziranje podataka tako da brzo možemo vidjeti trendove i odnose između podataka. Grafikon je samo jedan alat koji možemo koristiti za vizualizaciju i analizu podataka.

Statistika je grana matematike koja nam omogućuje sustavan način klasificiranja, analiziranja i tumačenja podataka. To je važno jer sa statistikom imamo zbirku gotovih alata za obavljanje svake od tih stvari.

Zamislite ako biste trebali iznova izmisliti pilu svaki put kad biste trebali rezati komad drveta. Mnogo ljudi bismo pile nazivali različitim imenima, iako rade isto. Da bismo izbjegli ovaj problem, dali smo pili ime na koje se svi mogu pozvati.

Isto se događa i u statistici - imamo alate dobro poznate alate koji su svima poznati. Jedan od takvih alata je srednja vrijednost.

Način rada, srednji i srednji

Iako je prosjek savršeno sposoban samostalno stajati, obično se podučava kao dio tria, koji uključuje način rada, medijan i prosjek.

Pogledajmo skupinu brojeva kako biste razumjeli što se ovdje događa. Zamislite da imate dolje navedene brojeve:

1, 2, 3, 3, 4, 6, 9

Recimo da smo željeli izraziti koji se broj javlja najviše puta. Bilo bi 3, a ime koje dajemo ovom svojstvu je način. Način je broj koji je najčešći u skupu koji ispitujemo.

Broj u sredini uređenog skupa naziva se medijan. Da biste pronašli medijanu numeričkog skupa, poredajte brojeve od najmanjeg do najvećeg, a zatim pogledajte broj u sredini. Skup brojeva gore već je raspoređen od najmanjeg do najvećeg, pa je i srednji broj 3.

Konačno, srednja vrijednost je još jedan način pozivanja na prosjek skupa. Da biste pronašli srednju vrijednost, jednostavno zbrojite sve brojeve i podijelite ih s ukupnim brojem elemenata u skupu. U slučaju gornjih brojeva, ako ih zbrojimo, dobit ćemo 28. Ukupan broj predmeta u skupu je 7, pa je naša srednja vrijednost 4.

Zašto nam trebaju srednja?

Stoga se u ovom trenutku možda pitate zašto bismo ionako trebali pronaći srednju vrijednost broja.

Stvar je u tome što je čak i sama statistika podijeljena u nekoliko skupina. Baš kao što imate alate koji se koriste za rad s drvetom, a drugi za obradu metala, tako se i neki alati u statistici grupiraju u razrede jer se koriste u slične svrhe.

Jedna takva skupina u statistici naziva se zbirna statistika. Jedna od stvari za koju se koristi statistika je opisivanje podataka, a sažeta statistika je zbirka alata koji se koriste u tu svrhu. Jedna od stavki u toj klasi alata je srednja vrijednost.

Srednja vrijednost je važna jer nam pomaže u analizi onoga što je poznato kao raspodjela. U statistikama je raspodjela metoda kojom se služimo za promatranje varijable o kojoj želimo informacije. Korištenjem distribucije pogledat ćemo vrijednosti ove varijable i koliko se često ona javlja.

Ako prikupljamo podatke, uobičajena vrsta distribucije koju vidimo je normalna distribucija koja ima oblik zvonaste krivulje:

To će reći da će varijabla imati zajedničku vrijednost prema kojoj teži, kao i početnu i krajnju točku.

Ono što znači jest da nam omogućuje da uzmemo ovakvu raspodjelu i pogledamo središnju tendenciju varijable, a to je točka u kojoj se vrijednosti varijable teže grupirati.

Stoga možemo reći da sredina opisuje središnju tendenciju distribucije.

Izračunavanje srednje vrijednosti u Pythonu

Možemo ručno izračunati srednju vrijednost ako imamo mali numerički skup podataka, imamo nekoliko vrijednosti s kojima možemo raditi. Međutim, kada imamo stotine ili tisuće vrijednosti u skupu podataka, postaje nemoguće izračunati ih ručno.

Budući da je Python jezik "uključene baterije", način na koji to možemo učiniti je da koristimo meanfunkciju statističkog modula unutar Pythona.

Upotrijebimo meanfunkciju za izračunavanje srednje vrijednosti numeričkog skupa podataka koji smo imali ranije u postu:

 # 1. import the statistics module import statistics # 2. list containing our numerical data set numerical_data_set = [1, 2, 3, 3, 4, 6, 9] # 3. calculate the mean calc_mean = statistics.mean(numerical_data_set) # 4. print our calculated mean print("Mean is: ", calc_mean) 

Naš se kod sastoji od 4 koraka koji možemo koristiti za izračunavanje srednje vrijednosti:

  1. Uvozimo statistički modul koji sadrži našu srednju funkciju
  2. Izrađujemo Python popis koji sadrži numerički skup podataka za koji bismo željeli izračunati srednju vrijednost
  3. Izračunavamo srednju vrijednost i rezultat pohranjujemo u varijablu, calc_mean
  4. Izračunavamo izračunatu srednju vrijednost kako bismo mogli dobiti vizualne povratne informacije

Kada pokrenemo kod, dobit ćemo sljedeći izlaz:

Program daje istu vrijednost kao i naši ručni izračuni. Kada radimo s velikim skupovima podataka, ova će se funkcija moći prilagoditi kako bi se bavila svim onim što na nju možemo baciti.

Završavati

U ovom smo postu pogledali meanfunkciju u Pythonu. Počeli smo raspravljajući o statistici u cjelini, a zatim smo duboko zarobili u zlo.

Now that you have a solid understanding of statistics and the mean function in Python, you can use it in your own programs.

If you liked this article, then you may also be curious about learning about data structures and algorithms. If you want a simple, clear, step by step guide to learning about data structures and algorithms without having to write a single line of code, then you can check out the book Codeless Data Structures and Algorithms.

Read the book here:

Strukture podataka i algoritmi bez koda - naučite DSA bez pisanja jedne linije koda | Armstrong Subero | Apress Ova vam knjiga donosi novu perspektivu algoritama i struktura podataka, potpuno bez koda. Saznajte više o algoritmima strukture podataka (DSA), a da nikada ne morate otvoriti uređivač koda, upotrijebiti kompajler ili pogledati integrirano razvojno okruženje (IDE) .... Armstrong Subero Izbornik pretraživanja Košarica V Vaša košarica je trenutno prazna. Prijava AccountBookshelf Prijava Apress Access