Pregled svakog tečaja Vizualizacije podataka na Internetu

Prije godinu dana odustao sam od jednog od najboljih programa informatike u Kanadi. Počeo sam stvarati vlastiti master program za znanost o podacima koristeći mrežne resurse. Shvatio sam da umjesto toga mogu naučiti sve što mi treba putem edX-a, Coursere i Udacity-a. A mogao bih to naučiti brže, učinkovitije i za djelić cijene.

Sad sam skoro gotov. Pohađao sam mnogo tečajeva vezanih uz znanost podataka i revidirao dijelove mnogih drugih. Znam mogućnosti koje postoje i koje su vještine potrebne učenicima koji se pripremaju za ulogu analitičara ili znanstvenika podataka. Prije nekoliko mjeseci započeo sam s izradom vodiča vođenog pregledom koji preporučuje najbolje tečajeve za svaki predmet u znanosti o podacima.

Za prvi vodič u seriji, početniku znanstveniku podataka preporučio sam nekoliko klasa kodiranja. Tada su to bile statistike i klase vjerojatnosti. Tada je to bio uvod u samu znanost o podacima.

Sada na vizualizaciju podataka.

Za ovaj vodič proveo sam više od 10 sati pokušavajući identificirati svaki internetski tečaj za vizualizaciju podataka koji se nudi od ožujka 2017., izvlačeći ključne dijelove informacija iz njihovih programa i recenzija i sastavljajući njihove ocjene. Za ovaj zadatak obratio sam se nikome osim zajednici Class Central s otvorenim kodom i njenoj bazi podataka s tisućama ocjena i recenzija tečaja.

Od 2011. godine osnivač Class Central Dhawal Shah pažljivije prati mrežne tečajeve nego vjerojatno bilo tko drugi na svijetu. Dhawal mi je osobno pomogao sastaviti ovaj popis resursa.

Kako smo odabrali tečajeve za razmatranje

Svaki tečaj mora odgovarati tri kriterija:

  1. Većina tečaja mora biti usredotočena na vizualizaciju objašnjavajućih podataka. Pokrivanje pripremom podataka, na primjer, dopušteno je s obzirom da je to važan dio postupka vizualizacije podataka. Tečajevi koji pokrivaju manje relevantne teme (statističko modeliranje, na primjer) su isključeni. Više o objašnjenju u nastavku.
  2. Mora biti na zahtjev ili se nudi svakih nekoliko mjeseci.
  3. To mora biti interaktivni internetski tečaj, tako da nema knjiga ili vodiča samo za čitanje . Iako su to održivi načini učenja, ovaj se vodič fokusira na tečajeve.

Vjerujemo da smo pokrili sve značajne tečajeve koji odgovaraju gore navedenim kriterijima. Budući da na Udemyju postoje naizgled stotine tečajeva, odlučili smo razmotriti samo one najpregledanije i najbolje ocijenjene. Uvijek postoji šansa da smo nešto propustili, pa vas molimo da nas obavijestite u odjeljku za komentare ako smo izostavili dobar tečaj.

Kako smo ocjenjivali tečajeve

Za izračunavanje ponderirane prosječne ocjene za svaki tečaj sastavili smo prosječnu ocjenu i broj recenzija s Class Central i drugih web mjesta s recenzijama. Čitali smo tekstualne preglede i koristili ove povratne informacije kako bismo nadopunili brojčane ocjene.

Nazvali smo subjektivne nastavne planove i programe na temelju dva čimbenika, s tim da je prvom dana prednost nad drugim:

  1. Obuhvat teorijom vizualizacije podataka. Jesu li objašnjeni motivi za odabir vizualizacije? Poučava li tečaj samo alat? O tome više u sljedećem odjeljku.
  2. Pokrivenost odabranih alata za vizualizaciju podataka. Poučava li tečaj učinkovito nastavne alate za vizualizaciju (Tableau, ggplot2, Seaborn, itd.)? Imaju li studenti priliku vježbati ove vještine? Ne daje se prednost izboru alata.

Zašto dati prioritet teoriji vizualizacije

Ovladavanje određenim alatom rasipno je bez poznavanja osnova učinkovite vizualizacije. Osim toga, alati su često zamjenjivi, ovisno o postavci.

Još je važnije da je dobra vizualizacija podataka složenija nego što većina ljudi misli. Potrebno je pažljivo razmišljanje od faza planiranja do izvršenja. Odabir pravog grafikona, uravnoteženje složenosti i nereda, iskorištavanje preattentivnih svojstava i još mnogo toga, vizualizacija podataka je i umjetnost i znanost. Lako je pogriješiti, a ponekad i užasno (vidi dolje).

Vizualizacija istraživanja i objašnjenja

Kao što je opisao profesor sveučilišta Indiana Yong-Yeol Ahn, cilj vizualizacije objašnjavajućih podataka je prenošenje uvida i poruka, dok je cilj istraživačke vizualizacije otkrivanje skrivenih obrazaca.

Ovaj se članak usredotočuje na tečajeve vizualizacije podataka s objašnjenjima . Tečajevi poput Udacity-ove Analize podataka s R (isključivo istraživački tečaj) stoga su isključeni iz ovog članka. Tema je važna; jednostavno nema dovoljno tečajeva koji bi opravdali samostalni članak. Ukratko će biti obrađen u sažetkom članka za ovu seriju.

Ponekad je potrebno iskustvo s kodiranjem

Neki tečajevi navedeni u nastavku zahtijevaju osnovne vještine kodiranja na jeziku nastave. Ako imate vrlo malo programskog iskustva, naše bi preporuke u prvom članku ove serije - najbolji uvod u tečajeve programiranja za znanost o podacima - bile bi sjajan početak. Obuhvaćeni su i tečajevi za Python i R.

Nedostaju podaci o pregledu

U usporedbi s ostalim člancima iz ove serije, nedostaje podataka o pregledima za tečajeve vizualizacije podataka koji odgovaraju gore navedenim kriterijima. Također još ne postoji jasan tečaj najbolje vizualizacije podataka. Preporuke u nastavku stoga nisu toliko konačne kao prošli članci. Kao i uvijek, ali posebno ovdje, pokušajte odabrati tečaj koji najbolje odgovara vašim potrebama.

Naš izbor za najbolji tečaj vizualizacije podataka je ...

  • Vizualizacija podataka specijalizacijom Tableau Sveučilišta Kalifornija, Davis na Courseri

... koji sadrži sljedećih pet tečajeva:

  • Osnove vizualizacije s Tableauom
  • Osnovni principi dizajna za Tableau
  • Vizualna analitika s Tableauom
  • Izrada nadzornih ploča i pripovijedanje priča s Tableauom
  • Vizualizacija podataka u projektu Tableau

Vizualizacija podataka sa Kalifornijskog sveučilišta u Davisu sa specijalizacijom Tableau ima najbolju kombinaciju teorije i pokrivenosti alata dostupnu na temelju kriterija za ocjenu ovog članka. Zaranja duboko u teoriju kao malo koji drugi tečaj. Postoje mogućnosti vježbanja Tableaua kroz prolazne korake i konačni projekt, iako svladavanje Tableaua nije glavni fokus. Prilično je nova specijalizacija (kraj 2016.), a tečajevi imaju samo jednu ocjenu s 4 zvjezdice na web mjestima koja se koriste za ovu analizu.

Govind Acharya, Hunter Whitney i Suk Brar su instruktori. Acharya je glavni analitičar u UC Davis. Whitney i Brar uvaženi su profesionalci u industriji. Između njih imaju desetljeća iskustva s vizualizacijom podataka koja se jasno prenose kroz sadržaj tečaja. Videozapisi su dobro producirani.

Procijenjeni vremenski okvir za specijalizaciju na Courseri je 22 tjedna sa tjednim obvezama u rasponu od tri do osam sati tjedno. Te su procjene zasigurno previsoke, kako je primijetilo nekoliko recenzenata i moje iskustvo s Courserom. Trenutno su dostupne besplatne (revizija svakog tečaja pojedinačno) i plaćene (plaćanje specijalizacije) opcije.

Nekoliko istaknutih recenzenata na Courseri primijetilo je sljedeće:

Oni vam ne samo da govore kako izraditi dizajn vizualizacije, već i zašto (fiziologija, principi). Toplo bih preporučio ovu nastavu. Veliki tečaj - štiti od suptilnih zamki u pripremi vizualizacije. Iako je vrlo osnovni uvod u upotrebu Tableau-a, tečaj pruža široku i zanimljivu pozadinu koja bi se trebala pokazati korisnom svima koji žele poboljšati svoje razumijevanje osnove vizualizacije.

Teorija vizualizacije i R, naučeni radeći

  • Vizualizacija podataka s ggplot2 od strane DataCamp

... za koja postoje tri dijela:

  • Vizualizacija podataka s ggplot2 (1. dio)
  • Vizualizacija podataka s ggplot2 (2. dio)
  • Vizualizacija podataka s ggplot2 (3. dio)

Još jedna izvrsna opcija je DataCamp-ova Vizualizacija podataka s ggplot2 serijom, posebno ako želite naučiti R i, točnije, ggplot2. Pokrivena je znatna količina teorije, što je prikladno s obzirom da je ggplot2 nadahnut Gramatikom grafike. Obuhvaćanje alata i praksa također su impresivni - dobro ćete znati R i njegovu neobičnu sintaksu napuštajući ove tečajeve. Na stranicama s recenzijama koje se koriste za ovu analizu nema recenzija za ove tečajeve.

Instruktor za sva tri tečaja je Rick Scavetta, koji je biolog, trener radionica, slobodni znanstvenik podataka i suosnivač Science Craft-a. Hibridni stil podučavanja DataCampa koristi video (glumi Scavetta) i tekstualne upute s puno primjera kroz uređivač koda u pregledniku. Sadržaj videozapisa, teksta i koda lijepo je poliran.

Zajedno, predviđeni vremenski raspored za sva tri tečaja je 16 sati. Prvo poglavlje svakog tečaja dostupno je besplatno. Za potpuni pristup potrebna je pretplata na DataCamp, koja trenutno iznosi 29 USD mjesečno ili 300 USD godišnje.

Slijedi podrška Hadleyja Wickhama, glavnog znanstvenika na RStudio i tvorca ggplot2:

Temeljito preporučujem "Vizualizacija podataka s ggplot2" Ricka Scavette. Pruža vam izvrstan uvod u ggplot2. Naučit ćete i temeljnu teoriju i upoznati se s praksom u mrežnom okruženju za učenje DataCampa.

Praktični uvod u Tableau s izvrsnim instruktorom

Serija Tableau 10, Kirill Eremenko i SuperDataScience tim na Udemyju, koji uključuje:

  • Tablica 10 AZ: Praktično osposobljavanje za znanost o podacima!
  • Tablica 10 Napredni trening: Master tabela iz znanosti o podacima

Podučavao Kirill Eremenko, SuperDataScienceova serija Tableau 10 učinkovit je praktični uvod. Fokusira se uglavnom na pokrivenost alata (Tableau), a ne na teoriju vizualizacije podataka. Eremenko je jedan od najcjenjenijih instruktora u ovim vodičima s neprestano pozitivnim kritikama na svim svojim tečajevima. AZ tečaj je preduvjet za tečaj naprednog obrazovanja. Zajedno, tečajevi u seriji imaju ponderiranu prosječnu ocjenu s 4,6 zvjezdice preko 3724 recenzije.

Serija ima sedamnaest sati video sadržaja. Cijena svakog tečaja varira ovisno o popustima Udemyja, ali oni su česti i mogu se kupiti već za 10 USD.

Nekoliko istaknutih recenzenata primijetilo je sljedeće:

Ovo je bilo sjajno. Koristim miljea dnevno, ali to je bio strašan podsjećanje na neke od stavki ja ne koriste i velika studija potpore za polaganje Tableau Certified Professional ispit. Dobar posao Kirill i tim!

Kirill je izvanredan učitelj i studenti koji pohađaju ovaj tečaj jasno će vidjeti zašto ima desetke tečajeva i tisuće učenika - sposoban je podučavati složene vještine u stvarnom poslovnom kontekstu i to postupno, kombinirajući često složeni zadatak podučavanja oba osnove i aplikacije specifične za kontekst istovremeno.

Natjecanje

Pogledajmo ostale mogućnosti poredane po opadajućoj ocjeni.

Interaktivna vizualizacija podataka s Python & Bokeh (Ardit Sulce / Udemy): Fokus alata (Python i Bokeh). Sadrži odjeljak o stvaranju web aplikacija. Sedam sati videozapisa. Cijena varira ovisno o udemy popustima, koji su česti. Ima ponderiranu prosječnu ocjenu s 4,6 zvjezdice tijekom 103 recenzije.

Vizualizacija informacija (IVMOOC) (Sveučilište Indiana / Neovisno): Vrlo detaljno pokriva teoriju i više alata. Impresivan projekt iz stvarnog života. Registracija nije uspjela pri pokušaju, unatoč e-porukama administratorima tečaja. Punih dvanaest tjedana diplomskog studija. Besplatno. Ima ponderiranu prosječnu ocjenu s 4,5 zvjezdice tijekom 2 recenzije.

Tablica za početnike - certificirano ubrzajte svoju karijeru (Lukas Halim / Udemy): fokus na alatu (tablica). Četiri sata videozapisa. Cijena varira ovisno o udemy popustima, koji su česti. Prosječnu ocjenu s 4,5 zvjezdice ima preko 649 recenzija.

Analiza i vizualizacija podataka s Power BI-om (Microsoft / edX): fokus alata (Power BI). Prilagođeno poslovnim korisnicima koji ulažu u Microsoftov ekosustav. Dio certifikata Microsoftova profesionalnog programa za znanost o podacima. Procijenjeni vremenski raspored od dva do četiri sata tjedno tijekom šest tjedana. Besplatno s verificiranim certifikatom dostupnim za kupnju. Prosječnu ponderiranu ocjenu s 4,5 zvjezdica ima 117 kritika.

Analiza i vizualizacija podataka u programu Excel (Microsoft / edX): fokus alata (Excel). Prilagođeno poslovnim korisnicima koji ulažu u Microsoftov ekosustav. Dio certifikata Microsoftova profesionalnog programa za znanost o podacima. Procijenjeni vremenski raspored od dva do četiri sata tjedno tijekom šest tjedana. Besplatno s verificiranim certifikatom dostupnim za kupnju. Prosječnu ponderiranu ocjenu s 4,5 zvjezdice ima 972 recenzije.

Podaci vizualiziraju podatke pomoću D3.js jednostavnog načina (beskonačne vještine / Udemy): fokus alata (D3.js). Četiri sata videozapisa. Cijena varira ovisno o udemy popustima, koji su česti. Prosječnu ponderiranu ocjenu s 4,4 zvjezdice ima 262 recenzije.

Vizualizacija podataka s Pythonom i Matplotlibom (e-Learning Stone River / Udemy): fokus alata (Python i Matplotlib). Šest sati videozapisa. Cijena varira ovisno o udemy popustima, koji su česti. Prosječnu ocjenu s 4,4 zvjezdice ima 92 recenzije.

Analiza podataka: Vizualizacija i dizajn nadzorne ploče (Tehničko sveučilište Delft / edX): Alat (Excel) i poslovni fokus. Procijenjeni vremenski raspored od četiri do šest sati tjedno tijekom šest tjedana. Besplatno s verificiranim certifikatom dostupnim za kupnju. Ima ponderiranu prosječnu ocjenu s 4,2 zvjezdice tijekom 5 recenzija.

Veliki podaci: Vizualizacija podataka (Queensland University of Technology / FutureLearn): Uravnotežena teorija / fokus alata. Izloženost raznim alatima. Počinje u kolovozu 2017. Procijenjeni vremenski raspored od dva sata tjedno tijekom tri tjedna. Besplatno uz nadogradnju dostupnu za kupnju. Ima ocjenu od 4 zvjezdice preko 1 recenzije.

Vizualizacija podataka i komunikacija s Tableauom (Sveučilište Duke / Coursera): Alat (Tableau) i poslovni fokus. Dio programa Excel to MySQL: Analitičke tehnike za poslovnu specijalizaciju. Procijenjeni vremenski raspored od šest do osam sati tjedno tijekom pet tjedana. Dostupne besplatne i plaćene opcije. To je 3.67 -star ponderirani prosjek ocjena iznad 9 mišljenja.

Vizualizacija podataka (Sveučilište Illinois na Urbana-Champaign / Coursera): Teorijski fokus. Dio specijalizacije za rudarenje podataka. Procijenjeni vremenski raspored od četiri do šest sati tjedno tijekom četiri tjedna. Dostupne besplatne i plaćene opcije. Ima ponderiranu prosječnu ocjenu s 3,14 zvjezdice u 22 recenzije.

Vizualizacija podataka i D3.js (Udacity): Uravnotežena teorija / fokus alata. Uputa D3.js osjeća se "nepotpunom" i "neumjesnom". Procijenjeni vremenski okvir od sedam tjedana. Besplatno. Ima ponderiranu prosječnu ocjenu s 2,83 zvjezdice tijekom 6 recenzija.

Upravljanje podacima i vizualizacija (Sveučilište Wesleyan / Coursera): Uravnotežena teorija / fokus alata. Pokriva više alata (Python i SAS). Dio Wesleyanove specijalizacije za analizu podataka i tumačenje. Procijenjeni vremenski raspored od četiri do pet sati tjedno tijekom četiri tjedna. Dostupne besplatne i plaćene opcije. Ima ponderiranu prosječnu ocjenu s 2,67 zvjezdice tijekom 6 recenzija.

Primijenjeno crtanje, crtanje i predstavljanje podataka u Pythonu (Sveučilište u Michiganu / Coursera): uravnotežena teorija i fokus alata. Dostupne besplatne i plaćene opcije. Ima ponderiranu prosječnu ocjenu s 2 zvjezdice tijekom 4 recenzije.

Sljedeći tečajevi nisu imali recenzija od ožujka 2017.

Vizualizacija podataka u Tableauu (Udacity): Teorijski fokus s izvrsnim pokrivanjem. Kratko pokrivanje alata (Tablica). Prvenstveno tekstualne upute s kvizovima s višestrukim izborom. Dio Udacity-ovog nano-stupnja analitičara podataka i prediktivne analitike za poslovnu nano-stupanj Ovaj tečaj vjerojatno će biti smješten na prva tri mjesta kada se ažurira videozapisima kako bi nadopunio tekst. Predviđeni vremenski raspored od tri tjedna. Besplatno.

Izgradnja alata za vizualizaciju podataka (Sveučilište Johns Hopkins / Coursera): fokus alata (R i ggplot2). Dio JHU-ovog ovladavanja razvojem softvera u R specijalizaciji. Procijenjeni vremenski raspored od dva sata tjedno tijekom četiri tjedna. Dostupne besplatne i plaćene opcije.

Vizualizacija podataka za sve (Trinity College / edX): Težište. Procijenjeni vremenski raspored od tri sata tjedno tijekom šest tjedana. Besplatno s verificiranim certifikatom dostupno za kupnju.

Vizualizacija podataka s naprednim Excelom (PwC / Coursera): fokus alata (Excel). Dio vještina PwC-ove analize podataka i prezentacije: Specijalizacija PwC pristupa. Procijenjeni vremenski raspored od tri do četiri sata tjedno tijekom četiri tjedna. Dostupne besplatne i plaćene opcije.

Komuniciranje rezultata poslovne analitike (Sveučilište Colorado Boulder / Coursera): Teorija i poslovni fokus. Dio analize podataka Colorado Boulder za poslovnu specijalizaciju Bootcamp. Procijenjeni vremenski okvir od četiri tjedna. Dostupne besplatne i plaćene opcije.

Pripovijedanje kroz vizualizaciju podataka (Dataquest): Uglavnom fokus alata (Python, Matplotlib i Seaborn). Neprocijenjeni vremenski slijed. Uglavnom besplatni, ali za potpuni pristup potrebna je pretplata.

Put učenja vizualizacije podataka (O'Reilly): Uravnoteženi fokus alata / teorije. Omoti D3.js. Više instruktora. Petnaest sati sadržaja. Besplatno uz desetodnevno besplatno probno razdoblje.

Vizualizacija podataka za programere (Dan Appleman / Pluralsight): Težište. Prilagođeno programerima. Dva sata sadržaja. Besplatno uz desetodnevno besplatno probno razdoblje.

Sljedeća četiri tečaja kreirao je Bill Shander iz Beehive Media i ponudio ih na Lyndi. Popisani su kronološkim redoslijedom prema datumu objavljivanja.

Osnove vizualizacije podataka (Bill Shander / Lynda): Teorijski fokus. Četiri sata sadržaja. Besplatno uz desetodnevno besplatno probno razdoblje.

Dizajniranje vizualizacije podataka (Bill Shander / Lynda): Teorijski fokus. Obuhvaća stvaranje specifičnog projekta od koncepta do analize podataka do dizajniranja i izvođenja. Četiri sata sadržaja. Besplatno uz desetodnevno besplatno probno razdoblje.

Vizualizacija podataka za analitičare podataka (Bill Shander / Lynda): Težište. Prilagođeno analitičarima podataka. Dva sata sadržaja. Besplatno uz desetodnevno besplatno probno razdoblje.

Osnove pripovijedanja o vizualizaciji podataka (Bill Shander / Lynda): Težište. Dva sata sadržaja. Besplatno uz desetodnevno besplatno probno razdoblje.

Vizualizacija u R, od početnika do naprednika (Nathan Yau / FlowingData): četverodjedni tečaj. Potrebna pretplata.

Sljedeća četiri tečaja nudi DataCamp. Kao što je gore spomenuto, hibridni stil podučavanja DataCampa koristi video i tekstualne upute s puno primjera kroz uređivač koda u pregledniku.

Vizualizacija podataka u R (DataCamp): Uravnoteženi fokus teorije / alata. Obuhvaća osnovnu R grafiku. Predviđeni vremenski raspored od četiri sata. Za potpuni pristup potrebna je pretplata.

Uvod u vizualizaciju podataka s Pythonom (DataCamp): fokus alata (Python, Matplotlib i Seaborn). Predviđeni vremenski raspored od četiri sata. Za potpuni pristup potrebna je pretplata.

Interaktivna vizualizacija podataka s bokehom (DataCamp): fokus alata (Python i Bokeh). Predviđeni vremenski raspored od četiri sata. Za potpuni pristup potrebna je pretplata.

Vizualizacija podataka u R s ggvis (DataCamp): Uravnoteženi fokus teorije / alata. Obuhvaća R i ggvis. Predviđeni vremenski raspored od četiri sata. Za potpuni pristup potrebna je pretplata.

Umotavanje

Ovo je četvrti iz šest dijelova koji pokriva najbolje mrežne tečajeve za pokretanje u području znanosti o podacima. Programiranje smo obradili u prvom članku, statistiku i vjerojatnost u drugom članku, a uvod u znanost o podacima u trećem članku. Ostatak serije pokrivat će ostale temeljne kompetencije znanosti znanosti. Sljedeće je strojno učenje.

Ako želite naučiti Data Science, započnite s jednom od ovih satova programiranja

medium.freecodecamp.com Ako želite naučiti Data Science, ponesite nekoliko ovih satova statistike

medium.freecodecamp.com Rangirao sam svaki tečaj Uvoda u znanost o podacima na internetu, na temelju tisuća podataka

medium.freecodecamp.com

Završni dio bit će sažetak tih članaka, plus najbolji mrežni tečajevi za druge ključne teme kao što su premetanje podataka, baze podataka, pa čak i softverski inženjering.

Ako tražite cjelovit popis mrežnih tečajeva znanosti znanosti, možete ih pronaći na stranici predmeta Data Science i Big Data Class Central.

Ako ste uživali čitati ovo, pogledajte neke druge dijelove Class Central:

Evo 250 tečajeva Ivy League koje trenutno možete besplatno pohađati na mreži

250 MOOC-a iz Browna, Columbije, Cornella, Dartmoutha, Harvarda, Penna, Princetona i Yalea. medium.freecodecamp.com 50 najboljih besplatnih internetskih sveučilišnih tečajeva prema podacima

Kad sam u studenom 2011. pokrenuo Class Central, bilo je oko 18 besplatnih internetskih tečajeva i gotovo svi ... medium.freecodecamp.com

Ako imate prijedloge za tečajeve koje sam propustio, javite mi u odgovorima!

Ako vam je ovo korisno, kliknite? pa će ga ovdje vidjeti više ljudi na Mediumu.

Ovo je sažeta verzija mog izvornog članka objavljenog na Class Central, gdje sam uključio daljnje opise tečaja, nastavne planove i brojne recenzije.