Naučite sebe znanosti o podacima: put učenja koji sam koristio da bih dobio posao analitike na Jet.com

Kako od nula vještina programiranja prijeći na posao u tehnologiji ili analitici?

Ako ste zainteresirani za učenje ovih vještina, bilo iz zabave ili zbog promjene karijere, koji je najbolji način za to?

Postoji bezbroj popisa najboljih internetskih tečajeva, ali kako možete stvoriti vlastiti put učenja uz svu buku?

Osobno nikad nisam mislio da ću naučiti bilo kakve praktične vještine oko programiranja, analize podataka, strojnog učenja ili tehnologije uopće. Kao financijski stručnjak, uvijek sam pretpostavljao da ću biti „poslovni čovjek“. Ipak, nekako sam naučio Python i SQL i zatekao se kako radim u analitici na Jet.com, svakodnevno koristeći jedan od ovih jezika.

Zašto bi pitali Python i SQL?

Python je programski jezik koji se najbrže razvija, i to s dobrim razlogom. Ima sulud broj knjižnica koje možete koristiti za aplikacije strojnog učenja, analizu podataka, vizualizaciju, web aplikacije, integracije API-ja i još mnogo toga. Osim toga, to je jedan od jezika koji je lakše pokupiti i naučiti. Što se tiče SQL-a, baze podataka napajaju tehnološke tvrtke, a SQL vam omogućuje da bolje razumijete, istražite i iskoristite mnoštvo prikupljenih podataka.

U nastavku opisujem put kojim sam krenuo u učenju ovih jezika koji me uveo u analitiku. Da budemo jasni, ovaj je put bio nevjerojatno izazovan; Provela sam bezbroj večeri osjećajući se frustrirano i zbunjeno. Mnogo sam noći želio samo baciti ručnik i nagoditi se da sam poslovni čovjek.

Ali vaša motivacija ostaje ključna za probijanje naprijed kroz prepreke s kojima ćete se neizbježno suočiti. Bez obzira želite li prijeći na ulogu analize podataka ili uloge tipa znanosti ili želite samo bolje razumjeti programiranje i tehnologiju radi zabave (što postaje zabavno!), Morate smisliti kako ostati motiviran i disciplinirano ako želite stvarno naučiti ove vještine.

Za mene je izdvajanje određenog vremena gotovo svakog dana (oko 90 minuta do 2 sata) za učenje ili vježbanje odmah nakon povratka kući s posla omogućilo mi da razvijem dosljedne navike i razbijem koncepte kuće koje sam smatrao zbunjujućim.

Evo puta kojim sam krenuo; nadam se da vam može pomoći da sami započnete.

Temeljna zaklada

  1. Naučite Python na teži način

Ovo je jedan od najboljih tečajeva koje sam ikad pohađao, točka. Samo je usmjeren i izazovan, ali Zed vam pruža dovoljno detalja i smjernica da započnete s zapravo započinjanjem programiranja na Pythonu. On čini programiranje pristupačnim, a materijal vam daje samopouzdanje iz tjedna u tjedan da se zapravo osjećate kao da možete učinkovito naučiti Python.

2. Analitika načina: Pande

Mode Analytics pruža sjajan uvod u Python i uključuje vodiče o jednoj od njegovih najsnažnijih struktura podataka: Pandas DataFrame. Ovo je savršeno za učenje osnova analize podataka nakon što spustite osnove Pythona.

3. Analitika načina: SQL

I drugi tutorial Mode Analyticsa o SQL-u je fantastičan. Ovdje možete naučiti sve ključne pojmove i stvoriti jake SQL temelje. Oni čak imaju svoj vlastiti SQL editor i podatke s kojima se možete poigrati.

Zajedno s Mode Analytics, W3 škole mogu vam pomoći odgovoriti na bilo koje SQL pitanje koje se ikad pojavljuje dok se krećete kroz tutorijale.

Ronjenje pravo u strojno učenje

Prije nego što sam u potpunosti shvatio Python, uslikao sam i prijavio se za Udacity-jev samovozeći automobil na nano-stupnju. Znao sam da mi je to potpuno preko glave, ali pomislio sam, zašto ne bih pokušao?

Lakše se motivirati za učenje Pythona i strojnog učenja kad vas fasciniraju praktične primjene.

Imao sam otprilike mjesec dana prije početka nastave, pa sam pohađao što više predavanja iz znanosti o podacima i strojnog učenja.

Evo najboljih besplatnih uvodnih tečajeva koji su mi bili od velike pomoći:

  • Udacity Uvod o strojnom učenju
  • Udacity Uvod u statistiku
  • Udacity Uvod u znanost o podacima

Da, vidite, prilično visoko mislim o Udacityu.

Iako nije besplatan, toplo bih preporučio da pogledate knjigu Grokking Deep Learning. Pruža izuzetno jasne i povezane primjere o osnovama strojnog učenja.

TensorFlow, koji je razvio Google, je biblioteka otvorenog koda za strojno učenje koja se može pisati na Pythonu. Nevjerojatno je moćan i apsolutno ga vrijedi upoznati.

Pogledajte vježbu MNIST za fantastičan uvod u okvir.

Otkrio sam da je i klasa Stanford CS231 koristan resurs; opsežno pokriva konvolucijske neuronske mreže (ono što koristimo za softver za prepoznavanje slika ili lica), što bi, kako sam pročitao, bilo nevjerojatno korisno za samostalni automobil Nanodegree. Ako vas uopće zanima strojno učenje sa slikama ili video zapisima, nećete pronaći puno bolje od ovog tečaja.

Napokon, nakon što sam iskoristio ove resurse za izgradnju čvrstih temelja, započeo sam Udacity Self Driving Car Nanodegree.

Neću previše pričati o tome jer ovdje i ovdje već postoje sjajni propisi tečaja. Ono što ću reći jest da sam, na vlastiti šok, usprkos tome što sam bio najizazovniji tečaj koji sam ikad išao, uspio razumjeti većinu sadržaja. Naoružani pravim osnovnim znanjem, iznenadit ćete se koliko duboko možete razumjeti složenu temu.

Nastavak učenja Analitike i znanosti o podacima

Nakon što sam nekoliko mjeseci intenzivno zaronio u strojno učenje, bilo je korisno napraviti korak unatrag i ojačati svoje razumijevanje praktične analitike i principa znanosti podataka.

Počeo sam s Data Scienceom, dubokim učenjem i strojnim učenjem s Pythonom , fantastičnim tečajem o Udemyju . Iako se dotiče strojnog učenja, u potpunosti pokriva principe u analitici, znanosti o podacima i statistici, posebno oko različitih tehnika rudarenja podataka i praktičnih scenarija za njihovo postavljanje.

Knjiga Data Science For Business , također nevjerojatno dobro objašnjava KAKO I ZAŠTO određeni modeli rade kada rješavaju probleme u određenom kontekstu; u vas ubija analitički okvir i način razmišljanja koji se mogu primijeniti na bilo koju situaciju koja se vrti oko problema s podacima. To je najbolji resurs koji sam pronašao koji povezuje različite analitičke pristupe određenim poslovnim situacijama i problemima.

Naravno, ako ste zainteresirani za karijeru u analitici ili znanosti o podacima, uvijek biste trebali brusiti stare vještine ili dodavati nove vještine u svoj alat. FreeCodeCamp i Hackernoonobjaviti informativne članke i vodiče o svim stvarima znanosti i softverskog inženjerstva. Moj najdraži članak nedavno je bio dobro napisan tutorial o pisanju vlastitog blockchaina.

Želite li znati najbolji način za nastavak učenja?

Izgradi nešto. Bilo što. Istražite skup podataka. Pronađite praktični problem s kojim se suočavate vi ili vaša tvrtka i pokušajte ga riješiti.

Čak i ako u svojoj tvrtki nemate pristup visokokvalitetnim podacima, postoji mnoštvo otvorenih izvora podataka s kojima se možete poigrati i vježbati. Kladim se da ćete naučiti jednako puno, ako ne i više, radeći na vlastitim projektima s podacima nego pohađati bilo koji tečaj ili čitati bilo koju knjigu.

Napokon, sastanak i učenje od ljudi koji imaju vještine koje želite steći izuzetno je korisno. Toplo preporučujem korištenje Meetupa za pronalaženje grupa stručnjaka za analitiku ili softver u vašem području. Mnoge od ovih grupa imaju besplatne poduke ili predavanja, a upoznat ćete mnoštvo ludo pametnih ljudi koji mogu pružiti savjete i trikove za ubrzanje vašeg učenja.

U New Yorku su neke od grupa koje su mi izuzetno pomogle:

  • Društvo za strojno učenje
  • Google Developer Group
  • NYAI
  • New York Data Science

Zabavite se učeći i javite mi kako ide vaše putovanje!

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

AŽURIRANJE : Udacity je upravo objavio novi program Data Scientist Nanodegree. Pregledao sam materijale i izgleda kao nevjerojatno koristan resurs! Projekti uključuju izgradnju mehanizma za preporuke s IBM podacima i klasificiranje kupaca u segmente. Još ga nisam uzeo, ali pogledajte ovdje: Program Data Scientist Nanodegree.