Siguran sam da ste čuli za nevjerojatne aplikacije za umjetnu inteligenciju - od programa koji mogu pobijediti najbolje svjetske igrače Goa do samovozećih automobila.
Problem je u tome što se većina ljudi hvata za AI hype, miješajući tehničke rasprave s filozofskim.
Ako želite probiti AI hype i raditi s praktički implementiranim modelima podataka, trenirajte prema položaju inženjera podataka ili inženjera strojnog učenja.
Ne tražite zanimljive AI aplikacije u člancima o AI. Potražite ih u vodičima za inženjering podataka ili za strojno učenje.

Ovo su koraci koje sam poduzeo za izgradnju ovog zabavnog malog strugača koji sam izgradio za analizu rodne raznolikosti u različitim kodirajućim kampovima za kodiranje. To je put kojim sam krenuo istraživati novi Springboardov AI / ML mrežni bootcamp s jamstvom posla.
Evo detaljnog vodiča za ulazak u prostor strojnog učenja s kritičnim skupom resursa koji su priloženi svakom.
1. Započnite obrađivati Python i prakse razvoja softvera

Morali biste započeti prihvaćajući Python, jezik koji odabire većina inženjera strojnog učenja.
Praktični skriptni jezik alat je koji odabire većina inženjera podataka i znanstvenika podataka. Većina alata za podatke izgrađena je u Pythonu ili je ugrađen API pristup za lakši Python pristup.
Srećom, Pythonovu sintaksu relativno je lako pokupiti. Jezik ima mnoštvo dokumentacije i resursa za obuku. Također uključuje podršku za sve vrste programskih paradigmi, od funkcionalnog programiranja do objektno orijentiranog programiranja.
Jedinu stvar koju je možda malo teško podići su tabulatori i razmaci potrebni za organiziranje i aktiviranje koda. U Pythonu je razmak stvarno važan.
Kao inženjer strojnog učenja, radili biste u timu za izgradnju složenih, često kritičnih aplikacija. Dakle, sada je pravo vrijeme da se osvježite i o najboljim praksama softverskog inženjerstva.
Naučite koristiti alate za suradnju kao što je Github. Steknite naviku pisanja temeljitih jediničnih testova za svoj kôd pomoću okvira za testiranje kao što je nos. Testirajte svoje API-je pomoću alata kao što je Postman. Upotrijebite CI sustave poput Jenkinsa kako biste osigurali da se vaš kôd ne pokvari. Razvijte dobre vještine pregleda koda kako biste bolje surađivali sa svojim budućim tehničkim kolegama.
Jedno treba pročitati : Koji je najbolji Python IDE za znanost o podacima? Kratko pročitajte kako biste mogli razumjeti na kojem skupu alata želite raditi kako biste implementirali Python na skupove podataka.
I sam koristim Jupyterovu bilježnicu, budući da dolazi predinstalirana s većinom važnih biblioteka znanosti podataka koje ćete koristiti. Dolazi s laganim, čistim interaktivnim sučeljem koje vam omogućuje da u trenu uređujete svoj kôd.
Jupyter Bilježnica također dolazi s proširenjima koja vam omogućavaju da svoje rezultate lako podijelite sa svijetom. S generiranim datotekama je također vrlo jednostavno raditi na Githubu.
Jedno što treba učiniti : Pandas Cookbook omogućuje vam uključivanje živih primjera okvira Pandas, jedne od najmoćnijih knjižnica za manipulaciju podacima. Možete brzo razraditi primjer kako se putem njega igrati sa skupom podataka.
2. Istražite okvire i teoriju strojnog učenja

Jednom kad se poigrate s Pythonom i vježbate s njim, vrijeme je da počnete gledati teoriju strojnog učenja.
Naučit ćete koje algoritme koristiti. Imajući osnovno znanje teorije iza strojnog učenja omogućit će vam da s lakoćom implementirate modele.
Jedna stvar koju treba pročitati : Obilazak deset najboljih algoritama za početnike strojnog učenja pomoći će vam da započnete s osnovama. Naučit ćete da ne postoji „besplatan ručak“. Ne postoji algoritam koji će vam dati optimalni rezultat za svaku postavku, pa ćete morati zaroniti u svaki algoritam.
Jedno što treba učiniti : Poigrajte se interaktivnim besplatnim strojnim učenjem u tečaju Python - razvijte svoje Python vještine i započnite s primjenom algoritama.
3. Počnite raditi sa skupovima podataka i eksperimentirati

Alati i teorija su vam pod paskom. Trebali biste razmisliti o izradi malih mini projekata koji vam mogu pomoći da usavršite svoje vještine.
Jedno za pročitati : Pogledajte 19 besplatnih javnih skupova podataka za svoj prvi projekt znanosti o znanosti i počnite tražiti gdje na internetu možete pronaći različite skupove podataka s kojima se možete poigrati.
Jedno što treba učiniti : Kaggle skupovi podataka omogućit će vam rad s puno javno dostupnih skupova podataka. Ono što je super u ovoj kolekciji je to što možete vidjeti koliko su pojedini skupovi podataka popularni. Također možete vidjeti koji su drugi projekti izgrađeni s istim skupom podataka.
4. Povećajte svoje vještine podataka s Hadoop-om ili Sparkom

Sad kad vježbate na manjim skupovima podataka, poželjet ćete naučiti raditi s Hadoop-om ili Sparkom. Inženjeri podataka rade sa strujanjem podataka u stvarnom vremenu proizvodnje na terabajtnoj, a ponekad i petabajtnoj razini. Vještine se učeći svoj put kroz okvir velikih podataka.
Jedno treba pročitati : Ovaj kratki članak Kako se slažu Hadoop i Spark? pomoći će vam da prođete kroz Hadoop i Spark te kako se međusobno uspoređuju i uspoređuju.
Jedno treba učiniti : Ako odmah želite započeti rad s okvirom za velike podatke, prijenosna računala Spark Jupyter hostirana na Databricks-u nude uvod u okvir na razini tutorijala i pruža vam uvježbavanje primjera koda na produkcijskoj razini.
5. Radite s dubokim okvirom za učenje poput TensorFlowa

Završili ste s istraživanjem algoritama strojnog učenja i radom s različitim postojećim alatima za velike podatke.
Sada je vrijeme da preuzmemo neku vrstu snažnog učenja ojačavanja koje je bilo fokus novih dostignuća. Naučite okvir TensorFlow i bit ćete na samom vrhu rada na strojnom učenju.
Jedno treba pročitati : Pročitajte Što je TensorFlow? i razumjeti što se događa ispod glave kad je riječ o ovom moćnom okviru dubokog učenja.
Jedno što treba učiniti : TensorFlow i duboko učenje bez doktora znanosti interaktivni je tečaj koji je izradio Google koji kombinira teoriju smještenu u dijapozitive s praktičnim laboratorijima s kodom.
6. Počnite raditi s velikim skupovima podataka na razini proizvodnje

Sad kad ste radili s okvirima za duboko učenje, možete početi raditi na velikim skupovima podataka na razini proizvodnje.
Kao inženjer strojnog učenja donosit ćete složene inženjerske odluke o upravljanju velikim količinama podataka i implementaciji svojih sustava.
To bi uključivalo prikupljanje podataka iz API-ja i struganje weba, SQL + NoSQL baza podataka, a kada biste ih koristili, upotrebu okvira cjevovoda kao što su Luigi ili Airflow.
Kada instalirate svoje programe, za skalabilnost i pouzdanost možete koristiti sustave temeljene na spremnicima, poput Dockera, i alate poput Flaska za izradu API-ja za vašu aplikaciju.
Jedna stvar koju treba pročitati : 7 načina za rukovanje velikim datotekama podataka za strojno učenje lijepa je teoretska vježba kako se postupa s velikim skupovima podataka i može poslužiti kao prikladan popis taktika za upotrebu.
Jedno što treba učiniti : Javno dostupni skupovi velikih podataka popis je mjesta na kojima možete dobiti vrlo velike skupove podataka - spremni za vježbanje svojih novootkrivenih vještina inženjeringa podataka.
7. Vježbajte, vježbajte, vježbajte, gradite prema portfelju, a zatim i poslu

Napokon, došli ste do točke u kojoj možete graditi djelotvorne modele strojnog učenja. Sljedeći je korak u napredovanju u karijeri strojnog učenja pronalazak posla u tvrtki koja drži te velike skupove podataka kako biste svoje vještine svakodnevno mogli primijeniti na vrhunski problem strojnog učenja.
Jedna stvar koju treba pročitati : 41 osnovno pitanje o intervjuu za strojno učenje (s odgovorima) pomoći će vam da uvježbate znanje koje vam je potrebno za predavanje razgovora o strojnom učenju.
Jedno što treba učiniti : Izađite i na Meetupu pronađite sastanke koji su posvećeni strojnom učenju ili inženjeringu podataka - to je sjajan način za upoznavanje vršnjaka u prostoru i potencijalnih menadžera zapošljavanja.
Nadamo se da je ovaj vodič pomogao da se širi hype oko AI na nešto praktično i prilagođeno što možete koristiti. Ako smatrate da vam treba malo više, tvrtka s kojom surađujem, Springboard, nudi bootcamp za karijeru posvećen umjetnoj inteligenciji i strojnom učenju uz jamstvo posla i mentorstvo stručnjaka za strojno učenje u omjeru 1: 1.