U današnje vrijeme programski jezici kao što su Python i R nesumnjivo su neki od najtraženijih jezika u znanosti o podacima i strojnom učenju.
No, je li moguće također izvoditi uobičajene zadatke strojnog učenja i znanosti podataka, a da pritom nije nužno vješt u kodiranju?
Naravno da je! Weka je paket otvorenog koda koji se temelji na grafičkom korisničkom sučelju. Može se koristiti za izvršavanje uobičajenih zadataka Data Sciencea samo pomoću grafičkog sučelja.
Osnove
Weka se lako može instalirati na bilo koju vrstu platforme slijedeći upute na sljedećoj poveznici. Jedini preduvjet je instaliranje Java 8.0 na vašem lokalnom računalu.
Nakon što instalirate Weka, imat ćete skup standardnih tehnika obrade podataka i zaključivanja, kao što su:
- Predobrada podataka : nakon što učitate skup podataka, Weka vam omogućuje brzo istraživanje njegovih atributa i primjera. Pored toga, dostupne su različite tehnike filtriranja kako bi se, na primjer, pretvorili kategorički podaci u numeričke ili izvršio odabir značajke kako bi se smanjila dimenzionalnost našeg skupa podataka (npr. Kako bi se ubrzalo vrijeme treninga i izvedba).
- Algoritmi klasifikacije i regresije:zbirka različitih algoritama kao što su Gaussian Naive Bayes, Odlučujuća stabla, K-Najbliži susjed, tehnike ansambala i razne varijante linearne regresije.
- Klasteriranje: ova se tehnika može koristiti za identificiranje glavnih kategorija u našim podacima na nenadziran način. Neki primjeri algoritama dostupnih u Weka kolekciji su K-Means klasterizacija i maksimizacija očekivanja.
- Otkrivanje udruga: otkrivanje pravila u našem skupu podataka kako bismo lakše identificirali obrasce i veze između različitih značajki.
- Vizualizacija podataka:paket integriranih tehnika vizualizacije podataka za brzu vizualizaciju korelacija između značajki i predstavlja naučene obrasce strojnog učenja, kao što su stabla odlučivanja i klasteri K-Means.
Još jedna zanimljiva značajka Weke je mogućnost instaliranja novih paketa kako su stvoreni.
Primjer dodatnog paketa koji možete instalirati je AutoML. AutoML zapravo može biti posebno koristan za početnike kojima bi moglo biti teško prepoznati koji model strojnog učenja može biti najbolje koristiti za određeni zadatak.
Korištenjem Weka AutoML paketa možete u letu lako testirati različite modele strojnog učenja. Također vam omogućuje automatsko podešavanje njegovih hiper-parametara kako biste povećali performanse.
Konačno, za stručnije korisnike Weka također nudi sučelje naredbenog retka za upotrebu Java koda. To može biti osobito korisno pogotovo ako radite s velikim količinama podataka.
Primjer
Sada ćemo proći kroz jednostavan primjer kako bismo pokazali kako započeti s Wekom.
Prije svega, svoju analizu možemo započeti otvaranjem Weka Explorera i otvaranjem našeg skupa podataka (u ovom primjeru Iris Dataset).

Odaberite karticu Classify, odaberite Naive Bayes kao naš klasifikator i kliknite start. Vidjet ćete da možemo brzo postići 96% točnosti klasifikacije bez potrebe za pisanjem bilo kojeg koda!

Zaključak
U slučaju da tražite više informacija o tome kako započeti s Wekom, ova YouTube serija Google Developers izvrsno je mjesto za početak.
Kontaktiraj me
Ako želite biti u toku s mojim najnovijim člancima i projektima, slijedite me na Mediumu i pretplatite se na moju mailing listu. Ovo su neki moji detalji o kontaktima:
- Osobni blog
- Osobna web stranica
- Srednji profil
- GitHub
- Kaggle
Naslovna fotografija iz ovog članka.