Strojno učenje: uvod u značenje kvadrata linija pogrešaka i regresije

Uvod

Ovaj će se članak baviti statističkom metodom srednje kvadratne pogreške , a ja ću opisati odnos ove metode s regresijskom linijom .

Primjer se sastoji od točaka na kartezijanskoj osi. Definirat ćemo matematičku funkciju koja će nam dati ravnu crtu koja najbolje prolazi između svih točaka na kartezijanskoj osi.

I na taj ćemo način naučiti vezu između ove dvije metode i kako rezultat njihove povezanosti izgleda zajedno.

Opće objašnjenje

Ovo je definicija iz Wikipedije:

U statistikama, srednja kvadratna pogreška (MSE) procjenitelja (postupka za procjenu neopažene veličine) mjeri prosjek kvadrata pogrešaka - to jest prosječnu kvadratnu razliku između procijenjenih vrijednosti i onoga što se procjenjuje. MSE je funkcija rizika koja odgovara očekivanoj vrijednosti kvadrata gubitka pogreške. Činjenica da je MSE gotovo uvijek strogo pozitivan (a ne nula) je zbog slučajnosti ili zato što procjenitelj ne uzima u obzir informacije koje bi mogle dati točniju procjenu.

Struktura članka

  • Osjetite ideju, vizualizaciju grafikona, jednadžbu srednje veličine kvadrata.
  • Matematički dio koji sadrži algebarske manipulacije i izvod funkcija s dvije varijable za pronalaženje minimuma. Ovaj je odjeljak za one koji žele razumjeti kako kasnije dobivamo matematičke formule. Možete ga preskočiti ako vas to ne zanima.
  • Objašnjenje matematičkih formula koje smo dobili i uloga svake varijable u formuli.
  • Primjeri

Osjetite ideju

Recimo da imamo sedam bodova, a cilj nam je pronaći liniju koja umanjuje kvadratne udaljenosti do ovih različitih točaka.

Pokušajmo to razumjeti.

Uzet ću primjer i povući ću crtu između točaka. Naravno, moj crtež nije najbolji, ali samo je u svrhu demonstracije.

Možda se pitate, što je ovaj grafikon?

  • su ljubičaste točkice su točke na grafikonu. Svaka točka ima x koordinatu i y koordinatu.
  • Plava linija je naša predviđanja linija. Ovo je linija koja prolazi kroz sve točke i na najbolji ih način odgovara. Ova linija sadrži predviđene bodove.
  • Crvena linija između svakog ljubičaste točke i predviđene linije su pogreške. Svaka je pogreška udaljenost od točke do predviđene točke.

Trebali biste se sjetiti ove jednadžbe iz školskih dana, y = Mx + B , gdje je M nagib crte, a B presjek crte y.

Želimo pronaći M (nagib) i B (presjek y) koji minimaliziraju kvadratnu pogrešku!

Definirajmo matematičku jednadžbu koja će nam dati srednju kvadratnu pogrešku za sve naše točke.

Analizirajmo što ova jednadžba zapravo znači.

  • U matematici se lik koji izgleda čudno E naziva zbrajanje (grčki sigma). To je zbroj niza brojeva, od i = 1 do n. Zamislimo ovo poput niza točaka, gdje prolazimo kroz sve točke, od prve (i = 1) do posljednje (i = n).
  • Za svaku točku uzmemo y-koordinatu točke i y'-koordinatu. Y-koordinata je naša ljubičasta točka. Točka y nalazi se na liniji koju smo stvorili. Oduzimamo vrijednost y-koordinate od vrijednosti y-koordinate i izračunavamo kvadrat rezultata.
  • Treći dio je uzeti zbroj svih vrijednosti (y-y ') ² i podijeliti ga s n, što će dati srednju vrijednost.

Cilj nam je minimalizirati ovu srednju vrijednost koja će nam pružiti najbolju crtu koja prolazi kroz sve točke.

Od koncepta do matematičkih jednadžbi

Ovaj je dio namijenjen ljudima koji žele razumjeti kako smo došli do matematičkih jednadžbi . Ako želite, možete prijeći na sljedeći dio.

Kao što znate, jednadžba crte je y = mx + b, gdje je m nagib, a b presjek y.

Uzmimo svaku točku na grafikonu i izvršit ćemo naš izračun (y-y ') ².

Ali što je y 'i kako to izračunati? Nemamo ga kao dio podataka.

Ali znamo da, da bismo izračunali y ', trebamo upotrijebiti našu linijsku jednadžbu, y = mx + b, i staviti x u jednadžbu.

Odavde dobivamo sljedeću jednadžbu:

Prepišimo ovaj izraz kako bismo ga pojednostavili.

Počnimo s otvaranjem svih zagrada u jednadžbi. Razliku između jednadžbi obojao sam kako bih je lakše razumio.

Sada, primijenimo još jednu manipulaciju. Uzet ćemo svaki dio i sastaviti ga. Uzet ćemo sve y, i (-2ymx) i itd., A sve ćemo ih staviti jedno uz drugo.

U ovom trenutku počinjemo biti neuredni, pa uzmimo sredinu svih kvadrata vrijednosti y, xy, x, x².

Definirajmo za svaki novi znak koji će predstavljati sredinu svih kvadratnih vrijednosti.

Pogledajmo primjer, uzmimo sve y vrijednosti i podijelimo ih s n jer je to srednja vrijednost i nazovimo y (HeadLine).

Pomnožimo li obje strane jednadžbe s n, dobit ćemo:

Što će nas dovesti do sljedeće jednadžbe:

Ako pogledamo što smo dobili, možemo vidjeti da imamo 3D površinu. Izgleda poput čaše, koja se naglo podiže prema gore.

Želimo pronaći M i B koji minimaliziraju funkciju. Napravit ćemo djelomičnu izvedenicu s obzirom na M, a djelomičnu izvedenicu s obzirom na B.

Budući da tražimo minimalnu točku, uzet ćemo djelomične izvode i usporediti s 0.

Uzmimo dvije jednadžbe koje smo dobili, izolirajući varijablu b iz obje, a zatim oduzimajući gornju jednadžbu od donje.

Oduzmimo prvu jednadžbu od druge

Riješimo se nazivnika iz jednadžbe.

I eto, ovo je jednadžba za pronalaženje M, uzmimo ovo i zapišite B jednadžbu.

Jednadžbe za nagib i presjek y

Navedimo matematičke jednadžbe koje će nam pomoći da pronađemo traženi nagib i presjek y.

Pa vjerojatno mislite u sebi, koje su, dovraga, te čudne jednadžbe?

Zapravo ih je jednostavno razumjeti, pa razgovarajmo malo o njima.

Sad kad razumijemo svoje jednadžbe, vrijeme je da se sve skupe i pokažemo neke primjere.

Primjeri

Veliko hvala akademiji Khan na primjerima.

Primjer # 1

Uzmimo 3 boda, (1,2), (2,1), (4,3).

Nađimo M i B za jednadžbu y = mx + b.

Nakon što smo izračunali relevantne dijelove za našu jednadžbu M i B, stavimo te vrijednosti u jednadžbe i dobijmo nagib i presjek y.

Uzmimo te rezultate i postavimo ih u linijsku jednadžbu y = mx + b.

Sada povucimo crtu i vidimo kako linija prolazi kroz crte na takav način da umanjuje kvadratne udaljenosti.

Primjer # 2

Uzmimo 4 boda, (-2, -3), (-1, -1), (1,2), (4,3).

Nađimo M i B za jednadžbu y = mx + b.

Kao i prije, stavimo te vrijednosti u naše jednadžbe kako bismo pronašli M i B.

Uzmimo te rezultate i postavimo ih u jednadžbu crte y = mx + b.

Sada povucimo crtu i vidimo kako linija prolazi kroz crte na takav način da umanjuje kvadratne udaljenosti.

U zaključku

Kao što vidite, cijela je ideja jednostavna. Samo trebamo razumjeti glavne dijelove i kako radimo s njima.

Možete raditi s formulama kako biste pronašli crtu na drugom grafu i izveli jednostavan izračun i dobili rezultate za nagib i presjek y.

To je sve, jednostavno, zar ne? ?

Svaki komentar i sve povratne informacije su dobrodošle - ako je potrebno, popravit ću članak.

Slobodno me kontaktirajte izravno na LinkedInu - kliknite ovdje.