Ohjattu oppiminen

Koneoppimisen ja tiedon louhinta, valvottu oppiminen on tekniikka johtamiseksi funktion harjoitustiedot. Koulutus tiedot koostuvat paria esineitä: momentin komponentti on tulona ja muut toivottuja tuloksia. Ulostulo toiminto voi olla numeerinen arvo tai etiketissä luokan. Tavoitteena ohjattua oppimista on luoda funktio pysty ennustamaan arvo ei hyväksyttävästä panos esine nähtyään useita esimerkkejä, koulutus tiedot. Tähän tarvitaan yleistää annettujen tietojen aiemmin näkymätön tilanteissa.

Tämä eroaa ohjaamaton oppiminen.

Yleiskatsaus

Ohjattu oppiminen malleja voi tuottaa kahdenlaisia. Yleensä luo funktio, joka muuntaa lähtötiedot toivottuja tuloksia.

Jotta voidaan ratkaista erityinen ongelma valvottu oppiminen on otettava huomioon useita vaiheita:

  • Millainen koulutus esimerkkejä. Ennen kuin teet mitään muuta, päättää millaisia ​​tietoja käytetään kouluttaa malliin. Esimerkiksi, se voi olla yksi merkki käsin, täydellinen sana kirjoitetaan käsin, tai linja käsialalla.
  • Kerää koulutus asetettu. Joukko koulutusvaatimukset ominaisuuksiin reaalimaailman käyttöä toiminto. Siksi joukko tulosobjektit kerätään ja vastaavat lähdöt kerätään myös, onko ihmisen tai asiantuntijoita mittauksista.
  • Voit selvittää tulot funktio edustus oppinut toiminnon. Tarkkuus oppinut toiminta riippuu pitkälti siitä, miten tulo kohde on edustettuna. Normaalisti, tulo kohde muuttuu piirrevektorin, joka sisältää useita ominaisuuksia, jotka ovat kuvailevia esineen. Useita ominaisuuksia ei saisi olla liian suuri, koska kirouksen dimensionality, mutta on oltava riittävän suuri ennustaa lähdön.
  • Määritä sopiva rakenne ja toiminta ongelman ratkaisemiseksi ja asianmukaiset oppimista tekniikkaa. Esimerkiksi, voit halutessasi käyttää keinotekoisia neuroverkko tai päätös puu.
  • Loppuun suunnitteluun. Insinööri valuu oppimisen algoritmi on joukko koulutuksen saatu. Oppiminen algoritmi parametrit voidaan säätää optimointiin yli osajoukko niistä koulutuksen asetettu, tai rajat validointi. Säätämisen jälkeen parametrien ja oppimisen algoritmi suorituskyky voidaan mitata käyttämällä erilaisia ​​riippumattoman testauksen koulutuksen.

Toinen termi ohjattua oppiminen on luokitus. Monenlaisia ​​luokittelijoita ovat käytettävissä, joista jokaisella on omat vahvuutensa ja heikkoutensa. Luokittelija suorituskyky riippuu suuresti ominaisuuksista tiedot on luokiteltava. Ei ole olemassa yhtä luokitusta joka toimii parhaiten kaikkia annettuja ongelmiin, joka tunnetaan myös ole ilmainen lounas lause. Erilaisia ​​empiirisiä testejä on suoritettu vertailla luokittelija suorituskyky ja löytää ominaisuuksia tietojen määrittävät luokittelija suorituskyky. Määritellään sopiva luokitin tietty ongelma, mutta vielä enemmän taidetta kuin tiedettä.

Laajimmin käytetty luokittelijoiden ovat neuroverkot, kuten; tukivektorikone; Algoritmi k-lähimmän naapurin, seokset malleja; Naiivi Bayes-luokitin; päätös puita ja säteittäinen perusteella tehtävät.

Empiirinen riskin minimointiin

Tavoitteena ohjattua oppimista on löytää funktio g, annetaan joukko kiinnostavia muoto).

Oletetaan, että pisteiden joukko, joiden käyttäytyminen g on tiedossa on näyte riippumattoman satunnaismuuttujien samoin jakautuneita mukaisesti tuntematon todennäköisyysjakauman s. Lisäksi katsotaan tappiofunktion L:

jossa Y on maalijoukko g:, ja L on kartoitus funktion mitään todellista negatiivinen n. Määrä L on tappiosta ennustaa z, koska arvo grammaa, kun sen todellinen arvo on y.

Liittyvä riski funktio f on toivoa tappiofunktion:

Jos todennäköisyysjakauma on diskreetti s voidaan kirjoittaa edellä esitetyn kaavan avulla kiinteästi sen sijaan, että summattu ..

Nyt tavoitteena on löytää funktio f * peräisin alaluokan kiinteän toiminnot, joiden riesgoR on minimaalinen.

Ottaen kuitenkin huomioon käyttäytyminen g yleensä vain tiedossa rajallinen joukko pisteitä, ... ,, voi vain lähentää todellinen riski, kuten esimerkiksi empiirinen riski:

* Valinta funktio f, joka minimoi empiirinen riski tunnetaan periaate empiirisen riskin minimointiin. Tilastollinen oppimisen teoria tutkii millä edellytyksillä minimoidaan empiirinen riski on hyväksyttävä ja miten hyvin se lähestyy voidaan odottaa olevan.

Active Learning

On olemassa tilanteita, joissa nimeämättömän aineiston avulla on runsaasti, mutta merkintöjen data on kallista. Tässä tilanteessa, oppiminen algoritmi aktiivisesti kysellä käyttäjä / opettaja tarrat. Tämäntyyppinen iteratiivista ohjattua oppimista kutsutaan aktiivinen oppiminen. Koska opiskelija valitsee esimerkkejä, joitakin esimerkkejä oppia käsite voi usein olla paljon vähemmän kuin tarvittava määrä valvoo oppimista standardi. Tämän lähestymistavan vaarana on, että algoritmi voi keskittyä merkitys voimassa esimerkkejä.

Aktiivinen oppiminen voi olla erityisen käyttökelpoinen biologisen tutkimuksen ongelmia, kuten proteiinitekniikka, jossa muutama proteiineja on löydetty joitakin mielenkiintoisia ominaisuus ja haluat määrittää, mitkä monista mahdollisista mutanttien on seuraava.

Määritelmät

Se on summa kaikkien tietojen osalta. Esimerkiksi tekniikan ongelma proteiinien, kaikki proteiinit, joiden tiedetään on tietty mielenkiintoinen toimintaa ja muita proteiineja, jotka voisi haluta testata tähän toimintaan sisältyvät.

Aikana jokaisen iteraation ,, on jaettu kolmeen alaryhmään:

  • : Pisteitä jonka etiketti on tunnettu
  • : Pisteitä jonka etiketti on tuntematon
  • : Osajoukko valittu merkitä

Useimmat nykyiset tutkimus aktiivinen oppiminen tarkoittaa, että paras tapa valita mittauspisteiden.

Hypertaso marginaalisuudesta

Osa aktiivisen oppimisen algoritmit perustuvat tukivektorikoneet ja hyödyntää rakenne SVM määrittää, mitä tietoja pistettä etiketti. Nämä menetelmät ovat yleensä laskea marginaali jokaisen tietojen ,, ilman etiketti ja käsitellään n-ulotteinen etäisyys että tosiasiassa erottaminen hypertaso.

Pienin marginaalinen hypertaso menetelmiä olettaa, että tiedot & gt; pienemmät ovat SVM on enemmän varma, niin se tulee sijoittaa on merkitty. Muita vastaavia menetelmiä, enintään marginaalinen hypertaso, valitse tiedot & gt; suurin. Kompromissi menetelmiä valita yhdistelmän pienimmän ja suurimman s.

Suurin uteliaisuus

Toinen menetelmä aktiivisen oppimisen, joka tyypillisesti etsii aineisto, jossa on vähemmän esimerkkejä marginaalisuudesta hypertaso, mutta tehokkaampi laskenta ja vain diskreetti luokittelijoiden on suurin uteliaisuus.

Se on suurin uteliaisuus kussakin merkitsemätön viite ja ottaa vastatakseen kaikki mahdolliset tarroja, jotka tiedot voivat olla. Tämä luku kunkin luokan lisätään sitten ja validoitu uusi risti. Oletetaan, että kun tiedot on sovitettu oikea etiketti, ristivalidointi tarkkuus paranee lisää. Asia useimpien parantaa tarkkuutta sijoitetaan on merkitty.

Tilastollinen ihmissuhteisiin oppiminen

Lähestymistapoja ja algoritmit

  • Oppiminen analytiikka
  • Neuroverkot
  • Backpropagation
  • Lisätä
  • Bayes tilastot
  • Asia-pohjainen perustelut
  • Päätös puu oppiminen
  • Induktiivinen logiikka ohjelmointi
  • Gaussin regressio prosessi
  • ydin
  • Oppiminen Automaatit
  • Pienin viestin pituuden
  • Naiivi Bayes-luokitin
  • lähimmän naapurin algoritmi
  • Luultavasti noin oikea oppiminen oppiminen
  • Curly asettaa standardit, menetelmät tiedon hankinta
  •  algoritmit]
  •  algoritmit]
  • Tukivektorikone s
  •  Metsät]
  • Asettaa luokittimet
  • Järjestysluku ranking
  • Pre-tietojen käsittely
  • Epäsymmetrinen Management tietokannat
  • Tilastollinen ihmissuhteisiin oppiminen

Sovellukset

  • Bioinformatiikka
  • Chemoinformatics
    • Määrälliset rakenteen ja aktiivisuuden
  • Tietokanta markkinointi
  • Käsialantunnistus
  • Tiedonhaku
    • Oppiminen vaihtelevat
  • Esine tunnustamisen konenäkö
  • OCR
  • Roskapostin tunnistus
  • Pattern Recognition
  • Puheentunnistus
  • Ennuste vilpillisiä tilinpäätös

Yleiset seikat

  • Laskennallinen oppimisen teoria
  • Induktiivinen Bias
  • Overfitting
  •  luokan jäsenyys todennäköisyydet
  • Versio tila s
  0   0
Edellinen artikkeli Quiddity
Seuraava artikkeli Cabimas kunta

Aiheeseen Liittyvät Artikkelit

Kommentit - 0

Ei kommentteja

Lisääkommentti

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Merkkiä jäljellä: 3000
captcha