Selitti: neuroverkot | MIT Uutiset | Massachusetts Institute of Technology

viimeisten 10 vuoden aikana, parhaiten suoriutuneen artificial-intelligence — järjestelmät- kuten puheentunnistimet älypuhelimet tai Googlen uusin automaattinen kääntäjä — on seurausta tekniikkaa kutsutaan ”syvä oppiminen.”

Syvä oppiminen on itse asiassa uusi nimi lähestymistapa tekoäly nimeltään neuroverkkojen, joka on ollut menossa ja pois muodista jo yli 70 vuotta., Neuroverkot olivat ensimmäisen kerran ehdotti vuonna 1944, jonka Warren McCullough ja Walter Pitts, kaksi Chicagon Yliopiston tutkijat, jotka muuttivat MIT: n vuonna 1952, kuten perustajajäseniä, mitä on joskus kutsutaan ensimmäinen kognitiotieteen osasto.

Hermo verkot olivat merkittävä tutkimusalue sekä neurotieteen ja computer science, kunnes 1969, kun mukaan tietojenkäsittelytieteen lore, ne tapettiin MIT matemaatikot Marvin Minsky ja Seymour Papert, joka vuotta myöhemmin olisi tullut co-johtajat uusi MIT Artificial Intelligence Laboratory.,

tekniikka sitten nauttia uuden tulemisen 1980-luvulla, vaipui eclipse uudelleen ensimmäisen vuosikymmenen uuden vuosisadan, ja on palannut kuin gangbusters toinen, ruokkivat suurelta osin lisääntynyt laskentatehoa grafiikka pelimerkkejä.

”on tämä ajatus, että ideoita tiede ovat vähän kuin epidemiat viruksia”, sanoo Tomaso Poggio, Eugene McDermott Professori Aivojen ja Kognitiivisten Tieteiden MIT, tutkija MIT: n McGovern Institute for Brain Research, ja johtaja MIT: n Center for Aivot, Ajatuksia, ja Koneita., ”Influenssavirusten peruskantoja on ilmeisesti viisi tai kuusi, ja ilmeisesti jokainen niistä tulee takaisin noin 25 vuoden jaksolla. Ihmiset saavat tartunnan, ja heille kehittyy immuunivaste, joten he eivät saa tartuntaa seuraavaan 25 vuoteen. Ja sitten on uusi sukupolvi, joka on valmis tartunnan samaa kantaa virusta. Tieteessä ihmiset rakastuvat ideaan, innostuvat siitä, vasaroivat sen kuoliaaksi ja saavat sitten immunisaation — kyllästyvät siihen. Ideoilla pitäisi siis olla samanlainen jaksollisuus!,”

tärkeissä asioissa,

Hermo verkot ovat keino tehdä kone oppiminen, jossa tietokone oppii suorittamaan jonkin tehtävän analysoimalla koulutusta esimerkkejä. Yleensä esimerkit on merkitty käsin etukäteen. Esine tunnustamisen järjestelmä, esimerkiksi, saattaa olla fed tuhansia merkitty kuvia autoja, taloja, kahvin-kupit ja niin edelleen, ja se olisi löytää visuaalisia kuvioita kuvia, jotka johdonmukaisesti korreloi erityistä tarroja.

ihmisen aivoissa löyhästi mallinnettu hermoverkko koostuu tuhansista tai jopa miljoonista yksinkertaisista prosessoivista solmuista, jotka ovat tiheästi yhteydessä toisiinsa., Useimmat nykypäivän hermo verkot on jaettu kerroksiin solmut, ja he ”feed-forward”, joka tarkoittaa, että data liikkuu niiden läpi vain yhteen suuntaan. Yksittäinen solmu voi olla liitettynä useita solmuja kerros sen alla, josta se vastaanottaa tietoja, ja useita solmuja kerroksen yläpuolella, johon se lähettää tietoja.

jokaiselle saapuvalle liitokselleen solmu antaa numeron, joka tunnetaan nimellä ”paino.”Kun verkko on käytössä, solmu vastaanottaa erilaisia tietoja tuote — eri määrä yli jokainen sen yhteyksiä ja kertoo sen liittyvän paino., Sitten se lisää tuloksena olevat tuotteet yhteen, jolloin saadaan yksi numero. Jos kyseinen luku on kynnysarvon alapuolella, solmu ei siirrä tietoja seuraavaan kerrokseen. Jos määrä ylittää raja-arvon, solmu ”tulipalot”, joka tänään on neural nets tarkoittaa yleensä lähettää numero — summa painotettu tulot — sekä sen kaikki lähtevät yhteydet.

kun hermoverkkoa harjoitellaan, kaikki sen painot ja kynnykset asetetaan aluksi satunnaisarvoille., Koulutuksen tiedot syötetään pohja kerros — sisääntulo kerros — ja se kulkee seuraaviin kerroksiin, saada kerrottuna ja lasketaan yhteen monimutkaisilla tavoilla, kunnes se vihdoin saapuu, radikaalisti muuttunut, lähtö kerros. Koulutuksen aikana, painot ja raja-arvot ovat jatkuvasti säätää, kunnes koulutus tietojen kanssa samaan tarrat johdonmukaisesti tuottaa vastaavia tuotoksia.

Ajatuksia ja koneita,

hermo verkot kuvataan McCullough ja Pitts vuonna 1944 oli raja-arvot ja painot, mutta ne eivät olleet järjestetty kerrokset, ja tutkijat eivät määritä mitään koulutusta mekanismi., McCullough ja Pitts osoittivat, että neuroverkko voi periaatteessa laskea minkä tahansa toiminnon, jonka digitaalinen tietokone pystyy. Tulos oli enemmän neurotieteen kuin tietojenkäsittelytieteen: tarkoitus oli esittää, että ihmisen aivot voi ajatella tietokonelaitetta.

hermoverkot ovat edelleen arvokas työkalu neurotieteelliseen tutkimukseen. Esimerkiksi, erityisesti verkko ulkoasuja tai sääntöjä säätämällä painoja ja raja-arvot on toistettu havaittu piirteitä ihmisen neuroanatomian ja kognition, osoitus siitä, että he kaapata jotain siitä, miten aivot prosessoivat tietoa.,

ensimmäinen trainable neuroverkko, että Perceptron, oli osoittanut, Cornellin Yliopiston psykologi Frank Rosenblatt vuonna 1957. Myös Perceptron suunnittelussa oli paljon, kuten että moderni neural net, paitsi että se oli vain yksi kerros, säädettävät painot ja raja-arvojen välissä input-ja output-kerroksia.,

Perceptrons oli aktiivinen tutkimusalue sekä psykologian ja aloitteleva discipline of computer science, kunnes 1959, kun Minsky ja Papert julkaisi kirjan nimeltä ”Perceptrons,” joka osoitti, että suorittamalla tiettyjä melko yleisiä laskelmia Perceptrons olisi impractically aikaa vievää.

”tietysti kaikki nämä rajoitukset tavallaan katoavat, jos otetaan vähän monimutkaisempia koneita, kuten kaksi kerrosta”, Poggio sanoo. Kirja vaikutti kuitenkin tuolloin hyytävästi hermoverkkotutkimukseen.,

”nämä asiat pitää laittaa historialliseen kontekstiin”, Poggio sanoo. ”He puolustivat ohjelmointia — Lispin kaltaisille kielille. Vielä muutama vuosi aiemmin ihmiset käyttivät analogisia tietokoneita. Tuolloin ei ollut lainkaan selvää, että ohjelmointi on oikea tapa edetä. He taisivat mennä vähän yli laidan, mutta kuten tavallista, se ei ole mustavalkoinen. Jos ajatellaan tätä analogisen laskennan ja digitaalisen laskennan kilpailuna, he taistelivat sen puolesta, mikä tuolloin oli oikein.,”

Jaksotus

1980-luvulla, kuitenkin, tutkijat olivat kehittäneet algoritmeja, jotka muuttavat hermo verkot’ painot ja raja-arvoja, jotka olivat riittävän tehokkaita verkkoja, joissa on enemmän kuin yksi kerros, poistaa monia rajoituksia tunnistetaan Minsky ja Papert. Kenttä nautti renessanssista.

mutta älyllisesti hermoverkoissa on jotain epätyydyttävää. Tarpeeksi koulutusta voi tarkistaa verkon asetuksia niin, että se voi hyödyllisesti luokitella tietoja, mutta mitä nämä asetukset tarkoittavat?, Mitä kuvan ominaisuuksia on esine recognizer tarkasteltaessa, ja miten se pala ne yhteen erottuva visuaalinen allekirjoitukset autoja, taloja, ja kahvikupit? Yksittäisten yhteyksien painojen tarkastelu ei vastaa tuohon kysymykseen.

viime vuosina, tietokone tutkijat ovat alkaneet keksiä nerokas menetelmiä liittäessään analyyttinen strategioiden hermo verkot. 1980-luvulla verkkojen strategiat olivat kuitenkin sopimattomia., Vuosisadan vaihteessa neuroverkkoja syrjäyttivät tukivektorikoneet, vaihtoehtoinen lähestymistapa koneoppimiseen, joka perustuu puhtaaseen ja eleganttiin matematiikkaan.

neuroverkkojen viimeaikainen elpyminen-syväoppimisen vallankumous-tulee tietokonepeliteollisuuden luvalla. Monimutkaisia kuvia ja nopea tänään on video pelit vaativat laitteiston, joka voi pysyä, ja tulos on ollut graphics processing unit (GPU), joka pakkaa tuhansia suhteellisen yksinkertainen käsittely ydintä yhteen siruun., Ei kestänyt kauan, ennen kuin tutkijat tajusivat, että GPU: n arkkitehtuuri muistuttaa huomattavan paljon neuroverkkoa.

Moderni Gpu käytössä yhden kerroksen verkot 1960-ja-kaksi – kolme-kerros verkostot 1980-luvun kukoistaa osaksi 10-, 15-, jopa 50-kerros verkostot tänään. Siihen ”syväoppimisen ””syvä” viittaa-verkon kerrosten syvyyteen. Ja tällä hetkellä syvä oppiminen on vastuussa parhaiten toimivista järjestelmistä lähes kaikilla tekoälytutkimuksen aloilla.,

Alla huppu

verkkojen peittävyys on silti hämmentävää teoreetikot, mutta siellä on edistystä tällä rintamalla, liian. Lisäksi ohjaa Center for Aivot, Ajatuksia, ja Koneet (CBMM), Poggio johtaa keskuksen tutkimus-ohjelman Teoreettisia Viitekehyksiä Älykkyyttä. Viime aikoina Poggio ja hänen CBMM-kollegansa ovat julkaisseet kolmiosaisen neuroverkkojen teoreettisen tutkimuksen.,

ensimmäinen osa, joka julkaistiin viime kuussa International Journal of Automaatio-ja Tietotekniikan, käsitellään erilaisia laskelmia, että syvä-oppimisen verkostot voivat toteuttaa ja kun syvät verkot tarjoavat etuja matalampi niistä., Osat kaksi ja kolme, jotka ovat olleet julkaissut kuin CBMM teknisiä raportteja, käsitellä ongelmia maailmanlaajuinen optimointi, tai takaa, että verkko on löytänyt asetukset, jotka parhaiten sopusoinnussa sen koulutuksen tiedot, ja overfitting, tai tapauksissa, joissa verkko tulee niin mieleen yksityiskohtia sen koulutuksen tiedot, että se ei yleistää koskemaan muita tapauksia samaan luokkaan.,

On olemassa vielä runsaasti teoreettisia kysymyksiä, mutta CBMM tutkijoiden työ voisi auttaa varmistamaan, että neuroverkot lopulta murtaa sukupolvien sykli, joka on tuonut niitä sisään ja ulos palvelusta seitsemän vuosikymmentä.

Vastaa Peruuta vastaus