Anonim

AI-algoritmen lærer en bil å kjøre fra bunnen av om 20 minutter

Automotive

Loz Blain

6. juli 2018

6 bilder

Storbritannia oppstart Wayve mener at prøve-og-feil maskin læring, akkurat som måten folk lærer, er nøkkelen til autonome biler (Kreditt: Wayve)

Et par kunstig intelligens Ph.Ds fra Cambridge University går all-in på maskin læring som grunnlaget for autonome biler. Deres selskap, Wayve, har nettopp gitt ut en video av en kitted-out Renault Twizy som lærer seg selv å følge en bane fra bunnen av i løpet av omtrent 20 minutter.

Wayves Amar Shah og Alex Kendall tror at det har vært for mye håndteknikk som skjer når folk prøver å løse bilkjøringsproblemet selv.

"Det manglende stykket av selvkjøring puslespillet er intelligente algoritmer, ikke flere sensorer, regler og kart, " sier shah, wayve medgrunnlegger og administrerende direktør. "Mennesker har en fascinerende evne til å utføre komplekse oppgaver i den virkelige verden, fordi hjernen vår tillater oss å lære raskt og overføre kunnskap gjennom våre mange opplevelser. Vi vil gi våre kjøretøy bedre hjerner, ikke mer maskinvare. "

Med denne tilnærmingen i tankene tok teamet en Renault Twizy, utstyrt med et enkelt kamera på forsiden og modifisert med evnen til å betjene styring, gass og bremser på datamaskinen. De koblet den til en grafikkbehandlingsenhet som kunne intelligent analysere kameradataene i sanntid, og kjørte et læringsprogram basert på eksperimentering, optimalisering og evaluering.

De satte Twizy på en smal, forsiktig buet kjørefelt. En menneskelig sjåfør satt i sjåførens sete, og ga full kontroll over til bilen, fortalte ikke hva sin oppgave var, og la den eksperimentere med kontrollene.

Hver gang bilen gikk for å kjøre av veien, stoppet de den og korrigerte den. Algoritmen "straffet " bilen for å lage feil, og "belønnet " det basert på hvor langt det reiste uten menneskelig innblanding. Innen 20 minutter, som representerte mindre enn 20 forsøk, hadde bilen arbeidet ut hvordan man skal følge en bane mer eller mindre på ubestemt tid.

Wayve tror det er kvaliteten på læringssystemene som vil være nøkkelfaktoren i hvem dominerer det autonome bilmarkedet i det kommende tiåret.

"DeepMind har vist oss at læringsmetoder med dyp forsterkning kan føre til superhuman ytelse i mange spill, inkludert Go, Chess og dataspill, som nesten alltid overgår ethvert regelbasert system, " leser et Wayve blogginnlegg. "Vi viser her at en lignende filosofi også er mulig i den virkelige verden, og spesielt i autonome kjøretøyer.

"Forestill deg å bruke en flåte med autonome biler, med en kjørealgoritme som i utgangspunktet er 95% kvaliteten på en menneskelig sjåfør. Et slikt system ville ikke være wobbly som den tilfeldig initierte modellen i vår demonstrasjonsvideo, men ville nesten være i stand til omgang med trafikklys, rundkjøringer, veikryss osv. Etter en hel dag med kjørings- og on-line forbedring fra menneskesikkerhetsdriveren, overtar kanskje systemet til 96%. Etter en uke, 98%. Etter en måned, 99%. Etter noen få måneder kan systemet være super-menneske, etter å ha tatt fordel av tilbakemeldingene fra mange forskjellige sikkerhetsdrivere. "

Det er absolutt læringselementer - og nettverksinnlæringselementer - presentert i dagens selvdrevne operasjoner. Tesla Autopliot logger for eksempel en feil en sjåfør må overta og korrigere for, og bruker den til å utdanne andre Teslas-overskrifter gjennom samme område. Men ideen om å la en selvkjørende bil bygge sin egen hele modell for hvordan man skal operere i verden, er det samme som en menneskelig sjåfør, en fascinerende.

Læringsprosessen er demonstrert i to minutters video nedenfor.

Kilde: Wayve

Et par Renault Twizys, kitted ut som selvkjørende test senger (Kreditt: Wayve)

Wayve medstiftere Alex Kendall og Amar Shah (Kreditt: Wayve)

Gitt kompleksiteten i oppgaven med å lære å kjøre, kan maskinlæring gjøre en bedre jobb enn å fylle et system med regler? (Kreditt: Wayve)

Storbritannia oppstart Wayve mener at prøve-og-feil maskin læring, akkurat som måten folk lærer, er nøkkelen til autonome biler (Kreditt: Wayve)

Ved å la bilseksperimentet styre seg, var det nødvendig å korrigere det når det var nødvendig og belønne det for maksimal tid før korreksjonen var nødvendig. Wayve lærte Twizy å lære seg å følge en bane (Kreditt: Wayve)

Disse Twizys er i stand til avansert maskinlæring (Kreditt: Wayve)

Anbefalt Redaksjonens