Galvenais Straumēšanas Pakalpojumi AI iemācās krāpties Q * bert tādā veidā, kā neviens cilvēks to vēl nav izdarījis

AI iemācās krāpties Q * bert tādā veidā, kā neviens cilvēks to vēl nav izdarījis



Mākslīgajam intelektam ir izdevies pievilt ar labāko cilvēces piedāvājumu, atklājot klasiskās arkādes spēles Q * bert izmantošanu un skrienot ar to.

Kaut arī agrāk AI atkārtojumi pareizi spēlētu Q * bert, kādā brīdī, mācoties, kā spēle darbojas, tas atklāj ekspluatāciju, kas ļauj tai apkopot nenormālus punktus. Protams, tāpat kā jebkurš spēlētājs, kas meklē medību rezultātu, tas atkārto procesu, lai pēc iespējas efektīvāk varētu palielināt savu rezultātu.

Zemāk esošajā videoklipā varat redzēt, kā AI darbojas pa platformām. Sākumā izskatās, ka tas bezmērķīgi lec starp platformām. Tā vietā, lai redzētu, kā spēle virzās uz nākamo kārtu, Q * bert iestrēgst cilpā, kur sāk mirgot visas tās platformas - šeit mākslīgais intelekts pēc tam var turpināt spēli ar neprātu, sakrājot milzīgus punktus.

LASI TĀLĀK: Beidzot ir diskreditēts viens no vispretrunīgākajiem spēļu ierakstiem

kā dokumentu pārvērst par JPEG

Kā AI uzvarēja Q * bert karā

Sagraujot visu laiku titula rekordu, AI ieguva neiespējami augstu rezultātu, pateicoties tā evolūcijas stratēģijas algoritmu programmēšanai. Evolūcijas stratēģijas (ES) atšķiras no parastās mācīšanās pastiprināšanas (RL), ko tradicionālais AI izmanto, jo tā tiek uzskatīta par vairāk pielāgojamu tās paaudžu mācīšanās dēļ.

Katra mācību cilpa tiek saukta par paaudzi, un tā turpina savu uzdevumu, līdz tiek izpildīts noteikts nosacījums (šajā gadījumā augsts rezultāts). Ar katru nākamo paaudzi AI uztver iepriekšējās paaudzes zināšanas un tāpēc labāk sasniedz to pašu mērķi un pārspēj tos. Turpiniet iet, un jūs iegūsiet AI, kurai ir absolūti nepārspējams uzdevums. Tas ir tieši tas, kas šeit notika ar Q * bert rezultātu.

Ieskicēts papīrs , kuru pagājušajā nedēļā publicēja Freiburgas universitātes (Vācija) pētnieki, šķiet, ka kļūda nebija zināms daudzums. Patiesībā, lai arī viņi nav pārāk pārsteigti par kļūdas atrašanu, ir interesanti redzēt, kā AI pēc tam gāja uz priekšu un iemācījās to izmantot katru reizi, kad spēlēja, lai maksimizētu savu punktu skaitu.

LASI TĀLĀK: Šis mākslīgais intelekts ir iemācījies apgūt Super Mario Bros

Lai atrastu kļūdu, aģentam vispirms bija jāiemācās gandrīz pabeigt pirmo līmeni - tas netika izdarīts uzreiz, bet tika izmantoti daudzi mazi uzlabojumi, pētnieki paskaidroja Reģistrs . Mums ir aizdomas, ka kādā apmācības brīdī viens no pēcnācēju risinājumiem saskārās ar kļūdu un ieguva daudz labāku punktu skaitu, salīdzinot ar brāļiem un māsām, kas savukārt palielināja tā ieguldījumu atjauninājumā - tā svars bija vislielākais svērtajā vidējā vērtībā. Tas lēnām pārvietoja risinājumu telpā, kur arvien vairāk pēcnācēju sāka sastapties ar to pašu kļūdu.

Mēs nezinām precīzus nosacījumus, kādos parādās kļūda; iespējams, ka tas parādās tikai tad, ja aģents ievēro modeli, kas šķiet neoptimāls, [piemēram, ja aģents tērē laiku vai pat zaudē dzīvību]. Ja tas tā būtu, tad standarta RL būtu ārkārtīgi grūti atrast kļūdu: ja izmantojat papildu atlīdzības, jūs iemācīsities stratēģijas, kas ātri dod zināmu atlīdzību, nevis mācīšanās stratēģijas, kas kādu laiku nedod daudz atlīdzību un tad pēkšņi laimē lielu.

Skatīt saistīto Dragster čempions Tods Rodžers tikko zaudējis savu vainagu pēc 35 gadiem Šis mākslīgais intelekts jau 17 dienas mācās apgūt Super Mario Bros 1-2 Skatieties, kā šis AI iemācās braukt GTA V vietnē Twitch

Tomēr, neskatoties uz robota brīnišķīgajiem rezultātiem, pētnieki nesaka, ka tas ir gadījums, kad ES čempions mācās RL. Faktiski abām sistēmām ir savas problēmas, un šo divu kombinācija lielākoties tiek uzskatīta par labāko variantu, kas virzās uz priekšu.

Tā pati ES metode citās Atari spēlēs nenodrošināja gandrīz vienādus pozitīvus rezultātus. No otras puses, RL ir atbildīgs par rekordu sagrūšanu pa kreisi, pa labi un pa centru, tostarp par pasaules labākā GO spēlētāja pārspēšanu. ES tomēr joprojām ir sava vieta lietās, un patiesībā tas, kā Nvidia veic daudz AI apmācības, jo tam ir nepieciešama lielāka skaitļošanas jauda, ​​bet ilgāk sasniedz labākus rezultātus.

Neatkarīgi no tā, kurš veids kļūs par AI attīstības nākotni, vismaz šis robots, kurš krāpj sistēmu, nav tik slikts kā šis tagad apkaunots videospēļu pasaules čempions .

Interesanti Raksti

Redaktora Izvēle

Kāds ir AirTags diapazons?
Kāds ir AirTags diapazons?
Apple ieviesa AirTags kā metodi objektu izsekošanai. Šīs ierīces izmanto bezvadu savienojumus, kas ļauj uzzināt, vai tās ir atstājušas jūsu apkārtni. Lielas monētas izmērā varat to novietot jebkurā vietā.
Kā iestatīt iebrucēja brīdinājumu par Alexa
Kā iestatīt iebrucēja brīdinājumu par Alexa
Lai gan daži cilvēki domā, ka Alexa Intruder Alert ir lielisks iedvesmas avots joku un memu veidošanai, tā ir noderīga funkcija. Uzbrucēja brīdinājums, šķiet, ir kaut kas no zinātniskās fantastikas filmas, un tas ir mazs
Kā izdzēst visus fotoattēlus no sava iPhone (nepazaudējot tos uz visiem laikiem)
Kā izdzēst visus fotoattēlus no sava iPhone (nepazaudējot tos uz visiem laikiem)
Tā kā Apple tālruņiem ir tikai noteikts iekšējās atmiņas apjoms, ko nevar paplašināt, krātuvē var ātri beigties vieta. Kādā brīdī jūs varat saņemt briesmīgo brīdinājumu, ka krātuve ir gandrīz pilna, kas ir
Kā iespējot Ubuntu Bash operētājsistēmā Windows 10
Kā iespējot Ubuntu Bash operētājsistēmā Windows 10
Kā jūs jau zināt, Windows 10 tagad ir aprīkots ar Ubuntu Bash konsoles komplektu un lietām. Ja vēlaties iespējot Bash operētājsistēmā Windows 10, rīkojieties šādi.
Kā redzēt, kad tika izveidots Facebook konts
Kā redzēt, kad tika izveidots Facebook konts
Mēs reti pamanām, cik ātri skrien laiks, tāpēc dažiem var šķist, ka Facebook tika ieviests tikai pirms mazāk nekā 10 gadiem. Pārsteigums, pārsteigums – Facebook šogad atzīmēja savu 17. dzimšanas dienu, un jūsu personīgais konts var būt vecāks par
Kā salabot Windows 10, izmantojot DISM
Kā salabot Windows 10, izmantojot DISM
Šajā rakstā mēs redzēsim, kā novērst Windows 10, izmantojot DISM, ja to nevar atjaunināt vai ja ir bojāti noteikti sistēmas komponenti.
Adobe Illustrator CS5 pārskats
Adobe Illustrator CS5 pārskats
Pirmo reizi palaists 1988. gadā, Adobe Illustrator ciltsgrāmata ir pat garāka nekā Photoshop. Un lielāko daļu laika tā radošās iespējas ir efektīvi ierobežotas ar Adobe lapu apraksta valodu PostScript. Illustrator CS5 joprojām nosaka PostScript -