MarI/O

Ez a poszt azért íródott, hogy megpróbáljam megmagyarázni, hogy mit is láthatunk a kapcsolódó Youtube videón, vagyis ezen itt:

https://www.youtube.com/watch?v=3FUvN_uGn5c

Az AI (mesterséges intelligencia) tanulási folyamatát láthatjuk. Az AI (ami egy kb 50 soros script) összesen annyi információval rendelkezik, hogy milyen gombokat tud megnyomni (Fel, Le, Jobbra, Balra, A, B), illetve a “Fitness” értéket, ami nagyjából annyit tesz, hogy hány képkockányit haladt előre míg meghalt, vagy “beszorult”. Ha a Fitness számláló pár másodpercig nem nő, akkor automatikusan resetel, ha meghal, akkor is.

A tanulás folyamata elég bonyolult – és hazudnék, ha azt mondanám, hogy értem hogyan működik pontosan –  nagy vonalakban arról van szó, hogy nyomkodja a gombokat, egy idő után megpróbálja a jobb irányt, ettől elkezd a Fitness növekedni, ezért annak egy kicsivel nagyobb súlyt ad, ezáltal egy idő után szinte mindig el fog indulni jobbra. Mivel folyton beleütközik az első Goombába, ezért egy idő után elkezd más gombkombinációkat próbálgatni (például ugrálni), ha így messzebbre jut, akkor később ezeket az “emlékeket” nagyobb súllyal veszi figyelembe, azokat pedig, amiken nem jut messzire, egyre kevesebbet próbálgatja (a kisebb súlyozásuk miatt) ezzel folytatódik a tanulási folyamat.

A fenti linken lévő videó 2018. 02. 19-én 20:00 körül indult, tippem szerint nagyjából március elejére végig kéne hogy jusson az első pályán… 🙂 Meglátjuk, a tippeket várjuk a videó melletti cseten… 🙂

Az AI, forráskódja, ha valakit érdekel:
https://pastebin.com/ZZmSNaHX