A sci-fi filmekből ismert, öntudatra ébredő mesterséges intelligenciára (amely előszeretettel írtja ki az emberiséget) még évtizedekig várni kell, azonban kép- és hangfelismerés terén már beérték a gépek az embereket – derült ki Agod Attila és Szalai Ferenc mesterséges intelligenciáról szóló előadásából a Café Csoport szakmai rendezvényén, a Tízórai történeteken.
Hol jár ma az AI?
A már emlegetett tudományos-fantasztikus filmeknek és regényeknek köszönhetően hajlamosak vagyunk a mesterséges intelligenciát (angolul rövidítve AI) emberként elképzelni, de még messze nem tart itt a technológia. Jelenleg a „gyenge AI” szinten állunk, ami az alapvető kognitív funkciók gyűjteménye: a programok látnak, hallanak, értik a szöveget, felfedezik a mintázatokat, ám ezek az észlelések nem állnak össze egy egésszé, a tudattalan AI nem tud optimalizálni az adatok alapján.
Agod Attila, a Scenarios kutatója szerint az elmúlt pár évtizedben harmadszorra merült fel az ígéret, miszerint a mesterséges intelligencia szerves része lesz a gazdaságnak, és a korábbi hype-tól eltérően jelenleg minden adott, hogy ez az ígéret beteljesüljön. Ennek oka az adatmennyiség és a számítási kapacitás 2 éves ciklusonkénti exponenciális növekedése. A folyamat a repüléshez hasonlítható: már az 1860-as évektől kísérleteztek repülőgépek tervezésével, de 40 év kellett ahhoz, hogy olyan motort készítsenek, amely fel tudja emelni a repülőgép súlyát. Jelenleg a kapacitás elérte azt a kritikus pontot, amikor a – fenti hasonlatot folytatva – a repülőgép elszakadhat a talajtól.
Pszichedelikus álom
Az igazi áttörést a mélytanulás hozta el. A mesterséges neurális háló az emberi agy működéséhez hasonló: rétegek dolgozzák fel az információt kezdve a legalacsonyabb szintet jelentő színekkel, foltokkal, vonalakkal. Ezt követően egyszerű struktúrákat rak össze az AI (például, egy állat esetében szem és fül), végül összeáll az arc, és jön a felismerés, hogy mit is ábrázol a kép.
A folyamat vizualizálva egy pszichedelikus LSD-triphez hasonló.
Jobb, mint az ember
Egy 100 ezer képet tartalmazó adatbázist végigböngészve az átlagember a képek 5 %-át nem ismeri fel, és hasonló a teljesítménye recsegős hangfelvételek megértésében is. A mélytanulásnak hála a gépek 2015-ben érték utol az embert, és azóta is folyamatosan fejlődnek. Ugyanez mondható el a szövegértésről és a fordításról is, különösen angol és mandarin nyelven.
Ezek a képességek a gyakorlatban is egyre jobban használhatók: az Adobe Sensei nevű terméke például automatikusan címkézi a képeket, felismeri a betűtípusokat, összefoglalót készít egy dokumentumról, illetve rendszerezi egy adott termékről alkotott felhasználói véleményeket.
Összelegózni a tudást
Jelenleg négy nagyobb cég, az Amazon, a Google, az IBM és a Microsoft fejleszt mesterséges intelligenciát, amelyek felhő alapú adattárolási kapacitásra tették le az AI építőkockáit. Szalai Ferenc fizikus szerint felesleges a nulláról AI-t fejleszteni, elég, ha jól tudjuk összelegózni a már meglévő tudást.
Jelenleg a kreatív feladatok modellezése jelenti a legnagyobb kihívást, de erre is láthatunk ígéretes megoldásokat. Ilyen például a Morgan című film trailere, amelyet az IBM mesterséges intelligenciája vágott meg. Ehhez több ezer filmet és azok előzetesét, valamint az előzetesekre adott nézői reakciókat tápláltak be a számítógépbe, amelyek alapján az algoritmus elkészítette a szerinte legjobb trailert.
Szalai szerint a mesterséges intelligenciával együtt kell tudni dolgozni a jövőben, és mint egy juniort, az embernek kell feladatokra betanítania. Az elkövetkező évek fő kérdése, hogy milyen távol leszünk a gépektől: marad a jelenlegi helyzet vagy a jövőben implantátumként lesznek jelen az emberi testben?