A mesterséges intelligencia legnagyobb kihívása egyes kutatók szerint a nyelv megértésének képessége, mivel a beszéd és a nyelv az emberi intelligencia, kommunikáció és kognitív folyamatainak központi eleme. Amennyiben sikerülne áthidalni ezt, a gépi tanulás fejlettsége sokkal közelebb kerülhetne az emberi intelligenciához.
2019-ben a Microsoft és az Alibaba bejelentették, hogy továbbfejlesztették a Google azon technológiáját, amely képes legyőzni az olvasásértésre elkészített Natural Language Processing (NLP) keretrendszerben. Hogy ez miért számít áttörésnek, ahhoz mindenekelőtt tudnunk kell, hogy mi történt négy évvel korábban: 2015-ben a Microsoft és a Google kutatói olyan – Geoff Hinton és Yann Lecun találmányain alapuló – rendszereket fejlesztettek ki, amelyek felülmúlják az embereket a képfelismerésben. Kai-Fu Lee technológiai szakember, a Wired szerzője akkoriban a számítógépes képalkotási módok felvirágzását jósolta, ezért cége körülbelül tucatnyi számítógépes képalkotási alkalmazást vagy terméket fejlesztő cégbe fektetett. Ma ezeket az eszközöket a kiskereskedelemben, a gyártásban, a logisztikában, az egészségügyben és a szállításban egyaránt alkalmazzák, a beruházások értéke pedig mára meghaladja a húszmilliárd dollárt.
Így 2019-ben, amikor a szakember hasonló áttörést sejtett az NLP-ben, arra számított, hogy az NLP-algoritmusok hihetetlenül pontos beszédfelismerést és gépi fordítást eredményeznek, amelyek egy napon egy olyan „univerzális fordítót” működtetnek majd, ahogyan azt a Star Trek ábrázolja. Ahogy fogalmaz, szerinte az NLP olyan vadonatúj megoldásokat is lehetővé tesz a jövőben, mint például egy precízebb keresőrendszer (Larry Page grandiózus víziója a Google számára) és a célzott tartalomszintézis (ami a mai célzott reklámozást gyerekjátékká teszi). Ezeket aztán fel lehet használni a pénzügyi, egészségügyi, marketing és fogyasztói fejlesztésekben is. Lee cége ezért 2019 óta az NLP-cégekbe való befektetéssel foglalkozik: „úgy gondolom, hogy az NLP nagyobb hatást gyakorolhat a világra, mint a számítógépes képalkotás” – mondja a szakember.
Mit takar pontosan az NLP áttörése?
Az NLP-algoritmus egy önfelügyelt tanulásnak nevezett technológia: a korábbi NLP-algoritmusok minden alkalmazási területhez adatgyűjtést és alapos finomhangolást igényeltek (mint például az Amazon Alexája vagy egy bank ügyfélszolgálati chatbotja), ami költséges eljárás, ráadásul sok a hibalehetőség. A 85-90 százalékos szövegértési pontossággal bíró Natural Language Processing (NLP) motor keretrendszere azonban könnyedén alakítható új nyelvek elsajátításakor, létrehozva ezáltal egy olyan óriási modellt, amelynek akár több billió paramétere is lehet.
Ezt a modellt emberi felügyelet nélkül képezték ki – a mesterséges intelligencia „önképződik” azáltal, hogy magától kitalálja a nyelv szerkezetét. Ezután, ha rendelkezik néhány adattal egy adott területhez, finomhangolhatja az óriásmodellt az adott tartományra, és felhasználhatja olyan dolgokra, mint például a gépi fordítás, a kérdések megválaszolása és a természetes párbeszéd. A finomhangolás szelektíven átveszi a modell részeit, és csupán minimális beállítást igényel. Ez némileg hasonlít ahhoz, ahogy az emberek először megtanulnak egy nyelvet, majd ennek alapján sajátítanak el konkrét ismereteket vagy végeznek el tanfolyamokat.
A szakember szerint az automatikus és emberi pontosságú szövegelemzés olyan lehetőségeket nyit meg a cégek életében, melyekkel merniük kell élni: a részletes és sok nyelven elérhető eredmények új és stabilabb alapokra helyezik a döntéshozatalt. Hozzáteszi: kollégáival a 2019-es áttörés óta azt tapasztalták, hogy az NLP-algoritmusok mérete gyorsan nőtt (évente körülbelül tízszer), és ennek megfelelően javult a teljesítménye is. „Elképesztő bemutatókat is láthattunk – mint például a GPT-3, amely bárki írói stílusát utánozhatja (például Dr. Seussét), vagy a Google Lambda, amely emberi módon beszélget, vagy a kínai Langboat startup, amely személyre szabott marketingmegoldásokat generál.„
Leküzdheti valaha a mesterséges intelligencia a nyelvi akadályokat?
A szkeptikusok szerint ezek az algoritmusok pusztán az egész világ adatait memorizálják, és okos módon felidézik a részhalmazokat, de nem értik azokat, és nem is igazán intelligensek. Az emberi intelligencia központi eleme az érvelés, a tervezés és a kreatív képesség. A mély tanuláson (deep learning) alapuló rendszerek egyik kritikája így hangzik: „a gépeknek soha nem lesz humorérzékük. Soha nem fogják értékelni a művészetet, a szépséget vagy a szerelmet. Soha nem érzik magukat magányosnak. Sohasem érezhetnek empátiát az emberek, állatok vagy környezet iránt. Soha nem fogják élvezni a zenét, nem lesznek szerelmesek, ahogy sírni sem fognak.” A csavar a történetben, hogy ezt a kritikát a fent említett GPT-3 írta.
Sokan úgy vélik, hogy az igazi intelligencia megköveteli az emberi kognitív folyamatok jobb megértését. Mások a „neuromorf számítástechnikát” támogatják, amely az emberi agyhoz jobban hasonlító áramkörök építését, valamint a programozás új módját szorgalmazza. Megint mások a „klasszikus” mesterséges intelligencia elemeit (azaz szabályalapú rendszereket) kombinálnák a hibrid rendszerekben a mély tanulással. Lee szerint vitathatatlan, hogy a számítógépek egyszerűen másként „gondolkodnak”, mint mi. Ő úgy látja, hogy a számítógépes intelligencia növelésének legjobb módja az általános számítási módszerek (például a mély tanulás és az önfelügyelt tanulás) kifejlesztése, amelyek nagyobb feldolgozási teljesítménnyel és több adattal skálázhatók. Mivel évente tízszer több adattal bővítjük a mesterséges intelligencia betanítását, nem kétséges, hogy az sok olyan dologra lesz képes, amit mi, emberek nem tudunk megtenni.
De hogy a deep learning végül „mesterséges általános intelligenciává” (AGI) válik, amely minden tekintetben megfelel az emberi intelligenciának? Lee nem hiszi, hogy ilyesmi megtörténhet a következő húsz évben. „Számos olyan kihívás van, amelyekkel kapcsolatban nem sokat haladtunk – vagy nem is értettük meg –, mint például a kreativitás, a stratégiai gondolkodás, az érvelés, a kontrafaktuális gondolkodás, az érzelmek és a tudatosság modellezése” – magyarázza. (Az AGI, vagyis a mesterséges általános intelligencia vagy az „erős” AI olyan gépekre utal, amelyek emberi intelligenciát mutatnak.
Más szavakkal, az AGI sikeresen végrehajthat bármilyen szellemi feladatot, amelyet az ember képes.) Lee mindenekelőtt azt javasolja, hogy ne a mesterséges intelligencia végső tesztjeként kezeljük az AGI-t. A szakember úgy véli, hamarosan a deep learning és annak kiterjesztései egyre több feladatban lekörözhetnek minket, de továbbra is sok olyan akadály lesz, amelyet az ember sokkal könnyebben legyőzhet. Hozzáteszi: az AGI-vel kapcsolatos megszállottságot, vagyis azt, hogy magunkat aranystandardnak tekintjük, egy nárcisztikus emberi hajlamnak tartja.
Borítókép forrása: Shutterstock/Puzzlepix