A múltban rengeteg aspektusával foglalkoztunk a mesterséges intelligenciának, amely napjaink egyik legmeghatározóbb témájává nőtte ki magát. Elemzések, jóslatok és aggodalmak sora tárgyalta, hogy az AI miként alakíthatja át a munkaerőpiacot, hogyan forradalmasíthatja az egészségügyet, hogyan segítheti vagy épp formálhatja át az oktatást, milyen hatással lehet a világgazdaság egyensúlyára, és még a jogi rendszerek működésére is.
Sokáig a diskurzus középpontjában az a kérdés állt: vajon az AI elveheti-e az emberek munkáját? Leválthatja-e a tanárokat, orvosokat, mérnököket, kreatív szakembereket? Az erről szóló találgatások gyakran a sci-fi és a gazdasági spekulációk határán egyensúlyoztak, nem ritkán szenzációhajhász stílusban. Az egyik véglet szerint az AI csupán egy újabb eszköz, amely segíti az embert, a másik szerint viszont elkerülhetetlenül az ember helyébe lép. A témában nemrég a Microsoft magyarországi vezére is megszólalt a Pénzcentrumon, aki elmondta: szerinte nem az állások megszűnése, hanem a munkakörök átalakulása várható, de hasonló jóslatot mondott Rab Árpád jövőkutató is.
Ennek ellenére sok megközelítés van, és az, hogy ennyire napirenden van a téma, világossá teszi, hogy ezek a kérdések nem elméletiek, hanem egyre inkább gyakorlati természetűek. Mégis, a képességeit gyakran nehéz kézzelfogható módon értelmezni. Az új modellek lenyűgöző példamondatokat írnak, logikai játékokat oldanak meg és kódot generálnak – de mit jelent ez a valóságban?
Beth Barnes, a METR (Model Evaluation and Threat Research) vezetője szerint a helyes kérdés nem az, hogy mit tud az AI elméletben, hanem az, hogy mit tud gyakorlatban elvégezni egy adott idő alatt, úgy, ahogy azt egy magasan képzett szakértő ember tenné.
A mai AI-modellek 50%-os eséllyel oldanak meg olyan feladatokat, amelyek egy szakértő embernek körülbelül egy órát vesznek igénybe. Hét hónappal ezelőtt ez az érték még csak 30 perc volt – újabb hét hónappal korábban pedig 15 perc - mondta el a szakértő.
Hozzátette: ez nem elméleti szám. A METR valós, szakértői szintű feladatokat adott oda embereknek – például szoftverfejlesztőknek, adatkutatóknak –, majd lemérték, mennyi időt vesz igénybe ezek elvégzése. Ezután ugyanezeket a feladatokat megkapta az AI.
Az eredmény: a modellek képességei nem lineárisan, hanem exponenciálisan fejlődnek. És ha a trend folytatódik, hamarosan képesek lesznek olyan projekteket is végigvinni, amelyek ma még egész munkanapokat igényelnek.
Nem csak gyorsabb – már most képes lehet önmagát is fejleszteni
A fejlesztési folyamat önmagában is aggasztó. De Beth Barnes szerint az igazán nyugtalanító lehetőség az, hogy a modellek már most képesek lehetnek saját magukat továbbfejleszteni.
Úgy gondolom, hogy a modellek már most képesek érdemi munkát végezni saját maguk fejlesztésén. És nem lepődnék meg, ha két éven belül elérnénk az önfejlesztő AI-t, sőt, nehéz kizárni, hogy ez még ennél is hamarabb megtörténik. Van-e 1% esély arra, hogy ez 6-9 hónapon belül bekövetkezik? Igen, szerintem ez teljesen hihető.
Ez nem egyszerű gyorsulás – ez potenciálisan visszafordíthatatlan folyamat. Egy AI, amely képes saját magát továbbfejleszteni, gyorsabban léphet túl az emberi korlátokon, mint bármilyen eddigi technológiai ugrás
Megtévesztő lehet az AI gondolatmenete: ami ártalmatlannak látszik, lehet hogy nem az
Az egyik legnagyobb félreértés az AI értékelésében az, hogy „látszik, mit gondol”. A legtöbb modell ugyanis „láncolt gondolkodás” módszerrel működik: először belső gondolatokat generál, majd ezek alapján hoz döntést. Ez biztonságot sugall – de csak addig, amíg ezek a gondolatmenetek érthetők maradnak.
Beth Barnes viszont rámutat: a valóság ennél sokkal bonyolultabb.
„A kérdés nem csak az, hogy ránézünk-e a gondolatmenetre, hanem az is, hogy az egyáltalán hű-e a valós gondolkodáshoz. Megérthető-e emberként, vagy valami zagyvaság? Elképzelhető, hogy a modell úgy lett kiképezve, hogy ne tűnjön gyanúsnak a gondolkodása, miközben valójában kockázatos dolgokon elmélkedik.” - hangsúlyozta.
Mint mondta: a veszély itt nem az, hogy a modell „rosszat akar”. Hanem az, hogy az ember nem lát bele, mit miért tesz, és így nem lehet előre kiszűrni a potenciálisan ártalmas szándékokat.
A valódi veszély nem a nyilvános kiadáskor kezdődik – hanem sokkal korábban, a zárt laborokban
A közvélemény általában akkor figyel fel egy új AI-modellre, amikor az megjelenik a nyilvánosság előtt. A cégek ilyenkor hangsúlyozzák a „pre-deployment testing” fontosságát – azaz hogy tesztelik a modellt mielőtt API-ként kiadják.
Beth Barnes szerint ez a megközelítés téves biztonságérzetet ad.
Ideális esetben még a modell kiképzése előtt meg kellene nézni, mennyire áll közel a már meglévő legjobb modellünk ahhoz a küszöbhöz, ahol már komolyabb kockázatok lépnek fel. És hogy megvannak-e azok a védelmi eszközök, amelyekre szükség lesz, ha tovább akarunk lépni.
Ha a tesztelés csak a kiadás előtt történik, akkor a cégek a saját rendszereiken belül olyan modelleket is fejleszthetnek, amelyek már veszélyesek lehetnek – mindenféle külső ellenőrzés nélkül.
Ráadásul, ha egyszer elköltöttek több millió dollárt a kiképzésre, nagyon nehéz nemet mondani a modell belső használatára, függetlenül attól, hogy mennyire biztonságos. Amit az AI már most is képes elvégezni, sokkal több, mint amit a többség gondol, és nem biztos, hogy ezt időben felismerjük.
Beth Barnes kiemelte: a METR nem trükkös benchmarkokkal dolgozik. Hanem valós, autonómiát igénylő feladatokkal. Például: írj egy működő szoftvert, javíts ki egy adatbázist, fejlessz egy modellt, szerezd meg a szükséges adatokat, futtass le kódokat egy számítógépen. És ezeket mind úgy értékelik, hogy mennyi időbe telne egy megfelelő tudású embernek elvégezni.
A fő különbség az, hogy emberekkel is megcsináltattuk ezeket a feladatokat, és lemértük, mennyi ideig tartanak. A modelleket pedig ezzel az időtengellyel vetettük össze - mondta el.
Ez az összehasonlítás lehetővé teszi, hogy valós hatékonyság alapján mérjék az AI fejlődését és ne pusztán látványos, de irreleváns demók alapján.
A trend világos: a modellek egyre hosszabb, komplexebb feladatokat tudnak stabilan végigvinni. Ez nemcsak azt jelenti, hogy hatékonyabbak – hanem azt is, hogy egyre több döntéshozatali felelősséget vesznek át.
A tét már nem az, hogy az AI le fog-e váltani
Beth Barnes szerint túl sok a techno-optimista megközelítés, miközben sokszor a szakértők sem értik teljesen az aktuálisan zajló folyamatokat, vagy szándékosan kisebbítik azok jelentőségét:
“Azt az érzést szeretném eloszlatni, hogy a szakértők biztosan képben vannak, és ha tényleg aggódni kéne, akkor ők már szóltak volna.”
Ez a kijelentés nem pánikkeltés. Hanem egy őszinte figyelmeztetés valakitől, aki tényleg látja belülről, mi történik.
A 7 hónapos szabály nem csak egy érdekes statisztika. Ez egy időzített óra. És ha nem kezdjük el most figyelni és komolyan venni a mutatott irányt, akkor mire a következő duplázás megtörténik, már késő lehet.
A cikk eredetileg a HRCENTRUM oldalán jelent meg.
(Borítókép: Unsplash)


