Az unlearning fogalmát fordított tanulásként lehetne lefordítani: célja, hogy a modellekből eltávolítsa a nemkívánatos adatokat anélkül, hogy újra kellene kezdeni a teljes tanítási folyamatot. Ennek a fejlesztésnek fontos szerepe lehet abban, hogy a jövőben az AI modellek egyszerre hatékonyabban és etikusabban működhessenek olyan környezetekben, ahol az érzékeny adatok törlése kötelező előírás vagy elvárás.
Az IBM kutatói szerint az unlearning jelentős előrelépés lehet az AI-modellek tökéletesítésében és biztonságosabbá tételében, ami nélkülözhetetlen annak érdekében, hogy a vállalati és intézményi döntéshozók mesterséges intelligenciába vetett bizalma erősödjön. A fordított tanulás amellett, hogy segít kiszűrni a téves következtetésekre vezető inputokat, megoldást kínál a nagy nyelvi modellek válaszaiban megjelenő toxikus, vagy etikai aggályokat felvető információk kiszűrésére és eltávolítására is. Ilyen például az, ha az alapadatok faji vagy nemi alapú, vagy éppen a szocioökonómiai státuszhoz kapcsolódó torzításokat tartalmaznak, hiszen ezeket a modellek is átvehetik. Az így születő következtetések és legenerált outputok pedig hátrányosan érinthetnek például olyan álláshirdetésre jelentkezőket, akiknek az önéletrajzát egy AI válogatja szét, vagy hiteligénylőket, akik első körös elbírálását mesterséges intelligencia végzi. Az ilyen esetek korrekcióját teszi lehetővé az unlearning: ha egy AI modell „megtanult” egy torzított adatsor alapján egy toxikus eljárást, az unlearning folyamat eredményeképpen ezt nemcsak elnyomni lesz képes, hanem el is felejti minden formáját.
Az unlearning ugyanakkor a döntéshozók a mesterséges intelligenciával kapcsolatos egyik leggyakoribb és legfontosabb fenntartásának kezelésére is alkalmas lehet, ez pedig az AI birtokába kerülő érzékeny, vagy személyes adatok sorsa. Nem véletlen, hogy a technológia iránti igény először az adatvédelmi törvények, például az EU-s GDPR rendelkezések miatt jelent meg, amelyek az adattulajdonos kérése esetén előírják a cégeknek és az intézményeknek a személyes adatok törlését. A hagyományos adatvédelmi eljárások ugyanakkor nem mindig elegendők az olyan modelleknél, amelyek több milliárd szóra és sok-sok terabájtnyi adatra épülnek, ezek esetében már fordított tanulásra van szükség.
Az IBM új fejlesztései azért kivételesen hatékonyak a mesterséges intelligenciát alkalmazó vállalatok és intézmények számára, mert azt is lehetővé teszik, hogy a modellek mindig csak a torzításokat okozó, vagy személyes jellegük miatt érzékeny adatokat felejtsék el, miközben megőrzik az adathalmazban található többi információt, ezzel javítva a modellek hatékonyságát.
„Ahogy a mesterséges intelligenciamodellek beépülnek az üzleti folyamatokba, még fontosabbá válik annak biztosítása, hogy csak megbízható adatokat használjanak az üzleti döntéshozatalhoz. Hosszú távon ugyanis a tanító adatok minősége fogja eldönteni, mely vállalatok és intézmények fognak győzni a mesterséges intelligencia segítségével. A kiemelkedő adatminőség elérése egy folyamat: az IBM egy holisztikus megközelítést kínál ehhez, amely lehetővé teszi, hogy a szervezetek kicsiben kezdjék, majd kiterjesszék adatminőségi programjukat a teljes adatökoszisztémára – mondta el Pikéthy Árpád, az IBM magyarországi vezetője. – Olyan eszközöket fejlesztünk, amelyekkel az AI etikus, transzparens és megbízhatóbb lesz a vállalati és az intézményi döntéshozók számára is. Az unlearning tehát lehetőséget ad arra, hogy a modelljeink biztonságosabbak legyenek, úgy, hogy közben javul a hatékonyságuk is. Továbbá a modelljeink megfelelnek a jogi és adatbiztonsági előírásoknak és elvárásoknak, különösen azokban az iparágakban, ahol az érzékeny információk kezelése fontos kihívást jelent. Az IBM jelenleg saját, Granite névre hallgató modellcsaládján is teszteli az unlearning technológiát. Nekünk az a véleményünk, hogy az unlearning kitörési pontot jelenthet az AI alkalmazások iránti bizalom erősítésében.”
Illés János, az IBM termékeit Magyarországon értéknövelt viszonteladóként forgalmazó Arrow ECS Hungary Kft. IBM termékekért felelős üzletágvezetője hozzátette, hogy „Az adatok még mindig a legkevésbé kihasznált erőforrások a vállalatoknál világszerte, a cégek és intézmények adatvagyona óriási potenciált rejt a döntéshozók számára. A mesterséges intelligencián keresztül elérhető üzleti lehetőségek köre ráadásul már most is jóval tágabb annál, amit a mindennapi gyakorlatban alkalmaznak. Az IBM watsonx AI megoldásai céges szinten a HR-től kezdve az ügyfélkapcsolattartáson keresztül egészen a marketing területekig számos dologra használhatók. Azért dolgozunk, hogy ezeket a lehetőségeket minél több magyarországi cég és szervezet számára elérhetővé tegyük.
Kövesd az oldalunkat a Facebook-on és a Twitteren is!