GALE: A Nagy Testvér bölcsője az USA-ban

A DARPA dolgozik

A mostanában megélénkült amerikai informatikai fejlesztésekről olvasva újra csak be kell látnunk egy régi közhely igazságát: számtalan igazán nagy projekt mögött a hadseregek igényei feszülnek. Ahogyan az 1960-as és az 1980-as években a szovjet fenyegetés inspirálta az amerikai űrhajózás, illetve a „csillagháborús” tervek fejlesztését, úgy napjainkban – oroszok híján – a terrorizmus lett az a mumus, melyre hivatkozva az Egyesült Államok Védelmi Minisztériuma és a köré csoportosuló érdekszövetségek iszonyú pénzeket áldozhatnak bizonyos speciális, katonai szempontból fontos informatikai – és egyéb – kutatásokra – s ezzel bizonyos iparágak és bizonyos vállalatok óriási támogatást nyerhetnek el. 2006 második felében több olyan hír is bejárta a világsajtót, melyek ezekről a gigaprojektekről tudósítottak. Mi is írtunk a szuperszámítógépek munkálatairól, illetve az IBM katonai célra tervezett tolmácsgépének próbaüzeméről. Ezek az innovációk dokumentáltan összekapcsolódnak egy nagyobb koncepcióba, melyet egy, a múlt századból örökölt amerikai intézmény, a DARPA fog össze. Az ősz egyik legérdekesebb híre e témában az volt, hogy a GALE-projekt – mely egy minden eddiginél tökéletesebb és nagyobb tudású fordító- és szövegelemző rendszer kidolgozását hivatott megvalósítani –, úgy tűnik, a vártnál is jobban halad.

A mágus a háttérben: a DARPA

Tony Tethey igazgató egy ez év márciusában benyújtott előterjesztésében összefoglalta a DARPA stratégiai, illetve legsürgetőbb feladatait. Az Információtechnológiai egységről a következőképpen nyilatkozott: „Az Információtechnológiai egységünk a legfontosabb, hosszú ideje fennálló részlegünk. […] Számtalan tanulmány bizonyítja, hogy a magas szintű számítástechnikai fejlettség döntő fontosságú az USA biztonságának szempontjából. Sajnálatos módon, a jelenlegi kereskedelmi trendek oda vezettek, hogy komoly technológiai lemaradásaink keletkeztek, s ezek veszélyeztetik az Egyesült Államok uralkodó szerepének megtartását e területen.”

Később Tethey kifejti, e lemaradások megszüntetésére a DARPA High Productivity Computing Systems (HPCS) programja lehet a megoldás, melynek különböző megvalósított egységei 2010-re képesek visszaszerezni az USA vezető helyét, s így a nemzetbiztonság nem szenved csorbát. Az Egyesült Államoknak mind a jelenben, mind a jövőben készen kell állnia arra, hogy hadserege bárhol a világon képes legyen gyorsan és hatékonyan akciókat végrehajtani, s mivel e színterek lakói a legtöbbször ellenségesek az amerikaiakkal szemben, s ugyanakkor nem angolul, hanem saját nyelvükön kommunikálnak, ezért létfontosságú az amerikai hadsereg számára e kommunikációk megértése és elemzése. Az internet és a hagyományos média hatalmas mérete miatt ez már emberi erővel nem megvalósítható, ezért a DARPA fokozta a GALE-projekt támogatását. A terv végső gyakorlati célja, hogy egy amerikai parancsnoknak – legyen bármely táján a világnak – csak be kelljen gépelnie a kulcsszavakat vagy kérdéseit számítógépébe, s máris kapja meg angolul a szükséges információt.

Tethey intézményének, a DARPA-nak nincsenek saját kutatóintézetei, laborjai, a megvalósítandó projektekkel külső cégeket, kutatócsoportokat bíznak meg, a költségvetésben rendelkezésre álló pénz 98 százalékát erre használják; a külsős projektmenedzserek és kordában tartott hierarchia hivatottak az intézményi nehézkességet és lassúságot kiküszöbölni.

A GALE és testvérei

Az első – és második – ránézésre kissé bonyolult projektstruktúra mindegyik eleme ma még szinte elképzelhetetlennek tűnő célok megvalósítását tűzte ki maga elé. Több közös pontjukból az egyik legfontosabb, hogy a modulszerűen egymásra épülő, mégis egymást dinamikus módon kiegészítő fejlesztéseket egy igen fontos vízió köti össze, nevezetesen a mesterséges intelligencia kutatása: minden fejlesztés x-ik fázisa egy ilyen lehetséges „Terminátor-projekt” részének tűnik. Az IPTO (Information Processing Technology Office) feladata az információfeldolgozással kapcsolatos kutatás-fejlesztési programok finanszírozása és irányítása. A hivatal célja, hogy a kognitív pszichológia, a mesterségesintelligencia- és az agykutatás eredményeire támaszkodva a jelenlegi rendszereknél nagyságrendekkel bonyolultabb, tanulni, elemezni, rendszerezni és döntéshozásra valós időben képes alkalmazásokat fejlesszen ki hadászati célokra.

Ezek a rendszerek „tudatában lesznek önmaguknak”, azaz saját viselkedésükre is tudnak reflektálni, továbbá képesek lesznek következtetéseiket elmagyarázni és az emberek természetes nyelven megfogalmazott utasításait követni. Csak néhány program mutatóba: Kognitív Információfeldolgozó Architektúrák (ACIP); Tanulóalgoritmusok alkalmazása autonóm járművekben (LAGR;) Tanulni képes személyi asszisztens kifejlesztése (PAL), s a számunkra most legfontosabb, a Globális Autonóm Nyelvelemző (GALE), melynek célja olyan önálló rendszerek kifejlesztése, melyek nagy tömegű és többnyelvű információt nyelvészek közreműködése nélkül képesek feldolgozni és értelmezni, továbbá a kinyert megbízható információt a katonai döntéshozók és elemzők számára prezentálni.

A GALE

A Globális Autonóm Nyelvelemző (Global Autonomous Language Exploitation – GALE) 2005-ben elindított programja, mely gyakorlatilag a DARPA fordítói és szövegelemzői projektjeinek felgyorsítása, két korábbi projekt integrálása. Az egyik a TIDES (Translingual Information Detection, Extraction and Summarization), mely írott szövegek, a másik az EARS (Effective Affordable Reusable Speech-to-Text), mely hangzó anyagok, a beszéd elemzését és gépi fordítását kívánta megoldani. Mindkét programban könyvelhet már el sikereket a DARPA. A 9/11 eseményei után nemzetbiztonsági szempontból elindított Total Information Awareness Program (melyet 2003 májusában átneveztek, s attól kezdve: Terrorism Information Awareness Program) keretében az EARS segítségével már képesek voltak beszédet szöveggé alakítani, majd a TIDES fejlesztéseivel lefordítani azokat angolra, ám ezek az eredmények már messze nem elegendőek a jelenlegi célok megvalósítására.

Általában az egész projektre, de magára a DARPA fejlesztési céljaira is jellemző, hogy a már meglévő kutatási eredmények koordinálásával, integrálásával képes nagy eredményeket elérni; a szervezettség és az összehangolás a legtöbbször minőségi ugráshoz vezet. A GALE esetében is az történik, hogy a felkért cégek külön-külön elért sikeres fejlesztéseit versenyeztetik, illetve fuzionáltatják, s a végeredmény a várakozások szerint egy szinte tökéletes rendszer lenne.

Mitől más a GALE?

A DARPA GALE programjának végső céljai:

  • Teljesen meg kívánják szüntetni a nyelvi nehézségeket, hogy a katonák az új szoftverek segítségével akadály nélkül kommunikálhassanak a szövetségeseikkel, az ellenséggel és a helyi lakossággal egyaránt.
  • A parancsnokok és elemzők minden idegen nyelvű információhoz hozzájuthassanak angolul.
  • A megszerzett dokumentumokat elolvashassák, illetve megfejthessék.
  • Segítsék a nyelvtanulást.

Az ez irányú programok már értek el eredményeket (például az eTap), de mindez még kevés, sok a hiányosság, integrálni és tovább kell fejleszteni ezeket.

A tolmács- és szövegelemző szoftverek kutatásának területén az eddig folytatott gyakorlat jellemzői voltak:

  1. A fejlesztések külön elemekben történtek.
  2. Statisztikai alapú fordítást végeztek.
  3. Az entitások kivonatolása és összegzése volt csak lehetséges.
  4. A hangsúly a nyelvészen és az elemzőn volt.
  5. A megvalósítás ösztönözte a további kutatásokat.

A jelenben és a jövőben, vagyis a GALE-projekt keretében:

  1. Magas szintű megvalósítás egyetlen integrált rendszer keretei között.
  2. A statisztikai és nyelvészeti alapú fordítás kombinálása.
  3. A releváns információk integrált kinyerése.
  4. A hangsúly a cselekvő katonán lesz.
  5. A megvalósítás és a hasznosság ösztönzi a további kutatásokat.

Ezen belül szisztéma a következő elemekből fog állni:

  • Nyelvelemző környezet (Language Exploitation Environment – LEE): integrált platform
  • Átíró motor: többnyelvű beszédből angol írott szöveg
  • Fordító motor: többnyelvű szövegből angol írott szöveg
  • Elemző motor: értelmezetten kereshetővé tett angol szöveg
  • Nyelvészeti adatok: eszközök és alapanyag a motorok számára
  • Értékelő eszközök fejlesztése

S mindez majd elvezethet egy roppant bonyolult struktúra kialakításához, melyet a Strukturálatlan Információk Feldolgozási Rendszere (Unstructured Information Management Architecture – UIMA) valósít majd meg, s ez lesz a megrendelő, a felhasználó számára igazán hasznos: a kimenő ponton az információra kíváncsi katonatiszt ma még elképzelhetetlen minőségű válaszokat kaphat. A várható lekérdezések, amelyekre e szoftvercsomagnak alkalmasnak kell lennie, a következő főbb elemekből fognak állni: életrajzok, állásfoglalások (vélekedések) összeállítása, (személyi és egyéb) viszonyok feltárása, bizonyos események bekövetkezésének, valószínűsíthető megtörténésének előrejelzése, gazdasági folyamatok elemzett megjelenítése.

Feladatok és fejlesztők

A hadsereg egyik sürgető igénye jelenleg: egy szoftver, amelyik figyeli a tévéadásokat, a telefonbeszélgetéseket, olvassa az arab vagy a kínai weboldalakat, és lefordítja ezeket angolra, összegzi a kulcsmomentumokat. A fejlesztési folyamatot három nagy munkafázisban fogják elvégezni, melyek különböző megoldandó feladatokra koncentrálnak: átírás/rögzítés, fordítás és szövegelemzés.



Az átírás fázisában a más nyelven elhangzott audioanyagokat angol szöveggé alakítják, fordításkor pedig az átírt szövegből olvasható, értelmes angol fordítást készítenek (közben ellátják jegyzetekkel: a szöveg forrása, témája, a szöveg nagyobb egységeinek megnevezése, az előforduló tulajdonnevek stb.). A szövegelemző egység keresi, összehasonlítja és integrálja a különböző forrásokból származó elemzett szövegeket, a megadott keresési akcióban megszünteti az ismétléseket és igyekszik kiszűrni a fontos információkat. Ez utóbbi, roppant érzékeny motornak kell képesnek lennie életrajzok összeállítására, össze kell tudnia foglalni egy szervezet történetét egy adott időszakban, vagy például egy adott személy adott témában történt megnyilatkozásait rendszerezett formában kell a keresést végző részére biztosítania.


 

A kutatásra 50 millió dollárt szánt a kormányzat három (de a sikerektől függően lehet, hogy csak két) évre. A három nagyon kívül 17 kisebb súlyú alvállalkozó is bekapcsolódott még a projektbe.



A DARPA a GALE fő fejlesztéseire három, a témában már nagy reputációval rendelkező vállalattal szerződött le, ezek: a BBN Technologies, az SRI International és az IBM Watson Research Center. Az őket támogató, és még mindig fontosnak számító 17 alvállalkozó a maga fejlesztéseivel vállalta feladatok megoldását, s mindegyikük egy-egy elemmel, egy-egy speciális feladat megoldásával veszi ki a részét a rendszer megalkotásából. A valós időben fordító szoftver létrehozását három kutatói csoportnak kell megoldania öt éven belül. A DARPA szigorú eredménycentrikusságából fakadóan minden évben értékelnek, majd a legrosszabbul dolgozó csapatot feloszlathatják, igen kedvezőtlen eredmények láttán esetleg az egész programot leállíthatják.



Ám a jelen projekt témájához értő kiváló szakemberből igen kevés van, ezért ezt a szokásos módszert nem valószínű, hogy alkalmazni fogják. A BBN elcsábított kutatókat a Cambridge Egyetemről, Maryland és Dél-Kalifornia egyetemeiről, még Franciaországból is. Az IBM a Carnegie Mellonról, a Johns Hopkinsról, a Brownról és a Stanfordról. Az SRI pedig Európából és Ázsiából, a Columbiáról, valamint Kalifornia és Washington állam egyetemeiről. Minden résztvevő és team egy bizonyos lépés kidolgozását végzi, roppant komoly szervezettség mellett: „Még soha nem dolgoztunk ilyen bonyolult projekten” – nyilatkozta idén áprilisban Owen Kimball, a BBN kutatója.

Kinek mije van, összeadják

A GALE röviden megfogalmazott konkrét célja, hogy 2010-re előállítsanak egy olyan szoftvert, mely valós időben, azonnal képes az arab és a kínai mandarin nyelvű szövegeket 90–95 százalékos pontossággal lefordítani. Előfordulhat, hogy ez nem is lehetséges – többek között az emberi nyelv és nyelvhasználat következetlenségei miatt, melyeket egy gépi „gondolkodásmóddal”, tehát algoritmusokkal leírni lehetetlen. A kutatók azonban egyelőre reménykednek: az első év célja, hogy az arab és a mandarin nyelvű beszédet 65 százalékos, az ugyanilyen nyelvű szövegeket pedig 75 százalékos pontossággal le tudják fordítani.

A GALE-projektbe való beszállása előtt a BBN azzal dicsekedett, hogy szoftverük képes a külföldi rádiók és televíziók hangzó szövegét 80 százalékos pontossággal lefordítani. Ám a DARPA követelményei magasabbak, ők nem csak a kifejezetten szépen és helyesen, jól artikuláltan beszélők szövegét akarják fordíthatóvá tenni, hanem az átlagemberét is. S ez már igen komoly feladat, hiszen számításba kell venni az egyéni hangképzést, a dialektusokat, az akcentussal beszélőket, a szlenget, a kötőszavak és toldalékok gyakori elhagyását a köznapi beszédben, s még ezernyi más, nem „szabályos” jelenséget. S arról még nem is szóltunk, hogy az arabot és a kínait jóval bonyolultabb és strukturáltabb nyelvnek tartják, mint az angolt.


Egy korábbi modell

A kutatók hatalmas adatbázissal dolgoznak, a meglévő hangzó és írott anyagot elemzik és elemeztetik a számítógépekkel, hogy minél több olyan szabályhoz, illetve esethez jussanak el, melyet be kell majd építeni a szoftverbe.

A három vezető kutatócsoport vezetői hetente találkoznak a munka koordinálása céljából, de magukat fejlesztéseket a cégek a saját laborjaikban, a saját, már meglévő technológiájuk segítségével végzik. Az IBM már részese volt a TIDES programjának – ennek gyakorlati eredménye is van már, nemrég írtunk a Mastor valós idejű, hangzó szöveget fordító tolmácsgép iraki főpróbájáról –, s most a GALE kapcsán a fordítás pontosságának javítását kell elérniük, illetve azt, hogy egy hatékony, a keresőkérdésekre releváns válaszokat produkáló szoftvert készítsenek. A BBN a beszédfelismerés és a hangzó szöveg átírása területén elért eredményei alapján jutott hozzá a Pentagon megrendeléséhez. Jelen esetben a feladatuk e két funkció magas szintű integrálása lesz. Mindkét cég közösen dolgozik olyan szemantikai modellek kimunkálásán, melynek segítségével a gépi fordítás által elkövetett hibákat mérsékelni tudják, s emellett rájuk vár annak megoldása, hogy az irreleváns információkat képesek legyenek az adott, feltett kérdéssel kapcsolatban kiszűrni.

Mennyi van még vissza?

A fordítói modul alapja a Language Weaver lesz, a Dél-Kaliforniai Egyetem Informatikai Intézetének fejlesztése, melyet már a TIDES programban is felhasználtak, ám ez még bőven tökéletesítésre szorul, mert a szóról szóra és a mondatról mondatra történő fordítás eddigi eredményei még messze vannak attól, hogy elemzésre alkalmas szövegeket adjanak. A Language Weaver kifejlesztői egy másik alkalmazást, a 2003-ban megjelent Statistical Machine Translation Software-t (SMTS) is bekapcsolták a kutatásba, s a BBN és az IBM közreműködésével igyekeznek egy sokkal magasabb színvonalú szoftvert kidolgozni.

A BBN tovább dolgozik a Broadcast Monitoring System médiafigyelő rendszerén, mely jelenleg a nemzetközi tévéadásokat képes kereshető módon archiválni s a Language Weaver segítségével az elhangzott szövegeket lefordítani. Egy alvállalkozó, a Language Computer feladata annak a kidolgozása, hogy a kérdéseket ne speciális formában, a keresőhöz hangolva kelljen feltenni, hanem „természetes” módon, ugyanúgy, ahogy azt társalgás közben tennénk, vagyis a szoftvernek meg kell értenie a hétköznapi angol nyelven feltett kérdéseket.


Ezek is feleslegesek lesznek

A csoportok júniusban, több ezer órányi hangzó anyag és több millió oldal arab és kínai nyelvű szövegoldal elemzése után lemérték, hogy hol tartanak. Az átlag pontosság 75 százalék lett a szövegek esetében, s 65 százalék a beszéd fordításánál. A BBN csoportja 75,3 százalékos eredményt produkált az arab nyelvű szövegek fordítása esetében, 75,2 százalékot a kínainál, 69,4 százalékos pontossággal fordították az arab hangzó szöveget, s 67 százalékosan a kínait. Az IBM az arab írott szövegek esetében nyújtott jobb eredményt, az SRI pedig a mandarin szövegfordításnál.


Egy hatvanhét százalékos megoldás

Ezek után jött az a teszt, amely már a mesterséges intelligenciát érintő kutatásokkal függ össze, hiszen olyan feladat elé állították a szoftvereket, mely már inkább sci-fibe illő. Ennek során kiegészítendő kérdéseket tettek fel a teamek egymás számítógépeinek, az adatbázisban lévő arab, kínai és angol nyelvű dokumentumok alapján. Például: Hogyan hatott Izraelre a Hamász választási győzelme? Vagy: Írd le a Kuvait elleni támadást! A válaszok még nem az igaziak…

Elég nyilvánvaló, hogy ezek a szoftverfejlesztések, ha megvalósulnak, mit jelenthetnek az üzleti és a hétköznapi élet területén. Ám, mint már annyiszor, nem ez az elsőrendű céljuk. Ez már nem egy fikciós, Orwell-féle Nagy Testvér lesz, hanem egy igazi.


Fontosabb, a cikkben nem említett források:

Dajkó Pál

  • Kapcsolódó cégek:
  • IBM

Előzmények