GALE: A Nagy Testvér bölcsője az USA-ban

Feladatok és fejlesztők

A hadsereg egyik sürgető igénye jelenleg: egy szoftver, amelyik figyeli a tévéadásokat, a telefonbeszélgetéseket, olvassa az arab vagy a kínai weboldalakat, és lefordítja ezeket angolra, összegzi a kulcsmomentumokat. A fejlesztési folyamatot három nagy munkafázisban fogják elvégezni, melyek különböző megoldandó feladatokra koncentrálnak: átírás/rögzítés, fordítás és szövegelemzés.



Az átírás fázisában a más nyelven elhangzott audioanyagokat angol szöveggé alakítják, fordításkor pedig az átírt szövegből olvasható, értelmes angol fordítást készítenek (közben ellátják jegyzetekkel: a szöveg forrása, témája, a szöveg nagyobb egységeinek megnevezése, az előforduló tulajdonnevek stb.). A szövegelemző egység keresi, összehasonlítja és integrálja a különböző forrásokból származó elemzett szövegeket, a megadott keresési akcióban megszünteti az ismétléseket és igyekszik kiszűrni a fontos információkat. Ez utóbbi, roppant érzékeny motornak kell képesnek lennie életrajzok összeállítására, össze kell tudnia foglalni egy szervezet történetét egy adott időszakban, vagy például egy adott személy adott témában történt megnyilatkozásait rendszerezett formában kell a keresést végző részére biztosítania.


 

A kutatásra 50 millió dollárt szánt a kormányzat három (de a sikerektől függően lehet, hogy csak két) évre. A három nagyon kívül 17 kisebb súlyú alvállalkozó is bekapcsolódott még a projektbe.



A DARPA a GALE fő fejlesztéseire három, a témában már nagy reputációval rendelkező vállalattal szerződött le, ezek: a BBN Technologies, az SRI International és az IBM Watson Research Center. Az őket támogató, és még mindig fontosnak számító 17 alvállalkozó a maga fejlesztéseivel vállalta feladatok megoldását, s mindegyikük egy-egy elemmel, egy-egy speciális feladat megoldásával veszi ki a részét a rendszer megalkotásából. A valós időben fordító szoftver létrehozását három kutatói csoportnak kell megoldania öt éven belül. A DARPA szigorú eredménycentrikusságából fakadóan minden évben értékelnek, majd a legrosszabbul dolgozó csapatot feloszlathatják, igen kedvezőtlen eredmények láttán esetleg az egész programot leállíthatják.



Ám a jelen projekt témájához értő kiváló szakemberből igen kevés van, ezért ezt a szokásos módszert nem valószínű, hogy alkalmazni fogják. A BBN elcsábított kutatókat a Cambridge Egyetemről, Maryland és Dél-Kalifornia egyetemeiről, még Franciaországból is. Az IBM a Carnegie Mellonról, a Johns Hopkinsról, a Brownról és a Stanfordról. Az SRI pedig Európából és Ázsiából, a Columbiáról, valamint Kalifornia és Washington állam egyetemeiről. Minden résztvevő és team egy bizonyos lépés kidolgozását végzi, roppant komoly szervezettség mellett: „Még soha nem dolgoztunk ilyen bonyolult projekten” – nyilatkozta idén áprilisban Owen Kimball, a BBN kutatója.

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • IBM

Előzmények