GRID-csúcs Budapesten az EGEE jegyében

Európai GRID-csúcs Budapesten

A globális méretű elosztott informatikai rendszerek kialakulásában egyre nagyobb szerepet játszanak a robbanásszerűen fejlődő adatátviteli megoldások, ahol ma már megoldhatóvá válik az erőforrások és a szolgáltatások jelenleginél hatékonyabb működtetése. A felhasználók számára az informatikai alkalmazásoknál hasonló lehetőségek nyílnak meg, mint például az elektromos hálózatok esetében: az igények és a kapacitások kiegyenlítődhetnek. Az elosztott informatikai rendszerek szolgáltatásszemléletű átalakulása napjaink kihívása.

Jövő héten Budapest lesz a házigazdája az Európai Unió egyik kiemelt kutatás-fejlesztési konferenciájának, ahol a Grid rendszerekről tanácskozik majd az 50 országból érkező több mint 600 kutató. Az EGEE’07 rendezvényt a Budapesti Műszaki és Gazdaságtudományi Egyetem – mint a projekt egyik résztvevő intézménye – rendezi. Dr. Szeberényi Imrét a BME IIT docensét, a BME IK igazgatóhelyettesét, a konferencia főszervezőjét kértük meg, beszéljen nekünk kicsit a Gridről és a jövő heti konferencia programjáról.

Mi a lényege és mik a fontosabb céljai az EGEE-projektnek?

Az első fázis, amely 2004 és 2006 között zajlott, az infrastruktúra kiépítését, a napi 24 órás üzemeltetés feltételeinek megteremtését és az alkalmazások fejlesztésének támogatását tekintette legfontosabb célnak. Egyik fontos eredménye a gLite köztesréteg, mely integrálja a korábbi fejlesztések eredményeit és a korszerű web technológia lehetőségeit.

A 2008-ban záruló második fázis már az alkalmazások fejlesztését, a rendszer folyamatos üzemeltetését és a rendszer előnyeinek széles körű megismertetését, valamint az infrastruktúra további bővítését tűzte ki célul. Jelenleg már 50 ország 243 helyszínének – tárolási és számítási – erőforrásai érhetők el. A pár perccel ezelőtt készült statisztika több mint 40 ezer CPU-t és 10 petabájt tárolókapacitást jelzett a rendszerben.


Áttekintés az LCG által kiosztott feladatokról – (c) CERN

Nagyon fontos kiemelni a célok közül az ipari felhasználás támogatását, a Grid technológia ipari elterjesztését. Ezért a projekt rendszeresen szervez szerte a világon úgynevezett ipari napokat és felhasználói fórumokat, ahol fontos szereplők az ipar szakemberei. Így a fejlesztők és az üzemeltetők közvetlen visszacsatolásokat is kapnak a felhasználóktól.

Röviden válaszolva: a legfontosabb cél a jelenleg működő rendszer fenntartása, bővítése, az alkalmazási területek növelése, valamint a technológia átadása az ipar számára.

A magyarok milyen területeken kapcsolódnak a programhoz?

Négy fő terület emelhető ki: az alkalmazásfejlesztés támogatása, illetve maga az alkalmazásfejlesztés, az eredmények széles körű megismertetése, az oktatás és az erőforrásokhoz való hozzájárulás. A jelenlegi konferencia megrendezési lehetősége mindenképpen elismerés a magyar résztvevők (a BME, az ELTE, a KFKI, a NIIF és a SZTAKI) számára. Ez azt mutatja, hogy Magyarország időben kapcsolódott be a Grid technológia kutatásába. Szerénytelennek hangzik, de biztosan mondhatom: ott vagyunk az élvonalban. Úgy gondolom, hogy az évtized elején e célra adott állami támogatások mostanra értek be.


A BME Információtechnológiai Innovációs és Tudásközpontban a HP-val közösen a Grid és egy skálázható tároló rendszer, az SFS (Scalable File Share) összehangolásán dolgoznak. Milyen konkrét feladatokra kell itt gondolnunk?

A nagy kapacitású, skálázható tárolórendszerek üzemeltetése, tervezése számos olyan problémát vet fel, ami Grid környezetben is felvetődik. Kísérletünk célja a válaszok keresése ezekre a kérdésekre. Ilyen például, hogy hogyan lehet hatékonyan és gyorsan nagyméretű fájlrendszereket szinkronozni. Kezdetben az EGEE tárolórendszere és a nálunk elhelyezett SFS összekapcsolását végeztük el, mára azonban előtérbe került a szinkronozás kérdése.

 

Webes kapcsolatok

Hogyan kapcsolódik a Grid a webtechnológiához?

Technikai megközelítésben azt kell mondani, hogy a ma megvalósított Grid rendszerek nagy része a web technológiájára épülnek, vagy éppen annak felhasználásával fejlődnek tovább. Itt elsősorban a web-szervizre, illetve a hozzá kapcsolódó technológiára kell gondolni, melyek lényege, illetve célja éppen a különböző számítógépes hálózatokon elérhető szolgáltatások egységes elérése és összekapcsolása, azok együttműködésének lehetővé tétele. A webtechnológia tehát ilyen szempontból a Grid rendszerek alapja, fontos technológiai eleme. A Grid ezeket a szolgáltatásokat/erőforrásokat egységes felületen, megfelelő biztonsággal nyújtja a felhasználók rendelkezésére. Ugyanakkor meg kell jegyezni, hogy nem csak webtechnológiával valósíthatók meg a különféle Grid rendszerek.

A funkcionalitás oldaláról vizsgálva a web az információk megosztására és összekapcsolására jött létre, a Grid rendszereket viszont az erőforrások megosztására és összekapcsolására találták ki. Hangsúlyoznom kell, hogy nem csak a számítási kapacitást tekinthetjük erőforrásnak, hanem bármilyen számítógépes kapacitást (pl. tárolási kapacitást), szolgáltatást, de esetenként még egy számítógéphez kapcsolt nagy értékű műszer (például űrteleszkóp, részecskegyorsító) adatait is ide sorolhatjuk.

Mind a webrendszerek, mind pedig a Grid kezdetben akadémiai környezetből – az ipar teljes közönye mellett – indultak és fejlődtek. Ezért sokan párhuzamot vonnak a két rendszer között e szempontból is, figyelmeztetve arra a tényre, hogy azok a cégek, akik időben felismerték a webtechnológiában rejlő lehetőségeket, hatalmas karriert futottak be mára, mások viszont lemaradtak.

Személy szerint azt gondolom, hogy a webtechnológia az IT-világ univerzális ragasztója – „Technocol Rapidja” –, ami képes összeragasztani és felhasználói szempontból egységessé formálni a legkülönbözőbb rendszereket.

A Gridnél sokszor előjön a VO fogalma. Mit jelent ez a rövidítés?

A VO a "virtuális szervezet" angol nyelvű változatának (Virtual Organization) a rövidítése. A Grid rendszerekben a felhasználókat úgynevezett virtuális szervezetekbe csoportosítják. Egy virtuális szervezet többnyire egy kutatói témaközösséget jelent, és alapvetően meghatározzák, hogy milyen erőforrásokat érhetnek el a közösség tagjai. A VO fontos fogalom, ugyanis egy ilyen nagy rendszerben igen sok felhasználó lehet, és elképzelhetetlen, sőt kivitelezhetetlen lenne, hogy mindenkinek legyen belépési lehetősége és jelszava minden egyes gépre.

Hogyan történik a programok indítása egy Grid rendszerben?

Amikor egy programot el akarunk indítani, először a megfelelő virtuális szervezetnél azonosítanunk kell magunkat. Sikeres azonosítás után a programunkhoz már csak az rendelődik hozzá, hogy melyik VO-hoz tartozik. A rendszer erőforrásai pedig (a 40 ezer CPU) csupán azt ellenőrzik, hogy az adott VO-t kiszolgálhatják-e vagy sem. Így aztán az általam indított program egy virtuális felhasználói név alatt fut mondjuk a Berkely Egyetemen, ahová már nem kell részemről belépési jogosultság, csupán az, hogy az én VO-mat az a gép kiszolgálhassa. Persze a rendszerbe számos helyen biztonsági ellenőrzések sorát építették be, de most nem ez a lényeg (persze fontos szempont a biztonság is), hanem a hozzáférés egyszerűsége. Jelenleg az EGEE hihetetlenül nagy erőforrástömegét közel 100 virtuális szervezet alkalmazásai használják.

 

Alkalmazások az EGEE infrastruktúráján

Milyen alkalmazásokat támogat jelenleg az EGEE?

A részecskefizikai kutatás a kezdetektől az egyik kiemelt terület, és a továbbiakban is fontos alkalmazása lesz az EGEE infrastruktúrájának. Az EGEE infrastruktúra nagyenergiás fizikai kísérletekben (HEP) történő felhasználása alapvető visszacsatolást jelent a fejlesztőknek. Az EGEE HEP (High Energy Physics) kutatóközösség a svájci Genf melletti CERN (European Organization for Nuclear Research) területén épülő LHC (Large Hadron Collider) kísérletei során alakult ki. Ez négy – méreteiben is hatalmas – kísérleti (ALICE, ATLAS, CMS és LHCb) berendezés megépítését jelenti, melyek 2008-tól várhatóan évi 15 petabájt mennyiségű adatot fognak generálni, s mindezt az EGEE infrastruktúra segítségével terveznek kezelni és feldolgozni.

Más nemzetközi HEP kísérletekben is felhasználják az EGEE infrastruktúráját, ilyen például a BABAR (B and B-bar), a CDF (Collider Detector at Fermilab) és a DO kísérletek, melyek egy amerikai részecskegyorsító adatait elemzik, vagy a ZEUS, H1 kísérletek, melyek a HERA gyorsítót (DESY laboratórium, Németország) használják.

A részecskefizikai alkalmazásokhoz hasonlóan már a projekt kezdete óta folynak orvosbiológiai kutatások is az EGEE-infrastruktúra felhasználásával. A földrajzilag is elosztott EGEE-rendszerben jelenleg 23 darab nagy számítási kapacitást igénylő orvosbiológiai alkalmazás fut. Ezek között megtalálható az orvosi képfeldolgozás, a bioinformatika és a gyógyszerkutatás is. Az orvosbiológiai felhasználások között kiemelkedik a WISDOM alkalmazás, melyet már több gyógyszerkutatási feladatban eredményesen alkalmaztak, így például bevetették már a malária és a madárinfluenza elleni harcban is.

A légkör- és asztrofizikai alkalmazások területén két VO-t érdemes kiemelni: Mind a Planck, mind a MAGIC nagy mennyiségű adat feldolgozását, illetve tárolását végzi. A Planck műhold feladata a mikrohullámú atmoszféra feltérképezése egyedülálló légkör- és frekvencia-lefedettséggel, pontossággal, stabilitással és érzékenységgel. A műholdat 2008-ben indítja útjára az ESA (European Space Agency). A MAGIC alkalmazás a nagy energiájú kozmikus sugárzásból származó atmoszferikus zápor viselkedését szimulálja. Ezek a szimulációk a MAGIC teleszkóp adatainak analizálásához szükségesek. A Kanári-szigeteken telepített műszer a nagyenergiájú gammasugarak tulajdonságainak és eredetének tanulmányozását szolgálja.

A Földkutatás eltérő tudományok széles skáláját fedi le: a szeizmikus mozgások, a levegő, az óceánok és felületük, a bolygó légköre és magja mind ide sorolandó. Az ESR virtuális szervezet földrengések elemzésén dolgozik, így segítve a tudósokat e pusztító természeti katasztrófák alaposabb megértésében.

Az EGEE első ipari alkalmazásának, az EGEODE (Expanding GEOsciences on Demand) virtuális szervezetnek területe a földtudományokhoz szorosan kapcsolódó geofizika. A Compagnie Générale de Géophysique társaság kezdeményezéséből létrejött EGEODE VO segítségével a kutatók elérhetik és használhatják a társaság Geocluster szoftverét az EGEE infrastruktúráján.

A fúziós kutatások támogatására is több alkalmazás áll a kutatók rendelkezésére: sugárkövetési módszer a plazmában terjedő mikrohullámú sugárzás pályájának becsléséhez; speciális mágneses behatároló fúziós eszközök (stellarátorok) kinetikus transzportja és optimalizációja. A sikeres próbák után számos, az ITER (International Thermonuclear Experimental Reactor) projekthez kapcsolódó számítási feladatot is áttelepítettek az EGEE-infrastruktúrára.

A számítógépes kémia legfőbb képviselője a Gridben a GEMS, a priori molekuláris szimuláció. Jól alkalmazhatók a Griden a kémiai reakciók jelenségének számítását, a komplex rendszerek molekuláris dinamikájának szimulációját, valamint a molekulák elektromos struktúrájának számítását végző alkalmazások.

Végül megemlítem még a pénzügyi és multimédiai alkalmazásokat is, ezek az EGEE legújabb jövevényei. A multimédia alkalmazások jelenleg tesztelés alatt állnak az EGEE GILDA környezetében. A pénzügyi alkalmazások az Abdus Salam International Centre for Theoretical Physics intézménnyel való közös munka gyümölcsei.

Kapcsolódó, illetve együttműködő projektekre is tudunk példát mondani?

Az EGEE sok európai kötődésű vagy nemzeti projektet indukált, melyek az EGEE köztesrétegét vagy infrastruktúráját kívánják használni. Így például a DILIGENT projekt digitális könyvtárak létrehozásához és karbantartásához fejleszt Grid-szoftvert. A DEGREE projekt a Földtudománnyal kapcsolatos kutatások és a Grid-technológiák összekötésén fáradozik. A GRIDCC célja a műszerek Gridbe integrálása. A BeinGrid projekt célkitűzése a Grid-technológiák befogadásának segítése több üzleti megvalósításból származó tapasztalat alapján, és egy Grid köztesréteghez tartozó eszköztár létrehozása.

 

Konferencia Budapesten

A jövő heti budapesti konferencia programjáról is ejtsünk szót! Milyen témájú előadásokra lehet számítani?

Az előadásokat négy fő téma köré csoportosítottuk, melyek a konferencia öt napján hol plenáris, hol pedig szekció előadás formájában vonulnak végig:

  1. Az üzleti témacsoport már tavaly, Genfben is nagy sikert aratott. Ebben az évben megújulva próbálja bemutatni az üzleti közönség számára, hogyan profitálhatnak a Grid technológiákból, valamint, hogy adaptálhatják azokat.
  2. Az alkalmazások vonulat főként technológiai előadásokat tartalmaz, melyek bemutatják azokat a módszereket, amelyek a legjobban alkalmazhatóak az EGEE infrastruktúráján, valamint rámutatnak az alkalmazási nehézségekre is. Ez részben visszacsatolása az EGEE projekt második felhasználói fórumán elhangzottaknak. A vonulathoz kapcsolódó demonstrációs szekcióban összesen 13 projekt mutat be működés közben valós Grid alkalmazást. Ezen kívül 40 poszter segítségével további alkalmazási példákat, illetve fejlesztési eredményeket ismerhet meg a látogató.
  3. A harmadik vonulat az együttműködő projektek vonulata. A budapesti konferencián közel 30 együttműködő projekt képviselteti magát kiállítással és bemutatkozó előadással. Igen büszke a projektvezetés, hogy nagy számban indukált további Grid projekteket, melyek többségét – az EGEE-hez hasonlóan – az Európai Bizottság is támogatja.
  4. A negyedik vonulat az EGEE projekt saját belső részprojektjeinek áttekintése. Ez az EGEE-infrastruktúra fejlesztésével kapcsolatos technikai és a projekttel kapcsolatos adminisztratív előadásokat fedi le. Bizonyára szó esik az infrastruktúra fenntarthatóságáról, a nemzeti Grid iniciatívák szerepéről, és a jelenlegi konzorciumi partnerek többsége által nemrégiben beadott újabb pályázatról.

Az EGEE projekt elsődleges célja tehát, hogy egy kiforrott szolgáltatásokat nyújtani tudó Grid-infrastruktúrát biztosítson az európai és más kontinensek kutatói hálózatai számára. A projekt keretében az akadémiai és ipari kutatóknak jelenleg már több mint 40 ezer számítógép erőforrása érhető el, a földrajzi elhelyezkedéstől függetlenül a nap 24 órájában, s ezek az erőforrások elosztottan helyezkednek el a világ számos országában. Ez az infrastruktúra már most átlagosan körülbelül 30 ezer konkurens feladat futtatását és több mint 10 petabájtnyi adat tárolását teszi lehetővé. Pedig a projekt még csak a félidejénél tart…

Krasznay Endre

* * *

A téma iránt érdeklődőknek javasolt weboldalak:

www.eu-egee.hu/egee07 - www.eu-egee.org/egee07

www.gridcafe.eu-egee.hu

Azóta történt

  • Kapcsoljuk a CERN-t

    A világ legnagyobb részecskefizikai laboratóriumában jártunk egy HP-switch bemutatóján.

Előzmények