Arvutuskeskus teeb teadlaste töö lihtsamaks
Kaheksa aastat on Tartu ülikoolis tegutsenud teadusarvutuste keskus, mis aitab kiiresti andmeid töödelda. See hoiab kõvasti aega kokku ja lihtsustab teadlaste tööd.
Tartu ülikooli teadusarvutuste keskus on Tartu ülikooli konsortsium, mille eesmärk on arendada välja teadusarvutuste tegemiseks vajalik arvutisüsteem ning juhtida süsteemi kasutust. Arvutusressurss on avatud kasutamiseks kõigile ülikooli uurimisrühmadele, oodatud on kasutajad ka teistest Eesti teadus- ja arendusasutustest.
Teadusarvutuste keskuse ruumides on suured masinad, mis mürisevad koledal kombel. Kaua selle lärmi sees ilmselt olla ei suudaks ja pole ka vaja. Tartu teadusarvutuste keskuse juht Ivar Koppel rääkis, et masinaparki käiakse vaatamas umbes kord kuus. Seda, kas kõik toimib ikka nii nagu vaja, saab jälgida ka igalt poolt mujalt arvutist ning selleks ei pea kohapeal olema. Arvutist on võimalik vaadata, kuidas tööd käivad, ja kui kellegi töö on katki läinud, siis on seda kohe näha. Suuremate probleemide korral, mis tervet serveriparki ohustavad – nagu näiteks jahutuse rike – oskab süsteem ise haldajatele helistada.
Arvutuskeskus loodi 2008. aastal sellepärast, et ülikoolis oli vaja teha pidevalt erinevaid arvutusi. Sageli tehti seda aga nii, et osteti mõned arvutid ja pandi keegi neid haldama, ning siis kuluski suur osa ajast arvutite haldamisele. «Meil on siin tihtipeale nii olnud, et teadlaste jaoks on vaja mingi programm käima panna ja sellega on nädal aega vaeva nähtud. Kui teadlane tegeleb nädal aega mingisuguse asja installeerimisega, siis see ei ole hea,» rääkis Koppel.
Kasu saab arvutuskeskusest praktiliselt kogu ülikool. Peamised kasutajad on geenivaramu ning loodus- ja täppisteaduste valdkonna teadlased, aga seda kasutavad ka keeleressursside keskuse inimesed, kellel on oma keelepangad. Peale nende on kasutajate hulgas ka näiteks sotsioloogia- ja majandusinimesi. Isegi Viljandi kultuuriakadeemia saadab oma back-up’e arvutuskeskusesse. Üleülikooliliste teenustena võib veel nimetada videoloengute süsteemi Panopto ja majutuse pakkumist ülikooli Owncloudile.
Arvutuskeskus on mõeldud kasutamiseks ka väljaspool ülikooli. Kasutama on oodatud nii teadusarenduskeskused kui ka erinevad ettevõtted.
«Aga me natuke ikka vaatame ka, kas tegu on mõne teadusteemaga või tahab keegi hakata e-poodi või veebimajutust siin pidama. Viimaseid me ilmselt ei võta enda alla. Keskus on mõeldud teaduse jaoks,» sõnas Koppel.
Tehakse koostööd
Koppel rääkis, et on olemas selline organisatsioon nagu Eesti teadusarvutuste infrastruktuur ehk ETAIS, kuhu kuuluvad Tartu ülikool, Tallinna tehnikaülikool, keemilise ja bioloogilise füüsika instituut (KBFI) ja Eesti hariduse ja teaduse andmesidevõrk (EENet).
Omavahel tehakse koostööd ja kuigi TTÜ-l on oma keskus, arvutavad nad praegu palju ka Tartu ülikooli omas, sest siinne on kiirem.
Aga teadusarvutuste keskust on kasutanud ka asutused ja ettevõtted mujalt. Koppel usub, et kui inimene on oma õpingute või töö jooksul Tartu ülikoolis midagi arvutanud ning kui minnakse kusagile firmasse tööle, kus on vaja midagi taolist teha, siis tuleb neile meelde, et ülikoolis sai andmeid kiiresti analüüsida.
Praegu on masinad sada protsenti hõivatud ja igal pool on järjekorrad. Need pole küll pikad: päev või paar tuleb oodata, kui on soovi palju andmeid korraga analüüsida.
Koppel rääkis, et vahepeal olid segased lood rahastusega. «Klister sööb 70 000 euro eest aastas elektrit,» lausus ta. Kui alguses rahastati keskust keskselt ja kõik arvutasid nii palju, kui jõudsid, ning keskus töötas kogu aeg täiskoormusel, siis mingist hetkest hakati iga töö eest lõppkasutajalt raha küsima. Niisugune korraldus aga ei meeldinud kasutajatele ja Koppeli sõnul tappis see arvutamiskeskuse ära.
Kuna ülikoolis olid olemas vanad klastrid, mis arvutasid 20 korda aeglasemalt, aga olid tasuta, siis hakati neid kasutama. «Ülikoolile tervikuna oli see ilmselt 20 korda ebatõhusam,» lausus Koppel.
Nüüdseks on aga rahastamissüsteemi jällegi muudetud. Lisaks ülikoolipoolsele kesksele rahastusele annavad osa rahast huvitatud valdkonnad, kes masinaid pidevalt kasutavad.
Küsimusele, kui kiiresti masinad andmeid töötlevad, vastas Koppel, et see oleneb tööst, mida on vaja analüüsida. «On töid, mis tehakse sekundiga ära.»
Koppel rääkis, et tema ise on keemia taustaga ja neil oli kunagi vaja arvutada molekuli omadusi. See töö võttis aega ligi aasta.
«Samal ajal palvetad kogu aeg, et midagi ei juhtuks. Et vool ei läheks ära. Et masin ei läheks kuumaks ja arvutus käiks ikka lõpuni,» sõnas ta. Ta toob näiteks ka lihtsa arvestuse: kui millegi arvutamiseks kulus muidu aasta, siis nüüd toimub see kakskümmend korda kiiremini ehk vähem kui kuuga saab valmis. Seda juhul, kui arvutamine toimub ühe arvuti peal. Kui teha mitme arvuti peal, siis saab ka päevaga hakkama.
Koppel mainis, et kogu asja juures pole üldse vähemtähtis see, et neil on olemas kogemused, kuidas tööd käivad ja mis võiks pudelikaelaks osutuda. «Nii on mõnigi kord puhtalt algoritmi veidi muutes mõni töö paarkümmend korda kiiremini tööle saadud,» rääkis ta.
Peale klassikalisele teadusarvutusele on nüüd võimalik kasutada ka teaduspilve, mis võimaldab kõigil lihtsalt käivitada just oma käe järgi tehtud rakendusi.
Tulevikuplaanidest rääkides ütles Koppel, et keskust tuleks jätkuvalt suurendada. Ilmselt see laienebki, kui valmib uus IT maja. «Üldiselt me peame kasutajate järgi vaatama, mida nad teha plaanivad, ja ka ise seeläbi ettenägelikumad olema.»
Praeguseks on geenivaramu 2000 inimese andmed ära sekveneerinud ja selleks on vaja poolt kettakasti. Aga kui nad järgmiseks tahavad ülejäänud 45 000 inimese andmeid sekveneerida, siis selleks on vaja viis korda rohkem kettapinda kui on täna, ja niisuguste nõuetega tuleb kaasa minna.
Peale selle tuleb kohe ka keskusesse uus lindirobot. Kui praegu on taristus kolm petabaiti (üks petabait on miljon miljardit baiti ehk sama palju teavet, kui sisaldub 4,7 miljardis raamatus), siis lindirobotil on 30 petabaiti. Sinna lähevad kõik ülikooli back-up’id ja ka harvemini kasutatavad andmed kolivad kõvakettalt lintidesse.
Kõvaketta põhiprobleem on tema kallidus, just pikemaajaliste andmete hoidmisel tekkivad püsikulud. Kõvaketastel on pöörlevad osad: umbes tuhat ketast käib ringi ja need võtavad kõvasti voolu.
Lindimasin aga ei võta praktiliselt üldse voolu: ta tarbib 200 vatti, mis on kaks elektripirni. Lisaks töötab lindimasin sama kiiresti. «Ma olen mitmel pool rääkinud, et kasutame linti, kuid siis kõik ütlevad, et see on 1960. aastatest. Ei ole,» lausus Koppel.
Töötab elektriga
Enam-vähem kogu arvutuskeskus töötab elektri peal, aga isegi, kui elekter peaks ära minema, ei juhtu midagi, sest on olemas UPS-id ja generaatorid. Generaaatoril peaks olema kolme päeva kütusevaru ja on olemas ka leping, et kui kütus otsa saab, tuleb firma ja täidab generaatori uuesti.
Koppel mainis, et ETAIS-i olemasolu on hea, sest koolidevaheline koostöö lihtsustab tegevust. Nii ei pea ka iga kool endale oma eripärast riistvara ostma, vaid saadakse üksteise omi kasutada.
«Kui keegi ostab endale 3D-printeri ja me tahame midagi printida, siis saame seda ju ka Tallinnas teha ja nemad saadavad selle meile postiga. Niisugune lahendus on hea, selle asemel et osta mingi asi, mida kasutatakse kord kuus. Koostöö tõesti toimib ja jalgratta leiutamist pole,» lausus Koppel.
Sandra Saar
UT toimetaja
sandra.saar [at] ut.ee
Lisa kommentaar