Suomeen havittellaan Euroopan nopeinta supertietokonetta

Osa Sisu-supertietokonetta

Mielikuvissa siintää visio, jonka mukaan Suomeen voisi syntyä yksi maailman johtavista datanhallinnan ja laskennan ekosysteemeistä. Se
houkuttelisi tänne muun muassa tutkimusinfrastruktuureja ja datakeskusinvestointeja. Tämä puolestaan lisäisi kotimaisen tutkimuksen kilpailukykyä, työllisyyttä ja talouskasvua.

Kyseessä on eurooppalainen suurteholaskennan yhteishanke, EuroHPC Joint Undertaking. Se on Euroopan unionin hanke, jonka ensimmäisenä, kunnianhimoisena päämääränä on hankkia Eurooppaan vähintään kaksi lähelle eksatasoa kurottavaa supertietokonetta vuoteen 2020 mennessä.

Eksataso tarkoitta sitä, että tietokoneen prosessorien laskentateho on vähintään yksi eksaflop. Tämä vastaa 1018 laskutoimitusta sekunnissa, eli sitä, että kone tekee miljoona miljoona miljoonaa laskua yhdessä sekunnissa.

Suomen tällä hetkellä ärein tietokone, CSC:n ylläpitämä Sisu kykenee teoreettisesti 1,69:n petaflopin laskentatehoon, mikä vastaa noin 0,00169 eksaflopia. Kyseessä on viime marraskuun tilaston mukaan maailman 267. tehokkain tietokone, kun tehokkain nyt Euroopassa oleva kone (maailman viidenneksi tehokkain) on sveitsiläisten Piz Daint, jonka teoreettinen huippulaskentateho on 0,027 eksaflopia.

Osa komeilla revontulikuvilla koristellusta Sisu-supertietokoneesta on otsikkokuvassa.

Nyt suunnitteilla oleva kone on siis suuri hyppäys ylöspäin ja auttaisi suurta laskentakapasiteettia tarvitsevaa tutkimusta. Monet tieteet käyttävät nykyisin simulointeja ja suurten, toisiaan täydentävien tietomassojen käsittelyä, mihin tarvitaan myös supertietokoneita.

Tutkimuksen ohella hanke on merkittävä suomalaiselle tietojenkäsittelyosaamiselle, sillä EuroHPC-supertietokoneen avulla Suomesta voisi tulla arktisen dataliikenteen globaali solmukohta. Järjestelmä sijoitettaisiin CSC:n Kajaanin datakeskukseen.

Iso, kallis ja tärkeä hanke

EU on budjetoinut EuroHPC-hankintoihin yhteensä noin 1,4 miljardia euroa. EU-komissio rahoittaa puolet EuroHPC:n superkoneiden hankinnasta. Toinen puolikas rahoituksesta tulee osallistuvilta mailta.

Tarvittava rahoitus riippuu konsortioon kuuluvien maiden määrästä ja esi-eksa-tason supertietokoneiden lukumäärästä, joita EU-komissio on kaavaillut olevan vähintään kaksi. Moni Euroopan maa näkee Suomen ihanteellisena sijaintipaikkana EuroHPC:n supertietokoneelle.

Päätökset EuroHPC:n ensimmäisten supertietokoneiden sijaintipaikoista tehdään kevään 2019 aikana.

Hakuprosessia varten ollaan muodostamassa laajapohjainen eurooppalainen konsortio, joka tukee esieksatason supertietokoneen sijoittamista Suomeen. Mukana konsortiossa ovat tällä hetkellä muun muassa Pohjoismaat ja Sveitsi.

"Tämä konsortio pystyy tarjoamaan laadukkaan, kustannustehokkaan ja laajapohjaiseen eurooppalaiseen yhteistyöhön pohjautuvan ekosysteemin, joka on myös ympäristöystävällinen", sanoo CSC:n toimitusjohtaja Kimmo Koski.

"Laitteistojen lisäksi tarvitaan korkeatasoista osaamista laskennasta datanhallintaan. Konsortion jäsenillä on vuosikymmenten kokemus tämän tyyppisten palveluiden tehokkaasta tuottamisesta. Suomelle EuroHPC-hanke on valtava mahdollisuus, joka tukee myös kansallista datanhallinnan ja laskennan kehittämishanketta ja vahvistaa kilpailukykyämme."

EuroHPC:n seuraavassa vaiheessa kehitetään eurooppalaista suurteholaskennan osaamista ja teknologiaa siten, että vuosien 2022–2023 aikana Eurooppaan on tarkoitus hankkia maailman nopeimpiin kuuluva eksatason tietokone, joka perustuu eurooppalaiseen teknologiaan.

*

Juttu on lähes suoraan CSC:n tiedote, jota on editoitu ja täydennetty.

Kajaaniin tulee kiihdyttämö

Tieteen tietotekniikan keskus CSC ja Kajaanin ammattikorkeakoulu aloittavat hankkeen, joka vauhdittaa data-analytiikan hyödyntämistä Kainuun alueen yrityksissä. Data-analytiikan kiihdyttämö -hankkeessa Kainuun alueella toimivat yritykset ja yhteisöt voivat nopeasti kokeilla mitä data-analytiikka voisi heille tarjota ja ottaa käyttöön analytiikkaan perustuvia ratkaisuja.

Datalähtöinen talous on jo nyt tuntuvaa bisnestä ja data-analytiikka, big data sekä tekoäly ovat keskeisiä keinoja kilpailukyvyn parantamiseen. Yrityksille kertyy paljon dataa esimerkiksi teknisistä prosesseista, antureista, tietojärjestelmistä ja asiakasrajapinnasta, ja tämän kaiken tiedon analysointi auttaa ymmärtämään ja ennakoimaan taustalla olevia ilmiöitä sekä riippuvuuksia.

Uudessa CSC:n ja Kajaanin ammattikorkeakoulun Data-analytiikan kiihdyttämö -hankkeessa innostetaan kainuulaisia yrityksiä ja yhteisöjä ottamaan käyttöön data-analytiikkaa.

CSC:n osaaminen perustuu pitkäaikaiseen kansalliseen toimintaan data-analytiikan parissa sekä laajaan kansainväliseen yhteistyöhön. Kajaanin ammattikorkeakoulu on puolestaan laajasti verkostoitunut paikallisten toimijoiden kanssa. KAMK auttaa CSC:tä löytämään oikeat paikalliset toimijat ja CSC auttaa KAMK:ia löytämään oikeat data-analytiikan ratkaisut.

Hankkeessa toteutetaan data-analytiikan pilottiprojekteja kolmen yrityksen kanssa sekä työpajoja 10 – 15 yrityksen kanssa. Lisäksi hankkeen viestintä tuottaa tietoa data-analytiikan mahdollisuuksista laajemmalle joukolle yrityksiä. Hankkeessa käynnistettävä data-analytiikan kiihdyttämö antaa tarvittavan alkusysäyksen uusien menetelmien käyttöönotolle, joka muuten vaatisi yrityksiltä merkittävää alkupanostusta ja osaamista.

Hanke saa rahoitusta Euroopan aluekehitysrahastolta. Hankkeen rahoitukseen osallistuvat myös alueen kunnat sekä hankkeeseen osallistuvat yritykset Loiste Oy, Kaisanet Oy ja Herman IT Oy.

Kajaani ei ole CSC:lle uusi tuttavuus, sillä muun muassa Suomen ärein tietokone, Cray XC -supertietokonejärjestelmään perustuva Sisu sijaitsee CSC:n Kajaanin datakeskuksessa, joka aloitti toimintansa vuonna 2013. Viimeisen vuoden ajan CSC on tuonut Kajaaniin myös data-analytiikan ympärille keskittyvää toimintaa.

"Pitkäaikaisena data-analytiikan kehittäjänä CSC:lle on syntynyt hyvä ja maanläheinen ymmärrys siitä, miten datasta jalostetaan tietämystä ja miten se tuodaan organisaation hyödyksi", toteaa kehityspäällikkö Aleksi Kallio CSC:n tiedotteessa.

"Nopeasti kehittyvällä alueella nousee koko ajan hyvin erilaisia ratkaisuja ja lupauksia, joten näemme, että meidän tehtävämme suomalaisessa yhteiskunnassa on tarjota laajempaa ja pidempää perspektiiviä data-analytiikan mahdollisuuksiin."

"KAMK on rakentanut strategiaansa älykkäiden ratkaisujen tukemiseen sekä niiden osaajien koulutukseen", kertoo puolestaan Kajaanin ammattikorkeakoulun rehtori Matti Sarén samaisessa tiedotteessa.

Data-analytiikan kiihdyttämö on merkittävä toiminto, jonka kautta yritysten on entistä helpompi hankkia osaamista dataintensiivisen liiketoiminnan kehittämiseen. KAMK on tuomassa koulutusohjelmiinsa data-analytiikan sekä insinööriosaamisen datan käyttämiseen liiketoiminnan perustana. Yhteistyö yritysten ja toimijoiden kanssa rakentaa vetovoimasta ja merkityksellistä koulutusta alalle sekä Kainuun että Suomen tarpeisiin.

*

Juttu on CSC:n tiedote hieman muokattuna. Otsikkokuvassa on Sisu-tietokone taannoisen päivityksen jälkeen, kuva: Susanna Salminen, CSC.

Supertietokone, joka toimi myös sohvana

Cray-sohva

Kuvassa näkyvää koneen vesijäähdytteistä keskusyksikköä ei olisi edes ymmärtänyt tietokoneeksi, vaan omituiseksi istuimeksi, mutta se edusti aikansa huippua.

Päivän kuvaKuvassa on 1970- ja 1980-lukujen klassinen supertietokone Cray, joka oli erikoisesti muotoiltu – kuten Cray-tietokoneet ovat aina olleet ja ovat edelleen.

Ensimmäinen tämänkaltainen kone oli Cray 1, joka esiteltiin vuonna 1976. Koneen suunnittelija oli jo aiemminkin suurten ja tehokkaiden tietokoneiden kanssa työskennellyt Seymour Cray, jonka ideana oli tehdä tietokoneesta hevosenkenkämäinen, missä osat olivat säteittäisesti toistensa ympärillä, koska silloin yhteys koneen osasta toiseen oli lyhyempi ja nopeampi kuin laatikkomaisissa, perinteisissä tietokoneissa.

Alla oleva kuva näyttäää Lausannen teknillisessä yliopistossa olleen koneen sisuskalut.

Cray avattuna

Cray-1 oli vallankumouksellinen tietokone, sillä se oli vuonna 1976 maailman nopein tietokone, maailman kallein tietokone sekä myös hinta/teho-suhteella laskettuna edullisin tietokone. Tutkijoiden lisäksi monet yritykset ostivat koneita käyttöönsä ja siitä tuli nopeasti suosittu.

Koneen kellotaajuus oli aluksi 80 MHz, mutta se saatiin myöhempinä vuosina nostettua 120 MHz:iin. Teoreettisesti se pystyi hetkellisesti 160 - 240 MIPSin laskentavauhtiin.

Huippunopeat kytkentäratkaisut vaativat huomattavan paljon sähköenergiaa, ja Cray-1:n tehontarve olikin noin 115 kilowattia. Tästä syntyi koneen toimiessa paljon hukkalämpöä, mistä johtuen koneessa oli fronia käyttänyt jäähdytysjärjestelmä ja jäähdytysnäkökohdat oli huomioitu erityisesti myös muotoilussa.

Massaa koneella oli noin 5,5 tonnia.

Tehon ja suorityskyvyn vertaaminen suoraan nykykoneisiin on hieman hankalaa, mutta karkeasti arvioiden vuonna 2013 esitelty iPhone 5S on on noin 10 000 kertaa tehokkaampi tietojenkäsittelylaite kuin oli Cray 1.

Suomessa luotettiin myös 1970- ja 80-luvuilla Cray-tietokoneisiin ja kuvassa olevan kaltainen kone Cray X-MP on esillä Jyväksylän yliopiston Agora-rakennuksessa Mattilanniemessä. Kiinnostavan tarinan koneesta ja sen käytöstä voi lukea Tieteen tietotekniikan keskuksen CSC:n nettisivuilta.

Myös nykyisin Suomen tehokkaimmat tietokoneet ovat Cray-koneita, tosin alkuperäinen yhtiö on tehnyt välillä konkurssin (koneet olivat kenties "liian" taiteellisia).

Vuonna 2013 avatussa CSC:n Kajaanin datakeskuksessa on Cray XC30 "Cascade" -malliin perustuva Sisu, joka jo kättelyssä oli noin kolme kertaa tehokkaampikuin edellisen sukupolven Suomessa ollut Cray-superkone (Louhi).

Seuraavana vuonna Sisu sai vielä lisää puhtia uusien prosessorien myötä ja nyt sen teoreettinen huipputeho on 1,7 petaflopsia eli 1,7 · 1015 liukulukulaskutoimitusta sekunnissa. Se oli vuonna 2014 Pohjoismaiden nopein supertietokone ja on edelleen eräs äreimmistä.

Konetta käyttävät mm. ilmaston, astrofysiikan ja nanotekniikoiden tutkijat, samoin materiaali- ja biotieteilijät sekä fuusioenergian ja uusiutuvien energiamuotojen tutkijat.

Otsikkokuva: Chilton Computing Lab

Uutta LHC-dataa ennnätysenergialla tulossa Suomeen

Cernissä, Genevessä on käynnistynyt LHC-hiukkastörmäyttimen (Large Hadron Collider) toinen mittausjakso entistä korkeammalla törmäysenergialla. Hiukkaskokeiden tarkoituksena on tuottaa tietoa aineen perusrakenteesta. Korkeampi törmäysenergia tarjoaa harvinaisen mahdollisuuden ymmärtää luonnon monimutkaisuutta ja löytää uusia hiukkasia. Fyysikoiden kokeet muodostavat myös suuren tietoteknisen haasteen maailmanlaajuiselle hajautetulle laskentajärjestelmälle Worldwide LHC Computing Grid (WLCG), jossa Suomi on aktiivisesti mukana.

LHC-hiukkastörmäyttimen, sen koeasemien ja hajautetun laskentajärjestelmän suorituskykyä on kasvatettu törmäyttimen 27 kuukauden pituisen huoltoseisokin aikana. Hiukkastörmäyttimen ensimmäisen ajojakson aikana vuosina 2010-2013 törmäysenergiassa päästiin arvoon 8 TeV (TeV = 1012 elektronivolttia). Silloin Cernissa taltioitiin noin 1 GB/s (GB = 109 tavua) mittausdataa, mutta nyt arvioidaan, että tallennusnopeus kasvaa arvoon 6 GB/s ja jopa siitä huippuarvoon 10 GB/s.

"Tämä tarkoittaa, että mittausdatan koko tulee olemaan useita kymmeniä petatavuja vuodessa", sanoo projektipäällikkö Dan Still CSC - Tieteen tietotekniikan keskus Oy:stä.  Yksi PB on yhtä paljon kuin 1015 tavua.

"Yksi petatavu vastaa noin 210 000 yksikerroksisen yksipuolisen DVD-levyn tallennustilaa".

Törmäysenergian arvolla 13 TeV saa ehkä lisää tietoa pimeästä aineesta

jakso käsittää vuodet 2015-2018. Ajossa protonit kiertävät kiihdytinrenkaassa vastakkaisiin suuntiin lähes valon nopeudella. Protonisuihkujen intensiteettiä kasvatetaan ajon aikana niin, että törmäystaajuus nousee miljardiin sekunnissa, ja törmäysenergiassa päästään arvoon 13 TeV.

"Törmäysenergian kasvu lisää harvinaisten hiukkasten tuottotodennäköisyyttä jopa kymmen-, sata- tai jopa tuhatkertaiseksi, mikä mahdollistaa uusien hiukkasten löytämisen", sanoo projektipäällikkö Tomas Lindén Fysiikan tutkimuslaitokselta.

Cernin ATLAS- ja CMS-kokeet ilmoittivat heinäkuussa 2012 uuden, noin 126 GeV painavan bosonin löytymisestä. Myöhemmin se vahvistettiin kauan etsityksi Higgsin bosoniksi. Nyt suurempi törmäysenergia ja korkeampi törmäystaajuus mahdollistavat myös Higgsin bosonin ominaisuuksien tarkan tutkimisen ja vertailun hiukkasfysiikan standardimallin kanssa.

Tutkimustyön yhtenä kiinnostavimmista tavoitteista on etsiä niin sanottuja supersymmetrisiä hiukkasia, joita teoria ennustaa.

"Tämä on kiinnostavaa koska, kevyin supersymmetriahiukkanen on yksi pimeän aineen kandidaateista", Lindén sanoo.

"Pimeän aineen osuus maailmankaikkeuden ainesisällöstä on noin 84,5 prosenttia, mutta siitä tiedetään vielä kovin vähän".

Suomi on liitetty pohjoismaiseen LHC-verkkoon nopeudella 10 Gb/s

Suomen laskentaresursseilla etsitään sähköisesti varattuja Higgsin hiukkasia ja tutkitaan b-kvarkkeja sekä lyijy-lyijy -törmäyksissä syntyvää kvarkki-gluoni -plasmaa. Maa on liitetty Pohjoismaiseen LHC-verkkoon nopeudella 10 Gb/s, ja nopeimmillaan dataa siirtyy Yhdysvaltojen Fermilabista Suomeen nopeudella 525 MB/s.

Fyysikot analysoivat LHC-törmäysdataa paikallisissa yliopistoissaan tai instituutioissaan ympäri maapallon käyttäen WLCG:n laskentaresursseja. WLCG:llä ajettavien analyysiohjelmistojen suorituskykyä on nyt kasvatettu. Myös grid-väliohjelmistoja on päivitetty, jotta tietovarastoja voidaan käyttää entistä joustavammin verkon yli.

Iso data-aineisto on hajautettuna verkostomaisesti eri keskuksiin

Cernissä käytettävä laskentamalli toimii niin, että raakadata esikäsitellään Cernissä ja Unkarissa niin sanotulla 0-tason resurssilla, josta se hajautetaan kolmeentoista eri maissa sijaitsevaan 1-tason keskukseen. Näiden tehtävänä on tallentaa ja käsitellä dataa sekä tarjota data-palveluja grid-laskentamenetelmiä käyttäen Cernille sekä pienemmille 2-tason keskuksille, joiden tehtävänä on tarjota levytilaa sekä edellytykset simulaatioille ja data-analyyseille.

Nordic e-Infrastructure Collaboration (NeIC) tarjoaa yhden pohjoismaisen 1-tason resurssin. Tämä resurssi on hajautettu Suomeen, Ruotsiin, Norjaan ja Tanskaan. CSC - Tieteen tietotekniikan keskus Oy ylläpitää Suomen osuutta tästä hajautetusta resurssista. Mukana resurssin toiminnassa on myös Fysiikan tutkimuslaitos (HIP). Tämän lisäksi Suomessa on myös 2-tason resurssi, joka on toteutettu HIP:in ja CSC:n yhteistyönä.