Mēs jau zinām, ka lielais hadronu sadursme (LHC) būs lielākais, dārgākais fizikas eksperiments, ko jebkad ir veikusi cilvēce. Relativistisko daļiņu sadursme ar enerģijām, kuras iepriekš nebija iedomājamas (līdz desmit TeV atzīmei līdz desmitgades beigām), radīs miljoniem daļiņu (zināmas un vēl atklājamas), kuras nepieciešams izsekot un raksturot ar milzīgiem daļiņu detektoriem. Šim vēsturiskajam eksperimentam būs nepieciešami lieli datu vākšanas un glabāšanas centieni, pārrakstot datu apstrādes noteikumus. Ik pēc piecām sekundēm LHC sadursmes ģenerēs DVD vērtības vērtībā ekvivalentu, tas ir, datu ieguves ātrums ir viens gigabaits sekundē. Raugoties perspektīvā, vidusmēra sadzīves dators ar ļoti labu savienojumu var lejupielādēt datus ar ātrumu viens vai divi megabaiti sekundē (ja jums ir ļoti paveicies! Es saņemu 500 kilobaitus sekundē). Tātad LHC inženieri ir izstrādājuši jauna veida datu apstrādes metodi, kas var saglabāt un izplatīt petabati (miljoni gigabaitu) datu LHC līdzstrādniekiem visā pasaulē (nenovecojot un kļūstot pelēkam, gaidot lejupielādi).
1990. gadā Eiropas Kodolpētījumu organizācija (CERN) mainīja mūsu dzīves veidu. Iepriekšējā gadā CERN fiziķis Tims Berners-Lī uzrakstīja priekšlikumu elektroniskai informācijas pārvaldībai. Viņš izvirzīja ideju, ka informāciju varētu viegli pārsūtīt internetā, izmantojot kaut ko, ko sauc par “hipertekstu”. Laikam ejot, Berners-Lee un līdzstrādnieks Roberts Kailliau, arī CERN sistēmu inženieris, izveidoja vienotu informācijas tīklu, lai palīdzētu CERN zinātniekiem sadarboties un dalīties ar informāciju no personālajiem datoriem, neveicot tā saglabāšanu apgrūtinošās atmiņas ierīcēs. Hiperteksts ļāva lietotājiem pārlūkot un koplietot tekstu tīmekļa lapās, izmantojot hipersaites. Pēc tam Berners-Lī izveidoja pārlūka redaktoru un drīz vien saprata, ka šo jauno saziņas veidu var koplietot ļoti daudz cilvēku. Līdz 1990. gada maijam CERN zinātnieki šo jauno sadarbības tīklu nodēvēja par Globālais tīmeklis. Faktiski CERN bija atbildīga par pasaules pirmo vietni: http://info.cern.ch/, un agrīnu piemēru tam, kā šī vietne izskatījās, var atrast tīmekļa vietnē World Wide Web Consortium.
Tātad CERN nav sveša datu pārvaldīšana internetā, bet pilnīgi jaunajam LHC būs nepieciešama īpaša attieksme. Kā uzsvēra Deivids Baders, Džordžijas Tehnoloģiju institūta augstas veiktspējas skaitļošanas izpilddirektors, pašreizējais interneta atļautais joslas platums ir milzīgs sašaurinājums, padarot citus datu apmaiņas veidus vēlamākus. “Ja es paskatos uz LHC un to, ko tā dara nākotnē, viena lieta, ko tīmeklim nav izdevies, ir fenomenāla datu bagātības pārvaldīšana, ”Viņš sacīja, kas nozīmē, ka lielākas datu kopas ir vieglāk saglabāt terabaitu cietajos diskos un pēc tam nosūtīt tās līdzstrādniekiem. Lai gan CERN bija pievērsusies datu koplietošanas sadarbībai globālajā tīklā, LHC ģenerētie dati viegli pārslogos pašreiz pieejamos mazos joslas platumus.
Tāpēc tika izveidots LHC skaitļošanas režģis. Režģis apstrādā apjomīgu LHC datu kopu ražošanu līmeņos, pirmais (0 līmenis) atrodas uz vietas CERN netālu no Ženēvas, Šveicē. 0 līmenis sastāv no milzīga paralēla datortīkla, kurā ir 100 000 modernu centrālo procesoru, kas ir izveidoti, lai nekavējoties saglabātu un pārvaldītu izejdatus (binārā koda 1 un 0 s), ko izvada LHC. Šajā brīdī ir vērts atzīmēt, ka sensori nekonstatēs visas daļiņu sadursmes, bet var uztvert tikai ļoti nelielu daļu. Lai gan var atklāt tikai salīdzinoši nelielu daļiņu skaitu, tas joprojām nozīmē milzīgu iznākumu.
Otrais līmenis pārvalda izdalīto datu daļas, izpūšot tos caur īpašām 10 gigabitu sekundē optiskās šķiedras līnijām līdz 11 1 līmenis vietnes visā Ziemeļamerikā, Āzijā un Eiropā. Tas ļauj tādiem līdzstrādniekiem kā Relativistic Heavy Ion Collider (RHIC) Brukhāvenas Nacionālajā laboratorijā Ņujorkā analizēt ALICE eksperimenta datus, salīdzinot LHC svina jonu sadursmju rezultātus ar viņu pašu smago jonu sadursmes rezultātiem.
No 1. līmeņa starptautiskajiem datoriem datu kopas tiek iesaiņotas un nosūtītas uz 140 2. līmenis datortīkli, kas atrodas universitātēs, laboratorijās un privātos uzņēmumos visā pasaulē. Tieši šajā brīdī zinātniekiem būs pieeja datu kopām, lai pārveidotu no neapstrādātā binārā koda izmantojamā informācijā par daļiņu enerģijām un trajektorijām.
Līmeņa sistēma ir laba un laba, taču tā nedarbotos bez ļoti efektīva programmatūras veida, ko sauc par “starpprogrammatūru”. Mēģinot piekļūt datiem, lietotājs var vēlēties iegūt informāciju, kas dažādos serveros dažādos formātos tiek izplatīta pa datu petabātiem. Atvērtā pirmkoda starpprogrammatūras platforma ar nosaukumu Globuss būs milzīga atbildība par vajadzīgās informācijas netraucētu savākšanu, it kā šī informācija jau atrodas pētnieka datorā.
Tieši šo līmeņu sistēmas, ātra savienojuma un atjautīgas programmatūras kombināciju varētu paplašināt ārpus LHC projekta. Pasaulē, kur viss kļūst pēc pieprasījuma, šāda veida tehnoloģija varētu padarīt internetu caurspīdīgs gala lietotājam. Būtu tūlītēja pieeja visam, sākot no datiem, kas iegūti eksperimentos otrajā planētas pusē, līdz augstas izšķirtspējas filmu skatīšanai, negaidot lejupielādes progresa joslu. Līdzīgi kā Berners-Lee HTML izgudrojums, LHC Computing Grid var radīt revolūciju, kā mēs izmantojam internetu.
Avoti: Scientific American, CERN