Lielie dati

Marcis Auzins 08.08.2014
Pamats:

Foto, Andris Kozlovskis

Viena no pasaules senākajām bibliotēkām esot Aleksandrijas bibliotēka. Tā tika izveidota Senajā Ēģiptē dažus simtus gadu pirms mūsu ēras. Mērķis esot bijis ļoti ambiciozs – savākt vienuviet visas zināšanas, kas pasaulē radītas. Droši vien jau tālaika Maķedonijas valdnieki saprata, ka zināšanas ir vērtība. Tādēļ viņi gan ar labu, gan ar varu no visām pakļautajām zemēm un karagājieniem veda uz Aleksandriju manuskriptus, tos kopēja, veidojot jaunus papirusus, un visu noglabāja Aleksandrijas bibliotēkā. Valdnieki ātri saprata, ka zināšanas ļauj valdīt pār pasauli.

Bet cik daudz visa tālaika civilizācija to zināšanu bija radījusi? Grūti noticēt, cik maz! Ja paļaujamies uz vēsturnieku novērtējumu, cik daudz papirusu bija sakrāts Aleksandrijas bibliotēkā, tad šobrīd katrs uz Zemes dzīvojošais varētu saņemt 320 reižu vairāk unikālas informācijas, nekā bija Aleksandrijas zināšanu krātuvē kopā. Te der atcerēties, ka šobrīd uz mūsu planētas ir vairāk par septiņiem miljardiem potenciālo zinātkāro. Ir grūti uzskatāmi aptvert, cik daudz zināšanu un informācijas pasaulē uzkrāts vairāk, nekā bija Prolemaju dinastijas laikā Ēģiptē.  Tādēļ tiek izdomāti visādi veidi, kā ļaut vismaz intuitīvi apjaust, kāds apjoms informācijas šobrīd ir pasaulē. Piemēram, zinātnes popularizētāji apgalvo, ja visu šobrīd pasaulē esošo informāciju sarakstītu CD ripuļos un tad tos sakrautu kaudzītēs, būtu piecas kaudzītes, kas no Zemes sniegtos līdz Mēnesim. Nezinu, vai tas padara visu skaidrāku vai tikai vēl vairāk saputro, bet izklausās tiešām iespaidīgi.

Taču šai absolūti unikālajai situācijai ir arī ļoti konkrētas sekas mūsu dzīvē. Vispirms tie, kuriem mājas bibliotēka ir palielāka, var justies īpaši. Iespējams, ka viņu mājās ir vairāk grāmatu, nekā bija sakrāts visā Aleksandrijas bibliotēkā. Ja nopietni, ir skaidrs, ka nevienā bibliotēkā, pat vislielākajā, šobrīd savākt vienkopus visas mūsdienu civilizācijas zināšanas nav iespējams. Piemēram, tiek apgalvots, ka šobrīd katru dienu pasaulē tiek izdots 4000 jaunu grāmatu. Ko tas nozīmē? Vieglāk iedomāties, cik jaunu grāmatplauktu katru dienu jāuzbūvē bibliotēkās, ja gribētu visas šīs grāmatas novietot. Vai cits tikpat interesants piemērs – šobrīd vienā nedēļā laikraksts The New York Times publicē tikpat daudz jaunas informācijas, cik visā 18. gadsimtā pasaule uzzināja kopumā.

Bet jautājums ir daudz nopietnāks – kur visu šo informācijas bagātību glabāt. Jautājums ir, ko ar to visu darīt? Tās piecas CD kaudzes no Zemes līdz Mēnesim neviens izpētīt nevar. Vēl vairāk, neviens dators, pat visjaudīgākais, pat kvantu dators, par kuriem mēs vēl tikai sapņojam, ar šo informācijas daudzumu galā netiks. Šai situācijai informācijas speciālisti pat ir izdomājuši īpašu nosaukumu – big data. Latviski mēs vēl tikai domājam, kā to vislabāk pārtulkot, bet pagaidām visbiežāk to tā arī saucam par  lielajiem datiem.

Šo datu apjoms maina mūsu attieksmi pret informāciju. Arī katra personisko attieksmi. Atceros laiku, kad kļuvu par Latvijas Universitātes rektoru. Ienācu savā jaunajā kabinetā, un viens no manas sajūsmas un apbrīnas objektiem bija Britu enciklopēdijas – Encyclopedia Britannica –skaistie sējumi kabineta grāmatplauktā. Visu mūžu man bija gribējies, lai man tāda būtu. Tā bija likusies kā zināšanu kvintesence, tik precīza, tik visaptveroša.
Tagad atskatoties laikā, varu sev jautāt, vai bieži esmu šos sējumus atvēris? Nu, dažas reizes esmu, bet daudz biežāk, meklējot kādu faktu vai gribot kaut ko ātri uzzināt par vienu vai otru lietu, esmu vienkārši iegūglējis un visbiežāk ātri nonācis pie wikipedias ieraksta plašajā interneta tīmeklī. Tas ir veids, kā parasti šodien operējam ar informāciju. Veids, kā informācija nonāk pie mums.

Pats fakts, ka informāciju visbiežāk meklējam elektroniskajā vide, nevis kā agrāk ejam uz bibliotēku, lai parakātos grāmatu plauktā, ir ļoti nozīmīgs. Vēl pavisam nesen, 2000. gadā, tikai viena ceturtā daļa visas informācijas tika glabāta digitālā formā, taču tagad tikai daži procenti no visas pasaulē esošās informācijas vēl nav pagūti digitalizēt. Viss ir iekodēts vieniniekos un nullītēs un glabājas kaut kur uz datu serveriem, un tagad jau visbiežāk ir atrodams ļoti populārajos digitālajos mākoņos.

Bet runa šeit ir ne tikai par datu daudzumu. Vairāk jādomā par to, ko tad ar šiem datiem darīt. Mums pamazām jāatbrīvojas no pieejas, ka gribam precīzi izpētīt, kāpēc lietas notiek tā un ne citādi. Meklējam nedaudz, bet ļoti precīzus un daudzkārt pārbaudītus datus. Vēlme izprast parādību dziļākos mehānismus un lietu būtību vienmēr ir bijis un būs vilinošs mērķis un uzziņas kalngals. Taču bieži vien tas būs nesasniedzams mērķis. Iespējams, ka dauzos praktiskos gadījumos vajadzēs analizēt nevis cēloņsakarības, bet gan korelācijas. Nāksies izmantot lielos datu daudzumus, kuros ir daudz kļūdu un pat muļķību, bet kuri tomēr tieši ar savu lielumu, ar savu apjomu ir neaizstājami praktisku problēmu risināšanai. Piemēram, nemeklēsim atbildi uz jautājumu, kas tieši bija iemesls, ka šajā ziemā sākās liela gripas epidēmija, bet labāk jautāsim, kādas bija tās korelācijas, kāds apstākļu kopums, pēc kuriem sākas šāda veida epidēmija. Iespējams, ka, pat nezinot un nesaprotot dziļāko cēloņsakarību, kas noveda pie slimības izplatības, mēs tomēr šādā veidā nākamajā reizē spēsim paredzēt jaunu uzliesmojumu un būt tam labi sagatavotiem. Tā kā ir jāsaskaņo cēlā vēlme saprast lietu un parādību dabu līdz galam un ļoti pragmatiski mērķi, pat nesaprotot visu, tomēr izmantot šos lielos datus, lai padarītu dzīvi drošāku un labāku.

Vēl vairāk, iespējams, ka daudzas parādības līdz vienkāršām formulu valodā izsakāmām cēloņsakarībām nemaz nav novedamas. Vienkāršākās, kas šādā veidā ir aprakstāmas, mēs jau diezgan labi esam izpētījuši. Fiziķi, iespējams, te ir spējuši visvairāk. Tomēr nu ir laiks ķerties pie sarežģītākām lietām, kur šī vienkāršā pieeja vairs nestrādā, piemēram, sarežģītām bioloģiskām sistēmām vai parādībām sociālajā vidē. Iespējams, ka lielo datu analīze un saistību meklēšana korelāciju formā ir vienīgais ceļš, kā virzīties uz priekšu. Ir zinātnieki, kas turas pie šādiem uzskatiem.

Atgriežoties pie bibliotēkām. Aleksandrijas bibliotēkā bez papirusu tīstokļu glabātavas bija arī mākslas centrs. Tas bija veltīts deviņām mākslu un zinātņu mūzām. Bibliotēkā esot bijušas gan telpas, kur zināšanu adeptiem satikties, gan zāles, kur noturēt publiskas lekcijas, gan arī dārzi sarunām pastaigu laikā. Vārdu sakot, vide, kādu mēs sagaidām arī mūsdienu bibliotēkā.

Man prātā kāda nesena saruna Leipcigas Universitātes bibliotēkā. Šī bibliotēka ir dibināta 1542. gadā, un pēc restaurācijas tā ir gan sena, gan vienlaikus arī moderna. Bibliotēkas darbinieki bija organizējuši aptauju studentu vidū, kādēļ viņi nāk uz bibliotēku un kas viņiem patīk bibliotēkā un kas ne. Pozitīvo atbilžu augšgalā par to, ko jaunie cilvēki sagaida un par ko priecājas bibliotēkā, bija divas lietas, kas var likties gan negaidītas, gan ļoti loģiskas un pašsaprotamas. Studenti nāk uz šo Leipcigas Universitātes bibliotēku tādēļ, ka telpas ir senatnīgi skaistas ar seniem portretiem un gleznām pie sienām, un arī tādēļ, ka bibliotēkas telpās ir novietots daudz zaļo augu.

Ko tas nozīmē? Informāciju mēs varam iegūt, arī neizejot no sava darba kabineta un mājām. Tā gandrīz visa ir pieejama digitālā formā. Jā, dzirdu iebildumus, ka lasīt senu grāmatu, kas smaržo pēc gadsimtu putekļiem, vai tieši otrādi – jaunu grāmatu, kas nāk tieši no tipogrāfijas un vēl smaržo pēc krāsas, ir īpašs šarms, ko nekāda digitālā vide neaizstās. Protams, es piederu pie tās paaudzes, kam gan šī sajūta ir pazīstama, gan gribas ar abām rokām balsot par šādu viedokli. Un tomēr…. Biežāk mani interesējošu grāmatu neatrodu uzrakstītu vai iztulkotu latviski. Arī grāmatu skaits, ko var nopirkt grāmatnīcās, ir galīgs. Tai pašā laikā tādās interneta vietnēs kā amazon.com pieejamo grāmatu skaits ir gandrīz neierobežots, lielākā daļa no tām ir nopērkamas elektroniski un dažu sekunžu laikā var būt manā planšetdatorā. Tā nu es arī visbiežāk šādā veidā nonāku pie jaunām grāmatām.

Jā, varu atzīties. Man piemīt arī kāds racionāli grūti izskaidrojams arhaisms. Ja grāmata man patiešām iepatīkas, gribu pēc tās elektroniskās izlasīšanas ielikt to papīra formā savā grāmatplauktā. To ik pa brīdim arī izdaru. Bet, kā jau teicu, pat sev atbildēt uz jautājumu, kādēļ es to daru, nespēju. Bet ar prātu cilvēks nav izskaidrojams. Te var līdzēt tikai lielie dati. Ja jūs rīkojaties līdzīgi, tad tā teikt – iekš tā kaut kas ir.

Tātad varam secināt, ka pasaules attīstībai ir sava loģika, ko tikai lielie dati spēj aptvert. Ar to cīnīties ir tāpat kā zināmajā stāstā par Servantesa Donu Kihotu, kas cīnījās ar vējdzirnavām. Tas ir bezcerīgi. Pasaulē tāpat kā lielajiem datiem ir sava iekšējā mums līdz galam neizprotamā loģika un to atliek vienīgi pieņemt.

Arī šovasar beidzot atvērtā Latvijas Nacionālā bibliotēka būs šīs pasaules loģikas sastāvdaļa. Ne velti, to atverot, simboliskā lentīte tika pārgriezta ne tikai fiziskā veidā, bet arī digitāli. Šī digitālā pārgriešana notika bibliotēkas pašā augstākajā stāvā kronītī, no kurienes ir redzama gandrīz visa Rīga. Tomēr elektroniskā vide ļauj skatam sniegties vēl daudz tālāk, un arī jaunā bibliotēka ļaus mums šo skatu paplašināt, lai Latvija nekad nekļūtu provinciāla vieta un mūsu skatam pavērtos pasaule.  Plašāka un vēl skaistāka. 

2014. gada 28. jūnijs, Rīgā

Publicēts žurnāla Klubs, 2014. gada augusta numurā, 20.-21. lpp.

Tags:

Autortiesības

Šajā lapā atrodamie materiāli ir domāti nekomerciālai lietošanai studentiem, pētniekiem un visiem interesentiem. Tos nedrīks lietot komerciālos nolūkos. Daļa materiālu ir aizsargāti ar autortiesībām. Materiālu tālākai pārpublicēšanai ir nepieciešams saņemt autortiesību īpašnieka atļauju. Parasti tas ir izdevējs, bet atsevišķos gadījumos – Mārcis Auziņš.