Hajautettua vai kerättyä tietoa?
Yksi nykyajan ilmiöistä on henkilökohtaisen, digitaalisen tiedon määrän jatkuva lisääntyminen. Tiedon varastointi niin, että se on helposti saavutettavissa mutta toisaalta suojassa asettaa valtaisia teknisia kuin yhteiskunnallisia haasteita. Matt Haughey itse asiassa huomioi asian hyvin näin Google Talkin julkistamisen yhteydessä. Hän huomasi, että suuri osa hänen tiedoistaan on tavalla tai toisella Googlen käsiteltävissä: sähköposti (Gmail), pikaviestintä (Google Talk) sekä kotikoneen tiedostot (Google Desktop). Kuten aina, tiedon keskittämisellä on niin hyvät kuin huonotkin puolensa.
Vaikka tällä hetkellä sanontana on, että Google ei tee pahaa (Google is not evil), tilanne voi muuttua hyvinkin nopeasti. Haughey’n kommentoinnissa joku totesi, ettei tarvita kuin muutama laihempi vuosi (kuukausi ?) niin Google saattaa päätyä toisiin käsiin. Käsiin, jotka eivät välttämättä olekaan yhtä rehellisiä ja ‘hyviä kansalaisia’ kuin nykyinen Google. Ja pitää myös muistaa se tosiasia, että Googlekin on yritys ja yrityksen tehtävänä on tuottaa voittoa osakkailleen.
Tiedon siirtämisellä digitaaliseen muotoon on tarkoitus helpottaa tiedon käsittelyä sekä sen saatavuutta. Kuitenkin näemme joka päivä käsittelemämme tietomäärän kasvaneen huomattavasti — infoähky ei ollut paperikauden sana. Ja yhä useammin pelkona on digitaalisen tiedon menettäminen ajan kuluessa. Tuskin kovinkaan monella on yhä tallessa ensimmäiset sähköpostit tai tekstiviestit rakkaaltaan — toisin kuin kirjeitä on aikoinaan säilytetty. Valokuvienkin osalta sama ilmiö saattaa toistua: paperikuvat kestävät useita kymmeniä, elleivät satoja, vuosia; samalla digikuvat saattavat jo muutaman vuoden sisällä kadota bittien taivaaseen hajoavien laitteiden ja epävarmojen tallennusmedioiden takia.
Digitaalisen tiedon säilyvyydelle positiivinen asia ovat keskitetyt tietovarastot. Näissä tietovarastoissa, kuten Flickr, del.icio.us, Gmail, yms. tietoa kuitenkin varmennetaan ja yksittäinen laitevika tuskin hävittää tiedon pysyvästi. Toisaalta käytön halpuus tai jopa ilmaisuus ei kuitenkaan mahdollista kovinkaan luotettavia takuita tiedon varmalle säilyvyydelle. Luottaminen omaan muistiin ja omiin varmuuskopioihin ei sekään ole mitenkään varma ratkaisu. Kun alan ammattilaiset niin usein laiminlyövät varmuuskopioinnin, voin vain kuvitella miten huono tilanne on tavallisten käyttäjien kohdalla.
Keskitetyissä tietovarastoissa on myös yksityisyyden kannalta merkittäviä ongelmia. Vaikka palvelut kuinka sanoisivat pitävänsä kiinni käyttäjien yksityisyydestä, on vaikea osoittaa tilanteita joissa yksityisyyttä loukattaisiin. Eihän kenelläkään ulkopuolisella ole pääsyä järjestelmien logia ja sisäistä toimintaa seuraamaan väärinkäytösten estämiseksi. Tiedon säilyttäminen kokonaan omissa käsissä onkin ainoa jotakuinkin varma tapa taata yksityisyyttä digitaalisessa maailmassa.
Samalla keskitetyt tietovarastot tarjoavat mahdollisuuden päästä käsiksi tietoon käytännössä mistä tahansa milloin tahansa. Niiden etuna on juuri helppo tiedon saavutettavuus ja sen säilyminen vain yhdessä paikassa monen paikan sijaan. Jokainen ohjelmoija tietää minkälaisen positiivisen lisän jo yhden henkilön ohjelmistoprojektiin saa käyttämällä keskitettyä versionhallintaa. Erityisesti omissa käsissä säilytettävän tiedon saatavuus on usein huomattavasti heikompaa, ellei kuljeteta koko ajan mukana laitteita ja tallennusmedioita joilla tietoja voidaan käsitellä. Ja tietenkin meidän pitää muistaa pitää mielessä keskenään kilpailevat yritykset ja tuotteet sekä niiden yhteensopimattomat ohjelmat.
Keskitetyt, ja usein avoimet, tietovarastot myös mahdollistavat suuremman tietomäärän jota käyttää alati lisääntyvän tiedon jäsentämiseen ja hakujen parempaan toteutumiseen. On sinällään huvittavaa, että toisaalta erilaisten hakujen tulokset parantuvat mitä enemmän tietoa aiheesta on. Tällöin saadaan kuitenkin yhä enemmän tilastoaineistoa mitä käyttää hakujen optimointiin. Ja tietenkin hiljalleen lisääntyvä koneen ymmärtämä tieto tiedosta parantaa entisestään hakujen toimintaa.
Ratkaisu tähän kaikkeen on varmasti jonkilainen yhdistelmä keskitettyä ja hajautettua tietoa. Itselläni ratkaisu on toisaalta julkisten palvelujen käyttäminen ei niin yksityiseen viestintään ja tiedon levittämiseen. Toisaalta pidän henkilökohtaisen sähköpostini visusti itseni hallinnoimassa tilassa (tai siis osin web-hotellin) ja kalenterini piilossa omassa kännykässäni. Jokaisen pitää miettiä omalta kohdaltaan sen avoimuuden asteen, tiedon säilyvyyden varmuuden ja tiedon saatavuuden välisen tasapainon kohdan omalta osaltaan. Ja tiedosta riippuen. Olisi vaan niin mukava nähdä minkälaisia tiedon varastointi- ja käyttämiskeinoja meillä on kymmenen vuoden päästä käytössä.