BIG DATA vs. SMALL DATA

Rufus Pollock (Open Knowledge Foundationin yksi perustajajäsenistä) tuo blogikirjoituksessaan mielenkiintoisen näkökulman esiin liittyen ”big data -hössötykseen”. Big datahan tarkoittaa suuria tietomassoja mitä syntyy koko ajan ja joka puolella tänä verkkoaikakautena – ja joiden hyödyntämiseen erilaiset Big data -työkalut on keksitty (esim. Hadoop). Big data -uskovaiset toistavat mantraa, että kun big dataa opitaan valjastamaan oikealla tavalla, vain taivas on rajana. Kaikki ongelmat ratkeavat tyyliin pystytään ennustamaan seuraava influenssaepidemia ja sen lähtöpaikka tarkalleen jne… Jos museolaisena big dataa miettii, mahdollisuudet voisivat liittyä lähinnä ”maailmanlaajuiseen muistiin”, jonka hyödyntäminen olisi mahdollista kun pian jokainen pieninkin museo ja sen kokoelmat ovat kiinni suurissa tietokannoissa.

Googlehan on tällä hetkellä suuri Big datan omistaja: se on erilaisten lisenssien (Google+, Youtube, picasa jne…) ja hakupalveluidensa kautta kerännyt jo vuosia sekä teksti- kuva- että videomateriaalia ja siihen liittyvää dataa. Googlen palvelut kuten Google trends on tietyllä tapaa Big data -palvelu; siinä suuria datamääriä käsitellään ja luodaan niistä graafeja. Uusimmat tutkimukset tukevat muun muassa sitä, että Google Trendillä voi ennustaa markkinoiden kehitystä.

Pollock kyseenalaistaa Big datan merkityksen siinä mielessä, että sillä olisi kovin suurta merkitystä suurimmalle osalle meistä. Big datan analysoimiseen tarvitaan valtavat resurssit, osaavat tilastotieteiteilijät ja dataakin pitäisi olla valtavat määrät. Pollockin pääteesi on, että koolla ei ole niinkään väliä, vaan meidän tulisi nähdä ne pienet datamäärät, mitä meidän jokaisen ympärillä on ja oppia hyödyntämään niitä ongelmien ratkaisuissa. Esimerkkeinä hän nostaa kotinsa energiakäytön datan, paikallisbussien aikataulut, hallintokulut… Kaikki niin sanottua pientä dataa eli ihan vain dataa, jonka hyödyntäminen tuo jokaisen elämään suuria säästöjä ja ratkaisee pieniä ongelmia.

Blogitekstin kommenttiosiossa joku nostaakin esiin mielestään tulevaisuuden käsitteen: Small, open and linked data (SOLD) eli pieni, avoin ja yhteenliitetty eli linkitetty data. Kunhan ”pienen datan” ohjelmat (esim. excel) kehittyvät, syntyy uusia mahdollisuuksia, joita meistä jokainen työyhteisöissä ja kotona voimme hyödyntää. Museoilla ”pienen datan” hyödyntäminen on jo digitaalisen kokoelmanhallintaohjelman myötä tullut tutuksi; kuinka helppoa onkaan esimerkiksi kokoelmahaut verrattuna pahvisiin arkistokortteihin ja diaarioihin? Se on jo tätä päivää ja kaikille tuttua, kunhan nämä kokoelmat nyt vähitellen linkitetään toisiinsa, museot voivat toteuttaa tehokkaammin ja datan kannalta fiksummin tehtäväänsä muistiorganisaationa.

Minna

Mainokset

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out / Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out / Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out / Muuta )

Google+ photo

Olet kommentoimassa Google+ -tilin nimissä. Log Out / Muuta )

Muodostetaan yhteyttä palveluun %s