Category: Digitaalinen kokoelmanhallinta

BIG DATA vs. SMALL DATA

Rufus Pollock (Open Knowledge Foundationin yksi perustajajäsenistä) tuo blogikirjoituksessaan mielenkiintoisen näkökulman esiin liittyen ”big data -hössötykseen”. Big datahan tarkoittaa suuria tietomassoja mitä syntyy koko ajan ja joka puolella tänä verkkoaikakautena – ja joiden hyödyntämiseen erilaiset Big data -työkalut on keksitty (esim. Hadoop). Big data -uskovaiset toistavat mantraa, että kun big dataa opitaan valjastamaan oikealla tavalla, vain taivas on rajana. Kaikki ongelmat ratkeavat tyyliin pystytään ennustamaan seuraava influenssaepidemia ja sen lähtöpaikka tarkalleen jne… Jos museolaisena big dataa miettii, mahdollisuudet voisivat liittyä lähinnä ”maailmanlaajuiseen muistiin”, jonka hyödyntäminen olisi mahdollista kun pian jokainen pieninkin museo ja sen kokoelmat ovat kiinni suurissa tietokannoissa.

Googlehan on tällä hetkellä suuri Big datan omistaja: se on erilaisten lisenssien (Google+, Youtube, picasa jne…) ja hakupalveluidensa kautta kerännyt jo vuosia sekä teksti- kuva- että videomateriaalia ja siihen liittyvää dataa. Googlen palvelut kuten Google trends on tietyllä tapaa Big data -palvelu; siinä suuria datamääriä käsitellään ja luodaan niistä graafeja. Uusimmat tutkimukset tukevat muun muassa sitä, että Google Trendillä voi ennustaa markkinoiden kehitystä.

Pollock kyseenalaistaa Big datan merkityksen siinä mielessä, että sillä olisi kovin suurta merkitystä suurimmalle osalle meistä. Big datan analysoimiseen tarvitaan valtavat resurssit, osaavat tilastotieteiteilijät ja dataakin pitäisi olla valtavat määrät. Pollockin pääteesi on, että koolla ei ole niinkään väliä, vaan meidän tulisi nähdä ne pienet datamäärät, mitä meidän jokaisen ympärillä on ja oppia hyödyntämään niitä ongelmien ratkaisuissa. Esimerkkeinä hän nostaa kotinsa energiakäytön datan, paikallisbussien aikataulut, hallintokulut… Kaikki niin sanottua pientä dataa eli ihan vain dataa, jonka hyödyntäminen tuo jokaisen elämään suuria säästöjä ja ratkaisee pieniä ongelmia.

Blogitekstin kommenttiosiossa joku nostaakin esiin mielestään tulevaisuuden käsitteen: Small, open and linked data (SOLD) eli pieni, avoin ja yhteenliitetty eli linkitetty data. Kunhan ”pienen datan” ohjelmat (esim. excel) kehittyvät, syntyy uusia mahdollisuuksia, joita meistä jokainen työyhteisöissä ja kotona voimme hyödyntää. Museoilla ”pienen datan” hyödyntäminen on jo digitaalisen kokoelmanhallintaohjelman myötä tullut tutuksi; kuinka helppoa onkaan esimerkiksi kokoelmahaut verrattuna pahvisiin arkistokortteihin ja diaarioihin? Se on jo tätä päivää ja kaikille tuttua, kunhan nämä kokoelmat nyt vähitellen linkitetään toisiinsa, museot voivat toteuttaa tehokkaammin ja datan kannalta fiksummin tehtäväänsä muistiorganisaationa.

Minna

Museokentällä tapahtuu…muualla maailmassa

Ajattelin koota tämän otsikon alle muutamia mielenkiintoisia juttuja, mitä tällä hetkellä tapahtuu muualla kuin Suomen museokentässä, liittyen lähinnä digitaaliseen kokoelmanhallintaan ja verkkoviestintään. Olen poiminut näitä ihan yleisesti netistä, LinkedIn -ryhmien keskusteluista sekä todella aktiiviselta OpenGlam -sähköpostilistalta.  Aloitetaan Ruotsista.

Kolme museota avaa kokoelmansa yleisölle Ruotsissa

Kolme museota eli Kuninkaallinen asevarasto (Mikä lie oikea suomennos? Livrustkammaren ruotsiksi, The Royal armoury englanniksi.) , Skoklosterin Linna ja Hallwyllin Museo ovat julkaisseet yli 40 000 hyvänlaatuista kuvaa verkossa käytettäväksi avoimilla lisensseillä. Kuvia voi selata helposti, ja mikä tärkeintä: lisenssi näkyy nopeasti ja selvästi jokaisen kuvan alla. Kaikki kuvat ovat jonkun seuraavan lisenssin alla: CC BY A, CC BY SA, ja public domain eli CC0.

Käytännössä nämä kaikki kolme lisenssiä (CC0 taitaa olla enemmän kuin lisenssi, se tarkoittaa kaikista oikeuksista luopumista.) mahdollistavat kuvien käytön ihan mihin vain, myös kaupalliseen käyttöön. Lisäksi museot (kolme museota, yksi hallinto) ovat lyöneet hynttyyt yhteen Wikimedia Swedenin kanssa, jotta kuvat ovat saatavissa myös Wikimedia Commonsin kautta.

Ruotsissakin on ongelmansa: esimerkiksi yhteistä avoimen datan portaalia ei Ruotsista löydy. Erinomainen artikkeli Ruotsin tilanteesta löytyy  www.sweden.se -sivuilta (englanniksi).

…Ja meillä Suomessa

Yksi harmaita hiuksia monelle aiheuttava ongelma on tekijänoikeudet. EU:ssa on meneillään omat neuvottelut koko uudesta tekijänoikeuslaista, ACTAsta. Museoiden osalta ilmeisesti viimeisimmillä Museoalan teemapäivillä on asiaa käsitelty kattavasti, ja Museoliiton blogissa on hyvä yhteenveto Suomen museoiden tilanteesta. Halua on löytää tapoja avata omia kokoelmiaan, mutta lainsäädäntö ja sen kiemurat estävät. Kuten blogissakin tulee ilmi, Creative Commonsin tapaiset lisenssit helpottavat verkossa sekä ammattilaisia että käyttäjiä ymmärtämään, missä mennään.

Mitä hyötyä tosiaan on hienosta käyttöliittymästä, jonka kautta voi selata (tähän iso luku ja monta nollaa) kuvia, jos niitä ei voi käyttää millään tavoin? Tai käyttäjä ei tiedä, miten niitä käytetään? Toki ne ovat itsessään yleissivistäviä, joka sinällään on itseisarvo, mutta kun potentiaalia olisi niin paljon muuhunkin.  Etenkään Europeana-tietokanta ei ole tarpeeksi selvästi nostanut käyttöliittymässään esiin käyttäjien näkökulmaa. Puhutaan metadatan lisensseistä (jotka kiinnostavat lähinnä sovelluskehittäjiä) tai ei puhuta lisensseistä ollenkaan. Heti sivulle tultaessa pitäisi olla selkeä viesti peruskäyttäjälle: Miten voin hyödyntää tästä tietokannasta löytyvää materiaalia? Mistä se tieto löytyy? jne… Europeanassa on yksi iso plussa; Objekteja voi hakea lisenssien mukaan. Ja lähes kaikille objekteille on määritelty jokin lisenssi, etenkin kuville.

Finnassa taas objekteille ei ole erikseen lisenssejä, tässä olemme jäljessä monia muita maita. Metadataa saa hyödyntää vapaasti. Finnan käyttöehdoissakin lukee: ”Näillä sivustoilla oleviin aineistoihin voi liittyä lakiin tai sopimuksiin liittyviä oikeuksia tai rajoituksia. Oikeuksista ja rajoituksista kerrotaan sisältöjä hallinnoivien organisaatioiden sivustoilla.” <— Tämä ja mahdollisesti suuri C-vesileima kuvan päällä, on märkä rätti esim. opettajan kasvoille, joka mielellään hyödyntäisi hienon tietokannan kautta tarjottua materiaalia omassa opetuksessaan.

Ja jatkuu: ”Joidenkin hakutulosten kohdalla Finnassa näytetään metatietoihin liittyvän digitaalisen aineiston kuva, esimerkiksi kuva museoesineestä, taideteoksesta, valokuvasta tai kirjan kannesta. Näihin ns. esikatselukuviin voi liittyä käytön rajoituksia samalla tavalla kuin aineistoja hallinnoivien organisaatioiden sivustoilla oleviin aineistoihin.” Toisin sanoen jos museoammattilainen on ottanut valokuvan jostain esineestä, tätäkään kuvaa ei voi hyödyntää ilman organisaation lupaa. Lisenssien määrittäminen valokuvateosten ja museoon lahjoitettujen valokuvien kohdalla on toki hankalaa, mutta tuntuisi, että museotyöntekijöiden ottamat kuvat, jotka kuvaavat itse esinettä, huom: eivät ole itse säilytettävä esine, tulisi automaattisesti lisenssoida CC0:n alle.

Henkilökohtaisesti ajattelen niin, että lisenssoinnin myötä tiukkaan lisenssoidut materiaalit (joita ei saa käyttää missään muodossa ilman tekijän lupaa) jätettäisiin rauhaan, kun olisi riittävästi ja helposti tarjolla materiaalia avoimin lisenssein. Tulisi hieman järjestystä kaaokseen.
Mielenkiinnolla jäämme odottelemaan Museo2015 -hankkeen (hieno hanke) lopputuloksia, joiden myötä Suomeen tulee yksi yhteinen kokoelmanhallintajärjestelmä ja yhteiset luettelointiohjeet (löytyy täältä). Nämä jo sinällään antavat työkaluja Suomen museokentälle vastata ajan haasteisiin.

Minna

Lisää aiheesta:

http://storify.com/Teema12/perjantai-aamu-ja-tekijanoikeudet

http://www.opencultuurdata.nl/about/

https://www.kiwi.fi/display/finna/Avoin+metatieto