Skip to main content
informatikaközigazgatási informatikaművelődésszakirodalom

A Magyar Nemzeti Múzeum megjelent a nyílt kapcsolt adatok nevezetes felhőjében

Szerző: 2018. március 18.No Comments

„Könyvtára révén pötty lett a Magyar Nemzeti Múzeum a híres nyílt kapcsolt adatok felhőjén, az úgynevezett LOD Cloud-on.

A LOD Cloud a Datahub adatbázis tartalmának grafikus megjelenítése. Az adatbázis a világ szemantikus adathalmazainak és azok kapcsolatainak leíró adatait tartalmazza. A hazai intézmények közül az Országos Széchényi Könyvtár, a Szépművészeti Múzeum és az MTA SZTAKI után Magyar Nemzeti Múzeum is felkerült a felhőbe „data-hnm-hu – Hungarian National Museum datasets” néven. Ezt azzal érdemelte ki, hogy a múzeum Központi Könyvtára a teljes online katalógusát publikálta a szemantikus weben [1] BIBFRAME-formátumban [2].

A publikálás több célt szolgált. A könyvtár már régen elkötelezte magát a nyílt bibliográfiai adatok mozgalma mellett. [3]. Ezzel a mostani lépésével a legmagasabb szinten, nyílt kapcsolt adatok formájában tette közkinccsé bibliográfiai rekordjait. A szinteket Tim Berners-Lee, a web és a szemantikus web létrehozója alkotta meg [4] (2. ábra).

Az egyes szintek az alábbi előnyöket jelentik a felhasználók számára: A felhasználók a bibliográfiai adatokat

*
megtekinthetik,
kinyomtathatják,
helyileg tárolhatják,
betölthetik a saját rendszerükbe,
módosíthatják a saját igényeik szerint,
megoszthatják másokkal,

**
speciális szoftverekkel feldolgozhatják,
konvertálhatják más formátumba,

***
speciális szoftverek nélkül is feldolgozhatják,

****
bárhonnan linkelhetik,
az azonosító linkeket elmenthetik,
részeiben is felhasználhatják,
más adatokkal egyesíthetik,

*****
más adathalmazokból származó adatokkal együtt tekinthetik meg.

Publikálásunkkal szerettünk volna hozzájárulni a szemantikus web építéséhez. A szemantikus webnek adatokra van szüksége. A könyvtárak rendelkeznek ilyen adatokkal, ráadásul a több évtizedes gépesítésnek és szabványosításnak köszönhetően adataik jól szegmentáltak, ami lehetővé teszi, hogy viszonylag könnyen konvertálják azokat a szemantikus webre.

További célunk volt a BIBFRAME-formátum megismertetése a hazai könyvtárakkal hazai bibliográfiai rekordok konverziója révén. A BIBFRAME

  • a leírást integrálja a hálózatba és a hálózatot bevonja a leírásba – azaz egy szemantikus web alapú formátum -, miközben továbbra is szolgálja a könyvtárak speciális igényeit;
  • világosan különbséget tesz a fogalmi tartalom és a fizikai/digitális megvalósulás között;
  • egyértelműen azonosítja az információs entitásokat;
  • megmutatja és hasznosítja az entitások külső és belső kapcsolatait.

Ez nem kevesebbet jelent, mint hogy a jövőben már nem a könyvtárunk számára, hanem a web számára fogunk katalogizálni. Az egyes könyvtárak a bibliográfia rekordok átvétele helyett egymás leírásaira fognak mutatni, azaz a másolásos katalogizálás helyét a linkelés veszi át. A felhasználók pedig a könyvtárak által készített leírásokat egyetlen egységben fogják látni.

A BIBFRAME-formátumban való publikálásunk specialitása, hogy célunk elérése érdekében, hasonlóan a német nemzeti könyvtárhoz – sőt azon egy kicsit túlmutatva –, összekötöttük a hagyományos – ún. MARC alapú – leírást tartalmazó, online katalógusbeli rekordjainkat a BIBFRAME-leírásokkal. A hagyományos leírástól a BIBFRAME-formátumig a leírás állandó, „Link a rekordhoz” feliratú URL-jéhez illesztett „.rdf” kiterjesztéssel lehet eljutni. Egy példán szemléltetve:
Online katalógus leírásának URL-je: http://link.hnm.hu/lib/bib/MNMKVT19563
A BIBFRAME megfelelőjének az URL-je: http://link.hnm.hu/lib/bib/MNMKVT19563.rdf
És ez fordítva is igaz. A BIBFRAME-leírástól el lehet jutni az online katalógusig a BIBFRAME-leírás URL-jét kiegészítve az „.opac” kiterjesztéssel. Így:
BIBFRAME-leírás URL-je: http://data.hnm.hu/doc/colls/lib/bib/MNMKVT19563
Az online katalógusbeli megfelelőjének URL-je: http://data.hnm.hu/doc/colls/lib/bib/MNMKVT19563.opac

Az online katalógus leírásai és a BIBFRAME-leírások között a kapcsolatot a számítógépek számára is megteremtettük az online katalógus HTML oldalainak részében elhelyezett „LINK rel” elem segítségével:
A fenti elem jelentése a számítógépek számára: a jelen oldal tartalmát alternatív formában RDF/XML szintaxissal meg lehet találni a href attributumban megadott URL-en.

Célunk eléréséhez több problémát is meg kellett oldani.

Először is kellett egy szerver. A szervert a Nemzeti Információs Infrastruktúra Fejlesztési program bocsájtotta a rendelkezésünkre virtuális szerver formájában. A szerver a http://data.hnm.hu URL címet kapta a szemantikus weben kialakult szokásoknak megfelelően. Ezen a szerveren foglalnak helyet a webes megjelenéshez és a Java programok futtatásához szükséges szoftverek, valamint a BIBFRAME-adatok tárolására és visszakeresésére szolgáló adatbáziskezelő, a Virtuoso (annak is az ingyenes változata). A telepítéseket Idoia Murua Belacortu végezte a szabad idejében spanyolországi otthonából.

A BIBFRAME-adatok a HUNTÉKA adatbázisból exportált MARC rekordok konverziójával álltak elő. A konverziót az olasz @Cult cég végezte: mi kiküldtük a MARC rekordokat, ők pedig visszaküldték a BIBFRAME-formátumú leírásokat, amiket aztán betöltöttünk a Virtuoso adatbázisba. Az @Cult-féle konverzió specialitása, hogy a konverzió során képes megállapítani, milyen műveket tartalmaz a konvertálandó adathalmaz, és az egyes megjelenési formák leírását ezekhez a tényleges művekhez kapcsolja (szemben más konverterekkel, melyek minden megjelenési formához létrehoznak egy álművet). A konverzió további specialitása, hogy a konvertálandó adathalmaz néventitásait összeköti más, külső adathalmazok néventitásaival. A mi neveink az alábbi adathalmazok néventitásaival lettek összekötve:

  • Bibliothèque nationale de France (BNF) [5]
  • International Standard Name Identifier (ISNI) [6]
  • Library of Congress Name Authority File (LC NAF) [7]
  • Virtual International Authority File (VIAF) [8]
  • Wikidata [9]

Ezen kapcsolatok révén váltak adataink igazi kapcsolt adatokká, ezáltal váltunk jogosulttá az 5 csillagos minősítésre.

Ahhoz, hogy a BIBFRAME-leírásoktól el lehessen jutni az online olvasói katalógus megfelelő oldalaihoz, újabb problémákat kellett megoldanunk.

A könyvtár online katalógusa a Mongúz kft szerverén fut, és egy adott könyv leírását ezen a címen lehetett elérni.

Ez az URL nagyon hosszú és ezért megjegyezhetetlen. Ráadásul nem is tartozik a hnm.hu tartományba, ami pedig egyéb céljaink megvalósítását akadályozta. Mindkét problémát a Mongúz kft. által fejlesztett linkfeloldó [10] oldotta meg. A linkfeloldó segítségével a Magyar Nemzeti Múzeum bármely online rekordjához, így a könyvtári rekordokhoz is hozzá lehet rendelni a World Wide Web Consortium ajánlásának [11] megfelelő kinézetű URL-t. A fenti leírás új URL-je ez: http://link.hnm.hu/lib/bib/mnmkvt19563

Mint látható, ez az URL már bevonja a leírást a hnm.hu tartományba, rövid, kifejező és könnyen megjegyezhető, szintaxisa révén pedig lehetőséget ad egyéb, nemzeti múzeumi adatbázisok rövid URL-lel való ellátására is.

(Azoknak, akik ki is próbálták a fenti URL-eket, feltűnhet, hogy a linkfeloldó nem a hunteka.asp.hunteka.hu tartományba visz, hanem a catalog.library.hnm.hu tartományba. Ez azért van, mert egyéb terveink megvalósítása szükségessé tette, hogy a katalógusszervert is bevonjuk a hnm.hu tartományba. Ez azonban már a BIBFRAME fejlesztés után történt, a BIBFRAME fejlesztéshez erre a lépésre nem volt szükség.)

Munkánk befejező része a részletes dokumentáció elkészítése volt. A teljes dokumentáció elérhető a http://data.hnm.hu címről kiindulva.

Részletes leírást tettünk közzé a Datahub adatbázisban is. A Datahub-beli bejegyzésnek, valamint annak, hogy mind a dokumentáció, mind a szemantikus adatok közzétételének módja megfelel a legmagasabb követelményeknek, köszönhető, hogy az adathalmazunk végül megjelent a már említett LOD cloudon.

Eredményeinket pedig a Katalisten [12], a NETWORKSHOP konferencián [13], valamint a LINKEDIN-en [14] népszerűsítettük.

Sokat dolgoztunk, de megérte: egyre több magyar könyvtár érdeklődik a BIBFRAME felől, meghívást kaptunk a European BIBFRAME Workshopra [15], és felkerültünk a Library of Congress honlapjára a BIBFRAME korai felhasználói közé [16], többek között olyan hírességek mellé, mint

  • Stanford University,
  • Deutsche Nationalbibliothek,
  • Library of Alexandria,
  • Music Library Association,
  • The National Library of Medicine,
  • Columbia University Libraries,
  • Princeton University Library,
  • Cornell University Library és maga a
  • Library of Congress.

Ezeket az eredményeket a Magyar Nemzeti Múzeum vezetőségének megértő elvi támogatása mellett nemzetközi összefogásban sikerült elérni teljesen ingyenesen a meglévő szoftveres és emberi erőforrások megfelelő összekapcsolása révén.
Hivatkozások:

Forrás:
Pötty lett a Magyar Nemzeti Múzeum; Horváth Ádám; Magyar Múzeumok Online (Pulszky Társaság – Magyar Múzeumi Egyesület); 2018. március 15.
Lásd még: Korábbi cikkeink a szemantikus web területéről.
Semantic Web; Wikipédia