„Könyvtára révén pötty lett a Magyar Nemzeti Múzeum a híres nyílt kapcsolt adatok felhőjén, az úgynevezett LOD Cloud-on.
A LOD Cloud a Datahub adatbázis tartalmának grafikus megjelenítése. Az adatbázis a világ szemantikus adathalmazainak és azok kapcsolatainak leíró adatait tartalmazza. A hazai intézmények közül az Országos Széchényi Könyvtár, a Szépművészeti Múzeum és az MTA SZTAKI után Magyar Nemzeti Múzeum is felkerült a felhőbe „data-hnm-hu – Hungarian National Museum datasets” néven. Ezt azzal érdemelte ki, hogy a múzeum Központi Könyvtára a teljes online katalógusát publikálta a szemantikus weben [1] BIBFRAME-formátumban [2].
A publikálás több célt szolgált. A könyvtár már régen elkötelezte magát a nyílt bibliográfiai adatok mozgalma mellett. [3]. Ezzel a mostani lépésével a legmagasabb szinten, nyílt kapcsolt adatok formájában tette közkinccsé bibliográfiai rekordjait. A szinteket Tim Berners-Lee, a web és a szemantikus web létrehozója alkotta meg [4] (2. ábra).
Az egyes szintek az alábbi előnyöket jelentik a felhasználók számára: A felhasználók a bibliográfiai adatokat
*
megtekinthetik,
kinyomtathatják,
helyileg tárolhatják,
betölthetik a saját rendszerükbe,
módosíthatják a saját igényeik szerint,
megoszthatják másokkal,**
speciális szoftverekkel feldolgozhatják,
konvertálhatják más formátumba,***
speciális szoftverek nélkül is feldolgozhatják,****
bárhonnan linkelhetik,
az azonosító linkeket elmenthetik,
részeiben is felhasználhatják,
más adatokkal egyesíthetik,*****
más adathalmazokból származó adatokkal együtt tekinthetik meg.Publikálásunkkal szerettünk volna hozzájárulni a szemantikus web építéséhez. A szemantikus webnek adatokra van szüksége. A könyvtárak rendelkeznek ilyen adatokkal, ráadásul a több évtizedes gépesítésnek és szabványosításnak köszönhetően adataik jól szegmentáltak, ami lehetővé teszi, hogy viszonylag könnyen konvertálják azokat a szemantikus webre.
További célunk volt a BIBFRAME-formátum megismertetése a hazai könyvtárakkal hazai bibliográfiai rekordok konverziója révén. A BIBFRAME
- a leírást integrálja a hálózatba és a hálózatot bevonja a leírásba – azaz egy szemantikus web alapú formátum -, miközben továbbra is szolgálja a könyvtárak speciális igényeit;
- világosan különbséget tesz a fogalmi tartalom és a fizikai/digitális megvalósulás között;
- egyértelműen azonosítja az információs entitásokat;
- megmutatja és hasznosítja az entitások külső és belső kapcsolatait.
Ez nem kevesebbet jelent, mint hogy a jövőben már nem a könyvtárunk számára, hanem a web számára fogunk katalogizálni. Az egyes könyvtárak a bibliográfia rekordok átvétele helyett egymás leírásaira fognak mutatni, azaz a másolásos katalogizálás helyét a linkelés veszi át. A felhasználók pedig a könyvtárak által készített leírásokat egyetlen egységben fogják látni.
A BIBFRAME-formátumban való publikálásunk specialitása, hogy célunk elérése érdekében, hasonlóan a német nemzeti könyvtárhoz – sőt azon egy kicsit túlmutatva –, összekötöttük a hagyományos – ún. MARC alapú – leírást tartalmazó, online katalógusbeli rekordjainkat a BIBFRAME-leírásokkal. A hagyományos leírástól a BIBFRAME-formátumig a leírás állandó, „Link a rekordhoz” feliratú URL-jéhez illesztett „.rdf” kiterjesztéssel lehet eljutni. Egy példán szemléltetve:
Online katalógus leírásának URL-je: http://link.hnm.hu/lib/bib/MNMKVT19563
A BIBFRAME megfelelőjének az URL-je: http://link.hnm.hu/lib/bib/MNMKVT19563.rdf
És ez fordítva is igaz. A BIBFRAME-leírástól el lehet jutni az online katalógusig a BIBFRAME-leírás URL-jét kiegészítve az „.opac” kiterjesztéssel. Így:
BIBFRAME-leírás URL-je: http://data.hnm.hu/doc/colls/lib/bib/MNMKVT19563
Az online katalógusbeli megfelelőjének URL-je: http://data.hnm.hu/doc/colls/lib/bib/MNMKVT19563.opacAz online katalógus leírásai és a BIBFRAME-leírások között a kapcsolatot a számítógépek számára is megteremtettük az online katalógus HTML oldalainak részében elhelyezett „LINK rel” elem segítségével:
A fenti elem jelentése a számítógépek számára: a jelen oldal tartalmát alternatív formában RDF/XML szintaxissal meg lehet találni a href attributumban megadott URL-en.Célunk eléréséhez több problémát is meg kellett oldani.
Először is kellett egy szerver. A szervert a Nemzeti Információs Infrastruktúra Fejlesztési program bocsájtotta a rendelkezésünkre virtuális szerver formájában. A szerver a http://data.hnm.hu URL címet kapta a szemantikus weben kialakult szokásoknak megfelelően. Ezen a szerveren foglalnak helyet a webes megjelenéshez és a Java programok futtatásához szükséges szoftverek, valamint a BIBFRAME-adatok tárolására és visszakeresésére szolgáló adatbáziskezelő, a Virtuoso (annak is az ingyenes változata). A telepítéseket Idoia Murua Belacortu végezte a szabad idejében spanyolországi otthonából.
A BIBFRAME-adatok a HUNTÉKA adatbázisból exportált MARC rekordok konverziójával álltak elő. A konverziót az olasz @Cult cég végezte: mi kiküldtük a MARC rekordokat, ők pedig visszaküldték a BIBFRAME-formátumú leírásokat, amiket aztán betöltöttünk a Virtuoso adatbázisba. Az @Cult-féle konverzió specialitása, hogy a konverzió során képes megállapítani, milyen műveket tartalmaz a konvertálandó adathalmaz, és az egyes megjelenési formák leírását ezekhez a tényleges művekhez kapcsolja (szemben más konverterekkel, melyek minden megjelenési formához létrehoznak egy álművet). A konverzió további specialitása, hogy a konvertálandó adathalmaz néventitásait összeköti más, külső adathalmazok néventitásaival. A mi neveink az alábbi adathalmazok néventitásaival lettek összekötve:
- Bibliothèque nationale de France (BNF) [5]
- International Standard Name Identifier (ISNI) [6]
- Library of Congress Name Authority File (LC NAF) [7]
- Virtual International Authority File (VIAF) [8]
- Wikidata [9]
Ezen kapcsolatok révén váltak adataink igazi kapcsolt adatokká, ezáltal váltunk jogosulttá az 5 csillagos minősítésre.
Ahhoz, hogy a BIBFRAME-leírásoktól el lehessen jutni az online olvasói katalógus megfelelő oldalaihoz, újabb problémákat kellett megoldanunk.
A könyvtár online katalógusa a Mongúz kft szerverén fut, és egy adott könyv leírását ezen a címen lehetett elérni.
Ez az URL nagyon hosszú és ezért megjegyezhetetlen. Ráadásul nem is tartozik a hnm.hu tartományba, ami pedig egyéb céljaink megvalósítását akadályozta. Mindkét problémát a Mongúz kft. által fejlesztett linkfeloldó [10] oldotta meg. A linkfeloldó segítségével a Magyar Nemzeti Múzeum bármely online rekordjához, így a könyvtári rekordokhoz is hozzá lehet rendelni a World Wide Web Consortium ajánlásának [11] megfelelő kinézetű URL-t. A fenti leírás új URL-je ez: http://link.hnm.hu/lib/bib/mnmkvt19563
Mint látható, ez az URL már bevonja a leírást a hnm.hu tartományba, rövid, kifejező és könnyen megjegyezhető, szintaxisa révén pedig lehetőséget ad egyéb, nemzeti múzeumi adatbázisok rövid URL-lel való ellátására is.
(Azoknak, akik ki is próbálták a fenti URL-eket, feltűnhet, hogy a linkfeloldó nem a hunteka.asp.hunteka.hu tartományba visz, hanem a catalog.library.hnm.hu tartományba. Ez azért van, mert egyéb terveink megvalósítása szükségessé tette, hogy a katalógusszervert is bevonjuk a hnm.hu tartományba. Ez azonban már a BIBFRAME fejlesztés után történt, a BIBFRAME fejlesztéshez erre a lépésre nem volt szükség.)
Munkánk befejező része a részletes dokumentáció elkészítése volt. A teljes dokumentáció elérhető a http://data.hnm.hu címről kiindulva.
Részletes leírást tettünk közzé a Datahub adatbázisban is. A Datahub-beli bejegyzésnek, valamint annak, hogy mind a dokumentáció, mind a szemantikus adatok közzétételének módja megfelel a legmagasabb követelményeknek, köszönhető, hogy az adathalmazunk végül megjelent a már említett LOD cloudon.
Eredményeinket pedig a Katalisten [12], a NETWORKSHOP konferencián [13], valamint a LINKEDIN-en [14] népszerűsítettük.
Sokat dolgoztunk, de megérte: egyre több magyar könyvtár érdeklődik a BIBFRAME felől, meghívást kaptunk a European BIBFRAME Workshopra [15], és felkerültünk a Library of Congress honlapjára a BIBFRAME korai felhasználói közé [16], többek között olyan hírességek mellé, mint
- Stanford University,
- Deutsche Nationalbibliothek,
- Library of Alexandria,
- Music Library Association,
- The National Library of Medicine,
- Columbia University Libraries,
- Princeton University Library,
- Cornell University Library és maga a
- Library of Congress.
Ezeket az eredményeket a Magyar Nemzeti Múzeum vezetőségének megértő elvi támogatása mellett nemzetközi összefogásban sikerült elérni teljesen ingyenesen a meglévő szoftveres és emberi erőforrások megfelelő összekapcsolása révén.
Hivatkozások:
- [1]: https://archiv.magyarmuzeumok.hu/muhely/2337_potty_lesz_a_szepmuveszetibol. A cikk első része a szemantikus web ismertetése.
- [2]: http://www.loc.gov/bibframe/
- [3]: Horváth Ádám: Open Data a könyvtárban https://archiv.magyarmuzeumok.hu/muhely/3687_open_data_a_konyvtarban
- [4]: 5 * OPEN DATA (http://5stardata.info/en/)
- [5]: http://data.bnf.fr/
- [6]: http://isni.org/
- [7]: http://id.loc.gov/authorities/names.html
- [8]: http://viaf.org/
- [9]: http://wikidata.org
- [10] A linkfeloldó működésének részletes leírása: http://link.hnm.hu
- [11]: Cool URIs for the Semantic Web (https://www.w3.org/TR/cooluris/)
- [12]: https://listserv.niif.hu/pipermail/katalist/2017-May/036758.html
- [13]: Horváth Ádám – Hubay Miklós: A BIBFRAME új keretei 2017-ben: http://niif.videotorium.hu/hu/recordings/17770
- [14]: https://www.linkedin.com/pulse/bibframe-library-hungarian-national-museum-adam-horvath/
- [15]: https://wiki.dnb.de/display/EBW/European+BIBFRAME+Workshop+2017
- [16]: https://www.loc.gov/bibframe/implementation/register.html
”
Forrás:
Pötty lett a Magyar Nemzeti Múzeum; Horváth Ádám; Magyar Múzeumok Online (Pulszky Társaság – Magyar Múzeumi Egyesület); 2018. március 15.
Lásd még: Korábbi cikkeink a szemantikus web területéről.
Semantic Web; Wikipédia