„ A közgyűjtemények webarchiválási feladatairól tanácskoznak az Országos Széchényi Könyvtárban (OSZK) csütörtökön Budapesten.
A harmadik alkalommal megrendezett 404 Not Found – Ki őrzi meg az internetet? szakmai napnak a célja feltérképezni a webes tartalmak archiválásának lehetőségeit és határait – mondta el Hammerstein Judit, az OSZK megbízott főigazgatója a tanácskozás kezdetén.
Az elmúlt mintegy két évtizedben nagyon sok értékes tartalom csak online formában jelent meg, de ha volt nyomtatott változat is, egyáltalán nem biztos, hogy a kettő megegyezik egymással. Ezek a webes tartalmak archiválás nélkül idővel eltűnésre vannak ítélve – tette hozzá.
Hammerstein Judit kiemelte: a teljes magyar internet archiválása egyetlen országos szintű intézmény számára sem lehetséges. Jelenleg 4600 online hírportál, napilap és időszakos kiadvány lementése tűnik megoldhatónak rendszeresen, évente pár alkalommal. A lementett webes tartalmak elérhetőek lesznek az Országos Könyvtári Platformon (OKP) belül.
Latorcai Csaba, az Emberi Erőforrások Minisztériuma közigazgatási államtitkára kiemelte: 2006-ban merült fel először a magyar weboldalak tömeges archiválásának ötlete, amely 2016-ban bekerült az Országos Könyvtári Platform (OKP) 10 milliárd forintos fejlesztésének elemei közé is.
A 2017-ben indult webarchiválási tesztprojekt keretében 2018 decemberében 291 ezer magyar domain cím tartalmát mentették le. A technikai háttér tehát már létezik, a következő lépés a stabil jogszabályi és költségvetési támogatás kidolgozása – tette hozzá az államtitkár.
Latorcai Csaba kitért arra is: a tervek szerint az OSZK-nak 2021-től el kell tudnia látni a magyar vonatkozású webtartalmak mentésének, feldolgozásának, hosszú távú megőrzésének és webarchívumba rendezésének feladatát.
Az internet legkomplexebb médium, amellyel az elmúlt több száz évben valaha is találkoztak a közgyűjtemények. A web egyre nagyobb részét teszik ki a különböző szoftverek, ezért elképesztően nehéz az archiválása – hangsúlyozta Drótos László főkönyvtáros a konferencián.
Kiemelte: a webarchiválási tesztprojekt keretében 2018-ban mintegy 20 ezer webhelyet, 29 terabájt összméretű adatot mentettek le. Az eltárolt fájlok/URL-címek száma megközelíti az 500 milliót. Idén decemberben egy ennél is nagyobb szabású „aratásra” készülnek.
A tanácskozáson szó lesz egyebek mellett az online sajtócikkek adatbázisba rendezéséről, a webhelyek metaadatolási problémáiról, valamint az OSZK országos projektjén belüli, helyi érdekű webarchiválási lehetőségekről is.”
Forrás:
A közgyűjtemények webarchiválási feladatairól tanácskoznak az OSZK-ban; Emberi Erőforrások Minisztériuma; 2019. november 14.
Lásd még:
A harmadik workshopra 2019. november 14-én került sor, melyen Hammerstein Judit, az OSZK főigazgatója köszöntötte a közel 90 fős közönséget és Latorcai Csaba államtitkárt, aki megnyitó beszédében a web történetéről, kulturális szerepéről és a nemzeti könyvtár webarchiválási törekvéseinek fontosságáról beszélt. Az első prezentáció témája az OSZK-s projekt elmúlt egy évének áttekintése volt, majd négy további előadás következett, melyek a regionális, illetve a tudományos jellegű webes tartalmak megőrzéséről, az online sajtó aratásával begyűjtött szövegek kutatási célú hasznosításáról, valamint az élő és az archív webhelyek metaadatolásának kérdéseiről szóltak. A rendezvényt ezúttal is beszélgetés zárta az előadók és a közönség között. A rendezvény meghívója itt található.
Az előadások prezentációi:
- Drótos László (OSZK): Az OSZK webarchívumának újdonságai (14,7 MB)
- Kokas Károly (SZTE EK): Szegedikum a webarchívumban – A helyi érdekű webarchiválás lehetőségei az OSZK webarchiválási programja keretében
- Holl András (MTA Könyvtár): noWebarchive – Amikor nem a webarchiválás a megfelelő módszer a web archiválására (2,5 MB)
- Indig Balázs (ELTE Digitális Bölcsészeti Központ): Online sajtócikkek adatbázisba rendezése webaratás segítségével (1,1 MB)
- Ilácsa Szabina (OSZK): Webhelyek metaadatolási problémái (1,5 MB)
Az előadások videofelvételei a Youtube-on:
404 NOT FOUND webarchiválási workshop
Az éves konferenciák webhelye (korábbi évek anyagai is)