informatikaInternetközigazgatás: magyarközigazgatási informatikaművelődésszakirodalom

404 Not Found – Ki őrzi meg az internetet? szakmai nap – A közgyűjtemények webarchiválási feladatairól tanácskoznak az OSZK-ban

Szerző: 2019. november 18.No Comments

„ A közgyűjtemények webarchiválási feladatairól tanácskoznak az Országos Széchényi Könyvtárban (OSZK) csütörtökön Budapesten.

A harmadik alkalommal megrendezett 404 Not Found – Ki őrzi meg az internetet? szakmai napnak a célja feltérképezni a webes tartalmak archiválásának lehetőségeit és határait – mondta el Hammerstein Judit, az OSZK megbízott főigazgatója a tanácskozás kezdetén.

Az elmúlt mintegy két évtizedben nagyon sok értékes tartalom csak online formában jelent meg, de ha volt nyomtatott változat is, egyáltalán nem biztos, hogy a kettő megegyezik egymással. Ezek a webes tartalmak archiválás nélkül idővel eltűnésre vannak ítélve – tette hozzá.

Hammerstein Judit kiemelte: a teljes magyar internet archiválása egyetlen országos szintű intézmény számára sem lehetséges. Jelenleg 4600 online hírportál, napilap és időszakos kiadvány lementése tűnik megoldhatónak rendszeresen, évente pár alkalommal. A lementett webes tartalmak elérhetőek lesznek az Országos Könyvtári Platformon (OKP) belül.

Latorcai Csaba, az Emberi Erőforrások Minisztériuma közigazgatási államtitkára kiemelte: 2006-ban merült fel először a magyar weboldalak tömeges archiválásának ötlete, amely 2016-ban bekerült az Országos Könyvtári Platform (OKP) 10 milliárd forintos fejlesztésének elemei közé is.

A 2017-ben indult webarchiválási tesztprojekt keretében 2018 decemberében 291 ezer magyar domain cím tartalmát mentették le. A technikai háttér tehát már létezik, a következő lépés a stabil jogszabályi és költségvetési támogatás kidolgozása – tette hozzá az államtitkár.

Latorcai Csaba kitért arra is: a tervek szerint az OSZK-nak 2021-től el kell tudnia látni a magyar vonatkozású webtartalmak mentésének, feldolgozásának, hosszú távú megőrzésének és webarchívumba rendezésének feladatát.

Az internet legkomplexebb médium, amellyel az elmúlt több száz évben valaha is találkoztak a közgyűjtemények. A web egyre nagyobb részét teszik ki a különböző szoftverek, ezért elképesztően nehéz az archiválása – hangsúlyozta Drótos László főkönyvtáros a konferencián.

Kiemelte: a webarchiválási tesztprojekt keretében 2018-ban mintegy 20 ezer webhelyet, 29 terabájt összméretű adatot mentettek le. Az eltárolt fájlok/URL-címek száma megközelíti az 500 milliót. Idén decemberben egy ennél is nagyobb szabású “aratásra” készülnek.

A tanácskozáson szó lesz egyebek mellett az online sajtócikkek adatbázisba rendezéséről, a webhelyek metaadatolási problémáiról, valamint az OSZK országos projektjén belüli, helyi érdekű webarchiválási lehetőségekről is.”

Forrás:
A közgyűjtemények webarchiválási feladatairól tanácskoznak az OSZK-ban; Emberi Erőforrások Minisztériuma; 2019. november 14.
Lásd még:
A harmadik workshopra 2019. november 14-én került sor, melyen Hammerstein Judit, az OSZK főigazgatója köszöntötte a közel 90 fős közönséget és Latorcai Csaba államtitkárt, aki megnyitó beszédében a web történetéről, kulturális szerepéről és a nemzeti könyvtár webarchiválási törekvéseinek fontosságáról beszélt. Az első prezentáció témája az OSZK-s projekt elmúlt egy évének áttekintése volt, majd négy további előadás következett, melyek a regionális, illetve a tudományos jellegű webes tartalmak megőrzéséről, az online sajtó aratásával begyűjtött szövegek kutatási célú hasznosításáról, valamint az élő és az archív webhelyek metaadatolásának kérdéseiről szóltak. A rendezvényt ezúttal is beszélgetés zárta az előadók és a közönség között. A rendezvény meghívója itt található.

Az előadások prezentációi:

Az előadások videofelvételei a Youtube-on:
404 NOT FOUND webarchiválási workshop
Az éves konferenciák webhelye (korábbi évek anyagai is)