MSc. Albert Bres
Sr. Jose Antonio Olvera
Ponència 4: La preservació del patrimoni digital personal
Què és el patrimoni ...
Lo més estimat: com es guarda i com es gaudeix
Cada persona li té més estima a alguns objectes digitals que a uns altres,...
diversos espais, siguin propis o aliens, és a dir, en el disc dur de l’ordinador que els produeix o
en el dels amics que ...
intenten tornar a l'usuari al que corresponen perquè aquests els torni a carregar i puguin
continuar vius desplaçant-se p...
Figura 4: Pantalla que mostra el que està passant en temps real
Per a l'obtenció de resultats, hem fet emulacions que ten...
decrementar-la considerablement, però tot i això després d'aquesta i de cadascuna de les
catàstrofes el sistema mostra un...
Té tres maneres diferents de funcionament amb les quals distribueix les còpies de les
fotografies:
 En local : les guar...
Figura 7: Imatges de l'aplicació Pyramid
Referències
[1] SaveMyMemories. http://www.savemymemories.org/
[2] Rivera Dono...
Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del Clúster TIC MEDIA de Girona, N...
of 9

Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del Clúster TIC MEDIA de Girona, Nov 24, 2011 (WORD)

Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del Clúster TIC MEDIA de Girona, Nov 24, 2011 (WORD)
Published on: Mar 4, 2016
Published in: Education      
Source: www.slideshare.net


Transcripts - Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del Clúster TIC MEDIA de Girona, Nov 24, 2011 (WORD)

  • 1. MSc. Albert Bres Sr. Jose Antonio Olvera Ponència 4: La preservació del patrimoni digital personal Què és el patrimoni personal La història està documentada en llibres, fotografies, pel·lícules, mapes, gravacions sonores, cròniques... I cada cop més, aquests materials es produeixen digitalment. Els blogs, fotografies digitals, pàgines web i correus electrònics creats avui, si es preserven, proveiran testament de la nostra història demà; això és el nostre patrimoni personal digital. Si explorem exemples del que els grans arxius i biblioteques han salvat de forma analògica veurem el que es perdria si no fóssim capaços de preservar la història digital . Un exemple molt proper és el cas del fotògraf Valentí Fargnoli [4], que va documentar la vida gironina en el trànsit dels segles XIX al XX. Un paisatge, una arquitectura i uns costums que no entendríem de la mateixa manera sense les imatges de pioners de la fotografia com ell. I és que l’ajuntament de Girona, conserva 4 milions de fotografies en total de tots aquests pioners de la fotografia. Però avui la relació entre la fotografia i l’entorn ha canviat fins al punt que cadascú de nosaltres ha esdevingut un Fargnoli i, per tant, gairebé tothom vol preservar tot allò que l’envolta. Encara no fa gaire temps que la memòria col·lectiva es construïa a partir d’unes poques mirades particulars i que les institucions públiques n’exercien la salvaguarda, a través dels arxius o les biblioteques. Però quan tots i cadascun de nosaltres esdevenim cronistes del temps que ens toca viure desbordem, per l’excés d’informació, la capacitat dels que fins ara havien gestionat la memòria. Tot apunta que l’única solució possible és que nosaltres mateixos ens responsabilitzem del treball de salvaguarda; però, com ho hauríem de fer? Fins ara, la resposta era copiar les imatges que es conservaven en discos durs locals o en servidors externs, però en el format en què havien estat preses. Tanmateix, els experts adverteixen que els formats dels arxius en què emmagatzemem les imatges no sobreviuen més de quinze anys, perquè l’avenç tecnològic els fa obsolets, la qual cosa vol dir que arribarà un dia en què no podrem mirar les imatges preses temps enrere perquè els lectors que hi haurà no sabran llegir els arxius. Som davant d’un problema d’abast considerable. Figura 1: «Girona: voltants – pont del riu Guell en l’antic camí de Sta. Eugenia:» FOTO: VALENTÍ FARGNOLI
  • 2. Lo més estimat: com es guarda i com es gaudeix Cada persona li té més estima a alguns objectes digitals que a uns altres, però en general, els que solen tenir més valor sentimental són les fotografies, els vídeos, les cartes (correus electrònics actualment), els diplomes... Aquests objectes digitals es guarden en el disc dur dels nostres ordinadors , en servidors remots o en xarxes socials com Facebook, YouTube i Flickr; guardar els objectes digitals és un tema que ja està resolt. El que no podem garantir, i que encara és un repte, és poder gaudir-lo al llarg del temps. Una persona pot gaudir el seu patrimoni personal en la intimitat o compartint-lo amb la seva gent, una vegada a l’any o cada sis mesos, però, com podem garantir que sempre ho puguem gaudir? En aquest punt ens trobem amb diversos problemes. Per una part tenim els problemes ocasionats pel hardware on s'emmagatzemen les fotografies, que es va deteriorant amb el pas del temps i es va quedant antiquat per la velocitat amb la que avança la tecnologia. A més s'afegeixen els problemes de software, com són:  Els virus, que poden danyar, alterar, o eliminar aquests fitxers  Les fotografies es poden arribar a eliminar per error. Som humans i cometem errors.  El software que s'utilitza per poder obrir els fit es queda obsolet.  Els canvis de format que puguin succeir amb el pas del temps.  Certs errors informàtics que corrompen els arxius (fotogràfics) i fa que els fitxers comprimits siguin especialment sensibles. Normalment una nova versió de software pot llegir els seus arxius anteriors, però això rares vegades supera les tres generacions cap enrere[2], pel que els fitxers més antics queden irrecuperables i la versió de l'aplicació que podia llegir-los ja no està disponible o no és llegible pels nous equips. Respecte als formats, el major risc el constitueixen els "formats propietaris" l'especificació dels quals no està disponible públicament, i que poden ser interpretats només pel software de la mateixa empresa; si aquesta decideix canviar el format o discontinuar el software, o bé cau en fallida o es fusiona amb una altra, els arxius dependents d'aquesta podrien quedar illegibles. A causa de tots aquests problemes, s'estima que la vida útil de la informació digitalitzada és aproximadament de deu a vint anys [3]. Això, que a priori no sembla un problema greu, comença a tenir conseqüències i es comencen a veure els efectes quan intentem obrir un fitxer i hem de descarregar-nos un software més antic o plug-in que permeti poder obrir-lo. I en el cas de les fotografies digitals, si comptem que es van popularitzar el 2005 (degut als indicis mostrats per gràfiques que mostren quan va començar la venta massiva de càmeres digitals per a l’ús personal), tindrem que cap al 2020 començarem a trobar greus símptomes. La preservació amb amics Una manera de preservar és aprofitant els amics que es puguin tenir en les xarxes socials. La idea és que es vagi realitzant còpies dels fitxers que vol preservar un usuari en diversos formats automàticament. Aquests formats, a mesura que passa el temps s’actualitzen perquè es descarten els vells i se n’incorporen de nous. I les còpies que es realitzen es distribueix en en
  • 3. diversos espais, siguin propis o aliens, és a dir, en el disc dur de l’ordinador que els produeix o en el dels amics que es tenen per exemple al Facebook o al Twitter. Llavors cada cert temps, quan es produeixi una "catàstrofe" (ve donada per qualsevol tipus de problema de software, com virus, eliminació per error, canvis de format o corrupció de fitxers) el que s'intentarà és recuperar els fitxers afectats amb el format més adient gràcies a aquest treball previ de realitzar còpies distribuïdes en diversos espais. Per tal de testejar aquesta estratègia de preservació, s'ha desenvolupat un prototipus que permet emular la preservació d'objectes digitals (OD) que tenim en la computadora fent que interactuïn amb un entorn simulat que representa una xarxa social, on succeeixen catàstrofes. El prototipus s'ha implementat emprant la tecnologia d'agents, agentificant els OD en el moment que decidim preservar-los. Aquests, es caracteritzen en que tenen un "pressupost digital", una espècie de crèdit per poder desplaçar-se per la xarxa social i anar fent còpies, que podran anar recarregant regularment, i que farà que competeixin entre ells per preservar-se. Com més interès tingui un OD, més pressupost rebrà i per tant tindrà més probabilitat de ser preservat. Figura 2: Estructura conceptual dels OD: tenen múltiples components que són preservats amb la redundància de format internament en l'SPADO, que tenen algunes regles que determinen la seva missió, i característiques socials que determinen com interactuarà, cooperarà i competirà pels serveis de preservació sota un pressupost limitat. D'aquesta manera tindrem un paradigma amb tres actors. Es tracta d'una aproximació centrada en els OD, on l'objecte té el rol de "cuidar-se" per ell mateix, els usuaris "pagaran" per la seva preservació i proveiran el saber com per "curar-los", i els serveis de preservació competeixen per preservar-los. Les característiques principals del prototipus d'emulació, que ajuden a entendre el seu funcionament general són les següents:  Les interconnexions entre els diferents nodes determinarà quins usuaris són amics de quins.  Per la xarxa viatjaran els OD, amb l’objectiu de fer còpies d’ells mateixos en altres ordinadors i en diferents formats per poder preservar-se. Quan es queden poc pressupost
  • 4. intenten tornar a l'usuari al que corresponen perquè aquests els torni a carregar i puguin continuar vius desplaçant-se per la xarxa i fent més còpies.  Cada node (ordinador) només podrà llegir un format determinat de vídeo o imatge, que anirà de més antic a més modern (d’1 a 5).  Quan succeeix una catàstrofe, aquesta afecta a un percentatge determinat d'usuaris de la xarxa sobre els quals es fa desaparèixer els OD que està allotjant en aquell moment per tal de simular l'obsolescència d'aquests OD.  Els agents que actuen en la simulació són: o Els usuaris (ofereixen servei de preservació) o Els objectes digitals (tenen pressupost de preservació digital) o Les catàstrofes (succeeixen cada cert temps) A més, aquest prototipus permet via interfície generar la topologia de xarxa social que es desitgi, ajustar els diversos paràmetres que actuen en l'emulació (ens permet poder fer diversos experiments), seleccionar els fitxers que es volen preservar, i una pantalla que mostra tot el que està passant en temps real. Figura 3: Pantalla que permet generar la topologia la xarxa social
  • 5. Figura 4: Pantalla que mostra el que està passant en temps real Per a l'obtenció de resultats, hem fet emulacions que tenen una durada de 20 anys, on succeeixen 3 catàstrofes, una cada 5 anys, on una proporció important de DO mor cada 20 anys. Així fem que coincideixi amb el factor de que cada 20 anys augmenten les dificultats per accedir als materials digitals. La mesura emprada és l'entropia de Shannon, per saber si hi ha prou diversitat de formats que proveeixen la suficient "resiliència" (capacitat de recuperació davant les pèrdues) per tornar a l'estat anterior, abans que succeeixin les catàstrofes. S'han realitzat catàstrofes que afecten a diferents percentatges d'usuaris de la xarxa, fent desaparèixer els OD que contenen en aquell moment; hem fet que afectin a un 10%, 33% i 50% dels usuaris de la xarxa. Aquestes emulacions s'han realitzat en diversos escenaris, amb diferents topologies de xarxa per determinar la seva repercussió sobre els resultats finals, tot i que en el present document només ho veurem aplicat sobre un escenari . S'han realitzat tantes execucions com han sigut necessàries fins a obtenir estabilitat estadística. Els resultats que es mostren a continuació han sigut realitzats sobre la topologia que s'observa a continuació (veure Figura 5), i l'evolució de l'entropia de els diversos experiments realitzat on les catàstrofes afecten a un 10, 33 i 50 percent dels usuaris de la xarxa es mostra en la Figura 6. Podem observar com l'entropia va augmentant fins que succeeix la primera catàstrofe, que fa
  • 6. decrementar-la considerablement, però tot i això després d'aquesta i de cadascuna de les catàstrofes el sistema mostra una resiliència molt important (es torna a recuperar la diversitat de formats). Si contrastem aquesta informació amb el percentatge de recuperació que mostren davant les catàstrofes (Taula 1) podem dir que en la primera catàstrofe mostren el percentatge més elevat de recuperació i en general va decreixent a mida que succeeixen les catàstrofes, segurament degut al breu interval entre catàstrofes. Cal destacar l'alt percentatge que obtenim de l'entropia al finalitzar l'emulació respecte l'entropia en el primer pic, abans que succeeixi la primera catàstrofe: per a una desaparició del 10% de fitxers obtenim un percentatge de recuperació de 101,78% (guanyem en diversitat de formats respecte l’inici de l’emulació), per a la desaparició del 33% obtenim un percentatge del 84,64% i per un a desaparició del 50%, un percentatge del 71,31%. Figura 5: Topologia de xarxa social emprada Figura 6: Resultats topologia 1 (small world). Adopció de software 10% 33% 50% Catàstrofe 1 152,93% 89,78% 75,82% Catàstrofe 2 96,40% 70,58% 63,53% Catàstrofe 3 77,04% 48,45% 52,78% Taula 1: Percentatge relatiu de recuperació després de cada catàstrofe Pyramid Aquesta és una aplicació, encara en desenvolupament que està en una versió alfa. Es tracta d'un programa preservador digital que s'encarrega de conservar el patrimoni personal digital (de moment centrat en fotografies) al llarg del temps de forma discreta i eficient.
  • 7. Té tres maneres diferents de funcionament amb les quals distribueix les còpies de les fotografies:  En local : les guarda en el disc dur de l'ordinador on està instal·lat el programa.  En cloud: les guarda en servidors remots.  En amics: les guarda en els discs durs dels amics que pot tenir l'usuari del programa. I les seves principals característiques són:  Fàcil d’instal·lar i utilitzar  No molesta ja que treballa en background  Automàtic. Un cop es selecciona les fotos digitals valuoses que vols preservar, du a terme la preservació per tu  Treballa igual que un antivirus, constantment buscant nous virus – en aquest cas l’analogia és amb els formats –  Segueix el principi open close: obert per extensions però obert per modificacions. És obert per afegir-li contínuament nous mòduls de “canvi de format”  Cooperatiu. Utilitza el poder de les xarxes socials  Distribuït. Un servidor pot fallar però no importa perquè les imatges estan distribuïdes arreu del món Aquesta aplicació està disponible a [5] i a continuació es mostren les pantalles principals:
  • 8. Figura 7: Imatges de l'aplicació Pyramid Referències [1] SaveMyMemories. http://www.savemymemories.org/ [2] Rivera Donoso M. A., Directrices para la creación de un programa de preservación digital. http://eprints.rclis.org/bitstream/10760/12989/1/Serie_N%C2%B043_Preservacion_digital .pdf [3] Jiménez León, A. (2006). Preservación digital vs obsolescencia de la información. Apertura, 3, 101-107. [4] Gorini, C. (2011). Tots som Fargnoli. http://www.udg.edu/LinkClick.aspx?fileticket=SfHmc1mFJFg%3D&tabid=12153&language =ca-ES [5] Pyramid http://www.pyramid.cat/