Marisa R. De Giusti, Ariel J. Lira, Gonzalo Villarreal, Agustín Terruzzi, Facundo
Adorno
Preservación digital:
un experime...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Parte 1 - Conceptos básicos
Repositorio, ...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
El repositorio
Un Repositorio es una infr...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Preservación
Los recursos que se generan ...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
El primer paso: qué preservar
La “Guía Un...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
No sólo lo técnico
Tránsito Ferreras Fern...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Problemas en la preservación
1. La propia...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Preservación: motivos y tendencias
• Mile...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Aproximaciones a la preservación
ISO 1472...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Parte 1 - Conceptos básicos
Repositorio, ...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Metadatos y metadatos de preservación
- I...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Metadatos y metadatos de preservación
•Me...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Metadatos de preservación
En resumen los ...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Deben guardarse las
relaciones que vincul...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Parte 1 - Conceptos básicos
Repositorio, ...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
PREMIS
PREMIS es un grupo de trabajo inte...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
PREMIS y OAIS
El Framework PREMIS puede s...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Entidad intelectual
Una entidad Intelectu...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Unidades discretas de información en form...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Eventos
La entidad Eventos agrega informa...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Agentes
Los Agentes pueden ser personas, ...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Unidades semánticas
“El Diccionario de Da...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Parte 1 - Conceptos básicos
Repositorio, ...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Directrices de la Norma ISO 14721. Última...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Preservation planning: sólo en la mente!!
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
OAIS (Open Archival Information System)
A...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Funciones del Modelo de Referencia
Las do...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
La unidad de intercambio entre un OAIS y ...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
ISO 14721: Fig 2-3: Paquete de
informació...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Variantes del IP: SIP, AIP y DIP
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
La información de contenido es el conjunt...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Información de representación
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Información de representación: item: http...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Debe brindar datos suficientes sobre la p...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
La información de empaquetado
es la que, ...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Parte 1 - Conceptos básicos
Repositorio, ...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
1) Metadatos descriptivos: soporta múltip...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
2) Metadatos Administrativos: información...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
3) Metadatos estructurales: mantiene sólo...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Modelo de datos en DSPACE
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
OAIS en DSPACE
DSpace está influenciado p...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
EXPERIMENTACIÓN
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Acciones propuestas
Las acciones propuest...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Acciones
La propuesta tiene como fin gene...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
SEDICI en números
• ITEMS TOTALES EN EL R...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
AssetStore en análisis
El conjunto de arc...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Formatos-Mime Types
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
De manera más simplificada
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
La presente evaluación va a analizar la e...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Qué verificar/medir/chequear: Metadatos
1...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
¿Qué hacer?
Con la experimentación propue...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Extensión de Driver
Si bien las directric...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Directrices Driver
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Qué tomar de Driver
Título, Creador, Fech...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Driver y algo más
•En algunos casos resul...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
1) Perfilamiento automático del repositor...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
5) Reporte final basado en los reportes p...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Experimento
Se analizaron 19230 archivos ...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Perfil en DROID
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Perfil exportado con MD5 para detección d...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Generación de tickets para mejora de cali...
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Reporte en DROID
exportado
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Modelo del Validador Desarrollado
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
¡Muchas gracias!
Marisa R. De Giusti
Arie...
of 66

Preservación digital: un experimento con SEDICI-DSpace

Objeto de conferenciaXX Asamblea General de ISTEC (Puebla, México, 2014)Sumario de la presentación: Parte 1 - Conceptos básicos. Repositorio, interoperabilidad, preservación, guías, proyectos Parte 2 - Metadatos de preservación Parte 3 - Directrices sobre preservación PREMIS, Modelo de datos PREMIS, METS Otros esquema de metadatos y más posibilidades en la preservación Parte 4- OAIS Parte 5- DSPACE Modelo de datos, OAIS en DspacePanel LibLink. Ver registro completo en: http://sedici.unlp.edu.ar/handle/10915/34889
Published on: Mar 4, 2016
Source: www.slideshare.net


Transcripts - Preservación digital: un experimento con SEDICI-DSpace

  • 1. Marisa R. De Giusti, Ariel J. Lira, Gonzalo Villarreal, Agustín Terruzzi, Facundo Adorno Preservación digital: un experimento con SEDICI-DSPACE
  • 2. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Parte 1 - Conceptos básicos Repositorio, interoperabilidad, preservación, guías, proyectos Parte 2 - Metadatos de preservación Parte 3 - Directrices sobre preservación PREMIS, Modelo de datos PREMIS, METS Otros esquema de metadatos y más posibilidades en la preservación Parte 4- OAIS Parte 5- DSPACE Modelo de datos, OAIS en Dspace Índice
  • 3. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar El repositorio Un Repositorio es una infraestructura web capaz de brindar un conjunto de servicios a una comunidad, destinados a recopilar, gestionar, difundir y preservar contenidos a través de una colección organizada y accesible en abierto que debe estar provista de facilidades que le permiten interoperar con otros repositorios similares. El desarrollo de los servicios en un repositorio no es parejo: gestión y difusión avanzadas, recopilación compleja, preservación: reciente.
  • 4. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Preservación Los recursos que se generan como resultado de los conocimientos de las personas y de sus expresiones “nacen”, cada vez más, en formas digitales, sean de carácter cultural, educativo, o engloben información de diferentes áreas del saber, ya sean de naturaleza técnica, artística o administrativa. Los productos de origen digital pueden no contar con un respaldo físico, por ejemplo en papel. La preservación digital se define como el conjunto de prácticas de naturaleza política, estratégica y acciones concretas, destinadas a asegurar el acceso a los objetos digitales a largo plazo.
  • 5. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar El primer paso: qué preservar La “Guía Unesco: Directrices para la preservación del Patrimonio Digital” [1], sostiene en su artículo 5.2.1 sobre Patrimonio que “El patrimonio digital está constituido únicamente por aquellos que se considera que poseen un valor permanente”. Este es el primer punto de un plan de preservación: definir materiales y tiempos de preservación de cada uno. [1] UNESCO “Directrices para la preservación del Patrimonio digital | Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura,” 2012.
  • 6. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar No sólo lo técnico Tránsito Ferreras Fernández [2] : “los esfuerzos para preservar los objetos digitales no se acaban con lo técnico, sino que existen otros retos: legales (permiso de los autores), económicos e institucionales (compromiso permanente) para llegar al resultado de perdurabilidad”. [2] T. Ferreras Fernández, “Preservación digital en repositorios institucionales: GREDOS,” 2010. [Online].
  • 7. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Problemas en la preservación 1. La propia naturaleza de los objetos digitales los hace efímeros. 2. La obsolescencia de los medios informáticos: dado que los OD siempre están mediados por la tecnología que cambia constantemente; una inadecuada vigilancia o falta de transformaciones puede dejarlos inaccesibles. La incompatibilidad entre sistemas nuevos y antiguos sumado a que los formatos, medios de soporte, software y hardware quedan obsoletos en poco tiempo.
  • 8. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Preservación: motivos y tendencias • Miles de objetos digitales sometidos a la obsolescencia tecnológica: fragilidad de los objetos digitales y obsolescencia de los medios informáticos. • La necesidad de metadatos apropiados para mantener el acceso a ese patrimonio. Tendencias: Digital curation (ciclo de vida) Digital preservation (a largo plazo) Web archiving…
  • 9. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Aproximaciones a la preservación ISO 14721: 2012
  • 10. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Parte 1 - Conceptos básicos Repositorio, interoperabilidad, preservación, guías, proyectos Parte 2 - Metadatos de preservación Parte 3 - Directrices sobre preservación PREMIS, Modelo de datos PREMIS, METS Otros esquema de metadatos y más posibilidades en la preservación Parte 4- OAIS Parte 5- DSPACE Modelo de datos, OAIS en Dspace Índice
  • 11. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Metadatos y metadatos de preservación - ID - Título - Autor - Idioma - Fecha - etc - Procedencia, - Autenticidad - Contexto - Gestión de derechos - Actividades de preservación
  • 12. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Metadatos y metadatos de preservación •Metadatos tradicionales: describen, explican, localizan, facilitan la localización y gestionan un recurso, pueden ser descriptivos, administrativos o estructurales (hay modos diferentes de clasificarlos). •Metadatos de preservación: documentan el proceso de preservación de los recursos digitales, también son descriptivos, administrativos y estructurales (si se sigue la misma taxonomía previa)
  • 13. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Metadatos de preservación En resumen los metadatos de preservación están destinados a almacenar los detalles técnicos sobre el formato, la estructura, el acceso y el uso de los contenidos digitales, la historia de todas las acciones realizadas en el recurso, incluyendo los cambios, la información de autenticidad, las características técnicas o la historia de la custodia y las responsabilidades y la información sobre los derechos con que se cuenta para realizar las acciones de preservación.
  • 14. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Deben guardarse las relaciones que vinculen al objeto con otros Debe mantenerse en el repositorio de manera segura. El repositorio debe tener los derechos suficientes para sostener el acceso al objeto Autenticidad Mediante la documentación de su procedencia Las estrategias de emulación y migración requieren datos sobre los objetos originales y sus entornos Su soporte debe ser compatible con los sistemas actuales Debe poder ser localizado y entregado al usuario. Si hay un cambio, debe saberse quién lo efectuó Debe conocerse su Creador OD y metadatos de preservación: Los metadatos que son útiles a la preservación pueden verse más fácilmente en su utilidad en esta gráfica donde se representa junto al Objeto de Información (OD), las acciones a realizar para su preservación de las cuales se desprenden los metadatos necesarios.
  • 15. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Parte 1 - Conceptos básicos Repositorio, interoperabilidad, preservación, guías, proyectos Parte 2 - Metadatos de preservación Parte 3 - Directrices sobre preservación PREMIS, Modelo de datos PREMIS, METS Otros esquema de metadatos y más posibilidades en la preservación Parte 4- OAIS Parte 5- DSPACE Modelo de datos, OAIS en Dspace Índice
  • 16. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar PREMIS PREMIS es un grupo de trabajo internacional patrocinado por Online Computer Library Center (OCLC) y Research Libraries Group (RLG) que se enfoca en estrategias de implementación de metadatos de preservación en Archivos Digitales. En 2008, este grupo elaboró el Diccionario de Datos PREMIS para Metadatos de Preservación el cual define los metadatos de preservación como “la información que utiliza un repositorio para dar soporte al proceso de preservación digital”. El diccionario de datos PREMIS define un conjunto de unidades semánticas, propiedades, e información que la mayoría de los repositorios necesita conocer de sus entidades para asegurar la preservación. Tanto el Framework como el Diccionario de Datos PREMIS se adaptan al modelo de referencia OAIS- ISO 14721. http://www.bne. es/es/Micrositios/Guias/DiccionarioPremis/resources/images/docs/PREMIS_es.pdf
  • 17. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar PREMIS y OAIS El Framework PREMIS puede ser considerado una aplicación práctica del modelo de referencia OAIS a través del mapeo de los metadatos de preservación a esa estructura conceptual; el Diccionario de Datos PREMIS puede ser entendido como la traducción del Framework a un conjunto de unidades semánticas.
  • 18. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Entidad intelectual Una entidad Intelectual es un conjunto de contenidos que se considera como una unidad intelectual individual al propósito de gestión y descripción. El diccionario de datos no determina los metadatos descriptivos a vincular a una entidad intelectual, sino que deja abierta la elección a cualquier formato deseado.
  • 19. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Unidades discretas de información en forma digital, que se clasifican en tres tipos: archivo (file), representación (representation) y cadenas de bits (bitstream). El objeto archivo es tal cual entendemos normalmente, p.e. un archivo PDF de un capítulo de un libro. El objeto representación es el conjunto de todos los archivos que se necesitan para representar la entidad Intelectual (un libro), incluyendo los metadatos estructurales. Los objetos cadenas de bits son subconjuntos de archivo con propiedades útiles a la preservación, en el ejemplo del libro el archivo JPEG de la tapa puede tener sus propios identificadores y metadatos. La información que se puede registrar en los objetos incluye: un identificador, la integridad, el tamaño, información sobre la creación, sobre el entorno, el soporte y la relación con otros objetos y otros tipos de entidades. Objetos
  • 20. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Eventos La entidad Eventos agrega información sobre acciones que un agente, o varios, lleva adelante sobre los objetos de los repositorios, por ejemplo: el identificador del acontecimiento (no repetible), el tipo (creación, migración, etc), la fecha de ocurrencia del evento, la descripción y el resultado codificado del acontecimiento así como los agentes.
  • 21. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Agentes Los Agentes pueden ser personas, organizaciones o aplicaciones de software con actividades o responsabilidades en los eventos. El Diccionario de datos aconseja como información: un identificador único, el nombre del agente y su tipo (por ej. persona).
  • 22. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Unidades semánticas “El Diccionario de Datos PREMIS define unidades semánticas. Cada unidad semántica especificada en el Diccionario de Datos se mapea a una de las entidades del modelo de datos. En este sentido, una unidad semántica puede entenderse como una propiedad de una entidad. Por ejemplo, la unidad semántica size es una propiedad de la entidad Objeto. Las unidades semánticas poseen valores: para un objeto concreto el valor de size puede ser «843200004»”. “” Tomada del diccionario de datos PREMIS.
  • 23. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Parte 1 - Conceptos básicos Repositorio, interoperabilidad, preservación, guías, proyectos Parte 2 - Metadatos de preservación Parte 3 - Directrices sobre preservación PREMIS, Modelo de datos PREMIS, METS Otros esquema de metadatos y más posibilidades en la preservación Parte 4- OAIS Parte 5- DSPACE Modelo de datos, OAIS en Dspace Índice
  • 24. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Directrices de la Norma ISO 14721. Última versión Junio de 2012. ISO Reference Model for an Open Archival information System (OAIS)
  • 25. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Preservation planning: sólo en la mente!!
  • 26. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar OAIS (Open Archival Information System) Archivo que comprende una organización de personas y sistemas que han asumido el compromiso de preservar a largo plazo y hacer disponible un determinado corpus de información (cualquier tipo de conocimiento a intercambiar) para una comunidad designada. Se refiere a la información analógica y a la digital, pero el foco está en esta última. Open (abierto): se usa para indicar que esta recomendación ha sido realizada en foros abiertos. No significa que el archivo es de acceso gratuito o irrestricto. Puede ser cualquiera.
  • 27. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Funciones del Modelo de Referencia Las dos funciones principales del modelo son conservar la información y garantizar el acceso a la misma. El modelo funcional OAIS, que se propone lograr estos objetivos amplios, en cierta medida, define la arquitectura aproximada de cualquier tipo de sistema de software diseñado para cumplir con esta norma y con todo tipo de flujos de trabajo asociados con el repositorio.
  • 28. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar La unidad de intercambio entre un OAIS y su medioambiente es el paquete de información (IP). • Un IP contiene 2 tipos de información: • De contenido (CI) • De descripción de preservación (PDI) La información de contenido y la PDI pueden verse como encapsuladas e identificables por medio de la información de empaquetado. • El paquete resultante es recuperable en virtud de la información descriptiva: DI.
  • 29. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar ISO 14721: Fig 2-3: Paquete de información: conceptos y relaciones
  • 30. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
  • 31. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Variantes del IP: SIP, AIP y DIP
  • 32. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar La información de contenido es el conjunto de información que es el objetivo original de la preservación de la OAIS. La información de contenido es el contenido de datos del objeto, junto con su representación de la información. Los objetos de datos contenidos en la información de contenido puede ser un objeto digital o un objeto físico (por ejemplo, una muestra física de microfilm). Cualquier objeto de información puede servir como información de contenido. Información de contenido
  • 33. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Información de representación
  • 34. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Información de representación: item: http://sedici.unlp.edu.ar/handle/10915/25088 Archivos del ítem
  • 35. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Debe brindar datos suficientes sobre la procedencia, el contexto, la referencia y la integridad. La procedencia, más allá de describir la fuente, incluye los procesos que se han realizado sobre la información: la historia del objeto, cambios, versiones y responsables. El contexto muestra las relaciones con otras fuentes de información o contenidos. La referencia provee una identificación única del contenido. La integridad (o fijeza) provee una protección para que la información no sea alterada de manera intencional /no. Información descriptiva de preservación (PDI)
  • 36. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar La información de empaquetado es la que, ya sea real o lógicamente, une, identifica y relaciona la información del contenido y la PDI. La información descriptiva es la información que se utiliza para descubrir qué paquete tiene la información de contenido de interés.
  • 37. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Parte 1 - Conceptos básicos Repositorio, interoperabilidad, preservación, guías, proyectos Parte 2 - Metadatos de preservación Parte 3 - Directrices sobre preservación PREMIS, Modelo de datos PREMIS, METS Otros esquema de metadatos y más posibilidades en la preservación Parte 4- OAIS Parte 5- DSPACE Modelo de datos, OAIS en Dspace Índice
  • 38. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar 1) Metadatos descriptivos: soporta múltiples formatos de metadatos no jerárquicos y permite mantener para un mismo ítem, metadatos de diversos formatos, habilitando de esta forma la utilización de uno o más Application Profiles. Para colecciones y comunidades, sólo permite gestionar una serie de campos fijos básicos aunque probablemente en las próximas versiones de Dspace se permita configurar los metadatos como sucede con los items. DSpace 3 grupos lógicos de metadatos para el contenido archivado
  • 39. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar 2) Metadatos Administrativos: información de procedencia y permisos de acceso y uso sobre cada item, colección y comunidad. Se registran campos adicionales sobre varios elementos: tamaño, suma de comprobación y tipo MIME de cada archivo. DSpace 3 grupos lógicos de metadatos para el contenido archivado
  • 40. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar 3) Metadatos estructurales: mantiene sólo unos pocos metadatos estructurales sobre los archivos de cada ítem p.e. la relación de pertenencia entre paquetes de archivos (bundles) y orden. Dependiendo cómo se armen las comunidades y colecciones, pueden considerarse las relaciones de pertenencia a colección como un metadato estructural. Para los ítems, es posible almacenar información estructural en los bitstreams o metadatos, aunque inicialmente no se provee nada. DSpace 3 grupos lógicos de metadatos para el contenido archivado
  • 41. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Modelo de datos en DSPACE
  • 42. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar OAIS en DSPACE DSpace está influenciado por el modelo OAIS, en términos de metodología y funciones. Siempre que es posible, adopta el modelo y vocabulario OAIS para articular su propio diseño y metodología. El modelo de datos, los metadatos y el módulo de autorizaciones cumplen con el modelo de referencia. En términos de la preservación digital, el sistema proporciona los metadatos de preservación como en el modelo OAIS y el identificador persistente Handle (http://www. handle.net/ ). Sin embargo, la arquitectura de Dspace no coincide con el modelo funcional de OAIS, por ejemplo, no hay disponible un módulo separado de planeamiento de la preservación (Preservation Planning).
  • 43. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar EXPERIMENTACIÓN
  • 44. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Acciones propuestas Las acciones propuestas están vinculadas justamente a los elementos constitutivos del paquete de información: la información de contenido (CDO), la información sobre la representación de ese contenido (RI), la información descriptiva de preservación (PDI), la información de empaquetado (PI) y la información descriptiva (DI).
  • 45. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Acciones La propuesta tiene como fin generar un reporte sobre el estado de los objetos del repositorio, considerándolos como paquetes de información. Se reportará que están bien formados (o no) y serán preservables (o no) si cuentan con todos los elementos que la norma define para el paquete de información; también se validará que cada elemento esté bien formado en el sentido de que cumple con una serie de estándares o criterios que se van a definir a continuación. Si los paquetes de información en el repositorio se adecúan a los criterios establecidos, los objetos digitales del repositorio y por tanto el repositorio mismo “pasan” la evaluación.
  • 46. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar SEDICI en números • ITEMS TOTALES EN EL REPOSITORIO: 30.323 • ITEMS CON BITSTREAM: 19.656 • ITEMS CON BITSTREAM y CON FULLTEXT: 18.599
  • 47. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar AssetStore en análisis El conjunto de archivos analizados de SEDICI comprende 17359 PDFs en diferentes versiones, 47 archivos en Flash, 4 BMPs, 5 PPTs, 583 audios en MPEG, 1 archivo en MOBI, 200 JPEGs, 1 ePub, 1 archivo de Adobe Illustrator, 4 archivos en x-msvideo.
  • 48. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Formatos-Mime Types
  • 49. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar De manera más simplificada
  • 50. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar La presente evaluación va a analizar la estructuración de contenidos bajo el criterio de usabilidad específico que es la accesibilidad: • Content (del RI) – Accesibilidad de los contenidos para la comunidad designada de usuarios. Objetivo de la evaluación
  • 51. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Qué verificar/medir/chequear: Metadatos 1) Sobre el perfilamiento y el registro PRONOM próximas hojas. 2) La información descriptiva de preservación (PDI) para OAIS debe brindar datos suficientes sobre la procedencia (provenance), el contexto (context), la referencia (reference), la integridad (fixity) y los derechos de acceso (access rights). 3) La información de empaquetado de los objetos deberá seguir las indicaciones de la Norma OAIS. Se anotan a continuación algunos puntos destacados de la Norma al respecto de esto que se encuentran en el Capítulo 4.2 de la Norma titulado “Modelo Funcional”. 4) Metadatos descriptivos: Las Directrices Driver, desarrolladas en el ámbito del proyecto DRIVER.
  • 52. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar ¿Qué hacer? Con la experimentación propuesta en los cuatro pasos precedentes se construirá la evaluación, la cual deberá además brindar un reporte adecuado y una recomendación de acciones a seguir en el caso de objetos que no cumplan con los requerimientos.
  • 53. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Extensión de Driver Si bien las directrices Driver están dadas pensando en recursos textuales, se van a extender aquí a recursos no textuales que brinda el RI, es decir para todos los recursos se verificará si cumplen con todos los metadatos que pide Driver para la interoperabilidad de los repositorios. Se podrían mirar también las Directrices OpenAIRE que sí son extensibles, pero el hecho que se use un subconjunto de metadatos descriptivos, se justifica por el Modelo OAIS en sí mismo, que dice que se refiere “a la información descriptiva necesaria para la localización”.
  • 54. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Directrices Driver
  • 55. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Qué tomar de Driver Título, Creador, Fecha, Tipo e Identificador (este último será parte de la PDI, entonces no vuelve a considerarse aquí). Los elementos Description (en el archivo DC XML de SEDICI) y Subject (en el metadata sedici xml) ya se tienen y serán considerados, manteniendo el criterio de que por esos dos (aunque no estén) no se evalúe negativo, pero tal vez sea importante chequear qué porcentaje lo tienen y cuántos no. Se atenderá además al punto de Driver: Normalización de descripción: Interoperabilidad semántica p.e. Creator* y Contributor: sintaxis: Apellido, iniciales (primer nombre) APA. bibliographic writing style as in a reference list.
  • 56. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Driver y algo más •En algunos casos resulta obvio pensar si se acepta o no el objeto digital, por e.j. si no tiene un identificador persistente; en otros aspectos esto se hace más problemático, por ejemplo qué eventos se van a considerar imprescindibles. •PREMIS recomienda que se registren siempre las acciones que modifican un objeto y la entrada para el tipo de acontecimiento (eventType) del Diccionario de Datos proporciona una “lista de entrada” de tipos de acontecimientos importantes con el objetivo de promover que los repositorios registren estos acontecimientos de manera consistente. Esa será la guía que se utilizará para determinar la validez o no del objeto en cuanto a los eventos.
  • 57. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar 1) Perfilamiento automático del repositorio y reporte. Herramienta: DROID. Debido a la necesidad/posibilidad de generar tareas de curation para los ítems que no cumplan con todos los requisitos, se hace necesario conocer sobre qué ítems deberán realizarse las tareas, dado que DROID no muestra sus reportes para objetos individuales sino en global, se realizarán consultas directas para contrastar los resultados y completar las acciones. Ver archivo de resultados. 2, 3 y 4) Revisión de la PDI de SEDICI, revisión de la Información de empaquetado y de los metadatos descriptivos y reporte que de cuenta de la adecuación o no con los patrones establecidos: PDI de OAIS, Información de empaquetado de OAIS y metadatos descriptivos según Directrices Driver. Validador según desarrollo propio. ¿Cómo aplicar la metodología?
  • 58. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar 5) Reporte final basado en los reportes parciales de 1,2,3,4. 6) Recomendación de acciones: 6.1) Formato antiguo - herramienta de migración automática (CRIB, Preservation action services de la Universidad de Minho y/o el workflow de Taverna y MiniMEE la herramienta de migración de Plato). 6.2) PDI defectuosa---> tarea de curation (automática) generada en SEDICI. 7) Propuesta de un Plan de Preservación para SEDICI cuya herramienta de creación es Plato (en experimentación) ¿Cómo aplicar la metodología?
  • 59. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Experimento Se analizaron 19230 archivos de un AssetStore completo de Diciembre de 2013. De entre esa totalidad de archivos 18522 son archivos reales y el resto folders. Filtrados los folders, se caracterizan los archivos por su formato PUID (Persistent Unique Identifier) y se analiza el riesgo, como tarea colateral se observa si hay repetición en el checksum (MD5) y de acontecer esto se revisan los casos. Luego, con los casos sospechosos se generan las tareas de análisis, revisión y corrección para que los administradores de SEDICI resuelvan el problema.
  • 60. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Perfil en DROID
  • 61. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Perfil exportado con MD5 para detección de duplicados
  • 62. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Generación de tickets para mejora de calidad
  • 63. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Reporte en DROID exportado
  • 64. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar Modelo del Validador Desarrollado
  • 65. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar
  • 66. Servicio de Difusión de la Creación Intelectual, Argentina :: sedici.unlp.edu.ar ¡Muchas gracias! Marisa R. De Giusti Ariel J. Lira Gonzalo Villarreal Agustín Terruzzi Facundo Adorno marisa.degiusti@sedici.unlp.edu.ar alira@sedici.unlp.edu.ar gonzalo@sedici.unlp.edu.ar agustinterruzzi@sedici.unlp.edu.ar facundo@sedici.unlp.edu.ar

Related Documents