Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Table of Contents
minLevel2
outlinetrue
stylenone

Warning
titleRegistrar no es importar

Los procedimientos descritos a continuación no importarán los bitstreams al sistema DSpace. Simplemente informarán a DSpace sobre una ubicación existente donde se pueden encontrar estos bistreams. Para obtener información sobre cómo importar metadatos y bistreams, consulte la sección Importación y exportación de ítems mediante el formato de Archivo Simple (Simple Archive Format).

Visión general

El registro es un método alternativo para incorporar ítems, sus metadatos y sus bistreams en DSpace, aprovechando que los bistreams ya se encentran almacenados en una ubicación accesible para DSpace. Un ejemplo puede ser la existencia de un repositorio con archivos digitales preexistentes. En lugar de utilizar el proceso interactivo habitual de ingestión o la importación por lotes para proporcionar los metadatos a DSpace y subir los bistreams, el registro permite suministrar a DSpace los metadatos y la ubicación de los bistreams. Dspace utiliza una variación de la herramienta de importación para llevar a cabo el proceso de registro.

Almacenamiento accesible

Para registrar un ítem, sus bistreams deben estar ubicados en un almacenamiento accesible para DSpace y, por lo tanto, deben ser referenciados mediante un número de almacén de activos (asset store) definido en dspace.cfg. El archivo de configuración dspace.cfg establece uno o más almacenes de activos utilizando un número entero de almacén. Este número se asocia a un directorio en el sistema de archivos del servidor donde está instalado DSpace, o bien un conjunto de parámetros de cuenta SRB. Este número de almacén de activos se describe en la sección archivo de propiedades de configuración dspace.cfg y también dentro del mismo archivo dspace.cfg. Generalmente, los números de almacén utilizados para ítems registrados no deberían coincidir con el valor de la propiedad assetstore.incoming, ya que probablemente no se desee mezclar los bistreams de ítems registrados con los que se han ingerido o importado mediante los métodos habituales.

Registrar ítems usando el importador de ítems

DSpace utiliza la misma herramienta de importación que se emplea para la importación por lotes, aunque con algunas variaciones que permiten soportar el registro. La explicación a continuación asume familiaridad con la herramienta de importación.

El Formato de Archivo Simple de DSpace para el registro no incluye los archivos de contenido reales (bistreams) que se van a registrar. El formato es, sin embargo, un directorio que contiene todos los ítems por registrar. Cada subdirectorio de ítem contiene un archivo con los metadatos descriptivos del ítem (dublin_core.xml) y un archivo que enlista los archivos del contenido del ítem (contents), pero no incluye los archivos de contenido reales.

El archivo dublin_core.xml para el registro de ítems es exactamente igual al utilizado para la importación regular de ítems.

El archivo contents, al igual que en la importación regular, enlista los archivos de contenido del ítem por línea. Sin embargo, cada línea tiene uno de los siguientes formatos:

Code Block
-r -s n -f filepath
-r -s n -f filepath\tbundle:bundlename
-r -s n -f filepath\tbundle:bundlename\tpermissions: -[r|w] 'group name'
-r -s n -f filepath\tbundle:bundlename\tpermissions: -[r|w] 'group	name'\tdescription: some text

Donde

  • -r indica un archivo que se registrará
  • -s n indica el número del almacén de activos (n)
  • -f filepath indica la ruta y nombre de archivo de contenido a registrar (filepath)
  • \t representa un carácter de tabulación
  • bundle:bundlename es un nombre de paquete (bundle) opcional
  • permissions: -[r|w] 'group name' es un permiso de lectura o escritura opcional que puede asignarse al bitstream
  • description: some text es un campo de descripción opcional que se puede añadir al archivo
    Todo lo que viene después de la ruta del archivo (filepatch), es opcional y es normal no usarlo.

La línea de comandos para realizar el registro es exactamente igual a la que se usa para la importación regular:

Code Block
[dspace]/bin/dspace import -a -e joe@user.com -c collectionID -s items_dir -m mapfile

(O usando la forma larga)

Code Block
[dspace]/bin/dspace import --add --eperson=joe@user.com --collection=collectionID --source=items_dir --map=mapfile

Las opciones --workflow y --test funcionarán tal como se describe en la sección importación de ítems.

La opción --delete también funcionará como se describe en dicha sección, pero los archivos de contenido registrados no serán eliminados del almacenamiento. Consulte la sección Eliminación de ítems registrados.

La opción --replace funcionará como se describe en los ítems de importación, pero debe usarse con precaución considerando los distintos casos y sus implicaciones. Cuando se combinan ítems antiguos y nuevos, registrados o ingeridos manualmente, existen cuatro combinaciones o casos a considerar. Lo más importante es que un ítem registrado antiguo que se elimine de DSpace usando --replace no será eliminado del almacenamiento. Consulte la sección eliminación de ítems registrados para más detalles sobre su ubicación. Un nuevo ítem añadido a DSpace usando --replace será ingerido normalmente o registrado, dependiendo de si en el archivo contents está marcado o no con la opción -r.

Identificación interna y recuperación de ítems registrados

Una vez que un ítem ha sido registrado, a simple vista es indistinguible de los ítems ingeridos de forma interactiva o mediante importación por lotes. Sin embargo, internamente existen algunas diferencias:

En primer lugar, no se utiliza el identificador interno generado aleatoriamente, ya que DSpace no controla la ruta ni el nombre del archivo del bitstream. En su lugar, la ruta y el nombre del archivo se especifican en el archivo contents.

En segundo lugar, la columna store_number de la tabla de base de datos bitstream contiene el número de almacén de activos especificado en el archivo contents.

En tercer lugar, la columna internal_id de la misma tabla contiene una bandera inicial (-R) seguida de la ruta y el nombre del archivo registrado. Por ejemplo, -Rfilepath, donde filepath representa la ruta y el nombre de archivos relativos al almacén de activos correspondiente al número especificado. Este almacén de activos puede ser un almacenamiento tradicional en el sistema de archivos del servidor DSpace o una cuenta SRB.

En cuarto lugar, se calcula una suma de verificación MD5 leyendo el archivo registrado, si se encuentra en almacenamiento local.

Los ítems registrados y sus bistreams pueden recuperarse de forma transparente, al igual que los ítems que han sido ingeridos normalmente.

Exportación de ítems registrados

Los ítems registrados pueden ser exportados como se describe en Exportación de ítems. En ese caso, el directorio de exportación contendrá copias reales de los archivos exportados, pero las líneas del archivo contents marcarán los archivos como registrados. Esto significa que si los ítems de DSpace se transfieren entre instancias de DSpace utilizando las herramientas de exportación e importación (ver Transferencia de Ítems entre Instancias de DSpace), los archivos marcados como registrados en el directorio de exportación serán registrados nuevamente en DSpace en vez de ser cargados e ingeridos normalmente.

Eliminación de ítems registrados

Si un ítem registrado se elimina de DSpace, ya sea de forma interactiva o usando las opciones --delete o --replace descritas en la sección Importación y Exportación de ítems mediante el Formato de Archivo Simple, el ítem desaparecerá de DSpace, pero sus archivos de contenido registrados permanecerán en su ubicación original, tal como estaban antes del registro. Los bitstreams que no fueron registrados, pero que fueron añadidos por DSpace como parte del proceso de registro (por ejemplo, archivos license.txt), sí serán eliminados.