Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

¿Cómo puedo dar comentarios sobre este documento?

Al Se puede insertar los comentarios en esta versión amigable para comentariosdel documento.

¿Qué son los ARK?

Los ARK ("Archival Resource Key," claves de recursos de archivo) son identificadores de alto funcionamiento que lo conducen a cosas y a descripciones de esas cosas. Por ejemplo, este ARK,

...

te lleva a una disertación y agrega . Al agregar dos '??' al final del ARK se debería llegar a su la descripción del objeto:

     https://n2t.net/ark:/67531/metadc107835/??

...

aparece dentro de dos URL diferentes (Localizadores uniformes de recursos, también conocidos como enlaces web o direcciones web):

           httphttp://ark.bnf.fr/ ark:/12148/btv1b8449691v/f29

           https  https://n2t.net/ ark:/12148/btv1b8449691v/f29

...

Los identificadores persistentes deberían seguir funcionando incluso cuando las cosas se mueven entre sitios web. Normalmente, cuando las cosas se mueven, todos los que alguna vez registraron los enlaces antiguos necesitarían saber cuáles son los nuevos enlaces, lo que es casi imposible. Ahí es donde entran los solucionadores de identificadores los resolvedores de identificadores.

¿Qué es un

...

resolvedor?

Un solucionadorresolvedor es un sitio web que se especializa en reenviar identificadores entrantes (los que se anunciaron originalmente a los usuarios) a los sitios web que estén mejor capacitados para manejarlos. En general, el reenvío se llama resolución ; Un paso en un proceso de resolución se llama redirección.

Para que un resolutor resolvedor funcione, su nombre de host (n2t.netark.bnf.fr) en los identificadores anteriores) debe elegirse cuidadosamente para que nunca sea necesario cambiarlo. Las organizaciones de memoria, algunas de ellas con siglos de antigüedad, tienden a tener nombres de host adecuados para resolverser resolvedor. Algunos solucionadoresresolvedores más jóvenes y conocidos son n2t.net (el solucionadorresolvedor ARK), identificaifiersidentifiers.org, doi.org, handle.net y purl.org.

...

Primero necesita un NAAN ("Name assigning authority number," Número de autoridad de asignación de nombre), que es un número reservado exclusivamente para su organización. Debe aparecer en cada ARK que su organización asigne, justo después de la etiqueta " ark:/ ". La NAAN en todas estas ARKs,

...

            http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29

                https://n2t.net/ark:/12148 /btv1b8449691v/f29

es 12148, e identifica de forma exclusiva la Biblioteca Nacional de Francia. Cada NAAN está asociado con la URL de un resolutor resolvedor para sus ARK, por ejemplo, para resolver resolver los 12148 ARK, agréguelos a http://ark.bnf.fr/ como se muestra arriba. El solucionador resolvedor N2T.net es inusual en el sentido de que dirige cualquier ARK al resolutor resolvedor registrado bajo su NAAN.

No hay ningún cargo por Es gratis obtener o usar un NAAN, y se lo puede solicitar uno completando un formulario en líneaa través de este formulario. Más de 500 organizaciones tienen un NAAN (bibliotecas, archivos, museos, departamentos universitarios, agencias gubernamentales, editoriales académicas y educativas, proyectos, etc.), todos incluidos en el registro público de NAAN.

...

Puede crear cadenas ARK como lo desee, siempre que use solo dígitos, letras (ASCII, sin signos diacríticos) y los siguientes caracteres:

= ~ * + @ _ $ . /

Los dos últimos caracteres están reservados en el caso de que desee revelar relaciones ARK.

Otra característica única de los ARK es que pueden aparecer guiones (' - ') pero son inertes de identidad, lo que significa que las cadenas que difieren solo por guiones se consideran idénticas; por ejemplo, estas cadenas

ark:/12345/141e86dc-d396-4e59-bbc2-4c3bf5326152

ark:/12345/141e86dcd3964e59bbc24c3bf5326152

Identificar lo mismo. La razón de esta característica es que los procesos de formateo de texto en el mundo introducen rutinariamente guiones adicionales en los identificadores, rompiendo enlaces a cualquier servidor que trate los guiones como significativos.

Los ARK distinguen entre letras minúsculas y mayúsculas, lo que hace posibles identificadores más cortos (52 vs 26 letras por posición de carácter). Sin embargo, la "forma ARK" es usar minúsculas a menos que necesite ARK más cortos. La restricción hace que sea más fácil para los resolutores resolvedores admitir sus ARK en caso de que lleguen del mundo con letras mayúsculas o mixtas, lo que sucede lamentablemente a menudo debido a la suposición persistente de 50 años de que los identificadores no distinguen entre mayúsculas y minúsculas. También puede considerar el uso del repertorio de caracteres de la herramienta Noid, que crea cadenas seguras para la transcripción utilizando el algoritmo más fuerte de dígitos de verificación del identificador principal; utiliza solo dígitos y consonantes menos 'l' (letra ell, a menudo confundida con el dígito 1):

0123456789bcdfghjkmnpqrstvwxz

Con respecto a la asignación, una estrategia común es aprovechar los identificadores heredados. Por ejemplo, un número de muestra de polilla de museo cd456f9_87 podría anunciarse debajo del ark:/12345/cd456f9_87. Es posible que sea necesario modificar algunos identificadores heredados en vista de las restricciones de caracteres ARK. La segunda estrategia común es crear cadenas completamente nuevas para sus ARK. En este caso, es importante considerar si hacerlos opacos o no opacos (o un poco de ambos).

¿Qué son los identificadores opacos?

Las cadenas de identificadores persistentes son típicamente opacas, revelando deliberadamente poco sobre a qué están asignadas, porque los identificadores no opacos no envejecen ni viajan bien. Los nombres de las organizaciones son notoriamente transitorios, razón por la cual los NAAN son números opacos. A medida que se corrigen los títulos y las fechas, los significados de las palabras evolucionan (p. Ej., Los acrónimos más inocentes pueden volverse ofensivos o infractores), las cadenas destinadas a ser persistentes pueden volverse confusas o políticamente desafiantes. La generación y asignación de cadenas completamente opacas también conlleva un riesgo, por ejemplo, los números asignados secuencialmente revelan información de tiempo y las cadenas que contienen letras pueden deletrear palabras involuntariamente (razón por la cual faltan vocales en el repertorio de caracteres recomendado).

Ejemplos de cadenas con un rango de opacidad
no opacoArchivo permanente de NetscapeGay_Divorcee_1934_April_1Resolver Resolvedor de nombre a cosa
opaco-ishx0001, x0002,..., x9998GD/1934/04/01n2t.net
opaquer141e86dc-d396-4e59-bbc2-4c3bf532615219340401n2t
opaquest141e86dcd3964e59bbc24c3bf5326152h8k74926g12148

...

Las cadenas opacas son "mudas" y, por lo tanto, difíciles de manejar, por eso los ARK fueron diseñados para ser identificadores "parlantes". Esto significa que si hay ARK Identifiers FAQ # metadata, un ARK que llega a su servidor con el '?' la inflexión debería poder hablar de sí misma.

¿Cómo hago que el contenido del servidor sea direccionable con ARK?

Primero, decida cuál será la experiencia del usuario al acceder a sus ARK, por ejemplo, un archivo de hoja de cálculo, un PDF, una imagen, una página de destino llena de metadatos formateados y un rango de opciones, etc. Cualquiera que elija, planifique su servidor para poder responder con metadatos si su ARK debería llegar con un '?' inflexión después de eso.

De lo contrario, servir ARK es como servir URL. Normalmente, las cadenas de URL entrantes direccionan (se asignan) al contenido que devuelve su servidor web. Si su servidor reconoce ARK, los ARK entrantes (expresados ​​como URL) deben asignarse al mismo contenido. Un enfoque común es asignar el ARK a la URL utilizando una tabla de software que actualiza cada vez que cambia la URL. En este caso, su servidor está actuando como un solucionador resolvedor local. Si no desea implementar esto usted mismo, existen herramientas y servicios de software ARK que pueden ayudarlo.

Otro enfoque es ejecutar su servidor web sin cambios, pero en lugar de actualizar las tablas locales, actualizaría las tablas de mapeo de ARK a URL que residen en un resolutor resolvedor no local. Se pueden encontrar ejemplos de esto entre los proveedores y en cualquier organización que actualice las tablas a través de EZID.cdlib.org (que, debido a una relación especial, actualiza las tablas de resolución en n2t.net).

¿Cómo cito o publicito un ARK?

Se prefiere la forma de URL (https o http) del ARK, por ejemplo,

https://n2t.net/ark:/99166/w66d60p2

Un ARK destinado para uso externo generalmente se publicita (libera, publica, difunde) de esta manera para que sea un identificador accionable. Si se necesita una visualización visual más compacta de un ARK, debe estar hipervinculado; por ejemplo, se puede lograr una visualización compacta de un hipervínculo HTML con

<a href=" https://n2t.net/ark:/99166/w66d60p2 "> ark:/99166/w66d60p2 </a>

Una decisión importante es si sus ARK basados ​​en URL utilizarán el nombre de host de su resolutor resolvedor local o el resolutorresolvedor N2T.net. Si el control local o el desarrollo de la marca es lo suficientemente importante, anunciaría ARK basados ​​en su resolutor resolvedor local (consulte la publicación de contenido con ARK). Si le preocupa la estabilidad de su nombre de host local, anunciaría sus ARK basados ​​en n2t.net (vea ejemplos de ambos).

Resolver sus ARK a través de N2T siempre es posible para los usuarios, independientemente de cómo los anuncie.

...

¿Qué es el N2T?

Estructura del resolutor N2T

N2T.net es un solucionadorresolvedor ARK global. N2T, que significa Name-to-Thing, es en realidad un solucionador resolvedor generalizado para asignar nombres a cosas, por lo que sabe dónde enrutar más de 600 otros tipos de identificadores: ARK, DOI, PMID, Taxon, PDB, ISSN, etc. estás interesado, el diagrama y el resto de esta respuesta dan un poco más de detalle.

Una solicitud llega del público en general como una URL que consiste en " https://n2t.net/ " seguido de un identificador (nombre). N2T busca ese identificador y redirige el enlace original a un enlace de reenvío. Para hacer esto, utiliza dos patrones de resolución diferentes. Primero N2T intenta resolver de acuerdo con la información encontrada en un identificador almacenado individual. De lo contrario, N2T intenta resolver de acuerdo con las reglas de clase almacenadas, en función del tipo de identificador. También hay una API N2T que requiere credenciales de inicio de sesión que permite operaciones por lotes y la generación de identificadores únicos.

...

En segundo lugar, N2T almacena más de 3500 registros de "reglas" para identificadores de enrutamiento que no se encuentran individualmente en N2T, pero para los cuales tiene información de redireccionamiento vinculada al tipo de identificador que se está resolviendo. Obtiene registros de reglas de varias fuentes, incluido el registro NAAN, una base de datos de hombros ARK y DOI y una asociación formal sobre identificadores compactos con identifiers.org.

Si la mayoría de los ARK se ejecutan en sus propios

...

resolvedors, ¿por qué existe también un

...

resolvedor global para ARK?

La mayoría de los ARK son creados por organizaciones que los anuncian ("publican") en función de sus propios resolversresolvedors. Por ejemplo, este ARK se publicó en función del solucionador resolvedor ark.bnf.fr :

          http://ark.bnf.fr/ ark:/12148/btv1b8449691v/f29

Tener que ejecutar y mantener su propio resolutor resolvedor es el costo de una autonomía completa. El uso de su propio resolutor resolvedor también le permite crear marcas a través del nombre de host, la desventaja es que las marcas son transitorias y tienden a hacer que los identificadores sean frágiles. Las presiones políticas e incluso legales (p. Ej., Marcas comerciales) pueden dificultar el soporte de nombres de host de marca más antiguos, por lo tanto, sus identificadores.

Esa es otra razón para tener el resolutor resolvedor global ARK. Las personas que se encuentren con un identificador roto en el futuro pueden encontrar que su nombre de host ya no existe, y si se trata de un ARK, pueden extraer la identidad central (comenzando con "ark:") y presentarla al resolutorresolvedor global n2t.net, como en

            https://n2t.net/ ark:/12148/btv1b8449691v/f29

Mi organización tiene su propio

...

resolvedor ARK. ¿Debería preocuparme por N2T.net?

Sí, por dos razones principales. Primero, si sus ARKs "en estado salvaje" se muestran sin su nombre de host de resolución (lo que significa que comienzan con "ark:...", que no es raro ver), la persona que quiera usarlos no necesitará saber el hostname siempre que puedan recordar agregar "n2t.net" delante de ellos. Esto funciona porque N2T conoce el nombre de host de resolución correcto.

En segundo lugar, aunque algunas organizaciones y sus nombres de host de resolución son de larga duración, la mayoría no lo son. Una persona que intente utilizar un ARK que contenga un nombre de host de resolución que no funcione puede reemplazar la parte que no funciona con "n2t.net". Si las circunstancias alguna vez lo obligan a cambiar su solucionadorresolvedor, este paso de reemplazo le da a las ARK que publicó antes del cambio una mejor oportunidad de trabajar.

Para evitar futuros inconvenientes, algunas organizaciones que ejecutan sus propios resolvers resolvedors pueden elegir desde el principio suprimir sus nombres de resolutor resolvedor y simplemente anunciar ("publicar") sus ARK basados ​​en n2t.net.

¿Por qué el 

...

resolvedor ARK global (n2t.net) no tiene la palabra "ARK"?

Cuando surgió la demanda de un solucionador resolvedor ARK global, los principios básicos de apertura y generalidad impidieron que los diseñadores crearan otro silo en el molde DOI/Handle/PURL. En cambio, el resolutor resolvedor ARK fue construido para ser un resolutor resolvedor genérico, independiente del esquema, llamado N2T (Name-to-Thing), que ahora resuelve más de 600 tipos de identificadores, incluidos ARK, DOI, Handles, PURL, URN, ORCID, ISSN, La resolución es esencialmente buscar en una tabla una cadena de identificación, independientemente del tipo, y redirigirla al lugar correcto.

...

Sí, los ARK se pueden asignar a cualquier nivel de granularidad, como un manuscrito, capítulos dentro de él, secciones de capítulos, subsecciones, etc. Un ARK también se puede asignar a una cosa que encierra otras cosas. En los ARK, el carácter '/' está reservado para ayudar al destinatario a comprender la contención, por ejemplo, el primer objeto a continuación contiene el segundo:

ark:/12148/btv1b8449691v

ark:/12148/btv1b8449691v/f29

Ese es el calificador de contención. Solo hay otro calificador ARK, e indica formas variantes de una cosa usando el carácter reservado ''. delante de un sufijo Por ejemplo, si estos ARK identifican documentos,

ark:/12148/btv1b8449691v/f29.pdf

ark:/12148/btv1b8449691v/f29.html

debido a que difieren solo por el sufijo.pdf o.html, se puede inferir que identifican dos formas diferentes del mismo documento.

...

  • Para mantener bajos los costos (detalles).
  • Para trabajar exactamente con los metadatos que desea.
  • Para poder crear identificadores sin metadatos.
  • Para poder crear un identificador incluso antes de que exista su objeto.
  • Tener un identificador tan pronto como cree el primer borrador de sus datos.
  • Mantener ese identificador privado mientras los datos y metadatos evolucionan, y decidir (quizás años) más tarde, publicarlo o descartarlo.
  • Para retener ese identificador después de la publicación, quizás luego asigne un identificador adicional, como un DOI.
  • Debido a que los ARK, creados para aplicaciones genéricas y no específicamente para contenido publicado, encajan naturalmente con objetos físicos como muestras o estaciones de campo.
  • Debido a que los solucionadores resolvedores de ARK pueden lidiar con identificadores dañados rutinariamente en el mundo mediante procesos de formateo de texto que introducen guiones.
  • Debido a que la mayoría de los ARK llevan un dígito de verificación de Noid que se puede usar para detectar todos los errores de transcripción comunes en lugar de solo algunos de ellos.
  • Para poder crear identificadores más cortos, ya que las mayúsculas y minúsculas permiten cadenas más densas (un mayor número de cadenas de una longitud dada).
  • Para poder cambiar el proveedor y/o la infraestructura sin tener que coordinar las transferencias de bases de datos con una autoridad central.
  • Para poder lidiar con el problema de división del espacio de nombres sin perder el control de sus identificadores.
  • Para vincular identificadores a diferentes tipos de compromisos de persistencia matizados.
  • Para poder agregar consultas (por ejemplo,? Lang = en) al resolver sus identificadores.
  • Utilizar una infraestructura abierta coherente con los valores de su organización.
  • Para vincular directamente a los objetos que valora en lugar de a las páginas de destino.
  • Para crear un identificador que permita millones (paso de sufijo).
  • Para acceder a metadatos convenientes y con todas las funciones a través de las identificaciones de preguntas frecuentes # de identificadores ARK.
  • Para integrarse fácilmente con API IIIF utilizando calificadores ARK.

...

https://n2t.net/ark:/99999/12345
https://doi.org/10.99999/12345
https:// handle.net/10.99999/12345
https://purl.org/99999/12345
https://<various>/urn:99999:12345
  1. el protocolo (https://) más un nombre de host,
  2. solo para ARK y URN, también hay una etiqueta ("ark:" o "urn:"),
  3. la autoridad de asignación de nombre (99999, 10.99999 o 99999), que es la organización o grupo que creó un identificador particular,
  4. y finalmente, el nombre o identificador local que asignó (12345).

...

Los ARK son inusuales en ser descentralizados. Si bien uno puede obtener servicios de resolución de un solucionadorresolvedor ARK global llamado n2t.net, más del 90% de los ARK en el mundo se publican sin usar   n2t.net   en el URL hostname. Más de 500 organizaciones registradas en todo el mundo han creado, entre ellas, un estimado de 3.200 millones de ARK y, al igual que con las URL, nadie ha pagado una tarifa de identificación para crearlas. Por supuesto que mantenerlos no es gratis. Nunca es gratuito mantener el acceso al contenido persistente a largo plazo, independientemente del tipo de identificador.

...

  • Páginas de destino: los DOI Crossref y DataCite enlazan con páginas de destino de editores construidas alrededor, pero no directamente, de los objetos que le interesan, pero los ARK pueden conectarse libremente directamente a los objetos que le interesan, lo que es amigable para las máquinas y los humanos, ya que no requiere un extra paso de navegación humana para tareas comunes como
    • abrir el archivo PDF de un artículo para leerlo,
    • haciendo referencia a un archivo de imagen destinado a incorporarse automáticamente en línea en un documento, y
    • citando una hoja de cálculo que se utilizará para el análisis directo de datos por software.
  • Los DOI, los identificadores, etc. no admiten las inflexiones de preguntas frecuentes sobre los identificadores ARK de estilo ARK que permiten el acceso a los metadatos, independientemente de si un identificador apunta a un objeto o su página de destino.
  • A diferencia de los DOI y los controladores, los ARK no tienen requisitos de metadatos. Los ARK que no se han lanzado al mundo son fáciles de eliminar.
  • Todas las cosas finalmente pasan, incluidos los nombres de host y la propia web y el protocolo " https://". Cuando esa primera parte del identificador deja de tener significado, solo los ARK y los URN incluirán la etiqueta (por ejemplo, "ark:") que indica el tipo de identificador que queda.
  • Para DOI, Manijas y PURL, debe usar sus respectivos solucionadoresresolvedores. ARKs y URNs, le permiten usar su propio resolutorresolvedor.
  • Para crear DOI y Manijas, se le exige que pague una tarifa de membresía y, para los DOI, las agencias de asignación imponen los cargos por DOI de varias maneras. No hay tarifas para ARK, PURL y URN.
  • Para crear Handles, debe instalar y mantener un servidor Handle local, que le brinda otro sistema para monitorear, parchear y solucionar problemas.
  • Aunque puede usar un resolutor resolvedor local o de proveedor para sus ARK y URN, los ARK pueden resolverse a través del resolutorresolvedor global n2t.net.
  • La infraestructura de resolución de URN prevista nunca se construyó, por lo que los URN se resuelven actualmente como URL y no hay un resolutor resolvedor global de URN como URL designado. Para registrarse para crear URN, debe solicitar un espacio de nombres URN.
  • Los ARK tienen algunas características únicas que admiten el desarrollo temprano de objetos : los ARK se pueden eliminar, pueden nacer sin metadatos y pueden existir con cualquier metadato que desee almacenar.

...

A diferencia de los DOI Crossref y DataCite, que requieren metadatos específicos (por ejemplo, ver el esquema DataCite), los ARK no limitan ninguna de estas actividades. Además, el solucionador resolvedor N2T.net realmente los admite a todos.

...

No tiene por qué ser costoso. Construir metadatos desde cero puede ser costoso, pero generalmente es creado y administrado por proveedores de objetos, en cuyo caso se puede aprovechar de manera eficiente para los identificadores. Idealmente, para una fuerte persistencia, los metadatos maestros (mantenidos por proveedores de objetos) deberían reflejarse en sistemas independientes, de modo que sea difícil para alguien manipular indetectamente las asociaciones de identificadores. Por ejemplo, los repositorios de objetos digitales que obtienen ARK y DOI del servicio EZID almacenan una copia de sus metadatos con EZID.cdlib.org, que a su vez almacena otra copia con el resolutorresolvedor N2T.net.

¿Qué metadatos se recomiendan para los ARK?

...

  • si actualmente está administrando metadatos (pista : quédese con él a menos que tenga una buena razón para cambiar),
  • si desea publicar objetos oficialmente (pista : prepárese para poder proporcionar autor, título, fecha, editor/archivo y tipo de objeto),
  • los requisitos y capacidades de su solucionador resolvedor (sugerencia : su personal de TI o proveedor podría tener sus propios requisitos), y
  • si desea almacenar elementos no estándar (sugerencia : N2T lo permite, pero la mayoría de los estándares y proveedores no).

...

Una inflexión es un cambio al final de una palabra para expresar un cambio en el significado. Nos permite definir una palabra como "ir" sin definir también "va" y "va". A un ARK que conduce a un objeto, simplemente agregando un '?' hasta el final (el '?' es un ejemplo de una inflexión ARK) nos permite solicitar metadatos sin tener que definir un identificador separado para los metadatos del objeto. Esta simple técnica puede ser utilizada por un humano con un navegador web. El solucionador resolvedor N2T admite inflexiones y negociación de contenido.

...

Por lo general, los servicios basados ​​en esquemas están diseñados como silos o plataformas cerradas, que sirven a un tipo de identificador particular, como Handle, DOI o PURL. Cada silo realiza las mismas funciones principales: asignar nombres (cadenas de identificadores) a cosas (objetos o metadatos). Excluir todos menos un tipo de cadena de identificación puede ayudar a capturar mercados, pero es un desperdicio y no incluye. Requiere construir el mismo conjunto de servicios una y otra vez para cada tipo y viola los principios básicos de apertura.

En contraste, el resolutor resolvedor N2T (Name-to-Thing) y la interfaz de administración EZID (identificadores fáciles) fueron diseñados para funcionar con todos los identificadores. El esfuerzo puesto en cualquier nueva característica se puede aprovechar de manera eficiente en todos los tipos, lo que a veces crea una flexibilidad sorprendente. Por ejemplo, los ARK a menudo se almacenan en EZID con "metadatos DOI", y cada DOI almacenado en N2T puede beneficiarse de las "características de resolución ARK", como las inflexiones y el paso de sufijos, que no están disponibles a través del resolutor resolvedor principal DOI (doi.org).