Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Puede crear cadenas ARK como lo desee, siempre que use solo dígitos, letras (ASCII, sin signos diacríticos) y los siguientes caracteres:

= ~ * + @ _ $ . /

Los dos últimos caracteres están reservados en el caso de que desee revelar relaciones ARK .

Otra característica única de los ARK es que pueden aparecer guiones (' - ') pero son inertes de identidad , lo que significa que las cadenas que difieren solo por guiones se consideran idénticas; por ejemplo, estas cadenas

ark:/12345/141e86dc-d396-4e59-bbc2-4c3bf5326152

ark:/12345/141e86dcd3964e59bbc24c3bf5326152

Identificar lo mismo. La razón de esta característica es que los procesos de formateo de texto en el mundo introducen rutinariamente guiones adicionales en los identificadores, rompiendo enlaces a cualquier servidor que trate los guiones como significativos.

Los ARK distinguen entre letras minúsculas y mayúsculas, lo que hace posibles identificadores más cortos (52 vs 26 letras por posición de carácter). Sin embargo, la "forma ARK" es usar minúsculas a menos que necesite ARK más cortos. La restricción hace que sea más fácil para los resolutores admitir sus ARK en caso de que lleguen del mundo con letras mayúsculas o mixtas, lo que sucede lamentablemente a menudo debido a la suposición persistente de 50 años de que los identificadores no distinguen entre mayúsculas y minúsculas. También puede considerar el uso del repertorio de caracteres de la herramienta Noid , que crea cadenas seguras para la transcripción utilizando el algoritmo más fuerte de dígitos de verificación del identificador principal; utiliza solo dígitos y consonantes menos 'l' (letra ell, a menudo confundida con el dígito 1):

0123456789bcdfghjkmnpqrstvwxz

Con respecto a la asignación, una estrategia común es aprovechar los identificadores heredados. Por ejemplo, un número de muestra de polilla de museo cd456f9_87 podría anunciarse debajo del ark:/12345/cd456f9_87 . Es posible que sea necesario modificar algunos identificadores heredados en vista de las restricciones de caracteres ARK. La segunda estrategia común es crear cadenas completamente nuevas para sus ARK. En este caso, es importante considerar si hacerlos opacos o no opacos (o un poco de ambos).

¿Qué son los identificadores opacos?

Las cadenas de identificadores persistentes son típicamente opacas , revelando deliberadamente poco sobre a qué están asignadas, porque los identificadores no opacos no envejecen ni viajan bien. Los nombres de las organizaciones son notoriamente transitorios, razón por la cual los NAAN son números opacos. A medida que se corrigen los títulos y las fechas, los significados de las palabras evolucionan (p. Ej., Los acrónimos más inocentes pueden volverse ofensivos o infractores), las cadenas destinadas a ser persistentes pueden volverse confusas o políticamente desafiantes. La generación y asignación de cadenas completamente opacas también conlleva un riesgo, por ejemplo, los números asignados secuencialmente revelan información de tiempo y las cadenas que contienen letras pueden deletrear palabras involuntariamente (razón por la cual faltan vocales en el repertorio de caracteres recomendado).

...

Las cadenas opacas son "mudas" y, por lo tanto, difíciles de manejar, por eso los ARK fueron diseñados para ser identificadores "parlantes". Esto significa que si hay ARK Identifiers FAQ # metadata , un ARK que llega a su servidor con el '?' la inflexión debería poder hablar de sí misma.

¿Cómo hago que el contenido del servidor sea direccionable con ARK?

Primero, decida cuál será la experiencia del usuario al acceder a sus ARK, por ejemplo, un archivo de hoja de cálculo , un PDF, una imagen, una página de destino llena de metadatos formateados y un rango de opciones, etc. Cualquiera que elija, planifique su servidor para poder responder con metadatos si su ARK debería llegar con un '?' inflexión después de eso.

De lo contrario, servir ARK es como servir URL. Normalmente, las cadenas de URL entrantes direccionan (se asignan) al contenido que devuelve su servidor web. Si su servidor reconoce ARK, los ARK entrantes (expresados ​​como URL) deben asignarse al mismo contenido. Un enfoque común es asignar el ARK a la URL utilizando una tabla de software que actualiza cada vez que cambia la URL. En este caso, su servidor está actuando como un solucionador local . Si no desea implementar esto usted mismo, existen herramientas y servicios de software ARK que pueden ayudarlo.

Otro enfoque es ejecutar su servidor web sin cambios, pero en lugar de actualizar las tablas locales, actualizaría las tablas de mapeo de ARK a URL que residen en un resolutor no local. Se pueden encontrar ejemplos de esto entre los proveedores y en cualquier organización que actualice las tablas a través de EZID.cdlib.org (que, debido a una relación especial, actualiza las tablas de resolución en n2t.net ).

¿Cómo cito o publicito un ARK?

Se prefiere la forma de URL (https o http) del ARK, por ejemplo,

https://n2t.net/ark:/99166/w66d60p2

Un ARK destinado para uso externo generalmente se publicita (libera, publica, difunde) de esta manera para que sea un identificador accionable . Si se necesita una visualización visual más compacta de un ARK, debe estar hipervinculado; por ejemplo, se puede lograr una visualización compacta de un hipervínculo HTML con

<a href=" https://n2t.net/ark:/99166/w66d60p2 "> ark:/99166/w66d60p2 </a>

Una decisión importante es si sus ARK basados ​​en URL utilizarán el nombre de host de su resolutor local o el resolutor N2T.net . Si el control local o el desarrollo de la marca es lo suficientemente importante, anunciaría ARK basados ​​en su resolutor local (consulte la publicación de contenido con ARK ). Si le preocupa la estabilidad de su nombre de host local, anunciaría sus ARK basados ​​en n2t.net (vea ejemplos de ambos ).

Resolver sus ARK a través de N2T siempre es posible para los usuarios, independientemente de cómo los anuncie.

...

N2T usa dos tipos de datos almacenados. Primero, almacena registros individuales de más de 20 millones de identificadores de objetos (por ejemplo, ARK, DOI) que obtiene de tres fuentes: EZID.cdlib.org , Internet Archive y YAMZ.net . Cuando dichos registros incluyen una URL de redireccionamiento ( destino ) y metadatos descriptivos de preguntas frecuentes sobre los identificadores ARK , N2T puede actuar sobre las inflexiones de preguntas frecuentes sobre los identificadores ARK , así como realizar el paso de sufijos y la "negociación de contenido".

...

¿Por qué el solucionador ARK global ( n2t.net ) no tiene la palabra "ARK"?

...

Sí, los ARK se pueden asignar a cualquier nivel de granularidad , como un manuscrito, capítulos dentro de él, secciones de capítulos, subsecciones, etc. Un ARK también se puede asignar a una cosa que encierra otras cosas. En los ARK, el carácter '/' está reservado para ayudar al destinatario a comprender la contención, por ejemplo, el primer objeto a continuación contiene el segundo:

ark:/12148/btv1b8449691v

ark:/12148/btv1b8449691v/f29

Ese es el calificador de contención. Solo hay otro calificador ARK, e indica formas variantes de una cosa usando el carácter reservado ''. delante de un sufijo Por ejemplo, si estos ARK identifican documentos,

ark:/12148/btv1b8449691v/f29.pdf

ark:/12148/btv1b8449691v/f29.html

debido a que difieren solo por el sufijo .pdf o .html , se puede inferir que identifican dos formas diferentes del mismo documento.

...

  • notificar a N2T que la persona de contacto de su organización o la URL de resolución cambiarán,
  • actualizar la política de asignación de nombre de su organización ( política de muestra ),
  • solicitando una NAAN adicional para un nuevo cuerpo significativo de ARK o una nueva división organizacional, y
  • haciendo la transición de su NAAN a otra organización que continuará con su trabajo y se hará cargo de su NAAN.

...

  • Para mantener bajos los costos ( detalles ).
  • Para trabajar exactamente con los metadatos que desea.
  • Para poder crear identificadores sin metadatos.
  • Para poder crear un identificador incluso antes de que exista su objeto.
  • Tener un identificador tan pronto como cree el primer borrador de sus datos.
  • Mantener ese identificador privado mientras los datos y metadatos evolucionan, y decidir (quizás años) más tarde, publicarlo o descartarlo.
  • Para retener ese identificador después de la publicación, quizás luego asigne un identificador adicional, como un DOI.
  • Debido a que los ARK, creados para aplicaciones genéricas y no específicamente para contenido publicado , encajan naturalmente con objetos físicos como muestras o estaciones de campo.
  • Debido a que los solucionadores de ARK pueden lidiar con identificadores dañados rutinariamente en el mundo mediante procesos de formateo de texto que introducen guiones.
  • Debido a que la mayoría de los ARK llevan un dígito de verificación de Noid que se puede usar para detectar todos los errores de transcripción comunes en lugar de solo algunos de ellos.
  • Para poder crear identificadores más cortos, ya que las mayúsculas y minúsculas permiten cadenas más densas (un mayor número de cadenas de una longitud dada).
  • Para poder cambiar el proveedor y / o la infraestructura sin tener que coordinar las transferencias de bases de datos con una autoridad central.
  • Para poder lidiar con el problema de división del espacio de nombres sin perder el control de sus identificadores.
  • Para vincular identificadores a diferentes tipos de compromisos de persistencia matizados.
  • Para poder agregar consultas (por ejemplo,? Lang = en) al resolver sus identificadores.
  • Utilizar una infraestructura abierta coherente con los valores de su organización.
  • Para vincular directamente a los objetos que valora en lugar de a las páginas de destino.
  • Para crear un identificador que permita millones ( paso de sufijo ).
  • Para acceder a metadatos convenientes y con todas las funciones a través de las identificaciones de preguntas frecuentes # de identificadores ARK .
  • Para integrarse fácilmente con API IIIF utilizando calificadores ARK.

...

https://n2t.net/ark:/99999/12345
https://doi.org/10.99999/12345
https:// handle.net/10.99999/12345
https://purl.org/99999/12345
https://<various>/urn:99999:12345
  1. el protocolo ( https:// ) más un nombre de host,
  2. solo para ARK y URN, también hay una etiqueta ("ark:" o "urn:"),
  3. la autoridad de asignación de nombre ( 99999 , 10.99999 o 99999 ), que es la organización o grupo que creó un identificador particular,
  4. y finalmente, el nombre o identificador local que asignó ( 12345 ).

Y todos tienen poco efecto sobre la persistencia. Vea 10 mitos persistentes sobre identificadores persistentes .

...

Nada inherente en ARK, DOI, Handles, PURL o URN los hace más o menos adecuados para un campo, dominio o sector en particular. Con un identificador de resolución y un servicio de administración administrativa, todos brindan el servicio central de resolución (y también lo hacen las URL administradas adecuadamente ).

Las generalizaciones sobre los tipos de identificadores a veces se aplican cuando la resolución y la administración de ese tipo están bloqueadas en un proveedor o proveedor en particular. Por ejemplo, muchas características y restricciones de PURL y Handle están bien definidas por sus respectivos silos de administración, al igual que los de DOI, que se construyen sobre los Handles. Pero los DOI tienen prácticas de metadatos que son diversas y evolucionan en diferentes agencias de registro de DOI.

...

  • si actualmente está administrando metadatos ( pista : quédese con él a menos que tenga una buena razón para cambiar),
  • si desea publicar objetos oficialmente ( pista : prepárese para poder proporcionar autor, título, fecha, editor / archivo y tipo de objeto),
  • los requisitos y capacidades de su solucionador ( sugerencia : su personal de TI o proveedor podría tener sus propios requisitos), y
  • si desea almacenar elementos no estándar ( sugerencia : N2T lo permite, pero la mayoría de los estándares y proveedores no).

...

Los ARK fueron diseñados para identificar cualquier cosa, no solo cosas que son, por ejemplo, publicables o que se pueden comprar. No es natural modelar un fósil, una muestra de tejido, un término de vocabulario o Marie Curie como si cada uno tuviera un Autor, Título, Editor, Copyright y Precio. En cambio, desde 2001, un ARK generalmente tiene un núcleo de cuatro elementos de metadatos altamente genéricos ( Dublin Kernel , inspirado en Dublin Core (DC) ), seguido de cualquier otro elemento de metadatos (pares de nombre / valor) que el proveedor desee proporcionar.

...

En contraste, el resolutor N2T (Name-to-Thing) y la interfaz de administración EZID (identificadores fáciles) fueron diseñados para funcionar con todos los identificadores. El esfuerzo puesto en cualquier nueva característica se puede aprovechar de manera eficiente en todos los tipos, lo que a veces crea una flexibilidad sorprendente. Por ejemplo, los ARK a menudo se almacenan en EZID con "metadatos DOI", y cada DOI almacenado en N2T puede beneficiarse de las "características de resolución ARK", como las inflexiones y el paso de sufijos , que no están disponibles a través del resolutor principal DOI ( doi.org ) .