Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Puede crear cadenas ARK como lo desee, siempre que use solo dígitos, letras (ASCII, sin signos diacríticos) y los siguientes caracteres:

= ~ * + @ _ $ . /

Los dos últimos caracteres están reservados en el caso de que desee revelar relaciones ARK .

Otra característica única de los ARK es que pueden aparecer guiones (' - ') pero son inertes de identidad , lo que significa que las cadenas que difieren solo por guiones se consideran idénticas; por ejemplo, estas cadenas

ark:/12345/141e86dc-d396-4e59-bbc2-4c3bf5326152

ark:/12345/141e86dcd3964e59bbc24c3bf5326152

Identificar lo mismo. La razón de esta característica es que los procesos de formateo de texto en el mundo introducen rutinariamente guiones adicionales en los identificadores, rompiendo enlaces a cualquier servidor que trate los guiones como significativos.

Los ARK distinguen entre letras minúsculas y mayúsculas, lo que hace posibles identificadores más cortos (52 vs 26 letras por posición de carácter). Sin embargo, la "forma ARK" es usar minúsculas a menos que necesite ARK más cortos. La restricción hace que sea más fácil para los resolutores admitir sus ARK en caso de que lleguen del mundo con letras mayúsculas o mixtas, lo que sucede lamentablemente a menudo debido a la suposición persistente de 50 años de que los identificadores no distinguen entre mayúsculas y minúsculas. También puede considerar el uso del repertorio de caracteres de la herramienta Noid , que crea cadenas seguras para la transcripción utilizando el algoritmo más fuerte de dígitos de verificación del identificador principal; utiliza solo dígitos y consonantes menos 'l' (letra ell, a menudo confundida con el dígito 1):

0123456789bcdfghjkmnpqrstvwxz

Con respecto a la asignación, una estrategia común es aprovechar los identificadores heredados. Por ejemplo, un número de muestra de polilla de museo cd456f9_87 podría anunciarse debajo del ark:/12345/cd456f9_87 . Es posible que sea necesario modificar algunos identificadores heredados en vista de las restricciones de caracteres ARK. La segunda estrategia común es crear cadenas completamente nuevas para sus ARK. En este caso, es importante considerar si hacerlos opacos o no opacos (o un poco de ambos).

¿Qué son los identificadores opacos?

Las cadenas de identificadores persistentes son típicamente opacas , revelando deliberadamente poco sobre a qué están asignadas, porque los identificadores no opacos no envejecen ni viajan bien. Los nombres de las organizaciones son notoriamente transitorios, razón por la cual los NAAN son números opacos. A medida que se corrigen los títulos y las fechas, los significados de las palabras evolucionan (p. Ej., Los acrónimos más inocentes pueden volverse ofensivos o infractores), las cadenas destinadas a ser persistentes pueden volverse confusas o políticamente desafiantes. La generación y asignación de cadenas completamente opacas también conlleva un riesgo, por ejemplo, los números asignados secuencialmente revelan información de tiempo y las cadenas que contienen letras pueden deletrear palabras involuntariamente (razón por la cual faltan vocales en el repertorio de caracteres recomendado).

...

Las cadenas opacas son "mudas" y, por lo tanto, difíciles de manejar, por eso los ARK fueron diseñados para ser identificadores "parlantes". Esto significa que si hay ARK Identifiers FAQ # metadata , un ARK que llega a su servidor con el '?' la inflexión debería poder hablar de sí misma.

¿Cómo hago que el contenido del servidor sea direccionable con ARK?

Primero, decida cuál será la experiencia del usuario al acceder a sus ARK, por ejemplo, un archivo de hoja de cálculo , un PDF, una imagen, una página de destino llena de metadatos formateados y un rango de opciones, etc. Cualquiera que elija, planifique su servidor para poder responder con metadatos si su ARK debería llegar con un '?' inflexión después de eso.

De lo contrario, servir ARK es como servir URL. Normalmente, las cadenas de URL entrantes direccionan (se asignan) al contenido que devuelve su servidor web. Si su servidor reconoce ARK, los ARK entrantes (expresados ​​como URL) deben asignarse al mismo contenido. Un enfoque común es asignar el ARK a la URL utilizando una tabla de software que actualiza cada vez que cambia la URL. En este caso, su servidor está actuando como un solucionador local . Si no desea implementar esto usted mismo, existen herramientas y servicios de software ARK que pueden ayudarlo.

Otro enfoque es ejecutar su servidor web sin cambios, pero en lugar de actualizar las tablas locales, actualizaría las tablas de mapeo de ARK a URL que residen en un resolutor no local. Se pueden encontrar ejemplos de esto entre los proveedores y en cualquier organización que actualice las tablas a través de EZID.cdlib.org (que, debido a una relación especial, actualiza las tablas de resolución en n2t.net).

¿Cómo cito o publicito un ARK?

Se prefiere la forma de URL (https o http) del ARK, por ejemplo,

https://n2t.net/ark:/99166/w66d60p2

Un ARK destinado para uso externo generalmente se publicita (libera, publica, difunde) de esta manera para que sea un identificador accionable . Si se necesita una visualización visual más compacta de un ARK, debe estar hipervinculado; por ejemplo, se puede lograr una visualización compacta de un hipervínculo HTML con

<a href=" https://n2t.net/ark:/99166/w66d60p2 "> ark:/99166/w66d60p2 </a>

Una decisión importante es si sus ARK basados ​​en URL utilizarán el nombre de host de su resolutor local o el resolutor N2T.net . Si el control local o el desarrollo de la marca es lo suficientemente importante, anunciaría ARK basados ​​en su resolutor local (consulte la publicación de contenido con ARK ). Si le preocupa la estabilidad de su nombre de host local, anunciaría sus ARK basados ​​en n2t.net (vea ejemplos de ambos ).

Resolver sus ARK a través de N2T siempre es posible para los usuarios, independientemente de cómo los anuncie.

...

N2T usa dos tipos de datos almacenados. Primero, almacena registros individuales de más de 20 millones de identificadores de objetos (por ejemplo, ARK, DOI) que obtiene de tres fuentes: EZID.cdlib.org , Internet Archive y YAMZ.net . Cuando dichos registros incluyen una URL de redireccionamiento (destino ) y metadatos descriptivos de preguntas frecuentes sobre los identificadores ARK , N2T puede actuar sobre las inflexiones de preguntas frecuentes sobre los identificadores ARK , así como realizar el paso de sufijos y la "negociación de contenido".

...

Sí, los ARK se pueden asignar a cualquier nivel de granularidad , como un manuscrito, capítulos dentro de él, secciones de capítulos, subsecciones, etc. Un ARK también se puede asignar a una cosa que encierra otras cosas. En los ARK, el carácter '/' está reservado para ayudar al destinatario a comprender la contención, por ejemplo, el primer objeto a continuación contiene el segundo:

ark:/12148/btv1b8449691v

ark:/12148/btv1b8449691v/f29

Ese es el calificador de contención. Solo hay otro calificador ARK, e indica formas variantes de una cosa usando el carácter reservado ''. delante de un sufijo Por ejemplo, si estos ARK identifican documentos,

ark:/12148/btv1b8449691v/f29.pdf

ark:/12148/btv1b8449691v/f29.html

debido a que difieren solo por el sufijo .pdf o .html , se puede inferir que identifican dos formas diferentes del mismo documento.

...

  • Para mantener bajos los costos (detalles).
  • Para trabajar exactamente con los metadatos que desea.
  • Para poder crear identificadores sin metadatos.
  • Para poder crear un identificador incluso antes de que exista su objeto.
  • Tener un identificador tan pronto como cree el primer borrador de sus datos.
  • Mantener ese identificador privado mientras los datos y metadatos evolucionan, y decidir (quizás años) más tarde, publicarlo o descartarlo.
  • Para retener ese identificador después de la publicación, quizás luego asigne un identificador adicional, como un DOI.
  • Debido a que los ARK, creados para aplicaciones genéricas y no específicamente para contenido publicado , encajan naturalmente con objetos físicos como muestras o estaciones de campo.
  • Debido a que los solucionadores de ARK pueden lidiar con identificadores dañados rutinariamente en el mundo mediante procesos de formateo de texto que introducen guiones.
  • Debido a que la mayoría de los ARK llevan un dígito de verificación de Noid que se puede usar para detectar todos los errores de transcripción comunes en lugar de solo algunos de ellos.
  • Para poder crear identificadores más cortos, ya que las mayúsculas y minúsculas permiten cadenas más densas (un mayor número de cadenas de una longitud dada).
  • Para poder cambiar el proveedor y / o la infraestructura sin tener que coordinar las transferencias de bases de datos con una autoridad central.
  • Para poder lidiar con el problema de división del espacio de nombres sin perder el control de sus identificadores.
  • Para vincular identificadores a diferentes tipos de compromisos de persistencia matizados.
  • Para poder agregar consultas (por ejemplo,? Lang = en) al resolver sus identificadores.
  • Utilizar una infraestructura abierta coherente con los valores de su organización.
  • Para vincular directamente a los objetos que valora en lugar de a las páginas de destino.
  • Para crear un identificador que permita millones (paso de sufijo ).
  • Para acceder a metadatos convenientes y con todas las funciones a través de las identificaciones de preguntas frecuentes # de identificadores ARK .
  • Para integrarse fácilmente con API IIIF utilizando calificadores ARK.

...

https://n2t.net/ark:/99999/12345
https://doi.org/10.99999/12345
https:// handle.net/10.99999/12345
https://purl.org/99999/12345
https://<various>/urn:99999:12345
  1. el protocolo (https://) más un nombre de host,
  2. solo para ARK y URN, también hay una etiqueta ("ark:" o "urn:"),
  3. la autoridad de asignación de nombre ( 99999 , 10.99999 o 99999 ), que es la organización o grupo que creó un identificador particular,
  4. y finalmente, el nombre o identificador local que asignó (12345).

...