Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Une autre des caractéristiques des ARK est que les traits d'union ('-') peuvent être utilisés mais qu’ils sont inertes en ce qui concerne l'identité, ce qui signifie que des chaînes ne différant que par des traits d'union sont considérées comme identiques ; par exemple, ces chaînes

ark:/12345/141e86dc-d396-4e59-bbc2-4c3bf5326152

ark:/12345/141e86dcd3964e59bbc24c3bf5326152

identifient la même chose. La raison de cette fonctionnalité est que les processus de formatage de texte utilisés à travers le monde introduisent régulièrement des traits d'union supplémentaires dans les identifiants, rompant ainsi les liens avec tout serveur qui considère les traits d'union comme signifiants.

...

N2T utilise deux types de données stockées. Premièrement, il stocke des enregistrements individuels pour plus de 20 millions d'identifiants d'objet (par exemple, ARK, DOI) qu'il obtient de trois sources : EZID, Internet Archive et YAMZ.net. Lorsque de tels enregistrements incluent une URL de redirection (cible) et des métadonnées descriptives, N2T peut agir sur les inflexions, effectuer un transfert de suffixe et une « négociation de contenu ». 

...

  • Pour rĂ©duire les coĂ»ts (voir cette section pour plus de prĂ©cision) ;
  • Pour ne gĂ©rer que les mĂ©tadonnĂ©es que vous voulez ;
  • Pour pouvoir crĂ©er des identifiants sans mĂ©tadonnĂ©es ;
  • Pour pouvoir crĂ©er un identifiant avant mĂŞme que votre objet n’existe ;
  • Pour avoir un identifiant dès que vous crĂ©ez le premier brouillon de votre objet ;
  • Pour garder cet identifiant privĂ© pendant que les donnĂ©es et les mĂ©tadonnĂ©es Ă©voluent, jusqu’à ce que vous dĂ©cidiez (Ă©ventuellement des annĂ©es après) de le publier ou de le supprimer ;
  • Pour conserver cet identifiant jusqu’à la publication et peut-ĂŞtre alors attribuer Ă  la place un autre identifiant tel qu'un DOI ;
  • Parce que les ARK, conçus pour une utilisation gĂ©nĂ©rique et non spĂ©cifiquement pour le monde de l’édition, sont naturellement adaptĂ©s Ă  l’identification d’objets physiques comme des Ă©chantillons ou des stations de recherche ;
  • Parce que les rĂ©solveurs ARK peuvent rĂ©soudre des identifiants habituellement endommagĂ©s par des processus de formatage de texte introduisant des traits d'union ;
  • Parce que la plupart des ARK portent un caractère de contrĂ´le Noid qui peut ĂŞtre utilisĂ© pour dĂ©tecter toutes les erreurs de transcription courantes (et non certaines d’entre elles uniquement) ;
  • Pour pouvoir crĂ©er des identifiants plus courts, car la casse mixte permet des chaĂ®nes plus compactes (un plus grand nombre de chaĂ®nes d'une longueur donnĂ©e) ;
  • Pour pouvoir changer de prestataire et/ou d'infrastructure sans avoir Ă  coordonner des transferts de bases de donnĂ©es avec une autoritĂ© centrale ;
  • Pour pouvoir rĂ©soudre le problème de la scission d'espace de noms sans perdre le contrĂ´le de vos identifiants ;
  • Pour lier des identifiants Ă  diffĂ©rentes dĂ©clarations de permanence nuancĂ©es ;
  • Pour pouvoir ajouter des requĂŞtes (par exemple « ?Lang=en ») lors de la rĂ©solution de vos identifiants ;
  • Pour utiliser une infrastructure ouverte correspondant aux valeurs de votre organisation ;
  • Pour permettre d’accĂ©der directement aux objets auxquels vous accordez de l’importance et non Ă  leur page d’accueil ;
  • Pour crĂ©er un seul identifiant qui peut ĂŞtre dĂ©clinĂ© en des millions (grâce au mĂ©canisme de transfert de prĂ©fixe) ;
  • Pour accĂ©der Ă  des mĂ©tadonnĂ©es adaptĂ©es et complètes via des inflexions
  • Pour s’intĂ©grer aisĂ©ment dans des API IIIF en utilisant les qualificatifs ARK.

...

Non, ce serait une affirmation excessive. Mais remettons ces formats d’identifiant (types) en perspective : ·       Aucun ne protège contre les principales causes de rupture des liens : baisse de financement, catastrophe naturelle, bouleversement social, guerre, élimination délibérée, erreur humaine ou négligence du prestataire ;·       Ils exigent tous de vous, le fournisseur final, de mettre à jour les tables de redirection à mesure que les URL changent ;·       Ils identifient tous un contenu susceptible d'avoir été modifié ou supprimé à l’occasion de visites ultérieures ;·       Tous comportent des identifiants brisés, et en grande quantité (plusieurs milliers) ;·       Ils reposent tous sur le simple système de la redirection géré par les serveurs Web depuis 1994 et proposé gratuitement par des centaines de services de raccourcissement d'URL. Étant donné le peu de choses que ces formats font pour vous, lorsque vous en choisissez un, vous prendrez probablement en compte des facteurs tels que le coût, le risque et l'ouverture. 

Anchor
differenceSchemasIdentifiants
differenceSchemasIdentifiants
En quoi les ARK diffèrent-ils des identifiants tels que les DOI, les Handle, les PURL et les URN ?

La réponse courte

Les ARK sont les seuls identifiants standards, non cloisonnés et non payants que vous pouvez enregistrer et utiliser en environ 48 heures. Les DOI, les Handle et les PURL nécessitent une résolution et d'autres services exigés par leurs systèmes centralisés respectifs (« silos »). Cela ne veut pas dire que la permanence est gratuite. Rendre un identifiant pérenne, en tant que fournisseur, vous impose des coûts de gestion, d’hébergement, de surveillance et de redirection. Vous pouvez faire ces choses vous-même ou avec l'aide d'un prestataire. Mais avec les ARK, comme avec les URL, vos identifiants ne vous seront pas facturés individuellement et vous ne serez pas enfermés dans un silo n’acceptant qu’un type de résolution spécifique et qui refuse donc les autres identifiants. Les ARK ont la particularité d'être décentralisés. Bien que l’on puisse obtenir des services de résolution d'un résolveur ARK global appelé n2t.net, plus de 90% des ARK dans le monde ne l’utilisent pas comme résolveur. Plus de 500 organisations enregistrées à travers le monde ont créé par elles-mêmes environ 3,2 milliards d’ARK et, à l'instar des URL, personne n'a jamais payé de frais pour les créer. Bien sûr, les maintenir n'est pas gratuit. Conserver l’accès au contenu de manière pérenne sur le long terme, quel que soit le type d’identifiant, n’est jamais gratuit.

...

·       Les pages d'accueil : les DOI de Crossref et DataCite aboutissent à des pages d'atterrissage conçues pour les éditeurs, mais pas directement aux objets qui vous tiennent à cœur. Les ARK peuvent en revanche aboutir directement aux objets qui vous tiennent à cœur, ce qui est pratique à la fois pour les machines et pour les utilisateurs, car cela ne demande pas à l’humain une étape supplémentaire de navigation pour des tâches courantes telles queo   ouvrir le fichier PDF d'un article en lecture,o   référencer un fichier image destiné à être incorporé automatiquement en ligne dans un document,o   ou citer un tableur à utiliser pour l’analyse directe des données par logiciel.·       Les DOI, les Handle, etc., ne prennent pas en charge le mécanisme d’inflexiond’inflexion d’ARK permettant l'accès aux métadonnées, qu'un identifiant pointe sur un objet ou sur sa page d’accueil.·       Contrairement aux DOI et aux Handle, les ARK n’ont pas de métadonnées obligatoires. Les ARK qui n'ont pas encore été publiés sont faciles à supprimer.·       Toute chose finira par disparaître, y compris les noms d’hôte, le Web et le protocole https. Lorsque cette première partie de l'identifiant cessera d'avoir une signification, seuls les ARK et les URN incluront un libellé (par exemple, « ark: ») indiquant le type d'identifiant restant.·       Pour les DOI, les Handle et les PURL, vous devez utiliser leurs résolveurs respectifs. Les ARK et les URN vous permettent d'utiliser votre propre résolveur.·       Pour créer des DOI et des Handle, vous devez payer une cotisation et, pour les DOI, des frais par DOI définis par les agences d’attribution. Il n'y a pas de frais pour les ARK, les PURL et les URN.·       Pour créer des Handle, vous devez installer et gérer un serveur Handle local, ce qui vous oblige à surveiller, mettre à jour et dépanner un autre système.·       Bien que vous puissiez utiliser un résolveur local ou proposé par un prestataire pour vos ARK et vos URN, vous pouvez aussi les résoudre via le résolveur global n2t.net.·       L'infrastructure de résolution URN envisagée n'a jamais été construite. Par conséquent, les URN sont actuellement résolus comme des URL et il n'y a pas de résolveur global et officiel d’URN en tant qu'URL. Pour vous inscrire afin de créer des URN, vous devez demander un espace de nom URN.·       Les ARK possèdent des fonctionnalités uniques qui permettent d’attribuer un identifiant à des stades précoces de développement de l’objet : les ARK peuvent être supprimés, peuvent naître sans métadonnées et peuvent exister avec toutes les métadonnées que vous souhaitez stocker.

...

Contrairement aux DOI Crossref et DataCite, qui nécessitent des métadonnées spécifiques (voir, par exemple, le schéma DataCite), les ARK n’exercent aucune contrainte sur ces activités. Mieux encore, le résolveur N2T.net permet effectivement de les prendre toutes en compte.

Anchor
metadonnees
metadonnees
Si les ARK ne les exigent pas, pourquoi se donner la peine de créer des métadonnées ?


La création de métadonnées (informations supplémentaires associées à ou décrivant un objet) présente plusieurs avantages essentiels. Premièrement, quelle que soit la cible de l'ARK - une page d'accueil ou un fichier - les métadonnées fournissent aux utilisateurs des informations essentielles sur l'objet, telles que des références à des versions plus récentes, une date de création, une provenance, etc. Dans le cas des ARK, les métadonnées sont généralement accessibles via des inflexions.

...

 Les ARK ont été conçus pour identifier n'importe quoi, pas seulement des choses qui sont, par exemple, publiables ou achetables. Il n’est pas naturel de modéliser un fossile, un échantillon de tissu, un terme de vocabulaire ou Marie Curie comme si chacun avait un auteur, un titre, un éditeur, un copyright et un prix. Au lieu de quoi, depuis 2001, un ARK est  généralement accompagné d’un noyau de métadonnées génériques de quatre éléments (Dublin Kernel, inspiré de Dublin Core (DC)), suivi de tout autre élément de métadonnée (paire attribut / valeur) que le fournisseur souhaite donner. Ce noyau de métadonnées est structuré pour répondre aux questions suivantes : « qui ? », « quoi ? », « quand ? » et « où ? » sur l'expression ou le « récit » d'un objet : -   qui l'a « dit » (semblable aux éléments DC Créateur, Contributeur et Éditeur, mais également à inventeur, découvreur, réalisateur, etc.),-   comment s'appelle le « dit » (semblable à l’élément DC Titre, mais aussi à NuméroDEchantillon, CodeBarreObjet, etc.),-   quand il a été « dit » (similaire à l’élément DC Date, mais inclut les intervalles de dates, les dates approximative et celles avant l’ère chrétienne),-   où le « dit » peut être trouvé (similaire à l’élément DC Identifiant, mais généralement inutile car il s'agit de l'ARK lui-même) Il y a beaucoup à dire sur les métadonnées et ARK (par exemple, sur l’application des éléments « qui », « quoi », « quand » et « où » au contenu d'une biographie, ou comment une institution de conservation prévoit de maintenir un jeu de données). Des recommandations supplémentaires sur les métadonnées et ARK seront disponibles sur arks.org. D'autres éléments sont essentiels, tels que -   comment il a été « dit » (similaire à un élément ResourceType), ce qui peut déterminer des alignements avec des spécifications de métadonnées externes et des éléments supplémentaires-   URL cible de la redirection, généralement stockée en tant qu'élément distinct des métadonnées-   éléments de déclaration de permanence, pour exprimer le niveau d'un engagement de conservation.

Anchor
inflexion
inflexion
Qu'est-ce qu'une « inflexion » et en quoi diffère-t-elle de la « négociation de contenu » ?

Une inflexion est une désinence à la fin d'un mot qui exprime un changement de sens. Cela permet de définir un mot tel que « aller » sans définir également « allez » et « allons ». Pour un ARK qui mène à un objet, ajouter simplement un « ? » à la fin (exemple d'inflexion ARK) nous permet de demander des métadonnées sans avoir à définir un identifiant distinct pour les métadonnées de l'objet. Cette technique simple peut être utilisée par un humain avec un navigateur Web. Le résolveur N2T prend en charge les inflexions et la négociation de contenu. La négociation de contenu pour les métadonnées est une technique logicielle permettant de demander d'autres formats d'objet, tels que le format PDF ou RTF d'un fichier HTML. Bien que cela n’ait pas été conçu pour cela, la « négociation de contenu » originelle était détournée dans certains cas pour demander des métadonnées, en considérant curieusement que les formats de fichier souvent utilisés pour exprimer des métadonnées ne pouvaient véhiculer que des métadonnées et jamais des objets à part entière. Contrairement aux inflexions, la « négociation de contenu pour les métadonnées » ne fonctionne pas du tout pour les objets représentés dans ces formats (formats dont la liste ne cesse de s'allonger et n'est connue que par convention tacite) et n'est pas assez simple d’utilisation pour la plupart des usagers humains. Bien que les inflexions soient généralement associées aux ARK, elles ne leur sont pas réservées. Contrairement aux idées reçues, les identifiants ne font rien ; ce sont leurs résolveurs qui gèrent ou non des fonctionnalités. Ainsi, par exemple, les inflexions et le « transfert de suffixe » sont pris en charge par n2t.net pour tous les types d’identifiants, mais pas par doi.org ni par handle.net (qui dispose d’une fonctionnalité similaire appelée « Template Handles ») pour aucun type d’identifiant.

...