...
Anatomie de l’ARK      Identité immuable de base
                     ____________________________________
                     /                             \
Service de résolution    Nom de base de l’objet Qualificatifs
   ______________________  ______________________  _____________
   /                    \/                  \/          \
   https://example.org/ark:12025/654xz321/s3/f8.05v.tiff
         \_____________/ \___/\_____/ \_________/\______/\______/
            |         |        |       |         |       |
            |        Libellé  |         |            |   Variantes
            |               |         |    Composantes
            |               |            |Â
Nom de l’autorité d’adressage  |   Nom ARK attribué
            (NMA)                 |
            Nom de l’autorité nommante (NAAN)
Anchorgranularite granularite
Puis-je attribuer des ARK à des composantes d’une ressource qui a déjà un ARK ?
granularite | |
granularite |
...
- Pour réduire les coûts (voir cette section pour plus de précision) ;
- Pour ne gérer que les métadonnées que vous voulez ;
- Pour pouvoir créer des identifiants sans métadonnées ;
- Pour pouvoir créer un identifiant avant même que votre objet n’existe ;
- Pour avoir un identifiant dès que vous créez le premier brouillon de votre objet ;
- Pour garder cet identifiant privé pendant que les données et les métadonnées évoluent, jusqu’à ce que vous décidiez (éventuellement des années après) de le publier ou de le supprimer ;
- Pour conserver cet identifiant jusqu’à la publication et peut-être alors attribuer à la place un autre identifiant tel qu'un DOI ;
- Parce que les ARK, conçus pour une utilisation générique et non spécifiquement pour le monde de l’édition, sont naturellement adaptés à l’identification d’objets physiques comme des échantillons ou des stations de recherche ;
- Parce que les résolveurs ARK peuvent résoudre des identifiants habituellement endommagés par des processus de formatage de texte introduisant des traits d'union ;
- Parce que la plupart des ARK portent un caractère de contrôle Noid qui peut être utilisé pour détecter toutes les erreurs de transcription courantes (et non certaines d’entre elles uniquement) ;
- Pour pouvoir créer des identifiants plus courts, car la casse mixte permet des chaînes plus compactes (un plus grand nombre de chaînes d'une longueur donnée) ;
- Pour pouvoir changer de prestataire et/ou d'infrastructure sans avoir à coordonner des transferts de bases de données avec une autorité centrale ;
- Pour pouvoir résoudre le problème de la scission d'espace de noms sans perdre le contrôle de vos identifiants ;
- Pour lier des identifiants à différentes déclarations de permanence nuancées ;
- Pour pouvoir ajouter des requêtes (par exemple « ?Langlang=en ») lors de la résolution de vos identifiants ;
- Pour utiliser une infrastructure ouverte correspondant aux valeurs de votre organisation ;
- Pour permettre d’accéder directement aux objets auxquels vous accordez de l’importance et non à leur page d’accueil ;
- Pour créer un seul identifiant qui peut être décliné en des millions (grâce au mécanisme de transfert de préfixe) ;
- Pour accéder à des métadonnées adaptées et complètes via des inflexions
- Pour s’intégrer aisément dans des API IIIF en utilisant les qualificatifs ARK.
Qu'ont en commun ARK, DOI, Handle, PURL et URNÂ ?
 Ce sont les principaux types (ou schĂ©mas) d'identifiants pĂ©rennes. Tous existent au moins depuis 2001.Tous sont utilisĂ©s dans des contextes tels que les profils Data Citation Indexâ„ , Wikipedia et ORCID.org. Tous donnent accès Ă presque tout type de contenu, qu'il soit numĂ©rique, physique, abstrait, une personne, un groupe, etc. Ils ont Ă©galement une structure très similaire composĂ©e de quatre parties, comme le montrent les exemples ci-dessous :Â
 https://n2t.net/ark:/99999/12345   https://doi.org/10.99999/12345 https://handle.net/10.99999/12345    https://purl.org/99999/12345 https://<various>/urn:99999:12345 |
|
|
|
|
 Aucun d’eux n’a d'effet réel sur la persistance (voir 10 mythes persistants sur les identifiants pérennes).
Attendez, vous voulez dire que ARK, DOI, Handle, PURL et URN sont inutiles ?
Non, ce serait une affirmation excessive. Mais remettons ces formats d’identifiant (types) en perspective : ·     Â
- Aucun ne protège contre les principales causes de rupture des liens : baisse de financement, catastrophe naturelle, bouleversement social, guerre, élimination délibérée, erreur humaine ou négligence du prestataire ;
...
- Ils exigent tous de vous, le fournisseur final, de mettre à jour les tables de redirection à mesure que les URL changent ;
...
- Ils identifient tous un contenu susceptible d'avoir été modifié ou supprimé à l’occasion de visites ultérieures ;
...
- Tous comportent des identifiants brisés, et en grande quantité (plusieurs milliers) ;
...
- Ils reposent tous sur le simple système de la redirection géré par les serveurs Web depuis 1994 et proposé gratuitement par des centaines de services de raccourcissement d'URL.
 Étant donnĂ© le peu de choses que ces formats font pour vous, lorsque vous en choisissez un, vous prendrez probablement en compte des facteurs tels que le coĂ»t, le risque et l'ouverture.Â
...
Les ARK sont les seuls identifiants standards, non cloisonnĂ©s et non payants que vous pouvez enregistrer et utiliser en environ 48 heures. Les DOI, les Handle et les PURL nĂ©cessitent une rĂ©solution et d'autres services exigĂ©s par leurs systèmes centralisĂ©s respectifs (« silos »).Â
Cela ne veut pas dire que la permanence est gratuite. Rendre un identifiant pérenne, en tant que fournisseur, vous impose des coûts de gestion, d’hébergement, de surveillance et de redirection. Vous pouvez faire ces choses vous-même ou avec l'aide d'un prestataire. Mais avec les ARK, comme avec les URL, vos identifiants ne vous seront pas facturés individuellement et vous ne serez pas enfermés dans un silo n’acceptant qu’un type de résolution spécifique et qui refuse donc les autres identifiants.
 Les ARK ont la particularité d'être décentralisés. Bien que l’on puisse obtenir des services de résolution d'un résolveur ARK global appelé n2t.net, plus de 90% des ARK dans le monde ne l’utilisent pas comme résolveur. Plus de 500 organisations enregistrées à travers le monde ont créé par elles-mêmes environ 3,2 milliards d’ARK et, à l'instar des URL, personne n'a jamais payé de frais pour les créer. Bien sûr, les maintenir n'est pas gratuit. Conserver l’accès au contenu de manière pérenne sur le long terme, quel que soit le type d’identifiant, n’est jamais gratuit.
D’autres différences entre ARK, DOI, Handle, PURL et URN
...
- ·Les pages d'accueil : les DOI de Crossref et DataCite aboutissent à des pages d'atterrissage conçues pour les éditeurs, mais pas directement aux objets qui vous tiennent à cœur. Les ARK peuvent en revanche aboutir directement aux objets qui vous tiennent à cœur, ce qui est pratique à la fois pour les machines et pour les utilisateurs, car cela ne demande pas à l’humain une étape supplémentaire de navigation pour des tâches courantes telles que
...
- ouvrir le fichier PDF d'un article en lecture,
...
- référencer un fichier image destiné à être incorporé automatiquement en ligne dans un document,
...
- ou citer un tableur à utiliser pour l’analyse directe des données par logiciel.
...
- Les DOI, les Handle, etc., ne prennent pas en charge le mécanisme d’inflexion d’ARK permettant l'accès aux métadonnées, qu'un identifiant pointe sur un objet ou sur sa page d’accueil.
...
- Contrairement aux DOI et aux Handle, les ARK n’ont pas de métadonnées obligatoires. Les ARK qui n'ont pas encore été publiés sont faciles à supprimer.
...
- Toute chose finira par disparaître, y compris les noms d’hôte, le Web et le protocole https. Lorsque cette première partie de l'identifiant cessera d'avoir une signification, seuls les ARK et les URN incluront un libellé (par exemple, « ark: ») indiquant le type d'identifiant restant.
...
- Pour les DOI, les Handle et les PURL, vous devez utiliser leurs résolveurs respectifs. Les ARK et les URN vous permettent d'utiliser votre propre résolveur.
...
- Pour créer des DOI et des Handle, vous devez payer une cotisation et, pour les DOI, des frais par DOI définis par les agences d’attribution. Il n'y a pas de frais pour les ARK, les PURL et les URN.
...
- Pour créer des Handle, vous devez installer et gérer un serveur Handle local, ce qui vous oblige à surveiller, mettre à jour et dépanner un autre système.
...
- Bien que vous puissiez utiliser un résolveur local ou proposé par un prestataire pour vos ARK et vos URN, vous pouvez aussi les résoudre via le résolveur global n2t.net.
...
- L'infrastructure de résolution URN envisagée n'a jamais été construite. Par conséquent, les URN sont actuellement résolus comme des URL et il n'y a pas de résolveur global et officiel d’URN en tant qu'URL. Pour vous inscrire afin de créer des URN, vous devez demander un espace de nom URN.
...
- Les ARK possèdent des fonctionnalités uniques qui permettent d’attribuer un identifiant à des stades précoces de développement de l’objet : les ARK peuvent être supprimés,
...
- naître sans métadonnées et
...
- exister avec toutes les métadonnées que vous souhaitez stocker.
Mais si les ARK peuvent être supprimés, comment peut-on leur faire confiance ?
...
L'objet et ses métadonnées évoluent conjointement, et pour le sous-ensemble d'éléments que vous souhaitez publier dans des contextes nécessitant des DOI, vous pouvez en attribuer au moment de la publication. Si votre ARK est stable et contient des métadonnées de base, vous faites déjà tout le nécessaire pour obtenir un bon DOI. C’est en cela que les ARK sont adaptés aux objets à un stade précoce de développement.
Pour gérer efficacement deux identifiants, il est recommandé de créer le DOI de manière à ce qu'il redirige vers l'ARK d'origine. Cela élimine non seulement la nécessité de mettre à jour la redirection DOI, mais maintient également l’ARK pérenne pour tous ceux qui l'ont précédemment enregistré ou marqué d'un signet.
...
Aucune caractéristique d’ARK, DOI, Handle, PURL ou URN ne les rend plus ou moins adaptés à une discipline, un domaine ou un secteur particuliers. Avec un résolveur d'identifiants et un système de gestion, ils fournissent tous le service essentiel : la résolution (tout comme des URL correctement gérées).
Certaines considérations spécifiques à un type d'identifiant s'expliquent parfois par le fait que la résolution et la gestion de ce type sont verrouillées par un prestataire ou un fournisseur de service donnés. Par exemple, de nombreuses fonctionnalités et restrictions de PURL ou Handle sont déterminées par leurs silos d’administration respectifs, de même que celles des DOI, basés sur les Handle. En revanche les DOI ont des pratiques de métadonnées variées et évolutives d'une agence d'enregistrement à l'autre.
...
À la naissance de l'objet, ou même avant. Nous nommons généralement nos enfants avant leur naissance, et nous appelons et nous référons à des objets aux étapes au stade de la conception, parfois longtemps avant qu'ils ne portent leurs fruits. Selon le niveau de précision de vos prévisions, vos objets à naître peuvent avoir des ARK fonctionnels qui fournissent un substitut approprié et renvoient des métadonnées riches, y compris des déclarations de permanence.
...
Cela peut surprendre, mais même s’ils sont plus largement diffusés, les ARK peuvent être accompagnées de déclarations de permanence qui indiquent quel niveau d’engagement – élevé ou bas – on garantit. Les ARK ont été conçus pour disposer d’une palette de déclarations de permanence, mais celles-ci ne sont en aucun cas exhaustives pour des identifiants et des objets qui présentent une grande variété de « saveurs » d’engagement. C'est pourquoi on parle des ARK comme d’identifiants de haute performance adaptés à la permanence plutôt que comme des « identifiants pérennes ».
Et enfinEnfin, les gens commettent des erreurs. Des ARK, des DOI, des Handle, des PURL et des URN sont parfois diffusés par erreur et doivent être retirés. Lorsque cela se produit, la meilleure option du fournisseur consiste à résoudre l'identifiant retiré en donnant accès à une page « fantôme » qui explique et éventuellement présente des excuses pour le désagrément occasionné. Contrairement aux idées reçues, les identifiants pérennes n’offrent aucune garantie.
Anchor | ||||
---|---|---|---|---|
|
On a besoin d'identifiants avant de savoir exactement à quel objet ils se réfèrent, ou s'ils font référence à quelque chose qui mérite d'être gardé. Un identifiant exigeant des métadonnées abouties ne peut pas être créé au début du développement car l'objet est mal connu. C’est pourquoi les créateurs d'objets attribuent presque toujours initialement des identifiants sans exigences de métadonnées, tels que des URL ou des ARK.
...
Comme l'objet lui-même, les éléments de métadonnées ont besoin d'une de flexibilité pour se développer et évoluer avec le temps :
- Au moment de la prévision , ; il suffit alors d'un identifiant,
- à la naissance, lorsque sa première représentation numérique nécessite une URL de redirection,
- après la première analyse, lorsque son sens et un titre provisoire apparaissent,
- lors de la création de dizaines d'éléments de métadonnées spécifiques à une discipline qui contreviennent à la plupart des normes de métadonnées, à l'exception de la vôtre,
- pendant le post-traitement par un collègue dont vous allez ajouter le nom en tant que contributeur supplémentaire,
- lorsque les premières réactions basées sur l'identifiant tweeté s’avèrent être des observations fondamentales de la part d’un nouveau contributeur,
- et ainsi de suite jusqu'à l'archivage, l'abandon, la diffusion publique, la correction, la révision, l'amélioration, etc.
...
La création de métadonnées (informations supplémentaires associées à ou décrivant un objet) présente plusieurs avantages essentiels. Premièrement, quelle que soit la cible de l'ARK - une page d'accueil ou un fichier - les métadonnées fournissent aux utilisateurs des informations essentielles sur l'objet, telles que des références à des versions plus récentes, une date de création, une provenance, etc. Dans le cas des ARK, les métadonnées sont généralement accessibles via des inflexions.
Les métadonnées facilitent vraiment l'utilisation d'identifiants opaques, qui ne révèlent aucun indice sur ce qu'ils identifient. En l'absence de métadonnées, vous êtes obligé d'accéder à l'objet lui-même pour vous rappeler de quoi il s'agit et également pour vous assurer que vous accédez au bon objet. De plus, la divergence entre les métadonnées renvoyées et l'objet consulté aident aide tout le monde à détecter des modifications ou des erreurs d'identification.
...
Cela n'est pas nécessairement cher. Les métadonnées créées à partir de zéro peuvent être coûteuses, mais elles sont généralement produites et gérées par des fournisseurs d'objets, auquel cas elles peuvent être exploitées efficacement pour les identifiants. Idéalement, pour une permanence maximale, les métadonnées principales (gérées par les fournisseurs d'objet) devraient être répliquées dans des systèmes indépendants , de sorte afin qu'il est soit difficile pour une personne d'altérer de manière indétectable les associations d'identifiants. Par exemple, les entrepôts d'objets numériques qui obtiennent des ARK et des DOI du service EZID stockent une copie de leurs métadonnées dans EZID, qui en stocke une autre copie dans le résolveur N2T.net.
...
Une interopérabilité fiable entre domaines peut rester hors de portées'avérer difficile, mais Dublin Core, DataCite, Schema.org et Dublin Kernel sont des spécifications de métadonnées standard à envisager pour une utilisation conjointe avec ARK.
...
 Les ARK ont Ă©tĂ© conçus pour identifier n'importe quoi, pas seulement des choses qui sont, par exemple, publiables ou achetables. Il n’est pas naturel de modĂ©liser un fossile, un Ă©chantillon de tissu, un terme de vocabulaire ou Marie Curie comme si chacun avait un auteur, un titre, un Ă©diteur, un copyright et un prix. Au lieu de quoi, depuis 2001, un ARK est  gĂ©nĂ©ralement gĂ©nĂ©ralement accompagnĂ© d’un noyau de mĂ©tadonnĂ©es gĂ©nĂ©riques de quatre Ă©lĂ©ments (Dublin Kernel, inspirĂ© de Dublin Core (DC)), suivi de tout autre Ă©lĂ©ment de mĂ©tadonnĂ©e (paire attribut / valeur) que le fournisseur souhaite donner. Ce noyau de mĂ©tadonnĂ©es est structurĂ© pour rĂ©pondre aux questions suivantes : « qui ? », « quoi ? », « quand ? » et « où ? » sur l'expression ou le « rĂ©cit » d'un objet : - Â
- qui l'a « dit » (semblable aux éléments DC Créateur, Contributeur et Éditeur, mais également à inventeur, découvreur, réalisateur, etc.),
...
- comment s'appelle le « dit » (semblable à l’élément DC Titre, mais aussi à NuméroDEchantillon, CodeBarreObjet, etc.),
...
- quand il a été « dit » (similaire à l’élément DC Date, mais inclut les intervalles de dates, les dates approximative et celles avant l’ère chrétienne),
...
- où le « dit » peut être trouvé (similaire à l’élément DC Identifiant, mais généralement inutile car il s'agit de l'ARK lui-même).
 Il y a beaucoup Ă dire sur les mĂ©tadonnĂ©es et ARK (par exemple, sur l’application des Ă©lĂ©ments « qui », « quoi », « quand » et « où » au contenu d'une biographie, ou comment une institution de conservation prĂ©voit de maintenir un jeu de donnĂ©es). Des recommandations supplĂ©mentaires sur les mĂ©tadonnĂ©es et ARK seront disponibles sur arks.org. D'autres Ă©lĂ©ments sont essentiels, tels que - Â
- comment il a été « dit » (similaire à un élément ResourceType), ce qui peut déterminer des alignements avec des spécifications de métadonnées externes et des éléments supplémentaires
...
- URL cible de la redirection, généralement stockée en tant qu'élément distinct des métadonnées
...
- éléments de déclaration de permanence, pour exprimer le niveau d'un engagement de conservation.
Anchorinflexion inflexion
Qu'est-ce qu'une « inflexion » et en quoi diffère-t-elle de la « négociation de contenu » ?
inflexion | |
inflexion |
Une inflexion est une dĂ©sinence Ă la fin d'un mot qui exprime un changement de sens. Cela permet de dĂ©finir un mot tel que « aller » sans dĂ©finir Ă©galement « allez » et « allons ». Pour un ARK qui mène Ă un objet, ajouter simplement un « ? » Ă la fin (un exemple d'inflexion ARK) nous permet de demander des mĂ©tadonnĂ©es sans avoir Ă dĂ©finir un identifiant distinct pour les mĂ©tadonnĂ©es de l'objet. Cette technique simple peut ĂŞtre utilisĂ©e par un humain avec un navigateur Web. Le rĂ©solveur N2T prend en charge les inflexions et la nĂ©gociation de contenu.Â
La négociation de contenu pour les métadonnées est une technique logicielle permettant de demander d'autres formats d'objet, tels que le format PDF ou RTF d'un fichier HTML. Bien que cela n’ait pas été conçu pour cela, la « négociation de contenu » originelle était détournée dans certains cas pour demander des métadonnées, en considérant curieusement que les formats de fichier souvent utilisés pour exprimer des métadonnées ne pouvaient véhiculer que des métadonnées et jamais des objets à part entière. Contrairement aux inflexions, la « négociation de contenu pour les métadonnées » ne fonctionne pas du tout pour les objets représentés dans ces formats (formats dont la liste ne cesse de s'allonger et n'est connue que par convention tacite) et n'est pas assez simple d’utilisation pour la plupart des usagers humains.
 Bien que les inflexions soient généralement associées aux ARK, elles ne leur sont pas réservées. Contrairement aux idées reçues, les identifiants ne font rien ; ce sont leurs résolveurs qui gèrent ou non des fonctionnalités. Ainsi, par exemple, les inflexions et le « transfert de suffixe » sont pris en charge par n2t.net pour tous les types d’identifiants, mais pas par doi.org ni par handle.net (qui dispose d’une fonctionnalité similaire appelée « Template Handles ») pour aucun type d’identifiant.
...
 La plupart des ARK sont crĂ©Ă©s par des organisations qui les publient en utilisant leur propre rĂ©solveur. Par exemple, cet ARK a Ă©tĂ© publiĂ© en spĂ©cifiant le rĂ©solveur ark.bnf.fr :Â
     http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29Â
Avoir à gérer et à maintenir son propre résolveur est la contrepartie d’une autonomie complète. L'utilisation de votre propre résolveur vous permet également de mettre en avant votre « marque » via le nom d'hôte, l'inconvénient étant que les marques sont transitoires et ont tendance à fragiliser les identifiants. Les pressions politiques voire légales (par exemple, sur les marques commerciales) peuvent rendre difficile le maintien de noms d'hôtes de « marque » plus anciens, et donc des identifiants sur lesquels ils ont été construits. C'est un autre argument en faveur du résolveur ARK global. Les utilisateurs rencontrant ultérieurement un identifiant brisé et constatant que son nom d'hôte n'existe plus peuvent, si c'est un ARK, extraire son identité immuable de base (l’élément commençant par « ark: ») et la présenter au résolveur global n2t.net,
             https://n2t.net/ark:/12148/btv1b8449691v/f29
 Pour éviter certains désagréments futurs, une organisation - même si elle utilise son propre résolveur - peut choisir d'emblée de publier ses ARK en utilisant n2t.net.
...
Lorsque le besoin d'un rĂ©solveur ARK global est apparu, les principes de base d'ouverture et de gĂ©nĂ©ricitĂ© ont dissuadĂ© les concepteurs de crĂ©er un autre silo sur le modèle de DOI / Handle / PURL. Au lieu de quoi, le rĂ©solveur ARK a Ă©tĂ© conçu pour ĂŞtre un rĂ©solveur gĂ©nĂ©rique, non liĂ© Ă un format, appelĂ© N2T (Name-to-Thing), qui rĂ©sout maintenant plus de 600 types d'identifiants, y compris les ARK, les DOI, les Handle, les PURL, les URN, les ORCID, les ISSN, etc. La rĂ©solution consiste Ă rechercher dans une table une chaĂ®ne de caractères d'identifiant, quel que soit son type, et Ă la rediriger au bon endroit.Â
Les mêmes principes de base ont guidé la conception d'un outil antérieur appelé noid, conçu pour les ARK, mais également utilisé régulièrement par les organisations attribuant des Handle.
...
En règle gĂ©nĂ©rale, les services basĂ©s sur des formats d’identifiant sont conçus comme des silos, ou des plates-formes fermĂ©es, gĂ©rant un type d'identifiant particulier tel que Handle, DOI ou PURL. Chaque silo remplit les mĂŞmes fonctions principales - associer des noms (chaĂ®nes de caractères d'identifiant) Ă des choses (objets ou mĂ©tadonnĂ©es). L'exclusion de tous les types d'identifiant, sauf un, peut aider Ă conquĂ©rir des marchĂ©s, mais elle est contre-productive et exclusive. Elle nĂ©cessite la reconstruction du mĂŞme ensemble de services pour chaque format et viole les principes de base de l’ouverture.Â
Ă€ l’inverse, le rĂ©solveur N2T (Name-to-Thing) et l'interface de gestion EZID (« identifiants simples ») ont Ă©tĂ© conçus pour gĂ©rer tout identifiant. Les efforts consacrĂ©s Ă toute nouvelle fonctionnalitĂ© peuvent ĂŞtre Ă©tendus avec profit Ă tous les types, ce qui permet une surprenante flexibilitĂ©. Par exemple, les ARK sont souvent stockĂ©s dans EZID avec des mĂ©tadonnĂ©es DOI, et chaque DOI stockĂ© dans N2T peut bĂ©nĂ©ficier des fonctionnalitĂ©s de rĂ©solution ARK telles que les inflexions et le « transfert de suffixe », qui ne sont pas disponibles via le rĂ©solveur DOI principal (doi.org).Â
...