Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: Update to take into account changes brought by versions 26 to 33 of the English FAQ.

...

On a estimé que la durée de vie moyenne d'un URL était de 44 jours. La fin de la vie d’un URL advient lorsque celui-ci se « rompt » ; il  vous retourne alors la redoutable erreur "404 Introuvable" que la plupart d’entre nous connaissent bien. Non seulement c’est agaçant, mais c’est en outre politiquement embarrassant lorsque l’on recherche des publications scientifiques financées sur fonds publics, et c’est un désastre culturel pour les bibliothèques, les archives, les musées et autres institutions mémorielles.

Un Parmi les multiples liens qui peuvent ou ont pu vous conduire à une chose, un identifiant pérenne est un lien qui, en principe, continue de fonctionner très longtemps. Les services qui permettent la découverte et l'interconnexion de ressources (comme entre les articles universitaires, les auteurs, les données de la recherche et les sujets connexes) préfèrent les identifiants pérennes en raison de cette stabilité.

Les identifiants pérennes devraient continuer à fonctionner même lorsque les choses sont déplacées d'un site Web à un autre. Normalement, lorsque les choses sont déplacées, tous ceux qui ont déjà enregistré les anciens liens devraient être informés des nouveaux, ce qui est presque impossible. C'est alors qu'interviennent les résolveurs d'identifiants.

...

Les deux derniers caractères sont réservés pour le cas où vous souhaiteriez divulguer des relations entre ARK.

Une autre des caractéristiques des ARK est que les traits d'union ('-') peuvent être utilisés mais qu’ils sont inertes en ce qui concerne l'identité, ce qui signifie que des chaînes ne différant que par des traits d'union sont considérées comme identiques ; par exemple, ces chaînes

...

Il n'est pas obligatoire que les ARK soient opaques, mais il est recommandé que le nom de base de l'objet le soit, car il constitue en général le nom du sujet principal de l’effort de pérennisation. Si des qualificatifs suivent ce nom, il est moins important qu'ils soient opaques. Pour vous aider à déterminer votre niveau d'opacité, vous pouvez évaluer la compatibilité avec les identifiants hérités et la facilité de génération et de retranscription de la chaîne de caractères (en prenant en compte la compacité, le caractère de contrôle). De nouvelles chaînes de caractères peuvent être générées avec la date et l’heure, un UUID, à l’aide d’un générateur de nombres ou du générateur Noid (Nice Opaque Identifiers).

...

Tout d’abord, déterminez ce que sera l’expérience utilisateur lors de l’accès par vos ARK : une feuille de calcul, un PDF, une image, une page d’accueil affichant des métadonnées et plusieurs options ? Quel que soit votre choix, prévoyez que votre serveur retourne des métadonnées si l’ARK arrivait suivi d’une inflexion 178880635 « ? ».

Pour le reste, résoudre des ARK revient à répondre à des URL. Normalement, les URL entrants appellent (ou sont associés à) du contenu renvoyé par votre serveur Web. Si votre serveur est compatible ARK, les ARK entrants (exprimés sous forme d’URL) doivent être associés au même contenu. L’approche habituelle consiste à associer l’ARK à l’URL à l’aide d’une table de données que vous mettez à jour chaque fois que l’URL change. Dans ce cas, votre serveur agit comme un résolveur local. Si vous ne souhaitez pas l’implémenter vous-même, il existe des outils et services logiciels ARK qui peuvent vous aider.

Une autre approche consiste à laisser votre serveur Web fonctionner en l’état et, au lieu de mettre à jour ses tables locales, de maintenir des tables de correspondance ARK/URL sur un résolveur distinct. Cette approche est adoptée par nombre d’éditeurs de logiciels et par les organisations maintenant leurs tables via le service EZID (qui est lié au résolveur n2t.net et met à jour les tables de résolution de ce dernier).

...

Une décision importante consiste à déterminer si vos URI ARK utiliseront le nom d’hôte de votre résolveur local ou le résolveur N2T.net. Si vous privilégiez le contrôle ou la stratégie de marque, vous préférerez publier des ARK utilisant votre résolveur local. Si vous doutez de la stabilité de votre nom d’hôte local, vous préférerez publier vos ARK en utilisant le nom d’hôte n2t.net (voir ici des exemples des deux approches). Quelle que soit la manière dont vous les publiez, la résolution de vos ARK via N2T est toujours possible.

...

 Voici une liste partielle d’outils logiciels de gestion d’identifiants. Elle comprend notamment -

...

  • ,
  • ArchiveSpace, une application open source pour gĂ©rer et fournir un accès web Ă  des archives, des manuscrits et des objets numĂ©riques,
  • un plug-in ARK pour Omeka, qui crĂ©e et gère des ARK pour la plate-forme de publication Web open source Omeka

...

  • ,
  • un module ARK pour Drupal, qui permet Ă  votre site Drupal d'agir en tant qu'autoritĂ© d’adressage (NMA).

On y mentionne également certains  Certains éditeurs de logiciels et fournisseurs de service sont également cités, tels que EZID. Vous trouverez ici des informations supplémentaires sur les concepts et les bonnes pratiques.

...

N2T utilise deux types de données stockées. Premièrement, il stocke des enregistrements individuels pour plus de 20 millions d'identifiants d'objet (par exemple, ARK, DOI) qu'il obtient de trois sources : EZID, Internet Archive et YAMZ.net. Lorsque de tels enregistrements incluent une URL de redirection (cible) et des métadonnées descriptives, N2T peut agir sur les inflexions, effectuer un transfert de suffixe et une « négociation de contenu ». 

Deuxièmement, N2T stocke plus de 3500 enregistrements de « règle » pour rediriger les identifiants qui n’ont pas été trouvés individuellement dans N2T, mais pour lesquels il dispose d'informations de redirection liées au type d'identifiant à résoudre. Il obtient des enregistrements de règles de plusieurs sources, notamment le registre NAAN, une base de données de préfixes ARK et DOI et un partenariat officiel sur les identifiants compacts avec identifiers.org.

...

Si la plupart des ARK ont leur propre résolveur, pourquoi existe-t-il également un résolveur global pour les ARK ?

Anatomie de l’ARK           Identité immuable de base
                                         ____________________________________
                                        /                                                        \
Service de résolution       Nom de base de l’objet  Qualificatifs
      ______________________   ______________________   _____________
     /                                 \/                                  \/                   \
     https://example.org/ark:12345/654xz321/s3/f8.05v.tiff
                 \_____________/ \___/\_____/ \_________/\______/\______/
                       |                  |          |             |              |          |
                       |               Libellé   |             |               |     Variantes
                       |                       
    |             |      Composantes
                       |                            |             | 
Nom de l’autorité d’adressage   |    Nom ARK attribué
                       (NMA)                  |
                       Nom de l’autorité nommante (NAAN)

...

Oui, les ARK peuvent être attribués à n'importe quel niveau de granularité, tel qu'un manuscrit, des chapitres à l'intérieur, des sections de chapitre, des sous-sections, etc. Un ARK peut également être attribué à une chose qui contient d'autres choses. Dans les ARK, le caractère '/' est réservé pour aider l’utilisateur à découvrir la relation de composition. Par exemple, le premier objet ci-dessous contient le second :

ark:/12148/btv1b8449691v

ark:/12148/btv1b8449691v/f29

C'est le qualificatif de granularité. Il n'y a qu'un seul autre qualificatif ARK, qui indique les variantes de forme d'une chose en utilisant le caractère réservé '.' devant un suffixe. Par exemple, ces ARK identifient des documents,

ark:/12148/btv1b8449691v/f29.pdf

ark:/12148/btv1b8449691v/f29.html

Comme ils ne diffèrent que par le suffixe .pdf ou .html, on peut en déduire qu'ils identifient deux formes différentes du même document.

Quel est le but du NAAN et puis-je y apporter des modifications ?

 Les NAAN subdivisent l'ensemble des ARK potentiels (l'espace de noms ARK). Le sous-ensemble d'ARK d'un NAAN donné peut être subdivisé par des préfixes (par exemple : 12345/x2, 98765/b4), ce qui facilite la délégation de l'attribution autonome d'ARK, aux départements d'une grande organisation par exemple. La résolution ARK est partiellement basée sur les NAAN, mais étant donné qu’il arrive que les organisations soient scindées, ARK répond au problème de la scission d'espaces de noms en permettant à plusieurs organisations de prendre en charge la gestion d'un espace de noms. Si vous passez d’un prestataire à un autre, rien ne vous empêche d’emporter votre NAAN avec vous. Vous pouvez modifier un NAAN en remplissant le même formulaire en ligne utilisé pour demander un nouveau NAAN, par exemple pour

  • mettre Ă  jour l'URL de la personne Ă  contacter ou du rĂ©solveur de votre organisation,
  • modifier la stratĂ©gie d'attribution de nom de votre organisation (voir ici un exemple d’une telle stratĂ©gie),
  • demander un NAAN supplĂ©mentaire pour un nouvel ensemble important d’ARK ou un nouvel organe Ă  l’intĂ©rieur de votre organisation,
  • ou enfin signaler le transfert de votre NAAN vers une autre organisation qui poursuivra votre travail et prendra en charge votre NAAN.

Y a-t-il des restrictions d’usage des NAAN ?

Oui. Il est important de ne jamais inventer ou utiliser un NAAN qui ne serait pas présent dans le registre public. Il y a néanmoins deux NAAN spécifiques que chacun peut utiliser :

  • « 99999 » pour des besoins de test, de dĂ©veloppement ou d’expĂ©rimentation,
  • « 12345 » pour des exemples d’ARK non fonctionnels Ă  utiliser dans la documentation.

Pour les experts, reconnaître les ARK avec de tels NAAN et les éliminer des rapports de liens brisés est aisé. Malgré les efforts des fournisseurs, de tels ARK s’échappent fréquemment « dans la nature », ce qui peut induire en erreur utilisateurs et vérificateurs de liens.

ARK et les autres identifiants

Pourquoi utiliser des ARK plutôt que des DOI, par exemple ?

  • Pour rĂ©duire les coĂ»ts (voir cette section pour plus de prĂ©cision) ;
  • Pour ne gĂ©rer que les mĂ©tadonnĂ©es que vous voulez ;
  • Pour pouvoir crĂ©er des identifiants sans mĂ©tadonnĂ©es ;
  • Pour pouvoir crĂ©er un identifiant avant mĂŞme que votre objet n’existe ;
  • Pour avoir un identifiant dès que vous crĂ©ez le premier brouillon de votre objet ;
  • Pour garder cet identifiant privĂ© pendant que les donnĂ©es et les mĂ©tadonnĂ©es Ă©voluent, jusqu’à ce que vous dĂ©cidiez (Ă©ventuellement des annĂ©es après) de le publier ou de le supprimer ;
  • Pour conserver cet identifiant jusqu’à la publication et peut-ĂŞtre alors attribuer Ă  la place un autre identifiant tel qu'un DOI ;
  • Parce que les ARK, conçus pour une utilisation gĂ©nĂ©rique et non spĂ©cifiquement pour le monde de l’édition, sont naturellement adaptĂ©s Ă  l’identification d’objets physiques comme des Ă©chantillons ou des stations de recherche ;
  • Parce que les rĂ©solveurs ARK peuvent rĂ©soudre des identifiants habituellement endommagĂ©s par des processus de formatage de texte introduisant des traits d'union ;
  • Parce que la plupart des ARK portent un caractère de contrĂ´le Noid qui peut ĂŞtre utilisĂ© pour dĂ©tecter toutes les erreurs de transcription courantes (et non certaines d’entre elles uniquement) ;
  • Pour pouvoir crĂ©er des identifiants plus courts, car la casse mixte permet des chaĂ®nes plus compactes (un plus grand nombre de chaĂ®nes d'une longueur donnĂ©e) ;
  • Pour pouvoir changer de prestataire et/ou d'infrastructure sans avoir Ă  coordonner des transferts de bases de donnĂ©es avec une autoritĂ© centrale ;
  • Pour pouvoir rĂ©soudre le problème de la scission d'espace de noms sans perdre le contrĂ´le de vos identifiants ;
  • Pour lier des identifiants Ă  diffĂ©rentes dĂ©clarations de permanence nuancĂ©es ;
  • Pour pouvoir ajouter des requĂŞtes (par exemple « ?lang=en ») lors de la rĂ©solution de vos identifiants ;
  • Pour utiliser une infrastructure ouverte correspondant aux valeurs de votre organisation ;
  • Pour permettre d’accĂ©der directement aux objets auxquels vous accordez de l’importance et non Ă  leur page d’accueil ;
  • Pour crĂ©er un seul identifiant qui peut ĂŞtre dĂ©clinĂ© en des millions (grâce au mĂ©canisme de transfert de prĂ©fixe) ;
  • Pour accĂ©der Ă  des mĂ©tadonnĂ©es adaptĂ©es et complètes via des inflexions
  • Pour s’intĂ©grer aisĂ©ment dans des API IIIF en utilisant les qualificatifs ARK.

Qu'ont en commun ARK, DOI, Handle, PURL et URN ?

Ce sont les principaux types (ou schémas) d'identifiants pérennes. Tous existent au moins depuis 2001.Tous sont utilisés dans des contextes tels que les profils Data Citation Index℠, Wikipedia et ORCID.org. Tous donnent accès à presque tout type de contenu, qu'il soit numérique, physique, abstrait, une personne, un groupe, etc. Ils ont également une structure très similaire composée de quatre parties, comme le montrent les exemples ci-dessous : 

...

  1. le protocole (https://) plus un nom d'hĂ´te,
  2. uniquement pour ARK et URN, un libellé (« ark: » ou « urn: »),
  3. l'autorité nommante (99999, 10.99999 ou 99999), qui est l'organisation ou le groupe qui a créé un identifiant particulier,
  4. et enfin, le nom, ou l'identifiant local, qu'elle a attribué (12345).

 La plupart des ARK sont créés par des organisations qui les publient en utilisant leur propre résolveur. Par exemple, cet ARK a été publié en spécifiant le résolveur ark.bnf.fr :

http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29

Avoir à gérer et à maintenir son propre résolveur est la contrepartie d’une autonomie complète. L'utilisation de votre propre résolveur vous permet également de mettre en avant votre « marque » via le nom d'hôte, l'inconvénient étant que les marques sont transitoires et ont tendance à fragiliser les identifiants. Les pressions politiques voire légales (par exemple, sur les marques commerciales) peuvent rendre difficile le maintien de noms d'hôtes de « marque » plus anciens, et donc des identifiants sur lesquels ils ont été construits. C'est un autre argument en faveur du résolveur ARK global. Les utilisateurs rencontrant ultérieurement un identifiant brisé et constatant que son nom d'hôte n'existe plus peuvent, si c'est un ARK, extraire son identité immuable de base (l’élément commençant par « ark: ») et la présenter au résolveur global n2t.net,

https://n2t.net/ark:/12148/btv1b8449691v/f29.

Mon organisation a son propre résolveur ARK - dois-je me soucier de N2T.net?

Oui, et ce pour deux raisons principales. Tout d'abord, si vos ARK « à l'état sauvage » apparaissent sans votre le nom d'hôte de votre résolveur (c'est-à-dire, s'ils commencent par « ark: ... », ce qui n'est pas rare), la personne qui veut les utiliser n'est pas tenue de connaître le nom d'hôte : il lui suffit d'ajouter « n2t.net » devant eux. Cela fonctionne car N2T connaît le nom d'hôte du résolveur.

Deuxièmement, si certaines organisations et leurs noms d'hôtes résolveurs ont une longue durée de vie, la plupart ne durent pas. Une personne essayant d'utiliser un ARK contenant un nom d'hôte de résolveur non fonctionnel peut remplacer la partie non fonctionnelle par « n2t.net ». Si les circonstances vous obligent à changer votre résolveur, cette étape de remplacement donne aux ARK que vous avez publiés avant le changement une meilleure chance de fonctionner.

Pour éviter de futurs désagréments, certaines organisations qui gèrent leurs propres résolveurs peuvent choisir d'emblée de préférer au nom de leur résolveur le nom de domaine n2t.net pour la publication de leurs ARK.

Pourquoi le résolveur ARK global (n2t.net) ne contient-il pas le mot « ARK » ?

Lorsque le besoin d'un résolveur ARK global est apparu, les principes de base d'ouverture et de généricité ont dissuadé les concepteurs de créer un autre silo sur le modèle de DOI / Handle / PURL. Au lieu de quoi, le résolveur ARK a été conçu pour être un résolveur générique, non lié à un format, appelé N2T (Name-to-Thing), qui résout maintenant plus de 600 types d'identifiants, y compris les ARK, les DOI, les Handle, les PURL, les URN, les ORCID, les ISSN, etc. La résolution consiste à rechercher dans une table une chaîne de caractères d'identifiant, quel que soit son type, et à la rediriger au bon endroit.

Les mêmes principes de base ont guidé la conception d'un outil antérieur appelé noid, conçu pour les ARK, mais également utilisé régulièrement par les organisations attribuant des Handle.

Que désigne-t-on par « transfert de suffixe » ?

En bref, le transfert de suffixe est une fonctionnalité de N2T. Supposons que vous n'ayez qu'un seul ARK enregistré, https://n2t.net/ark:/12345/6789, et qu'il redirige vers la page du serveur Web,

https://a.example.org/dataset542

Et supposons que ce mĂŞme serveur serve Ă©galement ces pages :

https://a.example.org/dataset542/volume3
https://a.example.org/dataset542/volume3/part2
https://a.example.org/dataset542/volume3/part2.pdf

Ce que fait le transfert de suffixe est de laisser votre ARK enregistré agir comme si vous aviez également enregistré ces trois ARK ci-dessous, qui seraient résolus par les pages ci-dessus, respectivement:

https://n2t.net/ark:/12345/6789/volume3
https://n2t.net/ark:/12345/6789/volume3/part2
https://n2t.net/ark:/12345/6789/volume3/part2.pdf

Dans ce cas, le transfert de suffixe vous évite d'avoir à conserver des enregistrements pour trois pages supplémentaires. En fait, cela fonctionne pour un nombre illimité de pages.

Quelles sont les parties d'un ARK ?

Anatomie de l’ARK           Identité immuable de base
                                         ____________________________________
                                        /                                                        \
Service de résolution       Nom de base de l’objet  Qualificatifs
      ______________________   ______________________   _____________
     /                                 \/                                  \/                   \
     https://example.org/ark:12345/654xz321/s3/f8.05v.tiff
                 \_____________/ \___/\_____/ \_________/\______/\______/
                       |                  |          |             |              |          |
                       |               Libellé   |             |               |     Variantes
                       |                       
    |             |      Composantes
                       |                            |             | 
Nom de l’autorité d’adressage   |    Nom ARK attribué
                       (NMA)                  |
                       Nom de l’autorité nommante (NAAN)

Anchor
granularite
granularite
Puis-je attribuer des ARK à des composantes d’une ressource qui a déjà un ARK ?

Oui, les ARK peuvent être attribués à n'importe quel niveau de granularité, tel qu'un manuscrit, des chapitres à l'intérieur, des sections de chapitre, des sous-sections, etc. Un ARK peut également être attribué à une chose qui contient d'autres choses. Dans les ARK, le caractère '/' est réservé pour aider l’utilisateur à découvrir la relation de composition. Par exemple, le premier objet ci-dessous contient le second :

ark:/12148/btv1b8449691v

ark:/12148/btv1b8449691v/f29

C'est le qualificatif de granularité. Il n'y a qu'un seul autre qualificatif ARK, qui indique les variantes de forme d'une chose en utilisant le caractère réservé '.' devant un suffixe. Par exemple, ces ARK identifient des documents,

ark:/12148/btv1b8449691v/f29.pdf

ark:/12148/btv1b8449691v/f29.html

Comme ils ne diffèrent que par le suffixe .pdf ou .html, on peut en déduire qu'ils identifient deux formes différentes du même document.

Quel est le but du NAAN et puis-je y apporter des modifications ?

 Les NAAN subdivisent l'ensemble des ARK potentiels (l'espace de noms ARK). Le sous-ensemble d'ARK d'un NAAN donné peut être subdivisé par des préfixes (par exemple : 12345/x2, 98765/b4), ce qui facilite la délégation de l'attribution autonome d'ARK, aux départements d'une grande organisation par exemple. La résolution ARK est partiellement basée sur les NAAN, mais étant donné qu’il arrive que les organisations soient scindées, ARK répond au problème de la scission d'espaces de noms en permettant à plusieurs organisations de prendre en charge la gestion d'un espace de noms. Si vous passez d’un prestataire à un autre, rien ne vous empêche d’emporter votre NAAN avec vous. Vous pouvez modifier un NAAN en remplissant le même formulaire en ligne utilisé pour demander un nouveau NAAN, par exemple pour

  • mettre Ă  jour l'URL de la personne Ă  contacter ou du rĂ©solveur de votre organisation,
  • modifier la stratĂ©gie d'attribution de nom de votre organisation (voir ici un exemple d’une telle stratĂ©gie),
  • demander un NAAN supplĂ©mentaire pour un nouvel ensemble important d’ARK ou un nouvel organe Ă  l’intĂ©rieur de votre organisation,
  • ou enfin signaler le transfert de votre NAAN vers une autre organisation qui poursuivra votre travail et prendra en charge votre NAAN.

Y a-t-il des restrictions d’usage des NAAN ?

Oui. Il est important de ne jamais inventer ou utiliser un NAAN qui ne serait pas présent dans le registre public. Il y a néanmoins deux NAAN spécifiques que chacun peut utiliser :

  • « 99999 » pour des besoins de test, de dĂ©veloppement ou d’expĂ©rimentation,
  • « 12345 » pour des exemples d’ARK non fonctionnels Ă  utiliser dans la documentation.

Pour les experts, reconnaître les ARK avec de tels NAAN et les éliminer des rapports de liens brisés est aisé. Malgré les efforts des fournisseurs, de tels ARK s’échappent fréquemment « dans la nature », ce qui peut induire en erreur utilisateurs et vérificateurs de liens.

ARK et les autres identifiants

Pourquoi utiliser des ARK plutôt que des DOI, par exemple ?

  • Pour rĂ©duire les coĂ»ts (voir cette section pour plus de prĂ©cision) ;
  • Pour ne gĂ©rer que les mĂ©tadonnĂ©es que vous voulez ;
  • Pour pouvoir crĂ©er des identifiants sans mĂ©tadonnĂ©es ;
  • Pour pouvoir crĂ©er un identifiant avant mĂŞme que votre objet n’existe ;
  • Pour avoir un identifiant dès que vous crĂ©ez le premier brouillon de votre objet ;
  • Pour garder cet identifiant privĂ© pendant que les donnĂ©es et les mĂ©tadonnĂ©es Ă©voluent, jusqu’à ce que vous dĂ©cidiez (Ă©ventuellement des annĂ©es après) de le publier ou de le supprimer ;
  • Pour conserver cet identifiant jusqu’à la publication et peut-ĂŞtre alors attribuer Ă  la place un autre identifiant tel qu'un DOI ;
  • Parce que les ARK, conçus pour une utilisation gĂ©nĂ©rique et non spĂ©cifiquement pour le monde de l’édition, sont naturellement adaptĂ©s Ă  l’identification d’objets physiques comme des Ă©chantillons ou des stations de recherche ;
  • Parce que les rĂ©solveurs ARK peuvent rĂ©soudre des identifiants habituellement endommagĂ©s par des processus de formatage de texte introduisant des traits d'union ;
  • Parce que la plupart des ARK portent un caractère de contrĂ´le Noid qui peut ĂŞtre utilisĂ© pour dĂ©tecter toutes les erreurs de transcription courantes (et non certaines d’entre elles uniquement) ;
  • Pour pouvoir crĂ©er des identifiants plus courts, car la casse mixte permet des chaĂ®nes plus compactes (un plus grand nombre de chaĂ®nes d'une longueur donnĂ©e) ;
  • Pour pouvoir changer de prestataire et/ou d'infrastructure sans avoir Ă  coordonner des transferts de bases de donnĂ©es avec une autoritĂ© centrale ;
  • Pour pouvoir rĂ©soudre le problème de la scission d'espace de noms sans perdre le contrĂ´le de vos identifiants ;
  • Pour lier des identifiants Ă  diffĂ©rentes dĂ©clarations de permanence nuancĂ©es ;
  • Pour pouvoir ajouter des requĂŞtes (par exemple « ?lang=en ») lors de la rĂ©solution de vos identifiants ;
  • Pour utiliser une infrastructure ouverte correspondant aux valeurs de votre organisation ;
  • Pour permettre d’accĂ©der directement aux objets auxquels vous accordez de l’importance et non Ă  leur page d’accueil ;
  • Pour crĂ©er un seul identifiant qui peut ĂŞtre dĂ©clinĂ© en des millions (grâce au mĂ©canisme de transfert de prĂ©fixe) ;
  • Pour accĂ©der Ă  des mĂ©tadonnĂ©es adaptĂ©es et complètes via des inflexions
  • Pour s’intĂ©grer aisĂ©ment dans des API IIIF en utilisant les qualificatifs ARK.

Qu'ont en commun ARK, DOI, Handle, PURL et URN ?

Ce sont les principaux types (ou schémas) d'identifiants pérennes. Tous existent au moins depuis 2001.Tous sont utilisés dans des contextes tels que les profils Data Citation Index℠, Wikipedia et ORCID.org. Tous donnent accès à presque tout type de contenu, qu'il soit numérique, physique, abstrait, une personne, un groupe, etc. Ils ont également une structure très similaire composée de quatre parties, comme le montrent les exemples ci-dessous : 

 https://n2t.net/ark:/99999/12345 
   https://doi.org/10.99999/12345 
https://handle.net/10.99999/12345 
     https://purl.org/99999/12345 
https://<various>/urn:99999:12345 
  1. le protocole (https://) plus un nom d'hĂ´te,
  2. uniquement pour ARK et URN, un libellé (« ark: » ou « urn: »),
  3. l'autorité nommante (99999, 10.99999 ou 99999), qui est l'organisation ou le groupe qui a créé un identifiant particulier,
  4. et enfin, le nom, ou l'identifiant local, qu'elle a attribué (12345).

 Aucun d’eux n’a d'effet réel sur la persistance (voir 10 mythes persistants sur les identifiants pérennes).

Attendez, vous voulez dire que ARK, DOI, Handle, PURL et URN sont inutiles ?

Non, ce serait une affirmation excessive. Mais remettons ces formats d’identifiant (types) en perspective :

  • Aucun ne protège contre les principales causes de rupture des liens : baisse de financement, catastrophe naturelle, bouleversement social, guerre, Ă©limination dĂ©libĂ©rĂ©e, erreur humaine ou nĂ©gligence du prestataire ;
  • Ils exigent tous de vous, le fournisseur final, de mettre Ă  jour les tables de redirection Ă  mesure que les URL changent ;
  • Ils identifient tous un contenu susceptible d'avoir Ă©tĂ© modifiĂ© ou supprimĂ© Ă  l’occasion de visites ultĂ©rieures ;
  • Tous comportent des identifiants brisĂ©s, et en grande quantitĂ© (plusieurs milliers) ;
  • Ils reposent tous sur le simple système de la redirection gĂ©rĂ© par les serveurs Web depuis 1994 et proposĂ© gratuitement par des centaines de services de raccourcissement d'URL.

Étant donné le peu de choses que ces formats font pour vous, lorsque vous en choisissez un, vous prendrez probablement en compte des facteurs tels que le coût, le risque et l'ouverture. 

Anchor
differenceSchemasIdentifiants
differenceSchemasIdentifiants
En quoi les ARK diffèrent-ils des identifiants tels que les DOI, les Handle, les PURL et les URN ?

La réponse courte

Les ARK sont les seuls identifiants standards, non cloisonnés et non payants que vous pouvez enregistrer et utiliser en environ 48 heures. Les DOI, les Handle et les PURL nécessitent une résolution et d'autres services exigés par leurs systèmes centralisés respectifs (« silos »).

Cela ne veut pas dire que la permanence est gratuite. Rendre un identifiant pérenne, en tant que fournisseur, vous impose des coûts de gestion, d’hébergement, de surveillance et de redirection. Vous pouvez faire ces choses vous-même ou avec l'aide d'un prestataire. Mais avec les ARK, comme avec les URL, vos identifiants ne vous seront pas facturés individuellement et vous ne serez pas enfermés dans un silo n’acceptant qu’un type de résolution spécifique et qui refuse donc les autres identifiants.

Les ARK ont la particularité d'être décentralisés. Bien que l’on puisse obtenir des services de résolution d'un résolveur ARK global appelé n2t.net, plus de 90% des ARK dans le monde ne l’utilisent pas comme résolveur. Plus de 500 organisations enregistrées à travers le monde ont créé par elles-mêmes environ 3,2 milliards d’ARK et, à l'instar des URL, personne n'a jamais payé de frais pour les créer. Bien sûr, les maintenir n'est pas gratuit. Conserver l’accès au contenu de manière pérenne sur le long terme, quel que soit le type d’identifiant, n’est jamais gratuit.

D’autres différences entre ARK, DOI, Handle, PURL et URN

  • ·Les pages d'accueil : les DOI de Crossref et DataCite aboutissent Ă  des pages d'atterrissage conçues pour les Ă©diteurs, mais pas directement aux objets qui vous tiennent Ă  cĹ“ur. Les ARK peuvent en revanche aboutir directement aux objets qui vous tiennent Ă  cĹ“ur, ce qui est pratique Ă  la fois pour les machines et pour les utilisateurs, car cela ne demande pas Ă  l’humain une Ă©tape supplĂ©mentaire de navigation pour des tâches courantes telles que
    • ouvrir le fichier PDF d'un article en lecture,
    • rĂ©fĂ©rencer un fichier image destinĂ© Ă  ĂŞtre incorporĂ© automatiquement en ligne dans un document,
    • ou citer un tableur Ă  utiliser pour l’analyse directe des donnĂ©es par logiciel.
  • Les DOI, les Handle, etc., ne prennent pas en charge le mĂ©canisme d’inflexion d’ARK permettant l'accès aux mĂ©tadonnĂ©es, qu'un identifiant pointe sur un objet ou sur sa page d’accueil.
  • Contrairement aux DOI et aux Handle, les ARK n’ont pas de mĂ©tadonnĂ©es obligatoires. Les ARK qui n'ont pas encore Ă©tĂ© publiĂ©s sont faciles Ă  supprimer.
  • Toute chose finira par disparaĂ®tre, y compris les noms d’hĂ´te, le Web et le protocole https. Lorsque cette première partie de l'identifiant cessera d'avoir une signification, seuls les ARK et les URN incluront un libellĂ© (par exemple, « ark: ») indiquant le type d'identifiant restant.
  • Pour les DOI, les Handle et les PURL, vous devez utiliser leurs rĂ©solveurs respectifs. Les ARK et les URN vous permettent d'utiliser votre propre rĂ©solveur.
  • Pour crĂ©er des DOI et des Handle, vous devez payer une cotisation et, pour les DOI, des frais par DOI dĂ©finis par les agences d’attribution. Il n'y a pas de frais pour les ARK, les PURL et les URN.
  • Pour crĂ©er des Handle, vous devez installer et gĂ©rer un serveur Handle local, ce qui vous oblige Ă  surveiller, mettre Ă  jour et dĂ©panner un autre système.
  • Bien que vous puissiez utiliser un rĂ©solveur local ou proposĂ© par un prestataire pour vos ARK et vos URN, vous pouvez aussi les rĂ©soudre via le rĂ©solveur global n2t.net.
  • L'infrastructure de rĂ©solution URN envisagĂ©e n'a jamais Ă©tĂ© construite. Par consĂ©quent, les URN sont actuellement rĂ©solus comme des URL et il n'y a pas de rĂ©solveur global et officiel d’URN en tant qu'URL. Pour vous inscrire afin de crĂ©er des URN, vous devez demander un espace de nom URN.
  • Les ARK possèdent des fonctionnalitĂ©s uniques qui permettent d’attribuer un identifiant Ă  des stades prĂ©coces de dĂ©veloppement de l’objet : les ARK peuvent ĂŞtre supprimĂ©s, naĂ®tre sans mĂ©tadonnĂ©es et exister avec toutes les mĂ©tadonnĂ©es que vous souhaitez stocker.

Mais si les ARK peuvent être supprimés, comment peut-on leur faire confiance ?

En réalité, cela rend les ARK plus fiables. La possibilité de supprimer est un élément essentiel d’une saine gestion de collections. Les types d'identifiants autres qu’ARK interdisent la suppression, en partant du principe que les personnes, lorsqu’elles sont invitées à intervenir, ne commettront pas d'erreur. Les personnes aux commandes d'un outil de gestion d'identifiants font régulièrement d’une simple inadvertance humaine une erreur à grande échelle, même au début de leur engagement. En rendant la correction difficile, nous condamnons les systèmes à traîner ces bourdes pour l’éternité.

Bien qu’ils ne soient pas à l’abri de telles erreurs, les ARK ont le grand avantage de pouvoir être créés et supprimés dans l’ombre, en dehors de toute publication, ou d’engagement de conservation.

Un objet peut-il avoir à la fois un ARK et un DOI ?

Oui. Parfois, avoir deux identifiants est utile, bien que cela puisse devenir déroutant quand cela se produit souvent. Beaucoup de gens commencent par attribuer des ARK à chaque élément créé afin de disposer d'une référence stable dès le début, avant de savoir s'ils souhaitent le publier ni même le conserver.

L'objet et ses métadonnées évoluent conjointement, et pour le sous-ensemble d'éléments que vous souhaitez publier dans des contextes nécessitant des DOI, vous pouvez en attribuer au moment de la publication. Si votre ARK est stable et contient des métadonnées de base, vous faites déjà tout le nécessaire pour obtenir un bon DOI. C’est en cela que les ARK sont adaptés aux objets à un stade précoce de développement.

Pour gérer efficacement deux identifiants, il est recommandé de créer le DOI de manière à ce qu'il redirige vers l'ARK d'origine. Cela élimine non seulement la nécessité de mettre à jour la redirection DOI, mais maintient également l’ARK pérenne pour tous ceux qui l'ont précédemment enregistré ou marqué d'un signet.

Quand dois-je utiliser ARK plutôt que DOI, Handle, PURL ou URN ?

Il n'y a pas de réponse simple. La question des identifiants (non les choses, mais leurs noms) est complexe, alors si vous entendez des réponses simples ailleurs, méfiez-vous des erreurs courantes.

Aucune caractéristique d’ARK, DOI, Handle, PURL ou URN ne les rend plus ou moins adaptés à une discipline, un domaine ou un secteur particuliers. Avec un résolveur d'identifiants et un système de gestion, ils fournissent tous le service essentiel : la résolution (tout comme des URL correctement gérées).

Certaines considérations spécifiques à un type d'identifiant s'expliquent parfois par le fait que la résolution et la gestion de ce type sont verrouillées par un prestataire ou un fournisseur de service donnés. Par exemple, de nombreuses fonctionnalités et restrictions de PURL ou Handle sont déterminées par leurs silos d’administration respectifs, de même que celles des DOI, basés sur les Handle. En revanche les DOI ont des pratiques de métadonnées variées et évolutives d'une agence d'enregistrement à l'autre.

Les différences concrètes que nous remarquons, sur les métadonnées, les pages d’accueil et l’intégration d’outils (par exemple, les outils de publication), ne sont pas des propriétés des formats d’identifiants en soi, mais des propriétés de résolution, de gestion et de services de citation que divers fournisseurs étendent ou limitent. Ces services sont définis à leur tour par les communautés d’utilisateurs et de clients. Les services de base reposent sur une base de données fiable contenant chaque identifiant, ainsi que des éléments de métadonnées (créateur, titre, date, URL de redirection, etc.) décrivant l'objet identifié. Les services supplémentaires incluent la vérification des liens, la détection des doublons, la génération de rapports et la recherche.

Du berceau au tombeau

Quand dois-je créer des ARK dans mon processus de travail ?

À la naissance de l'objet, ou même avant. Nous nommons généralement nos enfants avant leur naissance, et nous appelons et nous référons à des objets au stade de la conception, parfois longtemps avant qu'ils ne portent leurs fruits. Selon le niveau de précision de vos prévisions, vos objets à naître peuvent avoir des ARK fonctionnels qui fournissent un substitut approprié et renvoient des métadonnées riches, y compris des déclarations de permanence.

La seule mise en garde consiste à être prudent lors de la publication d’ARK dont les perspectives à long terme sont incertaines. Certains systèmes de gestion d'identifiant possèdent des fonctionnalités permettant de gérer et de résoudre les identifiants non validés (par exemple, EZID dispose d’un statut « réservé »). Plus il y a de personnes qui connaissent un ARK, plus il est difficile de le supprimer.

Comment se fait-il que les ARK puissent être faciles à supprimer ?

Si personne d’autre que vous ne connaît un identifiant, rien ne vous empêche de le supprimer ou de le retirer. Pour schématiser, un identifiant est en réalité l’affirmation qu'une chaîne de caractères donnée est associée à une chose spécifique. Moins vous en parlez, plus il est facile de supprimer cette affirmation. Si vous créez un URL et ne le partagez qu'avec vos collègues les plus proches, il sera beaucoup plus facile de le retirer que s’il apparaissait pendant un mois sur un site Web public, à partir duquel il aurait été collecté par les moteurs de recherche Internet. En revanche, il est difficile de supprimer les DOI et les Handle, car une fois enregistrés et résolus, ils sont effectivement diffusés dans le monde entier.

Les ARK se comportent comme des URL à cet égard. Les fournisseurs sont libres de créer et de partager des ARK de manière restreinte, auquel cas ils sont faciles à supprimer.

Cela peut surprendre, mais même s’ils sont plus largement diffusés, les ARK peuvent être accompagnées de déclarations de permanence qui indiquent quel niveau d’engagement – élevé ou bas – on garantit. Les ARK ont été conçus pour disposer d’une palette de déclarations de permanence, mais celles-ci ne sont en aucun cas exhaustives pour des identifiants et des objets qui présentent une grande variété de « saveurs » d’engagement. C'est pourquoi on parle des ARK comme d’identifiants de haute performance adaptés à la permanence plutôt que comme des « identifiants pérennes ».

Enfin, les gens commettent des erreurs. Des ARK, des DOI, des Handle, des PURL et des URN sont parfois diffusés par erreur et doivent être retirés. Lorsque cela se produit, la meilleure option du fournisseur consiste à résoudre l'identifiant retiré en donnant accès à une page « fantôme » qui explique et éventuellement présente des excuses pour le désagrément occasionné. Contrairement aux idées reçues, les identifiants pérennes n’offrent aucune garantie.

Anchor
precoce
precoce
Pourquoi dit-on que les ARK sont adaptés à des objets dans un stade précoce de développement ?

On a besoin d'identifiants avant de savoir exactement à quel objet ils se réfèrent, ou s'ils font référence à quelque chose qui mérite d'être gardé. Un identifiant exigeant des métadonnées abouties ne peut pas être créé au début du développement car l'objet est mal connu. C’est pourquoi les créateurs d'objets attribuent presque toujours initialement des identifiants sans exigences de métadonnées, tels que des URL ou des ARK.

En commençant par attribuer un ARK, vous bénéficiez de la possibilité de conserver l'identifiant d'origine de la naissance à la diffusion publique alors que l'objet et ses métadonnées évoluent. De nombreux objets passent par des phases de développement et de correction intensives, durant parfois plusieurs années, au cours desquelles ils sont trop immatures pour répondre à la plupart des exigences en matière de métadonnées. Néanmoins, chaque objet a besoin d’une sorte d’identifiant, de la conception à la maturité, cette dernière consistant en une publication et en une amélioration, ou en un abandon. Il est facile d’abandonner des ARK qui n’ont pas été dévoilés au public.

Comme l'objet lui-même, les éléments de métadonnées ont besoin de flexibilité pour se développer et évoluer avec le temps :

  • Au moment de la prĂ©vision ; il suffit alors d'un identifiant,
  • Ă  la naissance, lorsque sa première reprĂ©sentation numĂ©rique nĂ©cessite une URL de redirection,
  • après la première analyse, lorsque son sens et un titre provisoire apparaissent,
  • lors de la crĂ©ation de dizaines d'Ă©lĂ©ments de mĂ©tadonnĂ©es spĂ©cifiques Ă  une discipline qui contreviennent Ă  la plupart des normes de mĂ©tadonnĂ©es, Ă  l'exception de la vĂ´tre,
  • pendant le post-traitement par un collègue dont vous allez ajouter le nom en tant que contributeur supplĂ©mentaire,
  • lorsque les premières rĂ©actions basĂ©es sur l'identifiant tweetĂ© s’avèrent ĂŞtre des observations fondamentales de la part d’un nouveau contributeur,
  • et ainsi de suite jusqu'Ă  l'archivage, l'abandon, la diffusion publique, la correction, la rĂ©vision, l'amĂ©lioration, etc.

Contrairement aux DOI Crossref et DataCite, qui nécessitent des métadonnées spécifiques (voir, par exemple, le schéma DataCite), les ARK n’exercent aucune contrainte sur ces activités. Mieux encore, le résolveur N2T.net permet effectivement de les prendre toutes en compte.

Anchor
metadonnees
metadonnees
Si les ARK ne les exigent pas, pourquoi se donner la peine de créer des métadonnées ?

La création de métadonnées (informations supplémentaires associées à ou décrivant un objet) présente plusieurs avantages essentiels. Premièrement, quelle que soit la cible de l'ARK - une page d'accueil ou un fichier - les métadonnées fournissent aux utilisateurs des informations essentielles sur l'objet, telles que des références à des versions plus récentes, une date de création, une provenance, etc. Dans le cas des ARK, les métadonnées sont généralement accessibles via des inflexions.

Les métadonnées facilitent vraiment l'utilisation d'identifiants opaques, qui ne révèlent aucun indice sur ce qu'ils identifient. En l'absence de métadonnées, vous êtes obligé d'accéder à l'objet lui-même pour vous rappeler de quoi il s'agit et également pour vous assurer que vous accédez au bon objet. De plus, la divergence entre les métadonnées renvoyées et l'objet consulté aide tout le monde à détecter des modifications ou des erreurs d'identification.

Les métadonnées sont adaptées aux objets aboutis et sont beaucoup moins importantes pour les objets et les identifiants immatures que pour ceux qui ont été publiés. Avoir des métadonnées démontre la crédibilité du fournisseur et son engagement vis-à-vis d’identifiants de haute performance. Tous les fournisseurs ne sont pas à la hauteur de cette tâche.

Cela n'est pas nécessairement cher. Les métadonnées créées à partir de zéro peuvent être coûteuses, mais elles sont généralement produites et gérées par des fournisseurs d'objets, auquel cas elles peuvent être exploitées efficacement pour les identifiants. Idéalement, pour une permanence maximale, les métadonnées principales (gérées par les fournisseurs d'objet) devraient être répliquées dans des systèmes indépendants afin qu'il soit difficile pour une personne d'altérer de manière indétectable les associations d'identifiants. Par exemple, les entrepôts d'objets numériques qui obtiennent des ARK et des DOI du service EZID stockent une copie de leurs métadonnées dans EZID, qui en stocke une autre copie dans le résolveur N2T.net.

Quelles métadonnées sont recommandées pour les ARK ?

La question des métadonnées est complexe pour tous les identifiants, pas seulement pour ARK. Il existe des milliers de normes selon les domaines et les types d’objets, la plupart d’entre elles se recoupant tout en se contredisant, et chacune d’elles est appliquée conformément aux pratiques locales de l’organisation avec différents niveaux de conformité. Le choix ou la création d'une spécification pour vos métadonnées dépend de facteurs tels que

  • si vous gĂ©rez actuellement des mĂ©tadonnĂ©es (astuce : gardez-les, sauf si vous avez une bonne raison de changer),
  • si vous souhaitez publier officiellement des objets (astuce : prĂ©parez-vous Ă  fournir l'auteur, le titre, la date, l'Ă©diteur / l’institution de conservation et le type d'objet),
  • les exigences et les capacitĂ©s de votre rĂ©solveur (astuce : votre personnel informatique ou votre prestataire pourrait avoir ses propres exigences),
  • ou si vous souhaitez stocker des Ă©lĂ©ments de mĂ©tadonnĂ©es non standard (astuce : N2T le permet, contrairement Ă  la plupart des standards et des fournisseurs).

Une interopérabilité fiable entre domaines peut s'avérer difficile, mais Dublin Core, DataCite, Schema.org et Dublin Kernel sont des spécifications de métadonnées standard à envisager pour une utilisation conjointe avec ARK.

Pourquoi est-ce que je vois des métadonnées ARK avec les termes « qui », « quoi », « quand », « où » ?

 Les ARK ont été conçus pour identifier n'importe quoi, pas seulement des choses qui sont, par exemple, publiables ou achetables. Il n’est pas naturel de modéliser un fossile, un échantillon de tissu, un terme de vocabulaire ou Marie Curie comme si chacun avait un auteur, un titre, un éditeur, un copyright et un prix. Au lieu de quoi, depuis 2001, un ARK est généralement accompagné d’un noyau de métadonnées génériques de quatre éléments (Dublin Kernel, inspiré de Dublin Core (DC)), suivi de tout autre élément de métadonnée (paire attribut / valeur) que le fournisseur souhaite donner. Ce noyau de métadonnées est structuré pour répondre aux questions suivantes : « qui ? », « quoi ? », « quand ? » et « où ? » sur l'expression ou le « récit » d'un objet :

  • qui l'a « dit » (semblable aux Ă©lĂ©ments DC CrĂ©ateur, Contributeur et Éditeur, mais Ă©galement Ă  inventeur, dĂ©couvreur, rĂ©alisateur, etc.),
  • comment s'appelle le « dit » (semblable Ă  l’élĂ©ment DC Titre, mais aussi Ă  NumĂ©roDEchantillon, CodeBarreObjet, etc.),
  • quand il a Ă©tĂ© « dit » (similaire Ă  l’élĂ©ment DC Date, mais inclut les intervalles de dates, les dates approximative et celles avant l’ère chrĂ©tienne),
  • oĂą le « dit » peut ĂŞtre trouvĂ© (similaire Ă  l’élĂ©ment DC Identifiant, mais gĂ©nĂ©ralement inutile car il s'agit de l'ARK lui-mĂŞme).

Il y a beaucoup à dire sur les métadonnées et ARK (par exemple, sur l’application des éléments « qui », « quoi », « quand » et « où » au contenu d'une biographie, ou comment une institution de conservation prévoit de maintenir un jeu de données). Des recommandations supplémentaires sur les métadonnées et ARK seront disponibles sur arks.org. D'autres éléments sont essentiels, tels que

  • comment il a Ă©tĂ© « dit » (similaire Ă  un Ă©lĂ©ment ResourceType), ce qui peut dĂ©terminer des alignements avec des spĂ©cifications de mĂ©tadonnĂ©es externes et des Ă©lĂ©ments supplĂ©mentaires
  • URL cible de la redirection, gĂ©nĂ©ralement stockĂ©e en tant qu'Ă©lĂ©ment distinct des mĂ©tadonnĂ©es
  • Ă©lĂ©ments de dĂ©claration de permanence, pour exprimer le niveau d'un engagement de conservation.

Anchor
inflexion
inflexion
Qu'est-ce qu'une « inflexion » et en quoi diffère-t-elle de la « négociation de contenu » ?

Une inflexion est une désinence à la fin d'un mot qui exprime un changement de sens. Cela permet de définir un mot tel que « aller » sans définir également « allez » et « allons ». Pour un ARK qui mène à un objet, ajouter simplement un « ? » à la fin (« ? » est un exemple d'inflexion ARK) nous permet de demander des métadonnées sans avoir à définir un identifiant distinct pour les métadonnées de l'objet. Cette technique simple peut être utilisée par un humain avec un navigateur Web. Le résolveur N2T prend en charge les inflexions et la négociation de contenu.

La négociation de contenu pour les métadonnées est une technique logicielle permettant de demander d'autres formats d'objet, tels que le format PDF ou RTF d'un fichier HTML. Bien que cela n’ait pas été conçu pour cela, la « négociation de contenu » originelle était détournée dans certains cas pour demander des métadonnées, en considérant curieusement que les formats de fichier souvent utilisés pour exprimer des métadonnées ne pouvaient véhiculer que des métadonnées et jamais des objets à part entière. Contrairement aux inflexions, la « négociation de contenu pour les métadonnées » ne fonctionne pas du tout pour les objets représentés dans ces formats (formats dont la liste ne cesse de s'allonger et n'est connue que par convention tacite) et n'est pas assez simple d’utilisation pour la plupart des usagers humains.

Bien que les inflexions soient généralement associées aux ARK, elles ne leur sont pas réservées. Contrairement aux idées reçues, les identifiants ne font rien ; ce sont leurs résolveurs qui gèrent ou non des fonctionnalités. Ainsi, par exemple, les inflexions et le « transfert de suffixe » sont pris en charge par n2t.net pour tous les types d’identifiants, mais pas par doi.org ni par handle.net (qui dispose d’une fonctionnalité similaire appelée « Template Handles ») pour aucun type d’identifiant

 Aucun d’eux n’a d'effet réel sur la persistance (voir 10 mythes persistants sur les identifiants pérennes).

Attendez, vous voulez dire que ARK, DOI, Handle, PURL et URN sont inutiles ?

Non, ce serait une affirmation excessive. Mais remettons ces formats d’identifiant (types) en perspective :

  • Aucun ne protège contre les principales causes de rupture des liens : baisse de financement, catastrophe naturelle, bouleversement social, guerre, Ă©limination dĂ©libĂ©rĂ©e, erreur humaine ou nĂ©gligence du prestataire ;
  • Ils exigent tous de vous, le fournisseur final, de mettre Ă  jour les tables de redirection Ă  mesure que les URL changent ;
  • Ils identifient tous un contenu susceptible d'avoir Ă©tĂ© modifiĂ© ou supprimĂ© Ă  l’occasion de visites ultĂ©rieures ;
  • Tous comportent des identifiants brisĂ©s, et en grande quantitĂ© (plusieurs milliers) ;
  • Ils reposent tous sur le simple système de la redirection gĂ©rĂ© par les serveurs Web depuis 1994 et proposĂ© gratuitement par des centaines de services de raccourcissement d'URL.

Étant donné le peu de choses que ces formats font pour vous, lorsque vous en choisissez un, vous prendrez probablement en compte des facteurs tels que le coût, le risque et l'ouverture. 

...

La réponse courte

Les ARK sont les seuls identifiants standards, non cloisonnés et non payants que vous pouvez enregistrer et utiliser en environ 48 heures. Les DOI, les Handle et les PURL nécessitent une résolution et d'autres services exigés par leurs systèmes centralisés respectifs (« silos »).

Cela ne veut pas dire que la permanence est gratuite. Rendre un identifiant pérenne, en tant que fournisseur, vous impose des coûts de gestion, d’hébergement, de surveillance et de redirection. Vous pouvez faire ces choses vous-même ou avec l'aide d'un prestataire. Mais avec les ARK, comme avec les URL, vos identifiants ne vous seront pas facturés individuellement et vous ne serez pas enfermés dans un silo n’acceptant qu’un type de résolution spécifique et qui refuse donc les autres identifiants.

Les ARK ont la particularité d'être décentralisés. Bien que l’on puisse obtenir des services de résolution d'un résolveur ARK global appelé n2t.net, plus de 90% des ARK dans le monde ne l’utilisent pas comme résolveur. Plus de 500 organisations enregistrées à travers le monde ont créé par elles-mêmes environ 3,2 milliards d’ARK et, à l'instar des URL, personne n'a jamais payé de frais pour les créer. Bien sûr, les maintenir n'est pas gratuit. Conserver l’accès au contenu de manière pérenne sur le long terme, quel que soit le type d’identifiant, n’est jamais gratuit.

D’autres différences entre ARK, DOI, Handle, PURL et URN

  • ·Les pages d'accueil : les DOI de Crossref et DataCite aboutissent Ă  des pages d'atterrissage conçues pour les Ă©diteurs, mais pas directement aux objets qui vous tiennent Ă  cĹ“ur. Les ARK peuvent en revanche aboutir directement aux objets qui vous tiennent Ă  cĹ“ur, ce qui est pratique Ă  la fois pour les machines et pour les utilisateurs, car cela ne demande pas Ă  l’humain une Ă©tape supplĂ©mentaire de navigation pour des tâches courantes telles que
    • ouvrir le fichier PDF d'un article en lecture,
    • rĂ©fĂ©rencer un fichier image destinĂ© Ă  ĂŞtre incorporĂ© automatiquement en ligne dans un document,
    • ou citer un tableur Ă  utiliser pour l’analyse directe des donnĂ©es par logiciel.
  • Les DOI, les Handle, etc., ne prennent pas en charge le mĂ©canisme d’inflexion d’ARK permettant l'accès aux mĂ©tadonnĂ©es, qu'un identifiant pointe sur un objet ou sur sa page d’accueil.
  • Contrairement aux DOI et aux Handle, les ARK n’ont pas de mĂ©tadonnĂ©es obligatoires. Les ARK qui n'ont pas encore Ă©tĂ© publiĂ©s sont faciles Ă  supprimer.
  • Toute chose finira par disparaĂ®tre, y compris les noms d’hĂ´te, le Web et le protocole https. Lorsque cette première partie de l'identifiant cessera d'avoir une signification, seuls les ARK et les URN incluront un libellĂ© (par exemple, « ark: ») indiquant le type d'identifiant restant.
  • Pour les DOI, les Handle et les PURL, vous devez utiliser leurs rĂ©solveurs respectifs. Les ARK et les URN vous permettent d'utiliser votre propre rĂ©solveur.
  • Pour crĂ©er des DOI et des Handle, vous devez payer une cotisation et, pour les DOI, des frais par DOI dĂ©finis par les agences d’attribution. Il n'y a pas de frais pour les ARK, les PURL et les URN.
  • Pour crĂ©er des Handle, vous devez installer et gĂ©rer un serveur Handle local, ce qui vous oblige Ă  surveiller, mettre Ă  jour et dĂ©panner un autre système.
  • Bien que vous puissiez utiliser un rĂ©solveur local ou proposĂ© par un prestataire pour vos ARK et vos URN, vous pouvez aussi les rĂ©soudre via le rĂ©solveur global n2t.net.
  • L'infrastructure de rĂ©solution URN envisagĂ©e n'a jamais Ă©tĂ© construite. Par consĂ©quent, les URN sont actuellement rĂ©solus comme des URL et il n'y a pas de rĂ©solveur global et officiel d’URN en tant qu'URL. Pour vous inscrire afin de crĂ©er des URN, vous devez demander un espace de nom URN.
  • Les ARK possèdent des fonctionnalitĂ©s uniques qui permettent d’attribuer un identifiant Ă  des stades prĂ©coces de dĂ©veloppement de l’objet : les ARK peuvent ĂŞtre supprimĂ©s, naĂ®tre sans mĂ©tadonnĂ©es et exister avec toutes les mĂ©tadonnĂ©es que vous souhaitez stocker.

Mais si les ARK peuvent être supprimés, comment peut-on leur faire confiance ?

En réalité, cela rend les ARK plus fiables. La possibilité de supprimer est un élément essentiel d’une saine gestion de collections. Les types d'identifiants autres qu’ARK interdisent la suppression, en partant du principe que les personnes, lorsqu’elles sont invitées à intervenir, ne commettront pas d'erreur. Les personnes aux commandes d'un outil de gestion d'identifiants font régulièrement d’une simple inadvertance humaine une erreur à grande échelle, même au début de leur engagement. En rendant la correction difficile, nous condamnons les systèmes à traîner ces bourdes pour l’éternité.

Bien qu’ils ne soient pas à l’abri de telles erreurs, les ARK ont le grand avantage de pouvoir être créés et supprimés dans l’ombre, en dehors de toute publication, ou d’engagement de conservation.

Un objet peut-il avoir à la fois un ARK et un DOI ?

Oui. Parfois, avoir deux identifiants est utile, bien que cela puisse devenir déroutant quand cela se produit souvent. Beaucoup de gens commencent par attribuer des ARK à chaque élément créé afin de disposer d'une référence stable dès le début, avant de savoir s'ils souhaitent le publier ni même le conserver.

L'objet et ses métadonnées évoluent conjointement, et pour le sous-ensemble d'éléments que vous souhaitez publier dans des contextes nécessitant des DOI, vous pouvez en attribuer au moment de la publication. Si votre ARK est stable et contient des métadonnées de base, vous faites déjà tout le nécessaire pour obtenir un bon DOI. C’est en cela que les ARK sont adaptés aux objets à un stade précoce de développement.

Pour gérer efficacement deux identifiants, il est recommandé de créer le DOI de manière à ce qu'il redirige vers l'ARK d'origine. Cela élimine non seulement la nécessité de mettre à jour la redirection DOI, mais maintient également l’ARK pérenne pour tous ceux qui l'ont précédemment enregistré ou marqué d'un signet.

Quand dois-je utiliser ARK plutôt que DOI, Handle, PURL ou URN ?

Il n'y a pas de réponse simple. La question des identifiants (non les choses, mais leurs noms) est complexe, alors si vous entendez des réponses simples ailleurs, méfiez-vous des erreurs courantes.

Aucune caractéristique d’ARK, DOI, Handle, PURL ou URN ne les rend plus ou moins adaptés à une discipline, un domaine ou un secteur particuliers. Avec un résolveur d'identifiants et un système de gestion, ils fournissent tous le service essentiel : la résolution (tout comme des URL correctement gérées).

Certaines considérations spécifiques à un type d'identifiant s'expliquent parfois par le fait que la résolution et la gestion de ce type sont verrouillées par un prestataire ou un fournisseur de service donnés. Par exemple, de nombreuses fonctionnalités et restrictions de PURL ou Handle sont déterminées par leurs silos d’administration respectifs, de même que celles des DOI, basés sur les Handle. En revanche les DOI ont des pratiques de métadonnées variées et évolutives d'une agence d'enregistrement à l'autre.

Les différences concrètes que nous remarquons, sur les métadonnées, les pages d’accueil et l’intégration d’outils (par exemple, les outils de publication), ne sont pas des propriétés des formats d’identifiants en soi, mais des propriétés de résolution, de gestion et de services de citation que divers fournisseurs étendent ou limitent. Ces services sont définis à leur tour par les communautés d’utilisateurs et de clients. Les services de base reposent sur une base de données fiable contenant chaque identifiant, ainsi que des éléments de métadonnées (créateur, titre, date, URL de redirection, etc.) décrivant l'objet identifié. Les services supplémentaires incluent la vérification des liens, la détection des doublons, la génération de rapports et la recherche.

Du berceau au tombeau

Quand dois-je créer des ARK dans mon processus de travail ?

À la naissance de l'objet, ou même avant. Nous nommons généralement nos enfants avant leur naissance, et nous appelons et nous référons à des objets au stade de la conception, parfois longtemps avant qu'ils ne portent leurs fruits. Selon le niveau de précision de vos prévisions, vos objets à naître peuvent avoir des ARK fonctionnels qui fournissent un substitut approprié et renvoient des métadonnées riches, y compris des déclarations de permanence.

La seule mise en garde consiste à être prudent lors de la publication d’ARK dont les perspectives à long terme sont incertaines. Certains systèmes de gestion d'identifiant possèdent des fonctionnalités permettant de gérer et de résoudre les identifiants non validés (par exemple, EZID dispose d’un statut « réservé »). Plus il y a de personnes qui connaissent un ARK, plus il est difficile de le supprimer.

Comment se fait-il que les ARK puissent être faciles à supprimer ?

Si personne d’autre que vous ne connaît un identifiant, rien ne vous empêche de le supprimer ou de le retirer. Pour schématiser, un identifiant est en réalité l’affirmation qu'une chaîne de caractères donnée est associée à une chose spécifique. Moins vous en parlez, plus il est facile de supprimer cette affirmation. Si vous créez un URL et ne le partagez qu'avec vos collègues les plus proches, il sera beaucoup plus facile de le retirer que s’il apparaissait pendant un mois sur un site Web public, à partir duquel il aurait été collecté par les moteurs de recherche Internet. En revanche, il est difficile de supprimer les DOI et les Handle, car une fois enregistrés et résolus, ils sont effectivement diffusés dans le monde entier.

Les ARK se comportent comme des URL à cet égard. Les fournisseurs sont libres de créer et de partager des ARK de manière restreinte, auquel cas ils sont faciles à supprimer.

Cela peut surprendre, mais même s’ils sont plus largement diffusés, les ARK peuvent être accompagnées de déclarations de permanence qui indiquent quel niveau d’engagement – élevé ou bas – on garantit. Les ARK ont été conçus pour disposer d’une palette de déclarations de permanence, mais celles-ci ne sont en aucun cas exhaustives pour des identifiants et des objets qui présentent une grande variété de « saveurs » d’engagement. C'est pourquoi on parle des ARK comme d’identifiants de haute performance adaptés à la permanence plutôt que comme des « identifiants pérennes ».

Enfin, les gens commettent des erreurs. Des ARK, des DOI, des Handle, des PURL et des URN sont parfois diffusés par erreur et doivent être retirés. Lorsque cela se produit, la meilleure option du fournisseur consiste à résoudre l'identifiant retiré en donnant accès à une page « fantôme » qui explique et éventuellement présente des excuses pour le désagrément occasionné. Contrairement aux idées reçues, les identifiants pérennes n’offrent aucune garantie.

...

On a besoin d'identifiants avant de savoir exactement à quel objet ils se réfèrent, ou s'ils font référence à quelque chose qui mérite d'être gardé. Un identifiant exigeant des métadonnées abouties ne peut pas être créé au début du développement car l'objet est mal connu. C’est pourquoi les créateurs d'objets attribuent presque toujours initialement des identifiants sans exigences de métadonnées, tels que des URL ou des ARK.

En commençant par attribuer un ARK, vous bénéficiez de la possibilité de conserver l'identifiant d'origine de la naissance à la diffusion publique alors que l'objet et ses métadonnées évoluent. De nombreux objets passent par des phases de développement et de correction intensives, durant parfois plusieurs années, au cours desquelles ils sont trop immatures pour répondre à la plupart des exigences en matière de métadonnées. Néanmoins, chaque objet a besoin d’une sorte d’identifiant, de la conception à la maturité, cette dernière consistant en une publication et en une amélioration, ou en un abandon. Il est facile d’abandonner des ARK qui n’ont pas été dévoilés au public.

Comme l'objet lui-même, les éléments de métadonnées ont besoin de flexibilité pour se développer et évoluer avec le temps :

  • Au moment de la prĂ©vision ; il suffit alors d'un identifiant,
  • Ă  la naissance, lorsque sa première reprĂ©sentation numĂ©rique nĂ©cessite une URL de redirection,
  • après la première analyse, lorsque son sens et un titre provisoire apparaissent,
  • lors de la crĂ©ation de dizaines d'Ă©lĂ©ments de mĂ©tadonnĂ©es spĂ©cifiques Ă  une discipline qui contreviennent Ă  la plupart des normes de mĂ©tadonnĂ©es, Ă  l'exception de la vĂ´tre,
  • pendant le post-traitement par un collègue dont vous allez ajouter le nom en tant que contributeur supplĂ©mentaire,
  • lorsque les premières rĂ©actions basĂ©es sur l'identifiant tweetĂ© s’avèrent ĂŞtre des observations fondamentales de la part d’un nouveau contributeur,
  • et ainsi de suite jusqu'Ă  l'archivage, l'abandon, la diffusion publique, la correction, la rĂ©vision, l'amĂ©lioration, etc.

Contrairement aux DOI Crossref et DataCite, qui nécessitent des métadonnées spécifiques (voir, par exemple, le schéma DataCite), les ARK n’exercent aucune contrainte sur ces activités. Mieux encore, le résolveur N2T.net permet effectivement de les prendre toutes en compte.

...

La création de métadonnées (informations supplémentaires associées à ou décrivant un objet) présente plusieurs avantages essentiels. Premièrement, quelle que soit la cible de l'ARK - une page d'accueil ou un fichier - les métadonnées fournissent aux utilisateurs des informations essentielles sur l'objet, telles que des références à des versions plus récentes, une date de création, une provenance, etc. Dans le cas des ARK, les métadonnées sont généralement accessibles via des inflexions.

Les métadonnées facilitent vraiment l'utilisation d'identifiants opaques, qui ne révèlent aucun indice sur ce qu'ils identifient. En l'absence de métadonnées, vous êtes obligé d'accéder à l'objet lui-même pour vous rappeler de quoi il s'agit et également pour vous assurer que vous accédez au bon objet. De plus, la divergence entre les métadonnées renvoyées et l'objet consulté aide tout le monde à détecter des modifications ou des erreurs d'identification.

Les métadonnées sont adaptées aux objets aboutis et sont beaucoup moins importantes pour les objets et les identifiants immatures que pour ceux qui ont été publiés. Avoir des métadonnées démontre la crédibilité du fournisseur et son engagement vis-à-vis d’identifiants de haute performance. Tous les fournisseurs ne sont pas à la hauteur de cette tâche.

Cela n'est pas nécessairement cher. Les métadonnées créées à partir de zéro peuvent être coûteuses, mais elles sont généralement produites et gérées par des fournisseurs d'objets, auquel cas elles peuvent être exploitées efficacement pour les identifiants. Idéalement, pour une permanence maximale, les métadonnées principales (gérées par les fournisseurs d'objet) devraient être répliquées dans des systèmes indépendants afin qu'il soit difficile pour une personne d'altérer de manière indétectable les associations d'identifiants. Par exemple, les entrepôts d'objets numériques qui obtiennent des ARK et des DOI du service EZID stockent une copie de leurs métadonnées dans EZID, qui en stocke une autre copie dans le résolveur N2T.net.

Quelles métadonnées sont recommandées pour les ARK ?

La question des métadonnées est complexe pour tous les identifiants, pas seulement pour ARK. Il existe des milliers de normes selon les domaines et les types d’objets, la plupart d’entre elles se recoupant tout en se contredisant, et chacune d’elles est appliquée conformément aux pratiques locales de l’organisation avec différents niveaux de conformité. Le choix ou la création d'une spécification pour vos métadonnées dépend de facteurs tels que

  • si vous gĂ©rez actuellement des mĂ©tadonnĂ©es (astuce : gardez-les, sauf si vous avez une bonne raison de changer),
  • si vous souhaitez publier officiellement des objets (astuce : prĂ©parez-vous Ă  fournir l'auteur, le titre, la date, l'Ă©diteur / l’institution de conservation et le type d'objet),
  • les exigences et les capacitĂ©s de votre rĂ©solveur (astuce : votre personnel informatique ou votre prestataire pourrait avoir ses propres exigences),
  • ou si vous souhaitez stocker des Ă©lĂ©ments de mĂ©tadonnĂ©es non standard (astuce : N2T le permet, contrairement Ă  la plupart des standards et des fournisseurs).

Une interopérabilité fiable entre domaines peut s'avérer difficile, mais Dublin Core, DataCite, Schema.org et Dublin Kernel sont des spécifications de métadonnées standard à envisager pour une utilisation conjointe avec ARK.

Pourquoi est-ce que je vois des métadonnées ARK avec les termes « qui », « quoi », « quand », « où » ?

 Les ARK ont été conçus pour identifier n'importe quoi, pas seulement des choses qui sont, par exemple, publiables ou achetables. Il n’est pas naturel de modéliser un fossile, un échantillon de tissu, un terme de vocabulaire ou Marie Curie comme si chacun avait un auteur, un titre, un éditeur, un copyright et un prix. Au lieu de quoi, depuis 2001, un ARK est généralement accompagné d’un noyau de métadonnées génériques de quatre éléments (Dublin Kernel, inspiré de Dublin Core (DC)), suivi de tout autre élément de métadonnée (paire attribut / valeur) que le fournisseur souhaite donner. Ce noyau de métadonnées est structuré pour répondre aux questions suivantes : « qui ? », « quoi ? », « quand ? » et « où ? » sur l'expression ou le « récit » d'un objet :

  • qui l'a « dit » (semblable aux Ă©lĂ©ments DC CrĂ©ateur, Contributeur et Éditeur, mais Ă©galement Ă  inventeur, dĂ©couvreur, rĂ©alisateur, etc.),
  • comment s'appelle le « dit » (semblable Ă  l’élĂ©ment DC Titre, mais aussi Ă  NumĂ©roDEchantillon, CodeBarreObjet, etc.),
  • quand il a Ă©tĂ© « dit » (similaire Ă  l’élĂ©ment DC Date, mais inclut les intervalles de dates, les dates approximative et celles avant l’ère chrĂ©tienne),
  • oĂą le « dit » peut ĂŞtre trouvĂ© (similaire Ă  l’élĂ©ment DC Identifiant, mais gĂ©nĂ©ralement inutile car il s'agit de l'ARK lui-mĂŞme).

Il y a beaucoup à dire sur les métadonnées et ARK (par exemple, sur l’application des éléments « qui », « quoi », « quand » et « où » au contenu d'une biographie, ou comment une institution de conservation prévoit de maintenir un jeu de données). Des recommandations supplémentaires sur les métadonnées et ARK seront disponibles sur arks.org. D'autres éléments sont essentiels, tels que

  • comment il a Ă©tĂ© « dit » (similaire Ă  un Ă©lĂ©ment ResourceType), ce qui peut dĂ©terminer des alignements avec des spĂ©cifications de mĂ©tadonnĂ©es externes et des Ă©lĂ©ments supplĂ©mentaires
  • URL cible de la redirection, gĂ©nĂ©ralement stockĂ©e en tant qu'Ă©lĂ©ment distinct des mĂ©tadonnĂ©es
  • Ă©lĂ©ments de dĂ©claration de permanence, pour exprimer le niveau d'un engagement de conservation.

...

Une inflexion est une désinence à la fin d'un mot qui exprime un changement de sens. Cela permet de définir un mot tel que « aller » sans définir également « allez » et « allons ». Pour un ARK qui mène à un objet, ajouter simplement un « ? » à la fin (« ? » est un exemple d'inflexion ARK) nous permet de demander des métadonnées sans avoir à définir un identifiant distinct pour les métadonnées de l'objet. Cette technique simple peut être utilisée par un humain avec un navigateur Web. Le résolveur N2T prend en charge les inflexions et la négociation de contenu.

La négociation de contenu pour les métadonnées est une technique logicielle permettant de demander d'autres formats d'objet, tels que le format PDF ou RTF d'un fichier HTML. Bien que cela n’ait pas été conçu pour cela, la « négociation de contenu » originelle était détournée dans certains cas pour demander des métadonnées, en considérant curieusement que les formats de fichier souvent utilisés pour exprimer des métadonnées ne pouvaient véhiculer que des métadonnées et jamais des objets à part entière. Contrairement aux inflexions, la « négociation de contenu pour les métadonnées » ne fonctionne pas du tout pour les objets représentés dans ces formats (formats dont la liste ne cesse de s'allonger et n'est connue que par convention tacite) et n'est pas assez simple d’utilisation pour la plupart des usagers humains.

Bien que les inflexions soient généralement associées aux ARK, elles ne leur sont pas réservées. Contrairement aux idées reçues, les identifiants ne font rien ; ce sont leurs résolveurs qui gèrent ou non des fonctionnalités. Ainsi, par exemple, les inflexions et le « transfert de suffixe » sont pris en charge par n2t.net pour tous les types d’identifiants, mais pas par doi.org ni par handle.net (qui dispose d’une fonctionnalité similaire appelée « Template Handles ») pour aucun type d’identifiant.

RĂ©solveurs

Si la plupart des ARK ont leur propre résolveur, pourquoi existe-t-il également un résolveur global pour les ARK ?

 La plupart des ARK sont créés par des organisations qui les publient en utilisant leur propre résolveur. Par exemple, cet ARK a été publié en spécifiant le résolveur ark.bnf.fr :

http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29

Avoir à gérer et à maintenir son propre résolveur est la contrepartie d’une autonomie complète. L'utilisation de votre propre résolveur vous permet également de mettre en avant votre « marque » via le nom d'hôte, l'inconvénient étant que les marques sont transitoires et ont tendance à fragiliser les identifiants. Les pressions politiques voire légales (par exemple, sur les marques commerciales) peuvent rendre difficile le maintien de noms d'hôtes de « marque » plus anciens, et donc des identifiants sur lesquels ils ont été construits. C'est un autre argument en faveur du résolveur ARK global. Les utilisateurs rencontrant ultérieurement un identifiant brisé et constatant que son nom d'hôte n'existe plus peuvent, si c'est un ARK, extraire son identité immuable de base (l’élément commençant par « ark: ») et la présenter au résolveur global n2t.net,

https://n2t.net/ark:/12148/btv1b8449691v/f29

Pour éviter certains désagréments futurs, une organisation - même si elle utilise son propre résolveur - peut choisir d'emblée de publier ses ARK en utilisant n2t.net.

Pourquoi le résolveur ARK global (n2t.net) ne contient-il pas le mot « ARK » ?

Lorsque le besoin d'un résolveur ARK global est apparu, les principes de base d'ouverture et de généricité ont dissuadé les concepteurs de créer un autre silo sur le modèle de DOI / Handle / PURL. Au lieu de quoi, le résolveur ARK a été conçu pour être un résolveur générique, non lié à un format, appelé N2T (Name-to-Thing), qui résout maintenant plus de 600 types d'identifiants, y compris les ARK, les DOI, les Handle, les PURL, les URN, les ORCID, les ISSN, etc. La résolution consiste à rechercher dans une table une chaîne de caractères d'identifiant, quel que soit son type, et à la rediriger au bon endroit.

Les mêmes principes de base ont guidé la conception d'un outil antérieur appelé noid, conçu pour les ARK, mais également utilisé régulièrement par les organisations attribuant des Handle.

Qu'entendez-vous par « silos » ?

...