You are viewing an old version of this page. View the current version.

Compare with Current View Page History

Version 1

Foire aux questions-réponses sur les ARK

Ceci est la traduction française du document "ARK Identifiers FAQ".

Les bases

Comment puis-je donner mon avis sur ce document ?

En commentant cette version ouverte aux commentaires.

Que sont les ARK ?

Les ARK (Archival Resource Key) sont des identifiants de haute performance qui vous donnent accĂšs Ă  des choses et Ă  des descriptions de ces choses. Par exemple, cet ARK,

     https://n2t.net/ark:/67531/metadc107835/

vous donne accÚs à une thÚse, et, en ajoutant '??' à la fin de l'ARK, devrait vous amener à sa description :

     https://n2t.net/ark:/67531/metadc107835/??

Qu'est-ce qu'un identifiant ?

Sur Internet, un identifiant est une URL, ou une partie d'URL. Par exemple, cet identifiant ARK principal,

     ark:/12148/btv1b8449691v/f29

figure dans deux URL (Uniform Resource Locators, également appelés « liens Web » ou « adresses Web ») différentes :

        http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29
        https://n2t.net/ark:/12148/btv1b8449691v/f29

Les ARK sont plus particuliĂšrement destinĂ©s Ă  ĂȘtre des identifiants pĂ©rennes.

Qu'est-ce qu'un « identifiant pérenne » ?

On a estimĂ© que la durĂ©e de vie moyenne d'un URL Ă©tait de 44 jours. La fin de la vie d’un URL advient lorsque celui-ci se « rompt » ; il  vous retourne alors la redoutable erreur "404 Introuvable" que la plupart d’entre nous connaissent bien. Non seulement c’est agaçant, mais c’est en outre politiquement embarrassant lorsque l’on recherche des publications scientifiques financĂ©es sur fonds publics, et c’est un dĂ©sastre culturel pour les bibliothĂšques, les archives, les musĂ©es et autres institutions mĂ©morielles.

Parmi les multiples liens qui peuvent ou ont pu vous conduire à une chose, un identifiant pérenne est un lien qui, en principe, continue de fonctionner trÚs longtemps. Les services qui permettent la découverte et l'interconnexion de ressources (comme entre les articles universitaires, les auteurs, les données de la recherche et les sujets connexes) préfÚrent les identifiants pérennes en raison de cette stabilité.

Les identifiants pĂ©rennes devraient continuer Ă  fonctionner mĂȘme lorsque les choses sont dĂ©placĂ©es d'un site Web Ă  un autre. Normalement, lorsque les choses sont dĂ©placĂ©es, tous ceux qui ont dĂ©jĂ  enregistrĂ© les anciens liens devraient ĂȘtre informĂ©s des nouveaux, ce qui est presque impossible. C'est alors qu'interviennent les rĂ©solveurs d'identifiants.

Qu'est-ce qu'un résolveur ?

Un rĂ©solveur est un site Web spĂ©cialisĂ© dans la rĂ©orientation d'identifiants entrants (ceux initialement annoncĂ©s aux utilisateurs) vers les sites Web actuellement les mieux Ă  mĂȘme de les traiter. Ce transfert est gĂ©nĂ©ralement appelĂ© « rĂ©solution » et une des Ă©tapes de ce processus de rĂ©solution la « redirection ».

Pour qu'un rĂ©solveur fonctionne, son nom d'hĂŽte - hostname en anglais - (« n2t.net » ou « ark.bnf.fr » dans les identifiants ci-dessus) doit ĂȘtre soigneusement choisi afin qu'il ne soit plus nĂ©cessaire de le changer. Les noms d’hĂŽte des institutions mĂ©morielles, dont certaines sont vieilles de plusieurs siĂšcles, sont souvent de bons candidats pour devenir des rĂ©solveurs. On citera d’autres rĂ©solveurs, plus rĂ©cents et plus connus : n2t.net (le rĂ©solveur ARK), identifiers.org, doi.org, handle.net et purl.org.

À quoi peut-on attribuer un ARK ?

À toute chose numĂ©rique, physique ou abstraite. Cela inclut les choses qui n’existent pas encore mais auxquelles vous devez faire rĂ©fĂ©rence depuis des objets que vous crĂ©ez ou prĂ©voyez de crĂ©er, comme un lien depuis le brouillon d’un article vers un jeu de donnĂ©es en prĂ©paration, ou un lien depuis une lettre numĂ©rique archivĂ©e vers un instrument de recherche Ă  crĂ©er. Attention, vous ne devriez attribuer des ARK qu’à des choses que vous possĂ©dez, contrĂŽlez ou gĂ©rez. Attribuer des ARK Ă  des choses que vous ne contrĂŽlez pas est dĂ©conseillĂ© car de tels identifiants sont gĂ©nĂ©ralement fragiles.

Vous trouverez ci-dessous une liste de choses qui reçoivent des ARK. Les nombres sont une estimation produite en septembre 2019 par les organisations elles-mĂȘmes.

Catégories

Exemples

Qui utilise les ARK ?

Difficile Ă  dire car les ARK sont dĂ©centralisĂ©s, mais plus de 600 organisations enregistrĂ©es ont crĂ©Ă©, selon leurs estimations, environ 3,2 milliards d’ARK. Vous trouverez des ARK utilisĂ©s comme permaliens dans

  • le Data Citation Index (liĂ© au Web of Science)
  • les articles de WikipĂ©dia
  • les entrĂ©es de Wikidata
  • les collections d’Internet Archive)
  • les profils de chercheurs ORCID

Voici la rĂ©partition globale des organisations enregistrĂ©es comme attributrices d’ARK en avril 2020. Cliquez sur l’image ci-dessous pour accĂ©der Ă  une carte Ă  jour et zoomable.

Pour commencer

 De quoi ai-je besoin pour créer des ARK ?

Tout d'abord, vous avez besoin d'un NAAN (numéro d'autorité nommante, ou Name Assigning Authority Number en anglais), qui est un numéro exclusivement réservé à votre organisation. Il doit apparaßtre dans chaque ARK attribué par votre organisation, juste aprÚs l'étiquette "ark:/". Le NAAN de tous ces ARK

                               ark:/12148/btv1b8449691v/f29

     http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29

      https://n2t.net/ark:/12148/btv1b8449691v/f29

est 12148 ; il identifie de maniĂšre unique la BibliothĂšque nationale de France. Chaque NAAN est associĂ© Ă  l'URL d'un rĂ©solveur pour ses ARK. Par exemple, pour rĂ©soudre un ARK en 12148, apposez-le aprĂšs http://ark.bnf.fr/ comme indiquĂ© ci-dessus. Le rĂ©solveur N2T.net est Ă  part dans la mesure oĂč il transmet tout ARK au rĂ©solveur associĂ© Ă  son NAAN.

L'obtention ou l'utilisation d'un NAAN est gratuite et vous pouvez en demander un en remplissant un formulaire en ligne. Plus de 600 organisations (bibliothÚques, archives, musées, facultés, agences gouvernementales, éditeurs scientifiques et pédagogiques, projets, etc.) ont un NAAN répertorié dans le registre public NAAN.

Comment commencer à créer des chaßnes de caractÚres destinées à devenir des ARK ?

Vous ĂȘtes libre de crĂ©er des chaĂźnes de caractĂšre ARK Ă  votre guise, Ă  condition que vous n'utilisiez que des chiffres, des lettres (ASCII, donc sans aucun signe diacritique) et les caractĂšres suivants :

= ~ * + @ _ $ . /

Les deux derniers caractĂšres sont rĂ©servĂ©s pour le cas oĂč vous souhaiteriez divulguer des relations entre ARK.

Une autre des caractĂ©ristiques des ARK est que les traits d'union ('-') peuvent ĂȘtre utilisĂ©s mais qu’ils sont inertes en ce qui concerne l'identitĂ©, ce qui signifie que des chaĂźnes ne diffĂ©rant que par des traits d'union sont considĂ©rĂ©es comme identiques ; par exemple, ces chaĂźnes

ark:/12345/141e86dc-d396-4e59-bbc2-4c3bf5326152

ark:/12345/141e86dcd3964e59bbc24c3bf5326152

identifient la mĂȘme chose. La raison de cette fonctionnalitĂ© est que les processus de formatage de texte utilisĂ©s Ă  travers le monde introduisent rĂ©guliĂšrement des traits d'union supplĂ©mentaires dans les identifiants, rompant ainsi les liens avec tout serveur qui considĂšre les traits d'union comme signifiants.

Les ARK distinguent majuscules et minuscules, ce qui permet des identifiants plus courts (52 contre 26 lettres par caractĂšre). La « mĂ©thode ARK » consiste toutefois Ă  n'utiliser que des minuscules, sauf si vous avez besoin d'ARK plus courts. Cette restriction facilite la prise en charge de vos ARK par les rĂ©solveurs s’ils sont reçus avec des majuscules ou des majuscules et minuscules mĂ©langĂ©es, ce qui arrive malheureusement souvent Ă  cause de l’idĂ©e, vieille de 50 ans, selon laquelle les identifiants sont insensibles Ă  la casse. Vous pouvez Ă©galement envisager d'utiliser le rĂ©pertoire de caractĂšres de l'outil Noid, qui crĂ©e des chaĂźnes protĂ©gĂ©es contre une retranscription fautive Ă  l'aide de l'algorithme de contrĂŽle le plus puissant. Ce rĂ©pertoire comprend uniquement des chiffres et des consonnes moins 'l' (lettre « L », souvent confondue avec le chiffre 1) :

0123456789bcdfghjkmnpqrstvwxz

Pour l'attribution, une stratĂ©gie courante consiste Ă  tirer parti des identifiants hĂ©ritĂ©s. Par exemple, un numĂ©ro de spĂ©cimen de papillon de musĂ©e, cd456f9_87, pourrait ĂȘtre publiĂ© sous l’ARK ark:/12345/cd456f9_87. Certains identifiants hĂ©ritĂ©s devront peut-ĂȘtre ĂȘtre modifiĂ©s compte tenu des restrictions de caractĂšres ARK. La deuxiĂšme stratĂ©gie couramment utilisĂ©e consiste Ă  crĂ©er des chaĂźnes entiĂšrement nouvelles pour vos ARK. Dans ce cas, il est important de considĂ©rer si elles doivent ĂȘtre totalement ou partiellement opaques, ou signifiantes.

Que sont les identifiants opaques ?

Les chaĂźnes de caractĂšres d'identifiants pĂ©rennes sont gĂ©nĂ©ralement opaques et rĂ©vĂšlent dĂ©libĂ©rĂ©ment peu de choses sur ce Ă  quoi elles sont attribuĂ©es, car les identifiants non opaques ne vieillissent pas ou ne voyagent pas bien. Les noms d'organisations sont connus pour ĂȘtre transitoires, raison pour laquelle les NAAN sont des nombres opaques. Lorsque les dates et les titres sont corrigĂ©s, que les significations des mots Ă©voluent (par exemple, d'anciens sigles innocents peuvent devenir offensants ou attentatoires), les chaĂźnes de caractĂšres censĂ©es ĂȘtre pĂ©rennes peuvent gĂ©nĂ©rer de la confusion ou poser un problĂšme politique. La gĂ©nĂ©ration et l'attribution de chaĂźnes de caractĂšres complĂštement opaques comportent Ă©galement des risques ; ainsi, des nombres attribuĂ©s sĂ©quentiellement rĂ©vĂšlent des informations sur leur date et les chaĂźnes de caractĂšres contenant des lettres peuvent gĂ©nĂ©rer fortuitement des mots (c'est pourquoi le rĂ©pertoire de caractĂšres recommandĂ© ne comporte pas de voyelles).

Exemples de chaĂźnes de caractĂšres plus ou moins opaques

Non opaque

Netscape Permanent Archive

Gay_Divorcee_1934_April_1

Name-to-Thing Resolver

Partiellement opaque

X0001, x0002, ..., x9998

GD/1934/04/01

n2t.net

Plus opaque

141e86dc-d396-4e59-bbc2-4c3bf5326152

19340401

n2t

Totalement opaque

141e86dcd3964e59bbc24c3bf5326152

H8k74926g

12148


Il n'est pas obligatoire que les ARK soient opaques, mais il est recommandĂ© que le nom de base de l'objet le soit, car il constitue en gĂ©nĂ©ral le nom du sujet principal de l’effort de pĂ©rennisation. Si des qualificatifs suivent ce nom, il est moins important qu'ils soient opaques. Pour vous aider Ă  dĂ©terminer votre niveau d'opacitĂ©, vous pouvez Ă©valuer la compatibilitĂ© avec les identifiants hĂ©ritĂ©s et la facilitĂ© de gĂ©nĂ©ration et de retranscription de la chaĂźne de caractĂšres (en prenant en compte la compacitĂ©, le caractĂšre de contrĂŽle). De nouvelles chaĂźnes de caractĂšres peuvent ĂȘtre gĂ©nĂ©rĂ©es avec la date et l’heure, un UUID, Ă  l’aide d’un gĂ©nĂ©rateur de nombres ou du gĂ©nĂ©rateur Noid (Nice Opaque Identifiers).

Les chaĂźnes de caractĂšres opaques sont « muettes » et donc difficiles Ă  gĂ©rer, c'est pourquoi les ARK ont Ă©tĂ© conçus pour ĂȘtre des identifiants « parlants ». Cela signifie que s'il existe des mĂ©tadonnĂ©es sur la ressource, un ARK qui se prĂ©sente sur votre serveur suivi de l'inflexion « ? » devrait pouvoir parler de lui-mĂȘme.

Comment rendre le contenu du serveur accessible via les ARK ?

Tout d’abord, dĂ©terminez ce que sera l’expĂ©rience utilisateur lors de l’accĂšs par vos ARK : une feuille de calcul, un PDF, une image, une page d’accueil affichant des mĂ©tadonnĂ©es et plusieurs options ? Quel que soit votre choix, prĂ©voyez que votre serveur retourne des mĂ©tadonnĂ©es si l’ARK arrivait suivi d’une inflexion « ? ».

Pour le reste, rĂ©soudre des ARK revient Ă  rĂ©pondre Ă  des URL. Normalement, les URL entrants appellent (ou sont associĂ©s Ă ) du contenu renvoyĂ© par votre serveur Web. Si votre serveur est compatible ARK, les ARK entrants (exprimĂ©s sous forme d’URL) doivent ĂȘtre associĂ©s au mĂȘme contenu. L’approche habituelle consiste Ă  associer l’ARK Ă  l’URL Ă  l’aide d’une table de donnĂ©es que vous mettez Ă  jour chaque fois que l’URL change. Dans ce cas, votre serveur agit comme un rĂ©solveur local. Si vous ne souhaitez pas l’implĂ©menter vous-mĂȘme, il existe des outils et services logiciels ARK qui peuvent vous aider.

Une autre approche consiste Ă  laisser votre serveur Web fonctionner en l’état et, au lieu de mettre Ă  jour ses tables locales, de maintenir des tables de correspondance ARK/URL sur un rĂ©solveur distinct. Cette approche est adoptĂ©e par nombre d’éditeurs de logiciels et par les organisations maintenant leurs tables via le service EZID (qui est liĂ© au rĂ©solveur n2t.net et met Ă  jour les tables de rĂ©solution de ce dernier).

Comment citer ou faire connaßtre un ARK ?

On prĂ©fĂ©rera la forme URL (https ou http) de l’ARK. Par exemple : https://n2t.net/ark:/99166/w66d60p2. Un ARK destinĂ© Ă  un usage externe est gĂ©nĂ©ralement publiĂ© (annoncĂ©, diffusé ) de cette maniĂšre afin de constituer un identifiant actionnable. Si un affichage visuel plus compact est nĂ©cessaire, il doit ĂȘtre associĂ© Ă  un lien hypertexte. Par exemple :

<a href="https://n2t.net/ark:/99166/w66d60p2">ark:/99166/w66d60p2</a>

Une dĂ©cision importante consiste Ă  dĂ©terminer si vos URI ARK utiliseront le nom d’hĂŽte de votre rĂ©solveur local ou le rĂ©solveur N2T.net. Si vous privilĂ©giez le contrĂŽle ou la stratĂ©gie de marque, vous prĂ©fĂ©rerez publier des ARK utilisant votre rĂ©solveur local. Si vous doutez de la stabilitĂ© de votre nom d’hĂŽte local, vous prĂ©fĂ©rerez publier vos ARK en utilisant le nom d’hĂŽte n2t.net (voir ici des exemples des deux approches). Quelle que soit la maniĂšre dont vous les publiez, la rĂ©solution de vos ARK via N2T est toujours possible.

Existe-t-il des outils et des services de gestion d’ARK ?

 Voici une liste partielle d’outils logiciels de gestion d’identifiants. Elle comprend notamment

  • Noid (Nice Opaque Identifiers), logiciel open source permettant de crĂ©er et de rĂ©soudre vous-mĂȘme des ARK,
  • ArchiveSpace, une application open source pour gĂ©rer et fournir un accĂšs web Ă  des archives, des manuscrits et des objets numĂ©riques,
  • un plug-in ARK pour Omeka, qui crĂ©e et gĂšre des ARK pour la plate-forme de publication Web open source Omeka,
  • un module ARK pour Drupal, qui permet Ă  votre site Drupal d'agir en tant qu'autoritĂ© d’adressage (NMA).

On y mentionne également certains éditeurs de logiciels et fournisseurs de service, tels que EZID. Vous trouverez ici des informations supplémentaires sur les concepts et les bonnes pratiques.

Pour aller plus loin

Qu'est-ce que N2T ?

N2T.net est un rĂ©solveur ARK global. N2T, qui signifie « Name-to-Thing », est en fait un rĂ©solveur gĂ©nĂ©ricisĂ© permettant d’associer des noms Ă  des objets. Il sait ainsi rediriger plus de 600 autres types d'identifiants - ARK, DOI, PMID, Taxon, PDB, ISSN, etc. Si cela vous intĂ©resse, le schĂ©ma et la suite de cette rĂ©ponse donnent un peu plus de dĂ©tails. 

Les requĂȘtes entrantes sont gĂ©nĂ©ralement constituĂ©es de https://n2t.net/ suivies d’un identifiant (le nom). N2T cherche cet identifiant et renvoie un lien de redirection. Pour cela, il utilise deux mĂ©thodes de rĂ©solution. D’abord, N2T tente de rĂ©soudre l’identifiant selon une information associĂ©e Ă  un identifiant stockĂ© unitairement. À dĂ©faut, il applique des rĂšgles liĂ©es au type d’identifiant. Il existe Ă©galement une API N2T qui permet, sur authentification, des opĂ©rations de masse et la gĂ©nĂ©ration d’identifiants. 

N2T utilise deux types de donnĂ©es stockĂ©es. PremiĂšrement, il stocke des enregistrements individuels pour plus de 20 millions d'identifiants d'objet (par exemple, ARK, DOI) qu'il obtient de trois sources : EZID, Internet Archive et YAMZ.net. Lorsque de tels enregistrements incluent une URL de redirection (cible) et des métadonnées descriptives, N2T peut agir sur les inflexions, effectuer un transfert de suffixe et une « nĂ©gociation de contenu ». 

DeuxiĂšmement, N2T stocke plus de 3500 enregistrements de « rĂšgle » pour rediriger les identifiants qui n’ont pas Ă©tĂ© trouvĂ©s individuellement dans N2T, mais pour lesquels il dispose d'informations de redirection liĂ©es au type d'identifiant Ă  rĂ©soudre. Il obtient des enregistrements de rĂšgles de plusieurs sources, notamment le registre NAAN, une base de donnĂ©es de prĂ©fixes ARK et DOI et un partenariat officiel sur les identifiants compacts avec identifiers.org.

Si la plupart des ARK ont leur propre résolveur, pourquoi existe-t-il également un résolveur global pour les ARK ?

 La plupart des ARK sont créés par des organisations qui les publient en utilisant leur propre résolveur. Par exemple, cet ARK a été publié en spécifiant le résolveur ark.bnf.fr :

http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29

Avoir Ă  gĂ©rer et Ă  maintenir son propre rĂ©solveur est la contrepartie d’une autonomie complĂšte. L'utilisation de votre propre rĂ©solveur vous permet Ă©galement de mettre en avant votre « marque » via le nom d'hĂŽte, l'inconvĂ©nient Ă©tant que les marques sont transitoires et ont tendance Ă  fragiliser les identifiants. Les pressions politiques voire lĂ©gales (par exemple, sur les marques commerciales) peuvent rendre difficile le maintien de noms d'hĂŽtes de « marque » plus anciens, et donc des identifiants sur lesquels ils ont Ă©tĂ© construits. C'est un autre argument en faveur du rĂ©solveur ARK global. Les utilisateurs rencontrant ultĂ©rieurement un identifiant brisĂ© et constatant que son nom d'hĂŽte n'existe plus peuvent, si c'est un ARK, extraire son identitĂ© immuable de base (l’élĂ©ment commençant par « ark: ») et la prĂ©senter au rĂ©solveur global n2t.net,

https://n2t.net/ark:/12148/btv1b8449691v/f29.

Mon organisation a son propre résolveur ARK - dois-je me soucier de N2T.net ?

Oui, et ce pour deux raisons principales. Tout d'abord, si vos ARK « à l'état sauvage » apparaissent sans votre le nom d'hÎte de votre résolveur (c'est-à-dire, s'ils commencent par « ark: ... », ce qui n'est pas rare), la personne qui veut les utiliser n'est pas tenue de connaßtre le nom d'hÎte : il lui suffit d'ajouter « n2t.net » devant eux. Cela fonctionne car N2T connaßt le nom d'hÎte du résolveur.

DeuxiÚmement, si certaines organisations et leurs noms d'hÎtes résolveurs ont une longue durée de vie, la plupart ne durent pas. Une personne essayant d'utiliser un ARK contenant un nom d'hÎte de résolveur non fonctionnel peut remplacer la partie non fonctionnelle par « n2t.net ». Si les circonstances vous obligent à changer votre résolveur, cette étape de remplacement donne aux ARK que vous avez publiés avant le changement une meilleure chance de fonctionner.

Pour éviter de futurs désagréments, certaines organisations qui gÚrent leurs propres résolveurs peuvent choisir d'emblée de préférer au nom de leur résolveur le nom de domaine n2t.net pour la publication de leurs ARK.

Pourquoi le résolveur ARK global (n2t.net) ne contient-il pas le mot « ARK » ?

Lorsque le besoin d'un rĂ©solveur ARK global est apparu, les principes de base d'ouverture et de gĂ©nĂ©ricitĂ© ont dissuadĂ© les concepteurs de crĂ©er un autre silo sur le modĂšle de DOI / Handle / PURL. Au lieu de quoi, le rĂ©solveur ARK a Ă©tĂ© conçu pour ĂȘtre un rĂ©solveur gĂ©nĂ©rique, non liĂ© Ă  un format, appelĂ© N2T (Name-to-Thing), qui rĂ©sout maintenant plus de 600 types d'identifiants, y compris les ARK, les DOI, les Handle, les PURL, les URN, les ORCID, les ISSN, etc. La rĂ©solution consiste Ă  rechercher dans une table une chaĂźne de caractĂšres d'identifiant, quel que soit son type, et Ă  la rediriger au bon endroit.

Les mĂȘmes principes de base ont guidĂ© la conception d'un outil antĂ©rieur appelĂ© noid, conçu pour les ARK, mais Ă©galement utilisĂ© rĂ©guliĂšrement par les organisations attribuant des Handle.

Que désigne-t-on par « transfert de suffixe » ?

En bref, le transfert de suffixe est une fonctionnalité de N2T. Supposons que vous n'ayez qu'un seul ARK enregistré, https://n2t.net/ark:/12345/6789, et qu'il redirige vers la page du serveur Web,

https://a.example.org/dataset542

Et supposons que ce mĂȘme serveur serve Ă©galement ces pages :

https://a.example.org/dataset542/volume3
https://a.example.org/dataset542/volume3/part2
https://a.example.org/dataset542/volume3/part2.pdf

Ce que fait le transfert de suffixe est de laisser votre ARK enregistré agir comme si vous aviez également enregistré ces trois ARK ci-dessous, qui seraient résolus par les pages ci-dessus, respectivement:

https://n2t.net/ark:/12345/6789/volume3
https://n2t.net/ark:/12345/6789/volume3/part2
https://n2t.net/ark:/12345/6789/volume3/part2.pdf

Dans ce cas, le transfert de suffixe vous évite d'avoir à conserver des enregistrements pour trois pages supplémentaires. En fait, cela fonctionne pour un nombre illimité de pages.

Quelles sont les parties d'un ARK ?

Anatomie de l’ARK           IdentitĂ© immuable de base
                                         ____________________________________
                                        /                                                        \
Service de rĂ©solution       Nom de base de l’objet  Qualificatifs
      ______________________   ______________________   _____________
     /                                 \/                                  \/                   \
     https://example.org/ark:12345/654xz321/s3/f8.05v.tiff
                 \_____________/ \___/\_____/ \_________/\______/\______/
                       |                  |          |             |              |          |
                       |               Libellé   |             |               |     Variantes
                       |                       
    |             |      Composantes
                       |                            |             | 
Nom de l’autoritĂ© d’adressage   |    Nom ARK attribuĂ©
                       (NMA)                  |
                       NumĂ©ro d’autoritĂ© nommante (NAAN)

Puis-je attribuer des ARK Ă  des composantes d’une ressource qui a dĂ©jĂ  un ARK ?

Oui, les ARK peuvent ĂȘtre attribuĂ©s Ă  n'importe quel niveau de granularitĂ©, tel qu'un manuscrit, des chapitres Ă  l'intĂ©rieur, des sections de chapitre, des sous-sections, etc. Un ARK peut Ă©galement ĂȘtre attribuĂ© Ă  une chose qui contient d'autres choses. Dans les ARK, le caractĂšre '/' est rĂ©servĂ© pour aider l’utilisateur Ă  dĂ©couvrir la relation de composition. Par exemple, le premier objet ci-dessous contient le second :

ark:/12148/btv1b8449691v

ark:/12148/btv1b8449691v/f29

C'est le qualificatif de granularité. Il n'y a qu'un seul autre qualificatif ARK, qui indique les variantes de forme d'une chose en utilisant le caractÚre réservé '.' devant un suffixe. Par exemple, ces ARK identifient des documents,

ark:/12148/btv1b8449691v/f29.pdf

ark:/12148/btv1b8449691v/f29.html

Comme ils ne diffĂšrent que par le suffixe .pdf ou .html, on peut en dĂ©duire qu'ils identifient deux formes diffĂ©rentes du mĂȘme document.

Quel est le but du NAAN et puis-je y apporter des modifications ?

 Les NAAN subdivisent l'ensemble des ARK potentiels (l'espace de noms ARK). Le sous-ensemble d'ARK d'un NAAN donnĂ© peut ĂȘtre subdivisĂ© par des prĂ©fixes (par exemple : 12345/x2, 98765/b4), ce qui facilite la dĂ©lĂ©gation de l'attribution autonome d'ARK, aux dĂ©partements d'une grande organisation par exemple. La rĂ©solution ARK est partiellement basĂ©e sur les NAAN, mais Ă©tant donnĂ© qu’il arrive que les organisations soient scindĂ©es, ARK rĂ©pond au problĂšme de la scission d'espaces de noms en permettant Ă  plusieurs organisations de prendre en charge la gestion d'un espace de noms. Si vous passez d’un prestataire Ă  un autre, rien ne vous empĂȘche d’emporter votre NAAN avec vous. Vous pouvez modifier un NAAN en remplissant le mĂȘme formulaire en ligne utilisĂ© pour demander un nouveau NAAN, par exemple pour

  • mettre Ă  jour l'URL de la personne Ă  contacter ou du rĂ©solveur de votre organisation,
  • modifier la stratĂ©gie d'attribution de nom de votre organisation (voir ici un exemple d’une telle stratĂ©gie),
  • demander un NAAN supplĂ©mentaire pour un nouvel ensemble important d’ARK ou un nouvel organe Ă  l’intĂ©rieur de votre organisation,
  • ou enfin signaler le transfert de votre NAAN vers une autre organisation qui poursuivra votre travail et prendra en charge votre NAAN.

Y a-t-il des restrictions d’usage des NAAN ?

Oui. Il est important de ne jamais inventer ou utiliser un NAAN qui ne serait pas présent dans le registre public. Il y a néanmoins deux NAAN spécifiques que chacun peut utiliser :

  • « 99999 » pour des besoins de test, de dĂ©veloppement ou d’expĂ©rimentation,
  • « 12345 » pour des exemples d’ARK non fonctionnels Ă  utiliser dans la documentation.

Pour les experts, reconnaĂźtre les ARK avec de tels NAAN et les Ă©liminer des rapports de liens brisĂ©s est aisĂ©. MalgrĂ© les efforts des fournisseurs, de tels ARK s’échappent frĂ©quemment « dans la nature », ce qui peut induire en erreur utilisateurs et vĂ©rificateurs de liens.

ARK et les autres identifiants

Pourquoi utiliser des ARK plutÎt que des DOI, par exemple ?

  • Pour rĂ©duire les coĂ»ts (voir cette section pour plus de prĂ©cision) ;
  • Pour ne gĂ©rer que les mĂ©tadonnĂ©es que vous voulez ;
  • Pour pouvoir crĂ©er des identifiants sans mĂ©tadonnĂ©es ;
  • Pour pouvoir crĂ©er un identifiant avant mĂȘme que votre objet n’existe ;
  • Pour avoir un identifiant dĂšs que vous crĂ©ez le premier brouillon de votre objet ;
  • Pour garder cet identifiant privĂ© pendant que les donnĂ©es et les mĂ©tadonnĂ©es Ă©voluent, jusqu’à ce que vous dĂ©cidiez (Ă©ventuellement des annĂ©es aprĂšs) de le publier ou de le supprimer ;
  • Pour conserver cet identifiant jusqu’à la publication et peut-ĂȘtre alors attribuer Ă  la place un autre identifiant tel qu'un DOI ;
  • Parce que les ARK, conçus pour une utilisation gĂ©nĂ©rique et non spĂ©cifiquement pour le monde de l’édition, sont naturellement adaptĂ©s Ă  l’identification d’objets physiques comme des Ă©chantillons ou des stations de recherche ;
  • Parce que les rĂ©solveurs ARK peuvent rĂ©soudre des identifiants habituellement endommagĂ©s par des processus de formatage de texte introduisant des traits d'union ;
  • Parce que la plupart des ARK portent un caractĂšre de contrĂŽle Noid qui peut ĂȘtre utilisĂ© pour dĂ©tecter toutes les erreurs de transcription courantes (et non certaines d’entre elles uniquement) ;
  • Pour pouvoir crĂ©er des identifiants plus courts, car la casse mixte permet des chaĂźnes plus compactes (un plus grand nombre de chaĂźnes d'une longueur donnĂ©e) ;
  • Pour pouvoir changer de prestataire et/ou d'infrastructure sans avoir Ă  coordonner des transferts de bases de donnĂ©es avec une autoritĂ© centrale ;
  • Pour pouvoir rĂ©soudre le problĂšme de la scission d'espace de noms sans perdre le contrĂŽle de vos identifiants ;
  • Pour lier des identifiants Ă  diffĂ©rentes dĂ©clarations de permanence nuancĂ©es ;
  • Pour pouvoir ajouter des requĂȘtes (par exemple « ?lang=en ») lors de la rĂ©solution de vos identifiants ;
  • Pour utiliser une infrastructure ouverte correspondant aux valeurs de votre organisation ;
  • Pour permettre d’accĂ©der directement aux objets auxquels vous accordez de l’importance et non Ă  leur page d’accueil ;
  • Pour crĂ©er un seul identifiant qui peut ĂȘtre dĂ©clinĂ© en des millions (grĂące au mĂ©canisme de transfert de prĂ©fixe) ;
  • Pour accĂ©der Ă  des mĂ©tadonnĂ©es adaptĂ©es et complĂštes via des inflexions
  • Pour s’intĂ©grer aisĂ©ment dans des API IIIF en utilisant les qualificatifs ARK.

Qu'ont en commun ARK, DOI, Handle, PURL et URN ?

Ce sont les principaux types (ou schĂ©mas) d'identifiants pĂ©rennes. Tous existent au moins depuis 2001.Tous sont utilisĂ©s dans des contextes tels que les profils Data Citation Index℠, Wikipedia et ORCID.org. Tous donnent accĂšs Ă  presque tout type de contenu, qu'il soit numĂ©rique, physique, abstrait, une personne, un groupe, etc. Ils ont Ă©galement une structure trĂšs similaire composĂ©e de quatre parties, comme le montrent les exemples ci-dessous : 

 https://n2t.net/ark:/99999/12345 
   https://doi.org/10.99999/12345 
https://handle.net/10.99999/12345 
     https://purl.org/99999/12345 
https://<various>/urn:99999:12345 
  1. le protocole (https://) plus un nom d'hĂŽte,
  2. uniquement pour ARK et URN, un libellé (« ark: » ou « urn: »),
  3. l'autorité nommante (99999, 10.99999 ou 99999), qui est l'organisation ou le groupe qui a créé un identifiant particulier,
  4. et enfin, le nom, ou l'identifiant local, qu'elle a attribué (12345).

 Aucun d’eux n’a d'effet rĂ©el sur la persistance (voir 10 mythes persistants sur les identifiants pĂ©rennes).

Attendez, vous voulez dire que ARK, DOI, Handle, PURL et URN sont inutiles ?

Non, ce serait une affirmation excessive. Mais remettons ces formats d’identifiant (types) en perspective :

  • Aucun ne protĂšge contre les principales causes de rupture des liens : baisse de financement, catastrophe naturelle, bouleversement social, guerre, Ă©limination dĂ©libĂ©rĂ©e, erreur humaine ou nĂ©gligence du prestataire ;
  • Ils exigent tous de vous, le fournisseur final, de mettre Ă  jour les tables de redirection Ă  mesure que les URL changent ;
  • Ils identifient tous un contenu susceptible d'avoir Ă©tĂ© modifiĂ© ou supprimĂ© Ă  l’occasion de visites ultĂ©rieures ;
  • Tous comportent des identifiants brisĂ©s, et en grande quantitĂ© (plusieurs milliers) ;
  • Ils reposent tous sur le simple systĂšme de la redirection gĂ©rĂ© par les serveurs Web depuis 1994 et proposĂ© gratuitement par des centaines de services de raccourcissement d'URL.

Étant donnĂ© le peu de choses que ces formats font pour vous, lorsque vous en choisissez un, vous prendrez probablement en compte des facteurs tels que le coĂ»t, le risque et l'ouverture. 

En quoi les ARK diffÚrent-ils des identifiants tels que les DOI, les Handle, les PURL et les URN ?

La réponse courte

Les ARK sont les seuls identifiants standards, non cloisonnés et non payants que vous pouvez enregistrer et utiliser en environ 48 heures. Les DOI, les Handle et les PURL nécessitent une résolution et d'autres services exigés par leurs systÚmes centralisés respectifs (« silos »).

Cela ne veut pas dire que la permanence est gratuite. Rendre un identifiant pĂ©renne, en tant que fournisseur, vous impose des coĂ»ts de gestion, d’hĂ©bergement, de surveillance et de redirection. Vous pouvez faire ces choses vous-mĂȘme ou avec l'aide d'un prestataire. Mais avec les ARK, comme avec les URL, vos identifiants ne vous seront pas facturĂ©s individuellement et vous ne serez pas enfermĂ©s dans un silo n’acceptant qu’un type de rĂ©solution spĂ©cifique et qui refuse donc les autres identifiants.

Les ARK ont la particularitĂ© d'ĂȘtre dĂ©centralisĂ©s. Bien que l’on puisse obtenir des services de rĂ©solution d'un rĂ©solveur ARK global appelĂ© n2t.net, plus de 90% des ARK dans le monde ne l’utilisent pas comme rĂ©solveur. Plus de 600 organisations enregistrĂ©es Ă  travers le monde ont crĂ©Ă© par elles-mĂȘmes environ 3,2 milliards d’ARK et, Ă  l'instar des URL, personne n'a jamais payĂ© de frais pour les crĂ©er. Bien sĂ»r, les maintenir n'est pas gratuit. Conserver l’accĂšs au contenu de maniĂšre pĂ©renne sur le long terme, quel que soit le type d’identifiant, n’est jamais gratuit.

D’autres diffĂ©rences entre ARK, DOI, Handle, PURL et URN

  • ·Les pages d'accueil : les DOI de Crossref et DataCite aboutissent Ă  des pages d'atterrissage conçues pour les Ă©diteurs, mais pas directement aux objets qui vous tiennent Ă  cƓur. Les ARK peuvent en revanche aboutir directement aux objets qui vous tiennent Ă  cƓur, ce qui est pratique Ă  la fois pour les machines et pour les utilisateurs, car cela ne demande pas Ă  l’humain une Ă©tape supplĂ©mentaire de navigation pour des tĂąches courantes telles que
    • ouvrir le fichier PDF d'un article en lecture,
    • rĂ©fĂ©rencer un fichier image destinĂ© Ă  ĂȘtre incorporĂ© automatiquement en ligne dans un document,
    • ou citer un tableur Ă  utiliser pour l’analyse directe des donnĂ©es par logiciel.
  • Les DOI, les Handle, etc., ne prennent pas en charge le mĂ©canisme d’inflexion d’ARK permettant l'accĂšs aux mĂ©tadonnĂ©es, qu'un identifiant pointe sur un objet ou sur sa page d’accueil.
  • Contrairement aux DOI et aux Handle, les ARK n’ont pas de mĂ©tadonnĂ©es obligatoires. Les ARK qui n'ont pas encore Ă©tĂ© publiĂ©s sont faciles Ă  supprimer.
  • Toute chose finira par disparaĂźtre, y compris les noms d’hĂŽte, le Web et le protocole https. Lorsque cette premiĂšre partie de l'identifiant cessera d'avoir une signification, seuls les ARK et les URN incluront un libellĂ© (par exemple, « ark: ») indiquant le type d'identifiant restant.
  • Pour les DOI, les Handle et les PURL, vous devez utiliser leurs rĂ©solveurs respectifs. Les ARK et les URN vous permettent d'utiliser votre propre rĂ©solveur.
  • Pour crĂ©er des DOI et des Handle, vous devez payer une cotisation et, pour les DOI, des frais par DOI dĂ©finis par les agences d’attribution. Il n'y a pas de frais pour les ARK, les PURL et les URN.
  • Pour crĂ©er des Handle, vous devez installer et gĂ©rer un serveur Handle local, ce qui vous oblige Ă  surveiller, mettre Ă  jour et dĂ©panner un autre systĂšme.
  • Bien que vous puissiez utiliser un rĂ©solveur local ou proposĂ© par un prestataire pour vos ARK et vos URN, vous pouvez aussi les rĂ©soudre via le rĂ©solveur global n2t.net.
  • L'infrastructure de rĂ©solution URN envisagĂ©e n'a jamais Ă©tĂ© construite. Par consĂ©quent, les URN sont actuellement rĂ©solus comme des URL et il n'y a pas de rĂ©solveur global et officiel d’URN en tant qu'URL. Pour vous inscrire afin de crĂ©er des URN, vous devez demander un espace de nom URN.
  • Les ARK possĂšdent des fonctionnalitĂ©s uniques qui permettent d’attribuer un identifiant à des stades précoces de développement de l’objet : les ARK peuvent ĂȘtre supprimĂ©s, naĂźtre sans mĂ©tadonnĂ©es et exister avec toutes les mĂ©tadonnĂ©es que vous souhaitez stocker.

Mais si les ARK peuvent ĂȘtre supprimĂ©s, comment peut-on leur faire confiance ?

En rĂ©alitĂ©, cela rend les ARK plus fiables. La possibilitĂ© de supprimer est un Ă©lĂ©ment essentiel d’une saine gestion de collections. Les types d'identifiants autres qu’ARK interdisent la suppression, en partant du principe que les personnes, lorsqu’elles sont invitĂ©es Ă  intervenir, ne commettront pas d'erreur. Les personnes aux commandes d'un outil de gestion d'identifiants font rĂ©guliĂšrement d’une simple inadvertance humaine une erreur Ă  grande Ă©chelle, mĂȘme au dĂ©but de leur engagement. En rendant la correction difficile, nous condamnons les systĂšmes Ă  traĂźner ces bourdes pour l’éternitĂ©.

Bien qu’ils ne soient pas Ă  l’abri de telles erreurs, les ARK ont le grand avantage de pouvoir ĂȘtre crĂ©Ă©s et supprimĂ©s dans l’ombre, en dehors de toute publication, ou d’engagement de conservation.

Un objet peut-il avoir à la fois un ARK et un DOI ?

Oui. Parfois, avoir deux identifiants est utile, bien que cela puisse devenir dĂ©routant quand cela se produit souvent. Beaucoup de gens commencent par attribuer des ARK Ă  chaque Ă©lĂ©ment crĂ©Ă© afin de disposer d'une rĂ©fĂ©rence stable dĂšs le dĂ©but, avant de savoir s'ils souhaitent le publier ni mĂȘme le conserver.

L'objet et ses mĂ©tadonnĂ©es Ă©voluent conjointement, et pour le sous-ensemble d'Ă©lĂ©ments que vous souhaitez publier dans des contextes nĂ©cessitant des DOI, vous pouvez en attribuer au moment de la publication. Si votre ARK est stable et contient des mĂ©tadonnĂ©es de base, vous faites dĂ©jĂ  tout le nĂ©cessaire pour obtenir un bon DOI. C’est en cela que les ARK sont adaptĂ©s aux objets à un stade précoce de développement.

Pour gĂ©rer efficacement deux identifiants, il est recommandĂ© de crĂ©er le DOI de maniĂšre Ă  ce qu'il redirige vers l'ARK d'origine. Cela Ă©limine non seulement la nĂ©cessitĂ© de mettre Ă  jour la redirection DOI, mais maintient Ă©galement l’ARK pĂ©renne pour tous ceux qui l'ont prĂ©cĂ©demment enregistrĂ© ou marquĂ© d'un signet.

Quand dois-je utiliser ARK plutÎt que DOI, Handle, PURL ou URN ?

Il n'y a pas de réponse simple. La question des identifiants (non les choses, mais leurs noms) est complexe, alors si vous entendez des réponses simples ailleurs, méfiez-vous des erreurs courantes.

Aucune caractĂ©ristique d’ARK, DOI, Handle, PURL ou URN ne les rend plus ou moins adaptĂ©s Ă  une discipline, un domaine ou un secteur particuliers. Avec un rĂ©solveur d'identifiants et un systĂšme de gestion, ils fournissent tous le service essentiel : la rĂ©solution (tout comme des URL correctement gĂ©rĂ©es).

Certaines considĂ©rations spĂ©cifiques Ă  un type d'identifiant s'expliquent parfois par le fait que la rĂ©solution et la gestion de ce type sont verrouillĂ©es par un prestataire ou un fournisseur de service donnĂ©s. Par exemple, de nombreuses fonctionnalitĂ©s et restrictions de PURL ou Handle sont dĂ©terminĂ©es par leurs silos d’administration respectifs, de mĂȘme que celles des DOI, basĂ©s sur les Handle. En revanche les DOI ont des pratiques de mĂ©tadonnĂ©es variĂ©es et Ă©volutives d'une agence d'enregistrement Ă  l'autre.

Les diffĂ©rences concrĂštes que nous remarquons, sur les mĂ©tadonnĂ©es, les pages d’accueil et l’intĂ©gration d’outils (par exemple, les outils de publication), ne sont pas des propriĂ©tĂ©s des formats d’identifiants en soi, mais des propriĂ©tĂ©s de rĂ©solution, de gestion et de services de citation que divers fournisseurs Ă©tendent ou limitent. Ces services sont dĂ©finis Ă  leur tour par les communautĂ©s d’utilisateurs et de clients. Les services de base reposent sur une base de donnĂ©es fiable contenant chaque identifiant, ainsi que des Ă©lĂ©ments de mĂ©tadonnĂ©es (crĂ©ateur, titre, date, URL de redirection, etc.) dĂ©crivant l'objet identifiĂ©. Les services supplĂ©mentaires incluent la vĂ©rification des liens, la dĂ©tection des doublons, la gĂ©nĂ©ration de rapports et la recherche.

Du berceau au tombeau

Quand dois-je créer des ARK dans mon processus de travail ?

À la naissance de l'objet, ou mĂȘme avant. Nous nommons gĂ©nĂ©ralement nos enfants avant leur naissance, et nous appelons et nous rĂ©fĂ©rons Ă  des objets au stade de la conception, parfois longtemps avant qu'ils ne portent leurs fruits. Selon le niveau de prĂ©cision de vos prĂ©visions, vos objets Ă  naĂźtre peuvent avoir des ARK fonctionnels qui fournissent un substitut appropriĂ© et renvoient des mĂ©tadonnĂ©es riches, y compris des dĂ©clarations de permanence.

La seule mise en garde consiste Ă  ĂȘtre prudent lors de la publication d’ARK dont les perspectives Ă  long terme sont incertaines. Certains systĂšmes de gestion d'identifiant possĂšdent des fonctionnalitĂ©s permettant de gĂ©rer et de rĂ©soudre les identifiants non validĂ©s (par exemple, EZID dispose d’un statut « rĂ©servé »). Plus il y a de personnes qui connaissent un ARK, plus il est difficile de le supprimer.

Comment se fait-il que les ARK puissent ĂȘtre faciles Ă  supprimer ?

Si personne d’autre que vous ne connaĂźt un identifiant, rien ne vous empĂȘche de le supprimer ou de le retirer. Pour schĂ©matiser, un identifiant est en rĂ©alitĂ© l’affirmation qu'une chaĂźne de caractĂšres donnĂ©e est associĂ©e Ă  une chose spĂ©cifique. Moins vous en parlez, plus il est facile de supprimer cette affirmation. Si vous crĂ©ez un URL et ne le partagez qu'avec vos collĂšgues les plus proches, il sera beaucoup plus facile de le retirer que s’il apparaissait pendant un mois sur un site Web public, Ă  partir duquel il aurait Ă©tĂ© collectĂ© par les moteurs de recherche Internet. En revanche, il est difficile de supprimer les DOI et les Handle, car une fois enregistrĂ©s et rĂ©solus, ils sont effectivement diffusĂ©s dans le monde entier.

Les ARK se comportent comme des URL à cet égard. Les fournisseurs sont libres de créer et de partager des ARK de maniÚre restreinte, auquel cas ils sont faciles à supprimer.

Cela peut surprendre, mais mĂȘme s’ils sont plus largement diffusĂ©s, les ARK peuvent ĂȘtre accompagnĂ©es de dĂ©clarations de permanence qui indiquent quel niveau d’engagement – Ă©levĂ© ou bas – on garantit. Les ARK ont Ă©tĂ© conçus pour disposer d’une palette de dĂ©clarations de permanence, mais celles-ci ne sont en aucun cas exhaustives pour des identifiants et des objets qui prĂ©sentent une grande variĂ©tĂ© de « saveurs » d’engagement. C'est pourquoi on parle des ARK comme d’identifiants de haute performance adaptĂ©s Ă  la permanence plutĂŽt que comme des « identifiants pĂ©rennes ».

Enfin, les gens commettent des erreurs. Des ARK, des DOI, des Handle, des PURL et des URN sont parfois diffusĂ©s par erreur et doivent ĂȘtre retirĂ©s. Lorsque cela se produit, la meilleure option du fournisseur consiste Ă  rĂ©soudre l'identifiant retirĂ© en donnant accĂšs Ă  une page « fantĂŽme » qui explique et Ă©ventuellement prĂ©sente des excuses pour le dĂ©sagrĂ©ment occasionnĂ©. Contrairement aux idĂ©es reçues, les identifiants pĂ©rennes n’offrent aucune garantie.

Pourquoi dit-on que les ARK sont adaptés à des objets dans un stade précoce de développement ?

On a besoin d'identifiants avant de savoir exactement Ă  quel objet ils se rĂ©fĂšrent, ou s'ils font rĂ©fĂ©rence Ă  quelque chose qui mĂ©rite d'ĂȘtre gardĂ©. Un identifiant exigeant des mĂ©tadonnĂ©es abouties ne peut pas ĂȘtre crĂ©Ă© au dĂ©but du dĂ©veloppement car l'objet est mal connu. C’est pourquoi les crĂ©ateurs d'objets attribuent presque toujours initialement des identifiants sans exigences de mĂ©tadonnĂ©es, tels que des URL ou des ARK.

En commençant par attribuer un ARK, vous bĂ©nĂ©ficiez de la possibilitĂ© de conserver l'identifiant d'origine de la naissance Ă  la diffusion publique alors que l'objet et ses mĂ©tadonnĂ©es Ă©voluent. De nombreux objets passent par des phases de dĂ©veloppement et de correction intensives, durant parfois plusieurs annĂ©es, au cours desquelles ils sont trop immatures pour rĂ©pondre Ă  la plupart des exigences en matiĂšre de mĂ©tadonnĂ©es. NĂ©anmoins, chaque objet a besoin d’une sorte d’identifiant, de la conception Ă  la maturitĂ©, cette derniĂšre consistant en une publication et en une amĂ©lioration, ou en un abandon. Il est facile d’abandonner des ARK qui n’ont pas Ă©tĂ© dĂ©voilĂ©s au public.

Comme l'objet lui-mĂȘme, les Ă©lĂ©ments de mĂ©tadonnĂ©es ont besoin de flexibilitĂ© pour se dĂ©velopper et Ă©voluer avec le temps :

  • Au moment de la prĂ©vision ; il suffit alors d'un identifiant,
  • Ă  la naissance, lorsque sa premiĂšre reprĂ©sentation numĂ©rique nĂ©cessite une URL de redirection,
  • aprĂšs la premiĂšre analyse, lorsque son sens et un titre provisoire apparaissent,
  • lors de la crĂ©ation de dizaines d'Ă©lĂ©ments de mĂ©tadonnĂ©es spĂ©cifiques Ă  une discipline qui contreviennent Ă  la plupart des normes de mĂ©tadonnĂ©es, Ă  l'exception de la vĂŽtre,
  • pendant le post-traitement par un collĂšgue dont vous allez ajouter le nom en tant que contributeur supplĂ©mentaire,
  • lorsque les premiĂšres rĂ©actions basĂ©es sur l'identifiant tweetĂ© s’avĂšrent ĂȘtre des observations fondamentales de la part d’un nouveau contributeur,
  • et ainsi de suite jusqu'Ă  l'archivage, l'abandon, la diffusion publique, la correction, la rĂ©vision, l'amĂ©lioration, etc.

Contrairement aux DOI Crossref et DataCite, qui nĂ©cessitent des mĂ©tadonnĂ©es spĂ©cifiques (voir, par exemple, le schĂ©ma DataCite), les ARK n’exercent aucune contrainte sur ces activitĂ©s. Mieux encore, le rĂ©solveur N2T.net permet effectivement de les prendre toutes en compte.

Si les ARK ne les exigent pas, pourquoi se donner la peine de créer des métadonnées ?

La création de métadonnées (informations supplémentaires associées à ou décrivant un objet) présente plusieurs avantages essentiels. PremiÚrement, quelle que soit la cible de l'ARK - une page d'accueil ou un fichier - les métadonnées fournissent aux utilisateurs des informations essentielles sur l'objet, telles que des références à des versions plus récentes, une date de création, une provenance, etc. Dans le cas des ARK, les métadonnées sont généralement accessibles via des inflexions.

Les mĂ©tadonnĂ©es facilitent vraiment l'utilisation d'identifiants opaques, qui ne rĂ©vĂšlent aucun indice sur ce qu'ils identifient. En l'absence de mĂ©tadonnĂ©es, vous ĂȘtes obligĂ© d'accĂ©der Ă  l'objet lui-mĂȘme pour vous rappeler de quoi il s'agit et Ă©galement pour vous assurer que vous accĂ©dez au bon objet. De plus, la divergence entre les mĂ©tadonnĂ©es renvoyĂ©es et l'objet consultĂ© aide tout le monde Ă  dĂ©tecter des modifications ou des erreurs d'identification.

Les mĂ©tadonnĂ©es sont adaptĂ©es aux objets aboutis et sont beaucoup moins importantes pour les objets et les identifiants immatures que pour ceux qui ont Ă©tĂ© publiĂ©s. Avoir des mĂ©tadonnĂ©es dĂ©montre la crĂ©dibilitĂ© du fournisseur et son engagement vis-Ă -vis d’identifiants de haute performance. Tous les fournisseurs ne sont pas Ă  la hauteur de cette tĂąche.

Cela n'est pas nĂ©cessairement cher. Les mĂ©tadonnĂ©es crĂ©Ă©es Ă  partir de zĂ©ro peuvent ĂȘtre coĂ»teuses, mais elles sont gĂ©nĂ©ralement produites et gĂ©rĂ©es par des fournisseurs d'objets, auquel cas elles peuvent ĂȘtre exploitĂ©es efficacement pour les identifiants. IdĂ©alement, pour une permanence maximale, les mĂ©tadonnĂ©es principales (gĂ©rĂ©es par les fournisseurs d'objet) devraient ĂȘtre rĂ©pliquĂ©es dans des systĂšmes indĂ©pendants afin qu'il soit difficile pour une personne d'altĂ©rer de maniĂšre indĂ©tectable les associations d'identifiants. Par exemple, les entrepĂŽts d'objets numĂ©riques qui obtiennent des ARK et des DOI du service EZID stockent une copie de leurs mĂ©tadonnĂ©es dans EZID, qui en stocke une autre copie dans le rĂ©solveur N2T.net.

Quelles métadonnées sont recommandées pour les ARK ?

La question des mĂ©tadonnĂ©es est complexe pour tous les identifiants, pas seulement pour ARK. Il existe des milliers de normes selon les domaines et les types d’objets, la plupart d’entre elles se recoupant tout en se contredisant, et chacune d’elles est appliquĂ©e conformĂ©ment aux pratiques locales de l’organisation avec diffĂ©rents niveaux de conformitĂ©. Le choix ou la crĂ©ation d'une spĂ©cification pour vos mĂ©tadonnĂ©es dĂ©pend de facteurs tels que

  • si vous gĂ©rez actuellement des mĂ©tadonnĂ©es (astuce : gardez-les, sauf si vous avez une bonne raison de changer),
  • si vous souhaitez publier officiellement des objets (astuce : prĂ©parez-vous Ă  fournir l'auteur, le titre, la date, l'Ă©diteur / l’institution de conservation et le type d'objet),
  • les exigences et les capacitĂ©s de votre rĂ©solveur (astuce : votre personnel informatique ou votre prestataire pourrait avoir ses propres exigences),
  • ou si vous souhaitez stocker des Ă©lĂ©ments de mĂ©tadonnĂ©es non standard (astuce : N2T le permet, contrairement Ă  la plupart des standards et des fournisseurs).

Une interopérabilité fiable entre domaines peut s'avérer difficile, mais Dublin Core, DataCite, Schema.org et Dublin Kernel sont des spécifications de métadonnées standard à envisager pour une utilisation conjointe avec ARK.

Pourquoi est-ce que je vois des mĂ©tadonnĂ©es ARK avec les termes « qui », « quoi », « quand », « oĂč » ?

 Les ARK ont Ă©tĂ© conçus pour identifier n'importe quoi, pas seulement des choses qui sont, par exemple, publiables ou achetables. Il n’est pas naturel de modĂ©liser un fossile, un Ă©chantillon de tissu, un terme de vocabulaire ou Marie Curie comme si chacun avait un auteur, un titre, un Ă©diteur, un copyright et un prix. Au lieu de quoi, depuis 2001, un ARK est gĂ©nĂ©ralement accompagnĂ© d’un noyau de mĂ©tadonnĂ©es gĂ©nĂ©riques de quatre Ă©lĂ©ments (Dublin Kernel, inspirĂ© de Dublin Core (DC)), suivi de tout autre Ă©lĂ©ment de mĂ©tadonnĂ©e (paire attribut / valeur) que le fournisseur souhaite donner. Ce noyau de mĂ©tadonnĂ©es est structurĂ© pour rĂ©pondre aux questions suivantes : « qui ? », « quoi ? », « quand ? » et « oĂč ? » sur l'expression ou le « rĂ©cit » d'un objet :

  • qui l'a « dit » (semblable aux Ă©lĂ©ments DC CrĂ©ateur, Contributeur et Éditeur, mais Ă©galement Ă  inventeur, dĂ©couvreur, rĂ©alisateur, etc.),
  • comment s'appelle le « dit » (semblable Ă  l’élĂ©ment DC Titre, mais aussi Ă  NumĂ©roDEchantillon, CodeBarreObjet, etc.),
  • quand il a Ă©tĂ© « dit » (similaire Ă  l’élĂ©ment DC Date, mais inclut les intervalles de dates, les dates approximative et celles avant l’ùre chrĂ©tienne),
  • oĂč le « dit » peut ĂȘtre trouvĂ© (similaire Ă  l’élĂ©ment DC Identifiant, mais gĂ©nĂ©ralement inutile car il s'agit de l'ARK lui-mĂȘme).

Il y a beaucoup Ă  dire sur les mĂ©tadonnĂ©es et ARK (par exemple, sur l’application des Ă©lĂ©ments « qui », « quoi », « quand » et « oĂč » au contenu d'une biographie, ou comment une institution de conservation prĂ©voit de maintenir un jeu de donnĂ©es). Des recommandations supplĂ©mentaires sur les mĂ©tadonnĂ©es et ARK seront disponibles sur arks.org. D'autres Ă©lĂ©ments sont essentiels, tels que

  • comment il a Ă©tĂ© « dit » (similaire Ă  un Ă©lĂ©ment ResourceType), ce qui peut dĂ©terminer des alignements avec des spĂ©cifications de mĂ©tadonnĂ©es externes et des Ă©lĂ©ments supplĂ©mentaires
  • URL cible de la redirection, gĂ©nĂ©ralement stockĂ©e en tant qu'Ă©lĂ©ment distinct des mĂ©tadonnĂ©es
  • Ă©lĂ©ments de dĂ©claration de permanence, pour exprimer le niveau d'un engagement de conservation.

Qu'est-ce qu'une « inflexion » et en quoi diffÚre-t-elle de la « négociation de contenu » ?

Une inflexion est une dĂ©sinence Ă  la fin d'un mot qui exprime un changement de sens. Cela permet de dĂ©finir un mot tel que « aller » sans dĂ©finir Ă©galement « allez » et « allons ». Pour un ARK qui mĂšne Ă  un objet, ajouter simplement un « ? » Ă  la fin (« ? » est un exemple d'inflexion ARK) nous permet de demander des mĂ©tadonnĂ©es sans avoir Ă  dĂ©finir un identifiant distinct pour les mĂ©tadonnĂ©es de l'objet. Cette technique simple peut ĂȘtre utilisĂ©e par un humain avec un navigateur Web. Le rĂ©solveur N2T prend en charge les inflexions et la nĂ©gociation de contenu.

La nĂ©gociation de contenu pour les mĂ©tadonnĂ©es est une technique logicielle permettant de demander d'autres formats d'objet, tels que le format PDF ou RTF d'un fichier HTML. Bien que cela n’ait pas Ă©tĂ© conçu pour cela, la « nĂ©gociation de contenu » originelle Ă©tait dĂ©tournĂ©e dans certains cas pour demander des mĂ©tadonnĂ©es, en considĂ©rant curieusement que les formats de fichier souvent utilisĂ©s pour exprimer des mĂ©tadonnĂ©es ne pouvaient vĂ©hiculer que des mĂ©tadonnĂ©es et jamais des objets Ă  part entiĂšre. Contrairement aux inflexions, la « nĂ©gociation de contenu pour les mĂ©tadonnĂ©es » ne fonctionne pas du tout pour les objets reprĂ©sentĂ©s dans ces formats (formats dont la liste ne cesse de s'allonger et n'est connue que par convention tacite) et n'est pas assez simple d’utilisation pour la plupart des usagers humains.

Bien que les inflexions soient gĂ©nĂ©ralement associĂ©es aux ARK, elles ne leur sont pas rĂ©servĂ©es. Contrairement aux idĂ©es reçues, les identifiants ne font rien ; ce sont leurs rĂ©solveurs qui gĂšrent ou non des fonctionnalitĂ©s. Ainsi, par exemple, les inflexions et le « transfert de suffixe » sont pris en charge par n2t.net pour tous les types d’identifiants, mais pas par doi.org ni par handle.net (qui dispose d’une fonctionnalitĂ© similaire appelĂ©e « Template Handles ») pour aucun type d’identifiant.

Qu'entendez-vous par « silos » ?

En rĂšgle gĂ©nĂ©rale, les services basĂ©s sur des formats d’identifiant sont conçus comme des silos, ou des plates-formes fermĂ©es, gĂ©rant un type d'identifiant particulier tel que Handle, DOI ou PURL. Chaque silo remplit les mĂȘmes fonctions principales - associer des noms (chaĂźnes de caractĂšres d'identifiant) Ă  des choses (objets ou mĂ©tadonnĂ©es). L'exclusion de tous les types d'identifiant, sauf un, peut aider Ă  conquĂ©rir des marchĂ©s, mais elle est contre-productive et exclusive. Elle nĂ©cessite la reconstruction du mĂȘme ensemble de services pour chaque format et viole les principes de base de l’ouverture.

À l’inverse, le rĂ©solveur N2T (Name-to-Thing) et l'interface de gestion EZID (« identifiants simples ») ont Ă©tĂ© conçus pour gĂ©rer tout identifiant. Les efforts consacrĂ©s Ă  toute nouvelle fonctionnalitĂ© peuvent ĂȘtre Ă©tendus avec profit Ă  tous les types, ce qui permet une surprenante flexibilitĂ©. Par exemple, les ARK sont souvent stockĂ©s dans EZID avec des mĂ©tadonnĂ©es DOI, et chaque DOI stockĂ© dans N2T peut bĂ©nĂ©ficier des fonctionnalitĂ©s de rĂ©solution ARK telles que les inflexions et le « transfert de suffixe », qui ne sont pas disponibles via le rĂ©solveur DOI principal (doi.org). 








  • No labels