Foire aux questions-réponses sur les ARK
Ceci est la traduction française du document "ARK Identifiers FAQ".
Les bases
Comment puis-je donner mon avis sur ce document ?
En commentant cette version ouverte aux commentaires.
Que sont les ARKÂ ?
Les ARK (Archival Resource Key) sont des identifiants de haute performance qui vous donnent accĂšs Ă des choses et Ă des descriptions de ces choses. Par exemple, cet ARK,
     https://n2t.net/ark:/67531/metadc107835/
vous donne accÚs à une thÚse, et, en ajoutant '??' à la fin de l'ARK, devrait vous amener à sa description :
     https://n2t.net/ark:/67531/metadc107835/??
Qu'est-ce qu'un identifiant ?
Sur Internet, un identifiant est une URL, ou une partie d'URL. Par exemple, cet identifiant ARK principal,
     ark:/12148/btv1b8449691v/f29
figure dans deux URL (Uniform Resource Locators, également appelés « liens Web » ou « adresses Web ») différentes :
       http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29
       https://n2t.net/ark:/12148/btv1b8449691v/f29
Les ARK sont plus particuliĂšrement destinĂ©s Ă ĂȘtre des identifiants pĂ©rennes.
Qu'est-ce qu'un « identifiant pérenne » ?
On a estimĂ© que la durĂ©e de vie moyenne d'un URL Ă©tait de 44 jours. La fin de la vie dâun URL advient lorsque celui-ci se « rompt » ; il  vous retourne alors la redoutable erreur "404 Introuvable" que la plupart dâentre nous connaissent bien. Non seulement câest agaçant, mais câest en outre politiquement embarrassant lorsque lâon recherche des publications scientifiques financĂ©es sur fonds publics, et câest un dĂ©sastre culturel pour les bibliothĂšques, les archives, les musĂ©es et autres institutions mĂ©morielles.
Parmi les multiples liens qui peuvent ou ont pu vous conduire à une chose, un identifiant pérenne est un lien qui, en principe, continue de fonctionner trÚs longtemps. Les services qui permettent la découverte et l'interconnexion de ressources (comme entre les articles universitaires, les auteurs, les données de la recherche et les sujets connexes) préfÚrent les identifiants pérennes en raison de cette stabilité.
Les identifiants pĂ©rennes devraient continuer Ă fonctionner mĂȘme lorsque les choses sont dĂ©placĂ©es d'un site Web Ă un autre. Normalement, lorsque les choses sont dĂ©placĂ©es, tous ceux qui ont dĂ©jĂ enregistrĂ© les anciens liens devraient ĂȘtre informĂ©s des nouveaux, ce qui est presque impossible. C'est alors qu'interviennent les rĂ©solveurs d'identifiants.
Qu'est-ce qu'un résolveur ?
Un rĂ©solveur est un site Web spĂ©cialisĂ© dans la rĂ©orientation d'identifiants entrants (ceux initialement annoncĂ©s aux utilisateurs) vers les sites Web actuellement les mieux Ă mĂȘme de les traiter. Ce transfert est gĂ©nĂ©ralement appelĂ© « rĂ©solution » et une des Ă©tapes de ce processus de rĂ©solution la « redirection ».
Pour qu'un rĂ©solveur fonctionne, son nom d'hĂŽte - hostname en anglais - (« n2t.net » ou « ark.bnf.fr » dans les identifiants ci-dessus) doit ĂȘtre soigneusement choisi afin qu'il ne soit plus nĂ©cessaire de le changer. Les noms dâhĂŽte des institutions mĂ©morielles, dont certaines sont vieilles de plusieurs siĂšcles, sont souvent de bons candidats pour devenir des rĂ©solveurs. On citera dâautres rĂ©solveurs, plus rĂ©cents et plus connus : n2t.net (le rĂ©solveur ARK), identifiers.org, doi.org, handle.net et purl.org.
Ă quoi peut-on attribuer un ARKÂ ?
Ă toute chose numĂ©rique, physique ou abstraite. Cela inclut les choses qui nâexistent pas encore mais auxquelles vous devez faire rĂ©fĂ©rence depuis des objets que vous crĂ©ez ou prĂ©voyez de crĂ©er, comme un lien depuis le brouillon dâun article vers un jeu de donnĂ©es en prĂ©paration, ou un lien depuis une lettre numĂ©rique archivĂ©e vers un instrument de recherche Ă crĂ©er. Attention, vous ne devriez attribuer des ARK quâĂ des choses que vous possĂ©dez, contrĂŽlez ou gĂ©rez. Attribuer des ARK Ă des choses que vous ne contrĂŽlez pas est dĂ©conseillĂ© car de tels identifiants sont gĂ©nĂ©ralement fragiles.
Vous trouverez ci-dessous une liste de choses qui reçoivent des ARK. Les nombres sont une estimation produite en septembre 2019 par les organisations elles-mĂȘmes.
Catégories | Exemples |
---|---|
|
Qui utilise les ARKÂ ?
Difficile Ă dire car les ARK sont dĂ©centralisĂ©s, mais plus de 600 organisations enregistrĂ©es ont créé, selon leurs estimations, environ 3,2 milliards dâARK. Vous trouverez des ARK utilisĂ©s comme permaliens dans
- le Data Citation Index (lié au Web of Science)
- les articles de Wikipédia
- les entrées de Wikidata
- les collections dâInternet Archive)
- les profils de chercheurs ORCID
Voici la rĂ©partition globale des organisations enregistrĂ©es comme attributrices dâARK en avril 2020. Cliquez sur lâimage ci-dessous pour accĂ©der Ă une carte Ă jour et zoomable.
Pour commencer
 De quoi ai-je besoin pour créer des ARK ?
Tout d'abord, vous avez besoin d'un NAAN (numéro d'autorité nommante, ou Name Assigning Authority Number en anglais), qui est un numéro exclusivement réservé à votre organisation. Il doit apparaßtre dans chaque ARK attribué par votre organisation, juste aprÚs l'étiquette "ark:/". Le NAAN de tous ces ARK
                           ark:/12148/btv1b8449691v/f29
     http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29
     https://n2t.net/ark:/12148/btv1b8449691v/f29
est 12148 ; il identifie de maniĂšre unique la BibliothĂšque nationale de France. Chaque NAAN est associĂ© Ă l'URL d'un rĂ©solveur pour ses ARK. Par exemple, pour rĂ©soudre un ARK en 12148, apposez-le aprĂšs http://ark.bnf.fr/ comme indiquĂ© ci-dessus. Le rĂ©solveur N2T.net est Ă part dans la mesure oĂč il transmet tout ARK au rĂ©solveur associĂ© Ă son NAAN.
L'obtention ou l'utilisation d'un NAAN est gratuite et vous pouvez en demander un en remplissant un formulaire en ligne. Plus de 600 organisations (bibliothÚques, archives, musées, facultés, agences gouvernementales, éditeurs scientifiques et pédagogiques, projets, etc.) ont un NAAN répertorié dans le registre public NAAN.
Comment commencer à créer des chaßnes de caractÚres destinées à devenir des ARK ?
Vous ĂȘtes libre de crĂ©er des chaĂźnes de caractĂšre ARK Ă votre guise, Ă condition que vous n'utilisiez que des chiffres, des lettres (ASCII, donc sans aucun signe diacritique) et les caractĂšres suivants :
= ~ * + @ _ $ . /
Les deux derniers caractĂšres sont rĂ©servĂ©s pour le cas oĂč vous souhaiteriez divulguer des relations entre ARK.
Une autre des caractĂ©ristiques des ARK est que les traits d'union ('-') peuvent ĂȘtre utilisĂ©s mais quâils sont inertes en ce qui concerne l'identitĂ©, ce qui signifie que des chaĂźnes ne diffĂ©rant que par des traits d'union sont considĂ©rĂ©es comme identiques ; par exemple, ces chaĂźnes
ark:/12345/141e86dc-d396-4e59-bbc2-4c3bf5326152
ark:/12345/141e86dcd3964e59bbc24c3bf5326152
identifient la mĂȘme chose. La raison de cette fonctionnalitĂ© est que les processus de formatage de texte utilisĂ©s Ă travers le monde introduisent rĂ©guliĂšrement des traits d'union supplĂ©mentaires dans les identifiants, rompant ainsi les liens avec tout serveur qui considĂšre les traits d'union comme signifiants.
Les ARK distinguent majuscules et minuscules, ce qui permet des identifiants plus courts (52 contre 26 lettres par caractĂšre). La « mĂ©thode ARK » consiste toutefois Ă n'utiliser que des minuscules, sauf si vous avez besoin d'ARK plus courts. Cette restriction facilite la prise en charge de vos ARK par les rĂ©solveurs sâils sont reçus avec des majuscules ou des majuscules et minuscules mĂ©langĂ©es, ce qui arrive malheureusement souvent Ă cause de lâidĂ©e, vieille de 50 ans, selon laquelle les identifiants sont insensibles Ă la casse. Vous pouvez Ă©galement envisager d'utiliser le rĂ©pertoire de caractĂšres de l'outil Noid, qui crĂ©e des chaĂźnes protĂ©gĂ©es contre une retranscription fautive Ă l'aide de l'algorithme de contrĂŽle le plus puissant. Ce rĂ©pertoire comprend uniquement des chiffres et des consonnes moins 'l' (lettre « L », souvent confondue avec le chiffre 1) :
0123456789bcdfghjkmnpqrstvwxz
Pour l'attribution, une stratĂ©gie courante consiste Ă tirer parti des identifiants hĂ©ritĂ©s. Par exemple, un numĂ©ro de spĂ©cimen de papillon de musĂ©e, cd456f9_87, pourrait ĂȘtre publiĂ© sous lâARK ark:/12345/cd456f9_87. Certains identifiants hĂ©ritĂ©s devront peut-ĂȘtre ĂȘtre modifiĂ©s compte tenu des restrictions de caractĂšres ARK. La deuxiĂšme stratĂ©gie couramment utilisĂ©e consiste Ă crĂ©er des chaĂźnes entiĂšrement nouvelles pour vos ARK. Dans ce cas, il est important de considĂ©rer si elles doivent ĂȘtre totalement ou partiellement opaques, ou signifiantes.
Que sont les identifiants opaques ?
Les chaĂźnes de caractĂšres d'identifiants pĂ©rennes sont gĂ©nĂ©ralement opaques et rĂ©vĂšlent dĂ©libĂ©rĂ©ment peu de choses sur ce Ă quoi elles sont attribuĂ©es, car les identifiants non opaques ne vieillissent pas ou ne voyagent pas bien. Les noms d'organisations sont connus pour ĂȘtre transitoires, raison pour laquelle les NAAN sont des nombres opaques. Lorsque les dates et les titres sont corrigĂ©s, que les significations des mots Ă©voluent (par exemple, d'anciens sigles innocents peuvent devenir offensants ou attentatoires), les chaĂźnes de caractĂšres censĂ©es ĂȘtre pĂ©rennes peuvent gĂ©nĂ©rer de la confusion ou poser un problĂšme politique. La gĂ©nĂ©ration et l'attribution de chaĂźnes de caractĂšres complĂštement opaques comportent Ă©galement des risques ; ainsi, des nombres attribuĂ©s sĂ©quentiellement rĂ©vĂšlent des informations sur leur date et les chaĂźnes de caractĂšres contenant des lettres peuvent gĂ©nĂ©rer fortuitement des mots (c'est pourquoi le rĂ©pertoire de caractĂšres recommandĂ© ne comporte pas de voyelles).
Exemples de chaĂźnes de caractĂšres plus ou moins opaques | |||
Non opaque | Netscape Permanent Archive | Gay_Divorcee_1934_April_1 | Name-to-Thing Resolver |
Partiellement opaque | X0001, x0002, ..., x9998 | GD/1934/04/01 | |
Plus opaque | 141e86dc-d396-4e59-bbc2-4c3bf5326152 | 19340401 | n2t |
Totalement opaque | 141e86dcd3964e59bbc24c3bf5326152 | H8k74926g | 12148 |
Il n'est pas obligatoire que les ARK soient opaques, mais il est recommandĂ© que le nom de base de l'objet le soit, car il constitue en gĂ©nĂ©ral le nom du sujet principal de lâeffort de pĂ©rennisation. Si des qualificatifs suivent ce nom, il est moins important qu'ils soient opaques. Pour vous aider Ă dĂ©terminer votre niveau d'opacitĂ©, vous pouvez Ă©valuer la compatibilitĂ© avec les identifiants hĂ©ritĂ©s et la facilitĂ© de gĂ©nĂ©ration et de retranscription de la chaĂźne de caractĂšres (en prenant en compte la compacitĂ©, le caractĂšre de contrĂŽle). De nouvelles chaĂźnes de caractĂšres peuvent ĂȘtre gĂ©nĂ©rĂ©es avec la date et lâheure, un UUID, Ă lâaide dâun gĂ©nĂ©rateur de nombres ou du gĂ©nĂ©rateur Noid (Nice Opaque Identifiers).
Les chaĂźnes de caractĂšres opaques sont « muettes » et donc difficiles Ă gĂ©rer, c'est pourquoi les ARK ont Ă©tĂ© conçus pour ĂȘtre des identifiants « parlants ». Cela signifie que s'il existe des mĂ©tadonnĂ©es sur la ressource, un ARK qui se prĂ©sente sur votre serveur suivi de l'inflexion « ? » devrait pouvoir parler de lui-mĂȘme.
Comment rendre le contenu du serveur accessible via les ARKÂ ?
Tout dâabord, dĂ©terminez ce que sera lâexpĂ©rience utilisateur lors de lâaccĂšs par vos ARK : une feuille de calcul, un PDF, une image, une page dâaccueil affichant des mĂ©tadonnĂ©es et plusieurs options ? Quel que soit votre choix, prĂ©voyez que votre serveur retourne des mĂ©tadonnĂ©es si lâARK arrivait suivi dâune đ«đ· FAQ sur les identifiants ARK#inflexion « ? ».
Pour le reste, rĂ©soudre des ARK revient Ă rĂ©pondre Ă des URL. Normalement, les URL entrants appellent (ou sont associĂ©s Ă ) du contenu renvoyĂ© par votre serveur Web. Si votre serveur est compatible ARK, les ARK entrants (exprimĂ©s sous forme dâURL) doivent ĂȘtre associĂ©s au mĂȘme contenu. Lâapproche habituelle consiste Ă associer lâARK Ă lâURL Ă lâaide dâune table de donnĂ©es que vous mettez Ă jour chaque fois que lâURL change. Dans ce cas, votre serveur agit comme un rĂ©solveur local. Si vous ne souhaitez pas lâimplĂ©menter vous-mĂȘme, il existe des outils et services logiciels ARK qui peuvent vous aider.
Une autre approche consiste Ă laisser votre serveur Web fonctionner en lâĂ©tat et, au lieu de mettre Ă jour ses tables locales, de maintenir des tables de correspondance ARK/URL sur un rĂ©solveur distinct. Cette approche est adoptĂ©e par nombre dâĂ©diteurs de logiciels et par les organisations maintenant leurs tables via le service EZID (qui est liĂ© au rĂ©solveur n2t.net et met Ă jour les tables de rĂ©solution de ce dernier).
Comment citer ou faire connaĂźtre un ARKÂ ?
On prĂ©fĂ©rera la forme URL (https ou http) de lâARK. Par exemple : https://n2t.net/ark:/99166/w66d60p2. Un ARK destinĂ© Ă un usage externe est gĂ©nĂ©ralement publiĂ© (annoncĂ©, diffusĂ©âŠ) de cette maniĂšre afin de constituer un identifiant actionnable. Si un affichage visuel plus compact est nĂ©cessaire, il doit ĂȘtre associĂ© Ă un lien hypertexte. Par exemple :
<a href="https://n2t.net/ark:/99166/w66d60p2">ark:/99166/w66d60p2</a>
Une dĂ©cision importante consiste Ă dĂ©terminer si vos URI ARK utiliseront le nom dâhĂŽte de votre rĂ©solveur local ou le rĂ©solveur N2T.net. Si vous privilĂ©giez le contrĂŽle ou la stratĂ©gie de marque, vous prĂ©fĂ©rerez publier des ARK utilisant votre rĂ©solveur local. Si vous doutez de la stabilitĂ© de votre nom dâhĂŽte local, vous prĂ©fĂ©rerez publier vos ARK en utilisant le nom dâhĂŽte n2t.net (voir ici des exemples des deux approches). Quelle que soit la maniĂšre dont vous les publiez, la rĂ©solution de vos ARK via N2T est toujours possible.
Existe-t-il des outils et des services de gestion dâARKÂ ?
 Voici une liste partielle dâoutils logiciels de gestion dâidentifiants. Elle comprend notamment
- Noid (Nice Opaque Identifiers), logiciel open source permettant de crĂ©er et de rĂ©soudre vous-mĂȘme des ARK,
- ArchiveSpace, une application open source pour gérer et fournir un accÚs web à des archives, des manuscrits et des objets numériques,
- un plug-in ARK pour Omeka, qui crée et gÚre des ARK pour la plate-forme de publication Web open source Omeka,
- un module ARK pour Drupal, qui permet Ă votre site Drupal d'agir en tant qu'autoritĂ© dâadressage (NMA).
On y mentionne également certains éditeurs de logiciels et fournisseurs de service, tels que EZID. Vous trouverez ici des informations supplémentaires sur les concepts et les bonnes pratiques.
Pour aller plus loin
Qu'est-ce que N2TÂ ?
N2T.net est un rĂ©solveur ARK global. N2T, qui signifie « Name-to-Thing », est en fait un rĂ©solveur gĂ©nĂ©ricisĂ© permettant dâassocier des noms Ă des objets. Il sait ainsi rediriger plus de 600 autres types d'identifiants - ARK, DOI, PMID, Taxon, PDB, ISSN, etc. Si cela vous intĂ©resse, le schĂ©ma et la suite de cette rĂ©ponse donnent un peu plus de dĂ©tails.Â
Les requĂȘtes entrantes sont gĂ©nĂ©ralement constituĂ©es de https://n2t.net/ suivies dâun identifiant (le nom). N2T cherche cet identifiant et renvoie un lien de redirection. Pour cela, il utilise deux mĂ©thodes de rĂ©solution. Dâabord, N2T tente de rĂ©soudre lâidentifiant selon une information associĂ©e Ă un identifiant stockĂ© unitairement. Ă dĂ©faut, il applique des rĂšgles liĂ©es au type dâidentifiant. Il existe Ă©galement une API N2T qui permet, sur authentification, des opĂ©rations de masse et la gĂ©nĂ©ration dâidentifiants.Â
N2T utilise deux types de donnĂ©es stockĂ©es. PremiĂšrement, il stocke des enregistrements individuels pour plus de 20 millions d'identifiants d'objet (par exemple, ARK, DOI) qu'il obtient de trois sources : EZID, Internet Archive et YAMZ.net. Lorsque de tels enregistrements incluent une URL de redirection (cible) et des métadonnées descriptives, N2T peut agir sur les inflexions, effectuer un transfert de suffixe et une « nĂ©gociation de contenu ».Â
DeuxiĂšmement, N2T stocke plus de 3500 enregistrements de « rĂšgle » pour rediriger les identifiants qui nâont pas Ă©tĂ© trouvĂ©s individuellement dans N2T, mais pour lesquels il dispose d'informations de redirection liĂ©es au type d'identifiant Ă rĂ©soudre. Il obtient des enregistrements de rĂšgles de plusieurs sources, notamment le registre NAAN, une base de donnĂ©es de prĂ©fixes ARK et DOI et un partenariat officiel sur les identifiants compacts avec identifiers.org.
Si la plupart des ARK ont leur propre résolveur, pourquoi existe-t-il également un résolveur global pour les ARK ?
 La plupart des ARK sont créés par des organisations qui les publient en utilisant leur propre résolveur. Par exemple, cet ARK a été publié en spécifiant le résolveur ark.bnf.fr :
http://ark.bnf.fr/ark:/12148/btv1b8449691v/f29
Avoir Ă gĂ©rer et Ă maintenir son propre rĂ©solveur est la contrepartie dâune autonomie complĂšte. L'utilisation de votre propre rĂ©solveur vous permet Ă©galement de mettre en avant votre « marque » via le nom d'hĂŽte, l'inconvĂ©nient Ă©tant que les marques sont transitoires et ont tendance Ă fragiliser les identifiants. Les pressions politiques voire lĂ©gales (par exemple, sur les marques commerciales) peuvent rendre difficile le maintien de noms d'hĂŽtes de « marque » plus anciens, et donc des identifiants sur lesquels ils ont Ă©tĂ© construits. C'est un autre argument en faveur du rĂ©solveur ARK global. Les utilisateurs rencontrant ultĂ©rieurement un identifiant brisĂ© et constatant que son nom d'hĂŽte n'existe plus peuvent, si c'est un ARK, extraire son identitĂ© immuable de base (lâĂ©lĂ©ment commençant par « ark: ») et la prĂ©senter au rĂ©solveur global n2t.net,
https://n2t.net/ark:/12148/btv1b8449691v/f29.
Mon organisation a son propre résolveur ARK - dois-je me soucier de N2T.net ?
Oui, et ce pour deux raisons principales. Tout d'abord, si vos ARK « à l'état sauvage » apparaissent sans votre le nom d'hÎte de votre résolveur (c'est-à -dire, s'ils commencent par « ark: ... », ce qui n'est pas rare), la personne qui veut les utiliser n'est pas tenue de connaßtre le nom d'hÎte : il lui suffit d'ajouter « n2t.net » devant eux. Cela fonctionne car N2T connaßt le nom d'hÎte du résolveur.
DeuxiÚmement, si certaines organisations et leurs noms d'hÎtes résolveurs ont une longue durée de vie, la plupart ne durent pas. Une personne essayant d'utiliser un ARK contenant un nom d'hÎte de résolveur non fonctionnel peut remplacer la partie non fonctionnelle par « n2t.net ». Si les circonstances vous obligent à changer votre résolveur, cette étape de remplacement donne aux ARK que vous avez publiés avant le changement une meilleure chance de fonctionner.
Pour éviter de futurs désagréments, certaines organisations qui gÚrent leurs propres résolveurs peuvent choisir d'emblée de préférer au nom de leur résolveur le nom de domaine n2t.net pour la publication de leurs ARK.
Pourquoi le résolveur ARK global (n2t.net) ne contient-il pas le mot « ARK » ?
Lorsque le besoin d'un rĂ©solveur ARK global est apparu, les principes de base d'ouverture et de gĂ©nĂ©ricitĂ© ont dissuadĂ© les concepteurs de crĂ©er un autre silo sur le modĂšle de DOI / Handle / PURL. Au lieu de quoi, le rĂ©solveur ARK a Ă©tĂ© conçu pour ĂȘtre un rĂ©solveur gĂ©nĂ©rique, non liĂ© Ă un format, appelĂ© N2T (Name-to-Thing), qui rĂ©sout maintenant plus de 600 types d'identifiants, y compris les ARK, les DOI, les Handle, les PURL, les URN, les ORCID, les ISSN, etc. La rĂ©solution consiste Ă rechercher dans une table une chaĂźne de caractĂšres d'identifiant, quel que soit son type, et Ă la rediriger au bon endroit.
Les mĂȘmes principes de base ont guidĂ© la conception d'un outil antĂ©rieur appelĂ© noid, conçu pour les ARK, mais Ă©galement utilisĂ© rĂ©guliĂšrement par les organisations attribuant des Handle.
Que désigne-t-on par « transfert de suffixe » ?
En bref, le transfert de suffixe est une fonctionnalité de N2T. Supposons que vous n'ayez qu'un seul ARK enregistré, https://n2t.net/ark:/12345/6789, et qu'il redirige vers la page du serveur Web,
https://a.example.org/dataset542
Et supposons que ce mĂȘme serveur serve Ă©galement ces pages :
https://a.example.org/dataset542/volume3
https://a.example.org/dataset542/volume3/part2
https://a.example.org/dataset542/volume3/part2.pdf
Ce que fait le transfert de suffixe est de laisser votre ARK enregistré agir comme si vous aviez également enregistré ces trois ARK ci-dessous, qui seraient résolus par les pages ci-dessus, respectivement:
https://n2t.net/ark:/12345/6789/volume3
https://n2t.net/ark:/12345/6789/volume3/part2
https://n2t.net/ark:/12345/6789/volume3/part2.pdf
Dans ce cas, le transfert de suffixe vous évite d'avoir à conserver des enregistrements pour trois pages supplémentaires. En fait, cela fonctionne pour un nombre illimité de pages.
Quelles sont les parties d'un ARKÂ ?
Anatomie de lâARK      IdentitĂ© immuable de base
                     ____________________________________
                     /                             \
Service de rĂ©solution    Nom de base de lâobjet Qualificatifs
   ______________________  ______________________  _____________
   /                    \/                  \/          \
   https://example.org/ark:12345/654xz321/s3/f8.05v.tiff
         \_____________/ \___/\_____/ \_________/\______/\______/
            |         |        |       |         |       |
            |        Libellé  |         |            |   Variantes
            |               |         |    Composantes
            |               |            |Â
Nom de lâautoritĂ© dâadressage  |   Nom ARK attribuĂ©
            (NMA)                 |
            NumĂ©ro dâautoritĂ© nommante (NAAN)
Puis-je attribuer des ARK Ă des composantes dâune ressource qui a dĂ©jĂ un ARK ?
Oui, les ARK peuvent ĂȘtre attribuĂ©s Ă n'importe quel niveau de granularitĂ©, tel qu'un manuscrit, des chapitres Ă l'intĂ©rieur, des sections de chapitre, des sous-sections, etc. Un ARK peut Ă©galement ĂȘtre attribuĂ© Ă une chose qui contient d'autres choses. Dans les ARK, le caractĂšre '/' est rĂ©servĂ© pour aider lâutilisateur Ă dĂ©couvrir la relation de composition. Par exemple, le premier objet ci-dessous contient le second :
ark:/12148/btv1b8449691v
ark:/12148/btv1b8449691v/f29
C'est le qualificatif de granularité. Il n'y a qu'un seul autre qualificatif ARK, qui indique les variantes de forme d'une chose en utilisant le caractÚre réservé '.' devant un suffixe. Par exemple, ces ARK identifient des documents,
ark:/12148/btv1b8449691v/f29.pdf
ark:/12148/btv1b8449691v/f29.html
Comme ils ne diffĂšrent que par le suffixe .pdf ou .html, on peut en dĂ©duire qu'ils identifient deux formes diffĂ©rentes du mĂȘme document.
Quel est le but du NAAN et puis-je y apporter des modifications ?
 Les NAAN subdivisent l'ensemble des ARK potentiels (l'espace de noms ARK). Le sous-ensemble d'ARK d'un NAAN donnĂ© peut ĂȘtre subdivisĂ© par des prĂ©fixes (par exemple : 12345/x2, 98765/b4), ce qui facilite la dĂ©lĂ©gation de l'attribution autonome d'ARK, aux dĂ©partements d'une grande organisation par exemple. La rĂ©solution ARK est partiellement basĂ©e sur les NAAN, mais Ă©tant donnĂ© quâil arrive que les organisations soient scindĂ©es, ARK rĂ©pond au problĂšme de la scission d'espaces de noms en permettant Ă plusieurs organisations de prendre en charge la gestion d'un espace de noms. Si vous passez dâun prestataire Ă un autre, rien ne vous empĂȘche dâemporter votre NAAN avec vous. Vous pouvez modifier un NAAN en remplissant le mĂȘme formulaire en ligne utilisĂ© pour demander un nouveau NAAN, par exemple pour
- mettre à jour l'URL de la personne à contacter ou du résolveur de votre organisation,
- modifier la stratĂ©gie d'attribution de nom de votre organisation (voir ici un exemple dâune telle stratĂ©gie),
- demander un NAAN supplĂ©mentaire pour un nouvel ensemble important dâARK ou un nouvel organe Ă lâintĂ©rieur de votre organisation,
- ou enfin signaler le transfert de votre NAAN vers une autre organisation qui poursuivra votre travail et prendra en charge votre NAAN.
Y a-t-il des restrictions dâusage des NAANÂ ?
Oui. Il est important de ne jamais inventer ou utiliser un NAAN qui ne serait pas présent dans le registre public. Il y a néanmoins deux NAAN spécifiques que chacun peut utiliser :
- « 99999 » pour des besoins de test, de dĂ©veloppement ou dâexpĂ©rimentation,
- « 12345 » pour des exemples dâARK non fonctionnels Ă utiliser dans la documentation.
Pour les experts, reconnaĂźtre les ARK avec de tels NAAN et les Ă©liminer des rapports de liens brisĂ©s est aisĂ©. MalgrĂ© les efforts des fournisseurs, de tels ARK sâĂ©chappent frĂ©quemment « dans la nature », ce qui peut induire en erreur utilisateurs et vĂ©rificateurs de liens.
ARK et les autres identifiants
Pourquoi utiliser des ARK plutÎt que des DOI, par exemple ?
- Pour réduire les coûts (voir cette section pour plus de précision) ;
- Pour ne gérer que les métadonnées que vous voulez ;
- Pour pouvoir créer des identifiants sans métadonnées ;
- Pour pouvoir crĂ©er un identifiant avant mĂȘme que votre objet nâexiste ;
- Pour avoir un identifiant dÚs que vous créez le premier brouillon de votre objet ;
- Pour garder cet identifiant privĂ© pendant que les donnĂ©es et les mĂ©tadonnĂ©es Ă©voluent, jusquâĂ ce que vous dĂ©cidiez (Ă©ventuellement des annĂ©es aprĂšs) de le publier ou de le supprimer ;
- Pour conserver cet identifiant jusquâĂ la publication et peut-ĂȘtre alors attribuer Ă la place un autre identifiant tel qu'un DOI ;
- Parce que les ARK, conçus pour une utilisation gĂ©nĂ©rique et non spĂ©cifiquement pour le monde de lâĂ©dition, sont naturellement adaptĂ©s Ă lâidentification dâobjets physiques comme des Ă©chantillons ou des stations de recherche ;
- Parce que les résolveurs ARK peuvent résoudre des identifiants habituellement endommagés par des processus de formatage de texte introduisant des traits d'union ;
- Parce que la plupart des ARK portent un caractĂšre de contrĂŽle Noid qui peut ĂȘtre utilisĂ© pour dĂ©tecter toutes les erreurs de transcription courantes (et non certaines dâentre elles uniquement) ;
- Pour pouvoir créer des identifiants plus courts, car la casse mixte permet des chaßnes plus compactes (un plus grand nombre de chaßnes d'une longueur donnée) ;
- Pour pouvoir changer de prestataire et/ou d'infrastructure sans avoir à coordonner des transferts de bases de données avec une autorité centrale ;
- Pour pouvoir résoudre le problÚme de la scission d'espace de noms sans perdre le contrÎle de vos identifiants ;
- Pour lier des identifiants à différentes déclarations de permanence nuancées ;
- Pour pouvoir ajouter des requĂȘtes (par exemple « ?lang=en ») lors de la rĂ©solution de vos identifiants ;
- Pour utiliser une infrastructure ouverte correspondant aux valeurs de votre organisation ;
- Pour permettre dâaccĂ©der directement aux objets auxquels vous accordez de lâimportance et non Ă leur page dâaccueil ;
- Pour crĂ©er un seul identifiant qui peut ĂȘtre dĂ©clinĂ© en des millions (grĂące au mĂ©canisme de transfert de prĂ©fixe) ;
- Pour accéder à des métadonnées adaptées et complÚtes via des inflexions
- Pour sâintĂ©grer aisĂ©ment dans des API IIIF en utilisant les qualificatifs ARK.
Qu'ont en commun ARK, DOI, Handle, PURL et URNÂ ?
Ce sont les principaux types (ou schĂ©mas) d'identifiants pĂ©rennes. Tous existent au moins depuis 2001.Tous sont utilisĂ©s dans des contextes tels que les profils Data Citation Indexâ , Wikipedia et ORCID.org. Tous donnent accĂšs Ă presque tout type de contenu, qu'il soit numĂ©rique, physique, abstrait, une personne, un groupe, etc. Ils ont Ă©galement une structure trĂšs similaire composĂ©e de quatre parties, comme le montrent les exemples ci-dessous :Â
 https://n2t.net/ark:/99999/12345   https://doi.org/10.99999/12345 https://handle.net/10.99999/12345    https://purl.org/99999/12345 https://<various>/urn:99999:12345 |
|
 Aucun dâeux nâa d'effet rĂ©el sur la persistance (voir 10 mythes persistants sur les identifiants pĂ©rennes).
Attendez, vous voulez dire que ARK, DOI, Handle, PURL et URN sont inutiles ?
Non, ce serait une affirmation excessive. Mais remettons ces formats dâidentifiant (types) en perspective :
- Aucun ne protÚge contre les principales causes de rupture des liens : baisse de financement, catastrophe naturelle, bouleversement social, guerre, élimination délibérée, erreur humaine ou négligence du prestataire ;
- Ils exigent tous de vous, le fournisseur final, de mettre à jour les tables de redirection à mesure que les URL changent ;
- Ils identifient tous un contenu susceptible d'avoir Ă©tĂ© modifiĂ© ou supprimĂ© Ă lâoccasion de visites ultĂ©rieures ;
- Tous comportent des identifiants brisés, et en grande quantité (plusieurs milliers) ;
- Ils reposent tous sur le simple systÚme de la redirection géré par les serveurs Web depuis 1994 et proposé gratuitement par des centaines de services de raccourcissement d'URL.
Ătant donnĂ© le peu de choses que ces formats font pour vous, lorsque vous en choisissez un, vous prendrez probablement en compte des facteurs tels que le coĂ»t, le risque et l'ouverture.Â
En quoi les ARK diffĂšrent-ils des identifiants tels que les DOI, les Handle, les PURL et les URNÂ ?
La réponse courte
Les ARK sont les seuls identifiants standards, non cloisonnés et non payants que vous pouvez enregistrer et utiliser en environ 48 heures. Les DOI, les Handle et les PURL nécessitent une résolution et d'autres services exigés par leurs systÚmes centralisés respectifs (« silos »).
Cela ne veut pas dire que la permanence est gratuite. Rendre un identifiant pĂ©renne, en tant que fournisseur, vous impose des coĂ»ts de gestion, dâhĂ©bergement, de surveillance et de redirection. Vous pouvez faire ces choses vous-mĂȘme ou avec l'aide d'un prestataire. Mais avec les ARK, comme avec les URL, vos identifiants ne vous seront pas facturĂ©s individuellement et vous ne serez pas enfermĂ©s dans un silo nâacceptant quâun type de rĂ©solution spĂ©cifique et qui refuse donc les autres identifiants.
Les ARK ont la particularitĂ© d'ĂȘtre dĂ©centralisĂ©s. Bien que lâon puisse obtenir des services de rĂ©solution d'un rĂ©solveur ARK global appelĂ© n2t.net, plus de 90% des ARK dans le monde ne lâutilisent pas comme rĂ©solveur. Plus de 600 organisations enregistrĂ©es Ă travers le monde ont créé par elles-mĂȘmes environ 3,2 milliards dâARK et, Ă l'instar des URL, personne n'a jamais payĂ© de frais pour les crĂ©er. Bien sĂ»r, les maintenir n'est pas gratuit. Conserver lâaccĂšs au contenu de maniĂšre pĂ©renne sur le long terme, quel que soit le type dâidentifiant, nâest jamais gratuit.
Dâautres diffĂ©rences entre ARK, DOI, Handle, PURL et URN
- ·Les pages d'accueil : les DOI de Crossref et DataCite aboutissent Ă des pages d'atterrissage conçues pour les Ă©diteurs, mais pas directement aux objets qui vous tiennent Ă cĆur. Les ARK peuvent en revanche aboutir directement aux objets qui vous tiennent Ă cĆur, ce qui est pratique Ă la fois pour les machines et pour les utilisateurs, car cela ne demande pas Ă lâhumain une Ă©tape supplĂ©mentaire de navigation pour des tĂąches courantes telles que
- ouvrir le fichier PDF d'un article en lecture,
- rĂ©fĂ©rencer un fichier image destinĂ© Ă ĂȘtre incorporĂ© automatiquement en ligne dans un document,
- ou citer un tableur Ă utiliser pour lâanalyse directe des donnĂ©es par logiciel.
- Les DOI, les Handle, etc., ne prennent pas en charge le mĂ©canisme dâinflexion dâARK permettant l'accĂšs aux mĂ©tadonnĂ©es, qu'un identifiant pointe sur un objet ou sur sa page dâaccueil.
- Contrairement aux DOI et aux Handle, les ARK nâont pas de mĂ©tadonnĂ©es obligatoires. Les ARK qui n'ont pas encore Ă©tĂ© publiĂ©s sont faciles Ă supprimer.
- Toute chose finira par disparaĂźtre, y compris les noms dâhĂŽte, le Web et le protocole https. Lorsque cette premiĂšre partie de l'identifiant cessera d'avoir une signification, seuls les ARK et les URN incluront un libellĂ© (par exemple, « ark: ») indiquant le type d'identifiant restant.
- Pour les DOI, les Handle et les PURL, vous devez utiliser leurs résolveurs respectifs. Les ARK et les URN vous permettent d'utiliser votre propre résolveur.
- Pour crĂ©er des DOI et des Handle, vous devez payer une cotisation et, pour les DOI, des frais par DOI dĂ©finis par les agences dâattribution. Il n'y a pas de frais pour les ARK, les PURL et les URN.
- Pour créer des Handle, vous devez installer et gérer un serveur Handle local, ce qui vous oblige à surveiller, mettre à jour et dépanner un autre systÚme.
- Bien que vous puissiez utiliser un résolveur local ou proposé par un prestataire pour vos ARK et vos URN, vous pouvez aussi les résoudre via le résolveur global n2t.net.
- L'infrastructure de rĂ©solution URN envisagĂ©e n'a jamais Ă©tĂ© construite. Par consĂ©quent, les URN sont actuellement rĂ©solus comme des URL et il n'y a pas de rĂ©solveur global et officiel dâURN en tant qu'URL. Pour vous inscrire afin de crĂ©er des URN, vous devez demander un espace de nom URN.
- Les ARK possĂšdent des fonctionnalitĂ©s uniques qui permettent dâattribuer un identifiant à des stades précoces de développement de l’objet : les ARK peuvent ĂȘtre supprimĂ©s, naĂźtre sans mĂ©tadonnĂ©es et exister avec toutes les mĂ©tadonnĂ©es que vous souhaitez stocker.
Mais si les ARK peuvent ĂȘtre supprimĂ©s, comment peut-on leur faire confiance ?
En rĂ©alitĂ©, cela rend les ARK plus fiables. La possibilitĂ© de supprimer est un Ă©lĂ©ment essentiel dâune saine gestion de collections. Les types d'identifiants autres quâARK interdisent la suppression, en partant du principe que les personnes, lorsquâelles sont invitĂ©es Ă intervenir, ne commettront pas d'erreur. Les personnes aux commandes d'un outil de gestion d'identifiants font rĂ©guliĂšrement dâune simple inadvertance humaine une erreur Ă grande Ă©chelle, mĂȘme au dĂ©but de leur engagement. En rendant la correction difficile, nous condamnons les systĂšmes Ă traĂźner ces bourdes pour lâĂ©ternitĂ©.
Bien quâils ne soient pas Ă lâabri de telles erreurs, les ARK ont le grand avantage de pouvoir ĂȘtre créés et supprimĂ©s dans lâombre, en dehors de toute publication, ou dâengagement de conservation.
Un objet peut-il avoir Ă la fois un ARK et un DOIÂ ?
Oui. Parfois, avoir deux identifiants est utile, bien que cela puisse devenir dĂ©routant quand cela se produit souvent. Beaucoup de gens commencent par attribuer des ARK Ă chaque Ă©lĂ©ment créé afin de disposer d'une rĂ©fĂ©rence stable dĂšs le dĂ©but, avant de savoir s'ils souhaitent le publier ni mĂȘme le conserver.
L'objet et ses mĂ©tadonnĂ©es Ă©voluent conjointement, et pour le sous-ensemble d'Ă©lĂ©ments que vous souhaitez publier dans des contextes nĂ©cessitant des DOI, vous pouvez en attribuer au moment de la publication. Si votre ARK est stable et contient des mĂ©tadonnĂ©es de base, vous faites dĂ©jĂ tout le nĂ©cessaire pour obtenir un bon DOI. Câest en cela que les ARK sont adaptĂ©s aux objets à un stade précoce de développement.
Pour gĂ©rer efficacement deux identifiants, il est recommandĂ© de crĂ©er le DOI de maniĂšre Ă ce qu'il redirige vers l'ARK d'origine. Cela Ă©limine non seulement la nĂ©cessitĂ© de mettre Ă jour la redirection DOI, mais maintient Ă©galement lâARK pĂ©renne pour tous ceux qui l'ont prĂ©cĂ©demment enregistrĂ© ou marquĂ© d'un signet.
Quand dois-je utiliser ARK plutĂŽt que DOI, Handle, PURL ou URNÂ ?
Il n'y a pas de réponse simple. La question des identifiants (non les choses, mais leurs noms) est complexe, alors si vous entendez des réponses simples ailleurs, méfiez-vous des erreurs courantes.
Aucune caractĂ©ristique dâARK, DOI, Handle, PURL ou URN ne les rend plus ou moins adaptĂ©s Ă une discipline, un domaine ou un secteur particuliers. Avec un rĂ©solveur d'identifiants et un systĂšme de gestion, ils fournissent tous le service essentiel : la rĂ©solution (tout comme des URL correctement gĂ©rĂ©es).
Certaines considĂ©rations spĂ©cifiques Ă un type d'identifiant s'expliquent parfois par le fait que la rĂ©solution et la gestion de ce type sont verrouillĂ©es par un prestataire ou un fournisseur de service donnĂ©s. Par exemple, de nombreuses fonctionnalitĂ©s et restrictions de PURL ou Handle sont dĂ©terminĂ©es par leurs silos dâadministration respectifs, de mĂȘme que celles des DOI, basĂ©s sur les Handle. En revanche les DOI ont des pratiques de mĂ©tadonnĂ©es variĂ©es et Ă©volutives d'une agence d'enregistrement Ă l'autre.
Les diffĂ©rences concrĂštes que nous remarquons, sur les mĂ©tadonnĂ©es, les pages dâaccueil et lâintĂ©gration dâoutils (par exemple, les outils de publication), ne sont pas des propriĂ©tĂ©s des formats dâidentifiants en soi, mais des propriĂ©tĂ©s de rĂ©solution, de gestion et de services de citation que divers fournisseurs Ă©tendent ou limitent. Ces services sont dĂ©finis Ă leur tour par les communautĂ©s dâutilisateurs et de clients. Les services de base reposent sur une base de donnĂ©es fiable contenant chaque identifiant, ainsi que des Ă©lĂ©ments de mĂ©tadonnĂ©es (crĂ©ateur, titre, date, URL de redirection, etc.) dĂ©crivant l'objet identifiĂ©. Les services supplĂ©mentaires incluent la vĂ©rification des liens, la dĂ©tection des doublons, la gĂ©nĂ©ration de rapports et la recherche.
Du berceau au tombeau
Quand dois-je créer des ARK dans mon processus de travail ?
Ă la naissance de l'objet, ou mĂȘme avant. Nous nommons gĂ©nĂ©ralement nos enfants avant leur naissance, et nous appelons et nous rĂ©fĂ©rons Ă des objets au stade de la conception, parfois longtemps avant qu'ils ne portent leurs fruits. Selon le niveau de prĂ©cision de vos prĂ©visions, vos objets Ă naĂźtre peuvent avoir des ARK fonctionnels qui fournissent un substitut appropriĂ© et renvoient des mĂ©tadonnĂ©es riches, y compris des dĂ©clarations de permanence.
La seule mise en garde consiste Ă ĂȘtre prudent lors de la publication dâARK dont les perspectives Ă long terme sont incertaines. Certains systĂšmes de gestion d'identifiant possĂšdent des fonctionnalitĂ©s permettant de gĂ©rer et de rĂ©soudre les identifiants non validĂ©s (par exemple, EZID dispose dâun statut « rĂ©servé »). Plus il y a de personnes qui connaissent un ARK, plus il est difficile de le supprimer.
Comment se fait-il que les ARK puissent ĂȘtre faciles Ă supprimer ?
Si personne dâautre que vous ne connaĂźt un identifiant, rien ne vous empĂȘche de le supprimer ou de le retirer. Pour schĂ©matiser, un identifiant est en rĂ©alitĂ© lâaffirmation qu'une chaĂźne de caractĂšres donnĂ©e est associĂ©e Ă une chose spĂ©cifique. Moins vous en parlez, plus il est facile de supprimer cette affirmation. Si vous crĂ©ez un URL et ne le partagez qu'avec vos collĂšgues les plus proches, il sera beaucoup plus facile de le retirer que sâil apparaissait pendant un mois sur un site Web public, Ă partir duquel il aurait Ă©tĂ© collectĂ© par les moteurs de recherche Internet. En revanche, il est difficile de supprimer les DOI et les Handle, car une fois enregistrĂ©s et rĂ©solus, ils sont effectivement diffusĂ©s dans le monde entier.
Les ARK se comportent comme des URL à cet égard. Les fournisseurs sont libres de créer et de partager des ARK de maniÚre restreinte, auquel cas ils sont faciles à supprimer.
Cela peut surprendre, mais mĂȘme sâils sont plus largement diffusĂ©s, les ARK peuvent ĂȘtre accompagnĂ©es de dĂ©clarations de permanence qui indiquent quel niveau dâengagement â Ă©levĂ© ou bas â on garantit. Les ARK ont Ă©tĂ© conçus pour disposer dâune palette de dĂ©clarations de permanence, mais celles-ci ne sont en aucun cas exhaustives pour des identifiants et des objets qui prĂ©sentent une grande variĂ©tĂ© de « saveurs » dâengagement. C'est pourquoi on parle des ARK comme dâidentifiants de haute performance adaptĂ©s Ă la permanence plutĂŽt que comme des « identifiants pĂ©rennes ».
Enfin, les gens commettent des erreurs. Des ARK, des DOI, des Handle, des PURL et des URN sont parfois diffusĂ©s par erreur et doivent ĂȘtre retirĂ©s. Lorsque cela se produit, la meilleure option du fournisseur consiste Ă rĂ©soudre l'identifiant retirĂ© en donnant accĂšs Ă une page « fantĂŽme » qui explique et Ă©ventuellement prĂ©sente des excuses pour le dĂ©sagrĂ©ment occasionnĂ©. Contrairement aux idĂ©es reçues, les identifiants pĂ©rennes nâoffrent aucune garantie.
Pourquoi dit-on que les ARK sont adaptés à des objets dans un stade précoce de développement ?
On a besoin d'identifiants avant de savoir exactement Ă quel objet ils se rĂ©fĂšrent, ou s'ils font rĂ©fĂ©rence Ă quelque chose qui mĂ©rite d'ĂȘtre gardĂ©. Un identifiant exigeant des mĂ©tadonnĂ©es abouties ne peut pas ĂȘtre créé au dĂ©but du dĂ©veloppement car l'objet est mal connu. Câest pourquoi les crĂ©ateurs d'objets attribuent presque toujours initialement des identifiants sans exigences de mĂ©tadonnĂ©es, tels que des URL ou des ARK.
En commençant par attribuer un ARK, vous bĂ©nĂ©ficiez de la possibilitĂ© de conserver l'identifiant d'origine de la naissance Ă la diffusion publique alors que l'objet et ses mĂ©tadonnĂ©es Ă©voluent. De nombreux objets passent par des phases de dĂ©veloppement et de correction intensives, durant parfois plusieurs annĂ©es, au cours desquelles ils sont trop immatures pour rĂ©pondre Ă la plupart des exigences en matiĂšre de mĂ©tadonnĂ©es. NĂ©anmoins, chaque objet a besoin dâune sorte dâidentifiant, de la conception Ă la maturitĂ©, cette derniĂšre consistant en une publication et en une amĂ©lioration, ou en un abandon. Il est facile dâabandonner des ARK qui nâont pas Ă©tĂ© dĂ©voilĂ©s au public.
Comme l'objet lui-mĂȘme, les Ă©lĂ©ments de mĂ©tadonnĂ©es ont besoin de flexibilitĂ© pour se dĂ©velopper et Ă©voluer avec le temps :
- Au moment de la prévision ; il suffit alors d'un identifiant,
- à la naissance, lorsque sa premiÚre représentation numérique nécessite une URL de redirection,
- aprĂšs la premiĂšre analyse, lorsque son sens et un titre provisoire apparaissent,
- lors de la création de dizaines d'éléments de métadonnées spécifiques à une discipline qui contreviennent à la plupart des normes de métadonnées, à l'exception de la vÎtre,
- pendant le post-traitement par un collÚgue dont vous allez ajouter le nom en tant que contributeur supplémentaire,
- lorsque les premiĂšres rĂ©actions basĂ©es sur l'identifiant tweetĂ© sâavĂšrent ĂȘtre des observations fondamentales de la part dâun nouveau contributeur,
- et ainsi de suite jusqu'à l'archivage, l'abandon, la diffusion publique, la correction, la révision, l'amélioration, etc.
Contrairement aux DOI Crossref et DataCite, qui nĂ©cessitent des mĂ©tadonnĂ©es spĂ©cifiques (voir, par exemple, le schĂ©ma DataCite), les ARK nâexercent aucune contrainte sur ces activitĂ©s. Mieux encore, le rĂ©solveur N2T.net permet effectivement de les prendre toutes en compte.
Si les ARK ne les exigent pas, pourquoi se donner la peine de créer des métadonnées ?
La création de métadonnées (informations supplémentaires associées à ou décrivant un objet) présente plusieurs avantages essentiels. PremiÚrement, quelle que soit la cible de l'ARK - une page d'accueil ou un fichier - les métadonnées fournissent aux utilisateurs des informations essentielles sur l'objet, telles que des références à des versions plus récentes, une date de création, une provenance, etc. Dans le cas des ARK, les métadonnées sont généralement accessibles via des inflexions.
Les mĂ©tadonnĂ©es facilitent vraiment l'utilisation d'identifiants opaques, qui ne rĂ©vĂšlent aucun indice sur ce qu'ils identifient. En l'absence de mĂ©tadonnĂ©es, vous ĂȘtes obligĂ© d'accĂ©der Ă l'objet lui-mĂȘme pour vous rappeler de quoi il s'agit et Ă©galement pour vous assurer que vous accĂ©dez au bon objet. De plus, la divergence entre les mĂ©tadonnĂ©es renvoyĂ©es et l'objet consultĂ© aide tout le monde Ă dĂ©tecter des modifications ou des erreurs d'identification.
Les mĂ©tadonnĂ©es sont adaptĂ©es aux objets aboutis et sont beaucoup moins importantes pour les objets et les identifiants immatures que pour ceux qui ont Ă©tĂ© publiĂ©s. Avoir des mĂ©tadonnĂ©es dĂ©montre la crĂ©dibilitĂ© du fournisseur et son engagement vis-Ă -vis dâidentifiants de haute performance. Tous les fournisseurs ne sont pas Ă la hauteur de cette tĂąche.
Cela n'est pas nĂ©cessairement cher. Les mĂ©tadonnĂ©es créées Ă partir de zĂ©ro peuvent ĂȘtre coĂ»teuses, mais elles sont gĂ©nĂ©ralement produites et gĂ©rĂ©es par des fournisseurs d'objets, auquel cas elles peuvent ĂȘtre exploitĂ©es efficacement pour les identifiants. IdĂ©alement, pour une permanence maximale, les mĂ©tadonnĂ©es principales (gĂ©rĂ©es par les fournisseurs d'objet) devraient ĂȘtre rĂ©pliquĂ©es dans des systĂšmes indĂ©pendants afin qu'il soit difficile pour une personne d'altĂ©rer de maniĂšre indĂ©tectable les associations d'identifiants. Par exemple, les entrepĂŽts d'objets numĂ©riques qui obtiennent des ARK et des DOI du service EZID stockent une copie de leurs mĂ©tadonnĂ©es dans EZID, qui en stocke une autre copie dans le rĂ©solveur N2T.net.
Quelles métadonnées sont recommandées pour les ARK ?
La question des mĂ©tadonnĂ©es est complexe pour tous les identifiants, pas seulement pour ARK. Il existe des milliers de normes selon les domaines et les types dâobjets, la plupart dâentre elles se recoupant tout en se contredisant, et chacune dâelles est appliquĂ©e conformĂ©ment aux pratiques locales de lâorganisation avec diffĂ©rents niveaux de conformitĂ©. Le choix ou la crĂ©ation d'une spĂ©cification pour vos mĂ©tadonnĂ©es dĂ©pend de facteurs tels que
- si vous gérez actuellement des métadonnées (astuce : gardez-les, sauf si vous avez une bonne raison de changer),
- si vous souhaitez publier officiellement des objets (astuce : prĂ©parez-vous Ă fournir l'auteur, le titre, la date, l'Ă©diteur / lâinstitution de conservation et le type d'objet),
- les exigences et les capacités de votre résolveur (astuce : votre personnel informatique ou votre prestataire pourrait avoir ses propres exigences),
- ou si vous souhaitez stocker des éléments de métadonnées non standard (astuce : N2T le permet, contrairement à la plupart des standards et des fournisseurs).
Une interopérabilité fiable entre domaines peut s'avérer difficile, mais Dublin Core, DataCite, Schema.org et Dublin Kernel sont des spécifications de métadonnées standard à envisager pour une utilisation conjointe avec ARK.
Pourquoi est-ce que je vois des mĂ©tadonnĂ©es ARK avec les termes « qui », « quoi », « quand », « oĂč » ?
 Les ARK ont Ă©tĂ© conçus pour identifier n'importe quoi, pas seulement des choses qui sont, par exemple, publiables ou achetables. Il nâest pas naturel de modĂ©liser un fossile, un Ă©chantillon de tissu, un terme de vocabulaire ou Marie Curie comme si chacun avait un auteur, un titre, un Ă©diteur, un copyright et un prix. Au lieu de quoi, depuis 2001, un ARK est gĂ©nĂ©ralement accompagnĂ© dâun noyau de mĂ©tadonnĂ©es gĂ©nĂ©riques de quatre Ă©lĂ©ments (Dublin Kernel, inspirĂ© de Dublin Core (DC)), suivi de tout autre Ă©lĂ©ment de mĂ©tadonnĂ©e (paire attribut / valeur) que le fournisseur souhaite donner. Ce noyau de mĂ©tadonnĂ©es est structurĂ© pour rĂ©pondre aux questions suivantes : « qui ? », « quoi ? », « quand ? » et « oĂč ? » sur l'expression ou le « rĂ©cit » d'un objet :
- qui l'a « dit » (semblable aux Ă©lĂ©ments DC CrĂ©ateur, Contributeur et Ăditeur, mais Ă©galement Ă inventeur, dĂ©couvreur, rĂ©alisateur, etc.),
- comment s'appelle le « dit » (semblable Ă lâĂ©lĂ©ment DC Titre, mais aussi Ă NumĂ©roDEchantillon, CodeBarreObjet, etc.),
- quand il a Ă©tĂ© « dit » (similaire Ă lâĂ©lĂ©ment DC Date, mais inclut les intervalles de dates, les dates approximative et celles avant lâĂšre chrĂ©tienne),
- oĂč le « dit » peut ĂȘtre trouvĂ© (similaire Ă lâĂ©lĂ©ment DC Identifiant, mais gĂ©nĂ©ralement inutile car il s'agit de l'ARK lui-mĂȘme).
Il y a beaucoup Ă dire sur les mĂ©tadonnĂ©es et ARK (par exemple, sur lâapplication des Ă©lĂ©ments « qui », « quoi », « quand » et « oĂč » au contenu d'une biographie, ou comment une institution de conservation prĂ©voit de maintenir un jeu de donnĂ©es). Des recommandations supplĂ©mentaires sur les mĂ©tadonnĂ©es et ARK seront disponibles sur arks.org. D'autres Ă©lĂ©ments sont essentiels, tels que
- comment il a été « dit » (similaire à un élément ResourceType), ce qui peut déterminer des alignements avec des spécifications de métadonnées externes et des éléments supplémentaires
- URL cible de la redirection, généralement stockée en tant qu'élément distinct des métadonnées
- éléments de déclaration de permanence, pour exprimer le niveau d'un engagement de conservation.
Qu'est-ce qu'une « inflexion » et en quoi diffÚre-t-elle de la « négociation de contenu » ?
Une inflexion est une dĂ©sinence Ă la fin d'un mot qui exprime un changement de sens. Cela permet de dĂ©finir un mot tel que « aller » sans dĂ©finir Ă©galement « allez » et « allons ». Pour un ARK qui mĂšne Ă un objet, ajouter simplement un « ? » Ă la fin (« ? » est un exemple d'inflexion ARK) nous permet de demander des mĂ©tadonnĂ©es sans avoir Ă dĂ©finir un identifiant distinct pour les mĂ©tadonnĂ©es de l'objet. Cette technique simple peut ĂȘtre utilisĂ©e par un humain avec un navigateur Web. Le rĂ©solveur N2T prend en charge les inflexions et la nĂ©gociation de contenu.
La nĂ©gociation de contenu pour les mĂ©tadonnĂ©es est une technique logicielle permettant de demander d'autres formats d'objet, tels que le format PDF ou RTF d'un fichier HTML. Bien que cela nâait pas Ă©tĂ© conçu pour cela, la « nĂ©gociation de contenu » originelle Ă©tait dĂ©tournĂ©e dans certains cas pour demander des mĂ©tadonnĂ©es, en considĂ©rant curieusement que les formats de fichier souvent utilisĂ©s pour exprimer des mĂ©tadonnĂ©es ne pouvaient vĂ©hiculer que des mĂ©tadonnĂ©es et jamais des objets Ă part entiĂšre. Contrairement aux inflexions, la « nĂ©gociation de contenu pour les mĂ©tadonnĂ©es » ne fonctionne pas du tout pour les objets reprĂ©sentĂ©s dans ces formats (formats dont la liste ne cesse de s'allonger et n'est connue que par convention tacite) et n'est pas assez simple dâutilisation pour la plupart des usagers humains.
Bien que les inflexions soient gĂ©nĂ©ralement associĂ©es aux ARK, elles ne leur sont pas rĂ©servĂ©es. Contrairement aux idĂ©es reçues, les identifiants ne font rien ; ce sont leurs rĂ©solveurs qui gĂšrent ou non des fonctionnalitĂ©s. Ainsi, par exemple, les inflexions et le « transfert de suffixe » sont pris en charge par n2t.net pour tous les types dâidentifiants, mais pas par doi.org ni par handle.net (qui dispose dâune fonctionnalitĂ© similaire appelĂ©e « Template Handles ») pour aucun type dâidentifiant.
Qu'entendez-vous par « silos » ?
En rĂšgle gĂ©nĂ©rale, les services basĂ©s sur des formats dâidentifiant sont conçus comme des silos, ou des plates-formes fermĂ©es, gĂ©rant un type d'identifiant particulier tel que Handle, DOI ou PURL. Chaque silo remplit les mĂȘmes fonctions principales - associer des noms (chaĂźnes de caractĂšres d'identifiant) Ă des choses (objets ou mĂ©tadonnĂ©es). L'exclusion de tous les types d'identifiant, sauf un, peut aider Ă conquĂ©rir des marchĂ©s, mais elle est contre-productive et exclusive. Elle nĂ©cessite la reconstruction du mĂȘme ensemble de services pour chaque format et viole les principes de base de lâouverture.
Ă lâinverse, le rĂ©solveur N2T (Name-to-Thing) et l'interface de gestion EZID (« identifiants simples ») ont Ă©tĂ© conçus pour gĂ©rer tout identifiant. Les efforts consacrĂ©s Ă toute nouvelle fonctionnalitĂ© peuvent ĂȘtre Ă©tendus avec profit Ă tous les types, ce qui permet une surprenante flexibilitĂ©. Par exemple, les ARK sont souvent stockĂ©s dans EZID avec des mĂ©tadonnĂ©es DOI, et chaque DOI stockĂ© dans N2T peut bĂ©nĂ©ficier des fonctionnalitĂ©s de rĂ©solution ARK telles que les inflexions et le « transfert de suffixe », qui ne sont pas disponibles via le rĂ©solveur DOI principal (doi.org).Â