top bar
QuickTopic free message boards logo

The document below has a numbered blue "comment dot" () following selected items. Click a blue dot to add your comment regarding that item. A glasses icon () indicates existing comments on an item; click it to see them. Click the buttons above to navigate between views.

You can add a general comment here:
 View general commentsAdd a general commentAdd a general comment
Show comments in-line

Introduction

Contexte des travaux

Les évolutions marquantes de ces dernières années concernent d’une part les besoins des différents acteurs intervenant dans le cadre des SIDs vis-à-vis des dispositifs d’information documentaire, et d’autre part les ressources à traiter elles-mêmes (multiplication des objets numériques, des métadonnées, structuration de ces ressources, multimédia…). Ces évolutions ont un impact important sur les dispositifs eux-mêmes et sur les exigences en termes d’interopérabilité, aussi bien entre systèmes techniques qu’entre contenus ou vocabulaires utilisés. Cette situation étend considérablement le champ d’application de la standardisation nécessaire aux activités liées à la mise à disposition d’informations. Dans ce contexte, les professionnels de l’infodoc ne peuvent plus limiter leur « boîte à outils » aux normes strictement issues de leurs propres secteurs. Des normes déployées dans d’autres environnements nous sont également utiles.View comments on this item Add your comment on this item1

Nous pouvons citer plus particulièrement les normes des domaines de l’informatique ou de l’édition qui rejoignent assez directement les problématiques du numérique pour l’informatique ou du document numérique pour l’édition. Mais il est également important de prendre en compte des normes métiers mises en place par des communautés professionnelles (formation, géographie, terminologie, photos ou vidéos, mathématiques, chimie, commerce, sociologie, …), en tenant compte des besoins et règles spécifiques à chacun des métiers. Et force est de constater que l’articulation entre standards métiers associés aux activités qui produisent l’information, et standards issus des secteurs de l’infodoc qui gèrent en aval les informations produites, est difficile à penser pour beaucoup de professionnels, et que le continuum cher aux records managers est encore devant nous. Add your comment on this item2

Complémentairement à cet élargissement sectoriel, les règles régissant le développement du Web et de l’Internet, nous imposent d’étendre le champ normatif aux recommandations, standards[1] ou spécifications, élaborés par d’autres organismes que ceux à vocation normative traditionnelle comme l’ISO ou l’Afnor. Nous pouvons citer le W3C (Consortium du WWW), OASIS (Organization for the Advancement of Structured Information Standards) ou encore l’IETF (Internet Engineering Task Force)[2]. View comments on this item Add your comment on this item3

Les recommandations, standards ou normes présentés dans ce document traitent, à l’heure où ce document est produit, de spécifications techniques publiques et sans restriction d’accès ou de mise en œuvre (ouvertes), bien qu’il soit parfois difficile de définir ce critère pour certains de ces standards. View comments on this item Add your comment on this item4

Précisions terminologiques

 

> Le terme document est pris ici comme objet porteur d’information quel que soit le contexte de production et d’usage, ou la nature de l’information. C’est dans ce contexte très large que se définit un document XML. Ce peut dont être un livre ou un article, mais également une feuille de calcul de la comptabilité d’un mois, une transaction d’achat, un répertoire d'adresses, une bibliothèque de ressources pédagogiques sur une plateforme de e-learning, des messages de fil d’agences de presse, un ensemble de recettes de cuisine, la description d’un génotype, une banque de données terminologiques, un formulaire d’abonnement, le manuel d’utilisation d’une machine, une fiche des paramètres de configuration d’un produit, une émission de télévision, des documents techniques, etc. Tous ces objets d’information sont considérés comme des documents numériques, traités selon le formalisme et les standards du XML. La signification du terme document dépasse donc largement celle qui prévaut dans le monde de l’infodoc, et il faut toujours garder à l’esprit que certaines méthodes ou règles visent ces différents types d’objets et concernent de multiples usages qui vont de la production à leur utilisation finale en passant par des usages de gestion et de préservation. Add your comment on this item5

 

> Le terme « ressource » désigne dans le monde de l’Internet, tout ce qui a une identité et peut être caractérisé en vue d’être manipulé par un système informatique.  Add your comment on this item6

 

> Proche fonctionnellement des « champs d’une notice » en ce qu’elle fournissent des informations sur les documents qu’elles représentent (des « données sur des données »), les métadonnées ont des caractéristiques propres qui élargit considérablement leur périmètre : sur les contours de chacun de ces éléments de données, mais également sur leur description ainsi que les méthodes et formalisation de leur encodage. Elles doivent être « comprises «  par une machine et non uniquement par des humains ce qui impose une rigueur et un formalisme poussés. Add your comment on this item7

Les métadonnées traitées par lots (set) structurés sont utilisées pour décrire, identifier, gérer, retrouver… des ressources. Add your comment on this item8

 

> Nous parlerons fréquemment d’éléments de données. Ce sont des unités de données considérées comme indivisibles, et dont les attributs et la représentation sont précisés dans les spécifications. Métadonnées et éléments de données sont souvent pris l’un pour l’autre. Mais si la notion de métadonnée fait référence à la ressource représentée, l’élément de données fait plutôt référence aux règles de formalisation informatique.  Add your comment on this item9

 

> Un langage est un système de représentation composé de signes et de règles ou conventions. Cette définition s’applique aux langages humains ou informatiques. Un métalangage est un langage qui permet de définir et caractériser d’autres langages. Il précise « comment faire » (comment structurer un document, comment définir et rédiger des métadonnées…) mais ilS ne donne pas de règles pour tel ou tel usage précis. Ces normes n’interfèrent pas en elles-mêmes sur la signification des contenus, ce qui leur confère ce statut générique. Elles sont donc utilisables quel que soit le secteur concerné et/ou l’application développée. Par exemple, le métalangage XML est utilisable pour tout document numérique, que celui-ci représente un génome, un système d’information géographique ou un ouvrage. Mais ces métalangages ne sont pas directement exploitables pour représenter telle ou telle type de ressource.  Add your comment on this item10

 

> Nous utiliserons le terme de « schéma » pour qualifier les spécifications qui décrivent et structure une ressource numérique XML quelle qu’elle soit : objets pédagogiques, objets de musée, actualités, facture, génome,…. Nous pouvons distinguer trois familles de schémas  :  Add your comment on this item11

·     celles qui portent sur la description et la structure de métadonnées Add your comment on this item12

·     celles qui portent sur la description et la structure de documents  Add your comment on this item13

·     celles qui portent sur les échanges entre systèmes (recherche, prêt, achat…) Add your comment on this item14

La distinction que nous faisons entre les deux premiers axes de spécifications (structure de métadonnées et structure de documents) nous semble importante dans notre environnement professionnel où la prédominance de la notice bibliographique et du catalogue (sous-entendu catalogue de notices et non de documents) nous font oublier bien souvent le document lui-même. Dans le domaine de l’Internet, ce découpage n’a pas de sens, une notice pouvant constituer un document XML.  Add your comment on this item15

Sur le plan technique, il existe plusieurs familles de schémas de documents numériques XML que nous ne préciserons pas dans cette note. Add your comment on this item16

La DTD (définition de type de document) précise la structure d'un document numérique, son arborescence (ordre et imbrication). Elle fournit les caractéristiques propres à chacun des éléments de données qui la composent. Ce principe est fortement étendu avec la recommandation W3C Schéma XML, plus récente et qui incorpore plus d’informations contraignantes sur les éléments de données et les règles (en particulier le lieu où l’on peut trouver en permanence la documentation sur chacun des éléments). Relax-NG développé au sein d’Oasis est un autre langage de description de documents XML, normalisé (ISO 19757-2:2003) et dont le formalisme est différent de celui proposé par Schéma XML. Add your comment on this item17

 

> Le terme de profil d’application est utilisé pour désigner un schéma applicatif issu d’un schéma plus général. Ainsi la proposition LOM-Fr portant sur l’adaptation française du LOM, schéma général de description de ressources pédagogiques. Add your comment on this item18

 

> Certaines spécifications portent sur des protocoles d’échange : elles concernent non les documents eux-mêmes mais les relations d’échange et d’actions entre systèmes.  Add your comment on this item19

 

> Certaines normes ou standards ne visent pas précisément à représenter de façon formelle des ressources pour être exploiter dans systèmes informatique. On parle alors plus de modèle, de modèle de référence ou encore de cadre ou d’infrastructure de référence plutôt que de schéma. Ces modèles ne sont pas « xmlisés » et ne peuvent être mis en œuvre immédiatement sans un travail supplémentaire de « traduction » selon les recommandations XML. Ces 20 années de développement des documents numériques (structuration, langage de description, interopérabilité) ont créé un cadre dynamique de réflexion au sein des communautés professionnelles ou entre communautés proches. C’est dans ce contexte que d’importants travaux de conceptualisation et de modélisation ont été et sont encore réalisés. Les modèles de référence qui en découlent ne sont pas toujours normalisés, et leurs usages restent encore peu étendus bien que reconnus pour leur intérêt dans le contexte des documents numériques. Il nous a paru important d’intégrer les spécifications les plus utilisées dans nos secteurs[3]. Add your comment on this item20

 

En conclusion Add your comment on this item21

La liste présentée ici ne couvre qu’une partie de l’existant, l’orientation prise de filtrage suivant les besoins d’un secteur professionnel ayant réduit cet inventaire[4]. Et pourtant, on ne peut ignorer ce sentiment de foisonnement et de recouvrement que suscite la lecture de cet inventaire qui comporte 42 entrées. Peut-être arrive-t-on à une étape où « un moratoire sur les métadonnées »[5] serait nécessaire avant que cette profusion ne nuise justement aux objectifs premiers du déploiement de ces outils à savoir l’interopérabilité entre systèmes et l’accès à l’information ?  Add your comment on this item22

 



[1] Dans cette note, nous emploierons le terme général de norme quel que soit le statut de la spécification proposée, et préciserons le statut de chacune dans le chapitre qui leur est consacré. Add your comment on this item23

[2] Cet organisme produit les RFC - request for comment - qui ont valeur de standards pour l’Internet. Les RFC qui ont été normalisées ISO, continuent à se dénommer RFC. Add your comment on this item24

[3] Les schémas exposés dans le Chapitre 3 peuvent aussi être étudiés sur le plan de la conceptualisation et de la modélisation des objets qu’ils traitent.  Add your comment on this item25

[4] Nous avons hésité à intégrer des schémas comme ceux des calendriers (iCalender – RFC2445) ou des données personnelles (vCard) déjà implémentés dans de nombreux outils bureautiques. Add your comment on this item26

[5] Is it time for a moratorium on metadata ? Dicl Bulterman, http://www.cndwebzine.hcp.ma/IMG/pdf/promo1.pdf Add your comment on this item27