) following selected items. Click a blue dot to add your comment regarding that item. A glasses icon (
) indicates existing comments on an item; click it to see them. Click the buttons above to navigate between views.
Add a general comment
Les évolutions marquantes de ces dernières années concernent
d’une part les besoins des différents acteurs intervenant dans le cadre des
SIDs vis-à-vis des dispositifs d’information documentaire, et d’autre part les
ressources à traiter elles-mêmes (multiplication
des objets numériques, des métadonnées, structuration de ces ressources,
multimédia…). Ces évolutions ont un impact important sur les dispositifs
eux-mêmes et sur les exigences en termes d’interopérabilité, aussi bien entre
systèmes techniques qu’entre contenus ou vocabulaires utilisés. Cette situation
étend considérablement le champ
d’application de la standardisation nécessaire aux activités liées à la mise à
disposition d’informations. Dans ce contexte, les professionnels de l’infodoc
ne peuvent plus limiter leur « boîte à outils » aux normes
strictement issues de leurs propres secteurs. Des normes déployées dans
d’autres environnements nous sont également utiles.
1
Nous pouvons citer plus particulièrement les normes des
domaines de l’informatique ou de l’édition qui rejoignent assez directement les
problématiques du numérique pour l’informatique ou du document numérique pour
l’édition. Mais il est également important de prendre en compte des normes métiers mises en place par des communautés professionnelles
(formation, géographie, terminologie,
photos ou vidéos, mathématiques, chimie, commerce, sociologie, …), en
tenant compte des besoins et règles spécifiques à chacun des métiers. Et force est de constater que l’articulation
entre standards métiers associés aux activités qui produisent l’information, et standards issus
des secteurs de l’infodoc qui gèrent en aval les informations produites, est
difficile à penser pour beaucoup de professionnels, et que le continuum cher
aux records managers est encore devant nous.
2
Complémentairement à cet élargissement sectoriel, les règles
régissant le développement du Web et de l’Internet, nous imposent d’étendre le
champ normatif aux recommandations, standards[1]
ou spécifications, élaborés par d’autres organismes que ceux à vocation
normative traditionnelle comme l’ISO ou l’Afnor. Nous pouvons citer le W3C (Consortium du WWW), OASIS (Organization for the
Advancement of Structured Information Standards) ou encore l’IETF (Internet Engineering Task Force)[2].
3
Les recommandations, standards ou normes présentés dans ce
document traitent, à l’heure où ce document est produit, de spécifications
techniques publiques et sans restriction d’accès ou de mise en œuvre
(ouvertes), bien qu’il soit parfois difficile de définir ce critère pour
certains de ces standards.
4
> Le terme document
est pris ici comme objet porteur d’information quel que soit le contexte de
production et d’usage, ou la nature de l’information. C’est dans ce contexte
très large que se définit un document XML. Ce peut dont être un livre ou un
article, mais également une feuille de calcul de la comptabilité d’un mois, une
transaction d’achat, un répertoire d'adresses, une bibliothèque de ressources
pédagogiques sur une plateforme de e-learning, des messages de fil d’agences de
presse, un ensemble de recettes de cuisine, la description d’un génotype, une
banque de données terminologiques, un formulaire d’abonnement, le manuel
d’utilisation d’une machine, une fiche des paramètres de configuration d’un
produit, une émission de télévision, des documents techniques, etc. Tous ces objets d’information sont
considérés comme des documents numériques, traités selon le formalisme et les
standards du XML. La signification du terme document dépasse donc largement celle qui prévaut dans le
monde de l’infodoc, et il faut toujours garder à l’esprit que certaines
méthodes ou règles visent ces différents types d’objets et concernent de
multiples usages qui vont de la production à leur utilisation finale en passant
par des usages de gestion et de préservation.
5
> Le terme « ressource »
désigne dans le monde de l’Internet, tout ce qui a une identité et peut être
caractérisé en vue d’être manipulé par un système informatique.
6
> Proche fonctionnellement des « champs d’une
notice » en ce qu’elle fournissent des informations sur les documents
qu’elles représentent (des « données sur des données »), les métadonnées ont des caractéristiques propres
qui élargit considérablement leur périmètre : sur les contours de chacun
de ces éléments de données, mais également sur leur description ainsi que les
méthodes et formalisation de leur encodage. Elles doivent être
« comprises « par une machine et non uniquement par des humains
ce qui impose une rigueur et un formalisme poussés.
7
Les métadonnées traitées par lots (set) structurés sont
utilisées pour décrire, identifier, gérer, retrouver… des ressources.
8
> Nous parlerons fréquemment d’éléments
de données.
Ce sont des unités de données considérées comme indivisibles, et dont les
attributs et la représentation sont précisés dans les spécifications.
Métadonnées et éléments de données sont souvent pris l’un pour l’autre. Mais si
la notion de métadonnée fait référence à la ressource représentée, l’élément de
données fait plutôt référence aux règles de formalisation informatique.
9
> Un langage est un système de représentation composé
de signes et de règles ou conventions. Cette définition s’applique aux langages
humains ou informatiques. Un métalangage est un langage qui permet de définir et
caractériser d’autres langages. Il précise « comment faire » (comment
structurer un document, comment définir et rédiger des métadonnées…) mais ilS ne donne pas de règles pour
tel ou tel usage précis. Ces normes n’interfèrent pas en elles-mêmes sur la
signification des contenus, ce qui leur confère ce statut générique. Elles sont
donc utilisables quel que soit le secteur concerné et/ou l’application développée.
Par exemple, le métalangage XML est utilisable pour tout document numérique,
que celui-ci représente un génome, un système d’information géographique ou un
ouvrage. Mais ces métalangages ne sont pas directement exploitables pour
représenter telle ou telle type de ressource.
10
> Nous utiliserons le terme de « schéma » pour qualifier les spécifications qui
décrivent et structure une ressource numérique XML quelle qu’elle soit : objets
pédagogiques, objets de musée, actualités, facture, génome,…. Nous pouvons
distinguer trois familles de schémas
:
11
·
celles qui portent sur la description et la
structure de métadonnées
12
·
celles qui portent sur la description et la
structure de documents
13
·
celles qui portent sur les échanges entre systèmes (recherche, prêt, achat…)
14
La distinction que nous faisons entre les deux premiers axes
de spécifications (structure de métadonnées et structure de documents) nous
semble importante dans notre environnement professionnel où la prédominance de
la notice bibliographique et du catalogue (sous-entendu catalogue de notices et
non de documents) nous font oublier bien souvent le document lui-même. Dans le
domaine de l’Internet, ce découpage n’a pas de sens, une notice pouvant
constituer un document XML.
15
Sur le plan technique, il existe plusieurs familles de
schémas de documents numériques XML que nous ne préciserons pas dans cette
note.
16
La DTD (définition de
type de document) précise la structure d'un document numérique, son
arborescence (ordre et imbrication). Elle fournit les caractéristiques propres
à chacun des éléments de données qui la composent. Ce principe est fortement
étendu avec la recommandation W3C Schéma XML, plus récente et qui
incorpore plus d’informations contraignantes sur les éléments de données et les
règles (en particulier le lieu où l’on peut trouver en permanence la
documentation sur chacun des éléments). Relax-NG développé au sein
d’Oasis est un autre langage de description de documents XML, normalisé (ISO
19757-2:2003) et dont le formalisme est différent de celui proposé par Schéma
XML.
17
> Le terme de profil
d’application est utilisé pour désigner un schéma
applicatif issu d’un schéma plus général. Ainsi la proposition LOM-Fr portant
sur l’adaptation française du LOM, schéma général de description de ressources
pédagogiques.
18
> Certaines spécifications portent sur des protocoles d’échange :
elles concernent non les documents
eux-mêmes mais les relations d’échange et d’actions entre systèmes.
19
> Certaines normes ou standards ne visent pas précisément
à représenter de façon formelle des ressources pour être exploiter dans
systèmes informatique. On parle alors plus de modèle,
de modèle de référence ou encore de cadre ou d’infrastructure de référence plutôt
que de schéma. Ces modèles ne sont pas « xmlisés » et ne peuvent être
mis en œuvre immédiatement sans un travail supplémentaire de
« traduction » selon les recommandations XML. Ces 20 années de
développement des documents numériques (structuration, langage de description,
interopérabilité) ont créé un cadre dynamique de réflexion au sein des
communautés professionnelles ou entre communautés proches. C’est dans ce
contexte que d’importants travaux de conceptualisation et de modélisation ont
été et sont encore réalisés. Les modèles de référence qui en découlent ne sont
pas toujours normalisés, et leurs usages restent encore peu étendus bien que
reconnus pour leur intérêt dans le contexte des documents numériques. Il nous a
paru important d’intégrer les spécifications les plus utilisées dans nos
secteurs[3].
20
En conclusion
21
La liste présentée ici ne couvre qu’une partie de
l’existant, l’orientation prise de filtrage suivant les besoins d’un secteur
professionnel ayant réduit cet inventaire[4].
Et pourtant, on ne peut ignorer ce sentiment de foisonnement et de recouvrement
que suscite la lecture de cet inventaire qui comporte 42 entrées. Peut-être
arrive-t-on à une étape où « un moratoire sur les métadonnées »[5]
serait nécessaire avant que cette profusion ne nuise justement aux objectifs
premiers du déploiement de ces outils à savoir l’interopérabilité entre
systèmes et l’accès à l’information ?
22
[1] Dans cette
note, nous emploierons le terme général de norme quel que soit le statut de la
spécification proposée, et préciserons le statut de chacune dans le chapitre
qui leur est consacré.
23
[2] Cet
organisme produit les RFC - request for comment - qui ont valeur de standards
pour l’Internet. Les RFC qui ont été normalisées ISO, continuent à se dénommer
RFC.
24
[3] Les schémas exposés dans le Chapitre 3 peuvent aussi
être étudiés sur le plan de la conceptualisation et de la modélisation des
objets qu’ils traitent.
25