Enregistrer un vocabulaire normalisé
vocabulaire contrôlé ou thésaurus
Cette page est une initiation aux questions concernant l'enregistrement d'un vocabulaire normalisé ; présentation réalisée par simplification de la page de la
Bibliothèque nationale du Canada (Ottawa)
Enregistrer un vocabulaire normalisé.
Elle n'a qu'un but informatif : certains éléments pourraient être encore simplifiés ou d'autres ajoutés.
L'accent est mis sur la métadonnée
dc.subject, mais cela n'importe pas sur le fond.
- Le respect effectif des vocabulaires normalisés ainsi que leur maintenance supposent qu'ils soient le moins nombreux possibles tout en répondant aux besoins.
- Cette exigence et le poids de la responsabilité de la maintenance du vocabulaire enregistré exigent que l'organisme qui en prend l'initiative présente des garanties de stabilité et de représentativité de son secteur d'activité. Cette initiative doit donc être l'objet et le résultat d'un consensus dudit secteur.
- Nota Bene : Ce qui suit n'est qu'une simplification de la page originale à quelques retouches près. --HerveTigier Mars 2004
On peut enregistrer des vocabulaires contrôlés et des thésaurus.
- Un vocabulaire contrôlé est une liste établie de termes normalisés à utiliser dans l'indexation et la recherche documentaire, comme par exemple, les vedettes-matières utilisées pour décrire les ressources des bibliothèques. Un vocabulaire contrôlé assure qu'un sujet sera décrit en utilisant le même terme préférentiel chaque fois qu'il est indexé, facilitant la recherche d'information sur un sujet spécifique.
- Le thésaurus est un outil de contrôle de vocabulaire. En utilisant un thésaurus, on peut effectuer des recherches plus fructueuses. Il comprend des renseignements sur les relations entre les mots et les phrases (par ex. : termes génériques, termes spécifiques, termes préférentiels, termes non préférentiels ou termes associés).
- Un vocabulaire normalisé doit contenir de l'information concernant les relations entre les termes (c.-à-d., termes préférentiels et termes non préférentiels).
Exemple d'initiative d'enregistrement
- La Bibliothèque nationale du Canada a été désignée par la Norme du Conseil du Trésor sur la technologie de l'information NCTTI 39.2, en tant que registraire des vocabulaires normalisés utilisés par le Gouvernement du Canada.
- Par voie de conséquence, la Bibliothèque agira en tant qu'agent d'enregistrement pour le domaine gc.ca auprès de la Dublin Core Metadata Initiative ( http://dublincore.org/) pour assurer la conformité à la norme Dublin Core.
- La fonction de registraire comporte deux volets :
- rendre le vocabulaire normalisé accessibles pour utilisation par les moteurs de recherche, les créateurs d'information ainsi que les créateurs et les responsables de l'entretien du vocabulaire ;
- offrir un mécanisme central d'identification des éléments « méta » utilisés par les différents producteurs de documents.
- Le vocabulaire devrait être publié sur le Web.
L'intitulé du vocabulaire
- Le nom de l'organisme responsable de l'entretien et propriétaire du vocabulaire est rarement suffisant puisque ce nom ne peut identifier sans équivoque un vocabulaire particulier.
- Les versions remaniées d'un vocabulaire, et les versions modifiées et/ou traduites par une personne ou organisme autre que le propriétaire original devraient utiliser un nom local associé au service, au projet ou au nom du fournisseur.
- Exemple : Le Réseau canadien d'information sur le patrimoine (RCIP) a développé une version française d'une portion du Art and Architecture Thesaurus, un ouvrage en langue anglaise, pour décrire les ressources de ses collections. Ce vocabulaire, bien que fondé sur le AAT, serait enregistré sous un nom local.
- Les labels sont nécessaires aux fins de l'identification-machine du vocabulaire. Ils servent de noms de cadre de classement dans la métabalise « dc.subject ».
- Le label doit être unique.
- Les identifications en usage et utilisant des acronymes ou des noms locaux peuvent servir de labels.
- Exemple du Gouvernement du Canada :
- Les deux premières lettres de tout label d'un cadre de classement développé exclusivement pour utilisation au sein du GC doivent être gc. Le label ne contient aucun signe de ponctuation. Exemple : Thésaurus de Statistique Canada = gcstc.
Recommandations complémentaires du Gouvernement du Canada
Les organisations fédérales devraient d'abord considérer les points suivants avant de développer et enregistrer un schéma d'encodage pour l'élément Sujet :
- Suggérer des termes supplémentaires pour inclusion dans le Thésaurus des sujets de base.
- Remplir la métabalise HTML <Keywords> (mots clés) avec les termes supplémentaires, en plus d'utiliser l'élément <dc.subject> avec un schéma reconnu ; ou
- Utiliser l'élément <dc.subject> sans nom de schéma seulement si vous avez déjà utilisé, dans une autre occurrence de l'élément, une terminologie provenant d'un schéma d'encodage reconnu AVEC le nom du schéma spécifié.
Le gouvernement du Canada désire maintenir un nombre limité de schémas d'encodage reconnus pour utilisation par ses organisations. En faisant cela, il s'assure que les schémas satisfont les critères de base d'un vocabulaire contrôlé et prévient les problèmes d'interopérabilité qui pourraient résulter de la multiplicité des schémas.