4.2 Les métadonnées

Those of us who make our living in publishing by working with metadata regard its sudden popularity with a mix of amusement (that something previously regarded as so dry is now sexy) and exasperation (what took you so long?). In practice, metadata has been important in bookselling for many, many years. But because a book is no longer a physical object, discoverability via metadata is only just now becoming a front-office problem. (Dawson, 2012 ; 1)

Le terme métadonnées se retrouve dans presque toutes les publications concernant le livre numérique. Elles réfèrent aux données qui décrivent un livre : ISBN, titre, auteur, année de parution, prix, format, sujet, etc. Traditionnellement compilées dans les catalogues des libraires et des bibliographies, les métadonnées ont pris de l’importance avec le développement des inventaires informatiques des bibliothèques et des librairies. L’arrivée de la vente en ligne par Amazon a véritablement propulsé les métadonnées, ainsi que l’explique Laura Dawson :

Through Amazon, consumers were looking at metadata for the first time. No longer relegated to wholesalers’ warehouses and library reference desks, book metadata was front-and-center on the Website of “The World’s Largest Bookstore.” Suddenly ISBN and price were not enough. Why not? Because in order to figure out what they were buying, or what books they had to look forward to being published, consumers needed to see the metadata, too. Consumers wanted to know as much about each book as humanly possible. They wanted cover images, robust descriptions, and excerpts. They wanted to know when a book was published or going to be published—they wanted to place orders for books before they even rolled off the presses. (Idid.)

Les éditeurs et les distributeurs ont commencé à transmettre aux différents points de vente des renseignements additionnels comme les données sur l’auteur, la couverture arrière, la table des matières, les coordonnées d’un extrait téléchargeable, etc.

Dans le monde du livre physique au Québec, les éditeurs se fiaient encore récemment à leur distributeur-diffuseur pour la gestion des métadonnées. Ils avaient l’habitude de donner un fichier Word contenant les informations de ventes. Aujourd’hui, ils se retrouvent dans un entrepôt numérique et ne savent plus trop quels champs remplir, n’ayant pas de ressources, ni d’expertise à cet égard. Les éditeurs ont dû adapter leurs pratiques pour fournir correctement toutes les données au distributeur, à l’entrepôt numérique ou au libraire.

Parmi ces données, les différents systèmes de classification posent également un défi aux éditeurs, puisque plusieurs systèmes de données coexistent sans être toutefois arrimés. Leur gestion est loin d’être simple, comme l’explique Bianca Drapeau :

Les classifications sont les principales métadonnées qui sont galvaudées ou inutilisées. Il existe différents systèmes comme Dewey[1], celui de la BTLF[2] ou le BISAC que les américains utilisent et qu’on doit absolument documenter si on veut vendre chez Amazon ou chez Kobo. Même si les éditeurs documentent tout cela, chacun des revendeurs a ses propres catégories, que ce soit Renaud-Bray ou Archambault ou un autre. Un polar peut se retrouver classé en Travail social et il a alors peu de chances d’être vendu. Quand les données que nous avons documentées sont mal ou pas utilisées par les revendeurs, on l’impression qu’on recommence tout le temps.

Il en résulte que certains éditeurs ne mettent que les informations minimales et les métadonnées que reçoivent les libraires et les entrepôts sont loin d’être uniformes et elles sont souvent incomplètes. Le revendeur se retrouve par conséquent avec un site Web comprenant des titres sans descriptions ou sans page couverture, des noms d’auteurs mal orthographiés, etc.

Pour pallier à ce problème, les Américains ont développé le standard ONIX pour définir et communiquer les informations sur les produits. Plusieurs éditeurs et distributeurs québécois, dont Diffusion Dimedia, implantent ce logiciel compatible avec le grand standard de métadonnées de livres pour regrouper et faciliter la transmission de données. Parce qu’il s’agit d’un véritable enjeu : les métadonnées sont à peu près la seule façon de vendre un livre sur le Web. Si un livre est mal classifié, il sera impossible à trouver et à vendre. Le passage à un monde numérique vient changer totalement changer la dynamique du marché comme le décrit Hugh McGuire :

C’est la disparition des librairies physiques qui rend les métadonnées essentielles. If you want to sell your books, people have to be able find them. Je trouve étrange que la gestion des métadonnées soit perçue comme quelque chose de supplémentaire au travail d’un éditeur. C’est peut-être un nom trop complexe parce que c’est simplement de fournir les informations pour que ton livre soit trouvable. Si ce n’est pas de rendre ton livre trouvable, je ne sais pas c’est quoi ton rôle comme éditeur! Finalement, la protection contre Amazon et les grands joueurs, c’est d’être très trouvable sur le Web. Les data devraient absolument être utilisées de façon agressive.

Outre leur aspect descriptif, les métadonnées offrent de multiples possibilités pour les stratégies commerciales. Les systèmes informatiques permettent d’obtenir des renseignements concernant les données de ventes et tout ce qui émerge de la diffusion sur le Web : données sur les achats, les consultations, la lecture d’extraits, les habitudes d’achat, le profil des acheteurs, etc. Dans certains cas, on peut même savoir ce que les gens lisent, à quelle heure, pendant combien de temps, les livres qu’ils terminent ou à quelle page ils arrêtent. Ce type de données constitue une mine d’or pour le travail de promotion, de diffusion et même de création ou pour l’envoi de bulletins ou de textes à publier.

Peinant encore à traiter correctement leurs données, les éditeurs n’en perçoivent pas toutes les possibilités promotionnelles et stratégiques. Ils n’ont assurément pas le réflexe d’aller extraire ces données et de les utiliser pour leurs campagnes marketing ou le développement de nouveaux marchés et ainsi plusieurs opportunités d’affaires, selon Bianca Drapeau :

Pour beaucoup d’éditeurs, c’est encore le rôle du distributeur de fournir les métadonnées. Ils se retrouvent dans un entrepôt numérique et ne savent pas quels champs remplir pour vendre en Europe, où aller inscrire le prix en euros, parce c’est leur distributeur en France qui a toujours fait cela. Finalement, ils se retrouvent à mettre leurs livres en vente uniquement au Canada et perdent des ventes. Les métadonnées, c’est le nerf de la guerre!

La présence de l’entrepôt numérique constitue à cet égard un atout majeur, puisque le site permet d’obtenir une grande partie des métadonnées du marché et qu’il les partage avec ses éditeurs, contrairement à Amazon ou à Apple qui conservent ces données stratégiques. Kobo et les principaux agrégateurs québécois partagent également toutes ces informations avec leurs utilisateurs. Sans les acteurs locaux, le Québec n’aurait aucune de ces données.

Ces données sont utilisées par les libraires qui peuvent connaître les ventes de livres, le profil des acheteurs, des statistiques de ventes, etc. Grâce au site ruedeslibraires.com, les librairies indépendantes ont accès à toutes ces métadonnées. Chacune peut s’en servir sur son site personnalisé, gérer les livres qui sont mis de l’avant, faire un palmarès de ventes ou des sélections thématiques, etc.

Finalement, les métadonnées sont importantes pour les bibliothèques, tant pour la recherche que pour la gestion des achats. Elles ont développé des systèmes de classifications à partir des métadonnées existantes, en se servant notamment des codes Bisac (Book Industry Standards and Communications) qui sont de plus en plus utilisées par les éditeurs québécois[3]. De plus, elles ont développé des modules de statistiques qui leur permettent de planifier leurs achats en fonction des préférences de leurs utilisateurs ou de justifier leurs demandes de budgets auprès des administrateurs.


  1. La classification décimale de Dewey (CDD) est un système visant à classer l’ensemble du fonds documentaire d’une bibliothèque, développé en 1876 par Melvil Dewey, un bibliographe américain.
  2. Au Québec, la Banque de titres en langue française (BTLF) avec son outil Memento constitue une source de données importante que les librairies peuvent utiliser pour nourrir leurs sites Internet. Il s’agit d’un service payant qui ne comporte ni couvertures de livres, ni résumés, ce qu’offrent gratuitement les agrégateurs.
  3. Effectivement, pour vendre des livres sur l’iBookstore, il faut que les livres soient codés avec ce standard.

Leave a Reply

Your email address will not be published. Required fields are marked *