Herbiers 2.0. où la Belle au Bois Dormant n’était pas indexée!

banniere-herbiers

     C’est l’hiver, fleurs et plantes sont entrées en phase de repos et le jardin bien que très graphique en cette saison dissimule une grande partie de ses richesses. Le dimanche quand le jour décroît, et que le crépitement du feu dans l’âtre invite à cocooner, c’est l’occasion de tirer son herbier, ou celui hérité de son grand-père, de la bibliothèque pour s’abîmer dans la contemplation de ces plantes desséchées, découpées, pliées et repliées, et voyager entre les pages jaunies et les étiquettes rédigées à la plume d’une écriture nerveuse, parfois raturée, parfois effacée, pour découvrir mille formes et noms extraordinaires qui n’ont rien à envier aux bestiaires fabuleux de la littérature fantastique : Paeonia monticola Jord., Anemone pulsatilla L., Rosa brachystylis Gand. et ses cynorrhodons

Mais…voilà qu’il manque une étiquette! La colle sans doute n’aura pas supporté le poids des années! Qui est donc cette belle inconnue, qui repose aplatie, telle la Belle au Bois Dormant, ses feuilles délicatement déployées entourant la fleur aux couleurs surannées? Un parfum ténu, “vert”, “séché”, qui rappelle l’humus, en émane tandis que se tourne et retourne délicatement la page à la recherche de l’étiquette égarée?  Las… point d’étiquette.

Rosa_canina

Les herbiers, témoignages du vivant, d’hier et d’aujourd’hui, objets poétiques s’il en est…

Alors quel rapport entre les herbiers et les logiques documentaires me direz-vous? Et bien de nombreux!

La numérisation des collections naturalistes

     En effet les herbiers sont avant tout des objets scientifiques patrimoniaux ayant pour vocation de faire l’inventaire du monde végétal, volonté de classification à l’origine de toutes les disciplines documentaires. Ces collections font depuis plusieurs années l’objet de programmes de collectes et d’informatisation à l’échelle nationale et internationale. A ce titre le Muséum National d’Histoire Naturelle de Paris (MNHN), l’Université de Montpellier 2, en France ou le Royal Botanic Garden de Kew, en Angleterre, sont des modèles de cette dynamique d’acquisition, de sauvegarde, mais aussi de valorisation et de partage de ce patrimoine scientifique si vaste et si ancien.

Ces grands instituts appliquent les procédés archivistiques et documentaires propres à la conservation de fonds spécialisés et se sont également engagés dans de vastes campagnes de numérisation des herbiers, ouvrant dès lors de nouvelles perspectives à ces objets jusqu’alors souvent inaccessibles au commun des mortels non botanistes, car oubliés sur les étagères, trop fragiles pour être manipulés ou tout simplement trop loin.

En France c’est plus de 20 millions d’herbiers et plus de trois siècles de prospections qui constituent ce patrimoine botanique considéré comme l’un des plus riches du monde par le nombre de spécimens, la représentativité et la richesse des types.

Le Muséum National d’Histoire Naturelle et le réseau des herbiers de France se sont lancés dans l’informatisation et la numérisation de l’herbier national en 2010. Aujourd’hui c’est un peu plus de 6 millions d’images qui sont disponibles en ligne sur les 8 à 9 millions que contient le musée, via la base de données des collections du MNHN. Et  500.000 spécimens renseignés dont 40.000 images, sur la base de données du réseau des herbiers Sonnerat/BryoMyco. Mais toutes ces images n’ont d’utilité que si elles sont documentées et porteuses d’informations. Or vous en conviendrez, 6 millions de documents à inventorier, classer et renseigner est un travail colossal dont ne pourrait s’acquitter aucune équipe d’archivistes et de documentalistes aussi performants soient-ils, à moins d’y consacrer un temps qui n’a d’égal que la durée pendant laquelle la Belle au Bois Dormant s’assoupit!

Combinant ces deux problématiques, renseigner les planches numérisées et diffuser les contenus auprès des publics, le MNHN a développé avec le soutien du réseau de botanistes francophones, Tela-Botanica, la plateforme de crowdsourcing Les Herbonautes, l’herbier numérique collaboratif citoyen, qui est à ce jour la première et unique initiative de plateforme collaborative de documentarisation des collections naturalistes en France. Le terme herbonautes caractérise les internautes qui vont participer à la saisie des métadonnées liées aux spécimens d’herbiers précisent Marc Pignal et Eva Pérez, tous deux botanistes au MNHN en charge du montage de l’infrastructure e-ReColNat, programme scientifique de numérisation et de diffusion en ligne sur une plateforme commune des principales collections naturalistes et des herbiers français dont Les Herbonautes font partie.

Il faut noter qu’avec l’avènement du Web 2.0. de plus en plus de projets scientifiques se familiarisent avec les usages du web social, et s’appuient sur les méthodes de crowdsourcing (c’est-à-dire des contenus ou informations (source) produits par la foule (crowd) des usagers)  pour l’enrichissement, la médiation et la valorisation de leurs actions et de leurs collections ainsi que le souligne Pauline Moirez dans son article Archives Participatives, tiré de l’ouvrage Bibliothèques 2.0 à l’heure des médias sociaux. Dans le domaine de la botanique nous pouvons citer par exemple, les programme de sciences participatives tels que Sauvages de ma rue ou encore l’application pour smartphones Plant@net, qui s’appuient sur les observations et les relevés des internautes pour réaliser un inventaire de la flore territoriale.

L’indexation collaborative

     Si hier encore, la documentation était exclusivement dévolue aux professionnels de l’information-documentation, aujourd’hui n’importe quel usager du web peut, et souvent adopte sans le savoir, une logique documentaire et classificatoire ne serait-ce que par l’usage des tags et autres folksonomies.

Au profit de projets culturels, patrimoniaux ou scientifiques, nous pouvons même y voir de nouvelles expressions de la citoyenneté. Ce n’est d’ailleurs pas sans raison que les anglo-saxon qualifient ces pratiques de Citizen Science, littéralement science citoyenne.

Bien évidemment ces nouvelles méthodes d’indexation collaborative des documents scientifiques ne vont pas sans susciter quelques craintes de la part des gestionnaires des collections mais aussi des internautes, qui pourraient mal renseigner la base de données. Une marge d’erreur est donc clairement assumée par la plateforme et compensée par la force même du réseau que constitue la multiplicité des participants et donc le recoupement des identifications.

Pour cela la plateforme Les Herbonautes met en place un processus d’expertise et de validation des données par le croisement des regards portés sur les objets soumis à informatisation. Les spécimens sont proposés plusieurs fois aux contributeurs, permettant à un plus grand nombre d’en donner une interprétation et donc d’effectuer une pré-validation efficace. Un forum de discussion permet in fine de lever les contradictions et de déterminer, le cas échéant, les données les plus pertinentes.

Bien entendu la plateforme fourni ce qu’elle appelle les “règles du jeu” ou consignes d’usage à l’attention des contributeurs, ainsi qu’un lexique leur permettant de normaliser et donc d’optimiser la saisie des métadonnées qui n’est pas toujours évidente, en particulier pour les débutants. Car il ne faut pas oublier que ces données sont destinées à être utilisées dans le cadre d’exploitations scientifiques des herbiers, qui, encore de nos jours, constituent des “références valides utilisées pour l’étude et la classification du vivant et de l’évolution des espèces” comme le souligne Lisa Chupin dans son étude sur les enjeux de la numérisation des herbiers pour l’information et la communication scientifiquesDes index regroupant biographies et signatures de botanistes sont mis à disposition en ligne pour faciliter la détermination, ainsi que les bases de données Sonnerat/BryoMyco et JSTOR Global Plant, un portail international de spécimens et de publications numérisés.

Les herbonautes complètent et vérifient par la même occasion les données textuelles issues du procédé d’océrisation des étiquettes mis en oeuvre au moment de la numérisation des planches, et sujettes à caution au regard des spécificités de l’écriture manuscrite.

indexation_herbier

Indexation des herbiers lors de la Mission Santo 2006, Vanuatu. Boré, Jean-Michel – Copyright ©IRD

Toutes les métadonnées récoltées préparent le travail d’indexation des herbiers qui devenant de plus en plus pertinent, rend les herbiers accessibles à des publics plus vastes et plus variés, notamment auprès des chercheurs de disciplines scientifiques autres que la botanique, telles que la biologie, l’écologie, l’ethnobotanique et la linguistique.

Marc Pignal et Eva Pérez, précisent que les techniques d’indexation des herbiers, bien que réalisée à partir de métadonnées définies désormais aussi bien par des experts que des amateurs, s’inspirent toujours de celles mise en oeuvre dans les bibliothèques.

Pour être accessibles les documents iconographiques nécessitent d’être assortis de données descriptives, permettant une indexation adéquate et aux moteurs de recherches d’effectuer des requêtes en plein texte. En cela l’indexation collaborative est particulièrement adaptée pour traiter une telle masse de documents. Sont donc étudiées les étiquettes plus que les plantes elles-mêmes: les herbonautes doivent déterminer le pays, la région, la date, le récolteur, le déterminateur, la localité et produire  la géolocalisation de la récolte.

Des herbiers et des tags

     Avec la version 2 de la plateforme des Herbonautes, de nouvelles modalités de documentarisation sont désormais introduites dont la possibilité, caractéristique des réseaux sociaux, d’ajouter des tags aux identifications.

Capture d’écran Les Herbonautes

Capture d’écran Les Herbonautes ©MNHN

Ces tags décrivant des caractéristiques de l’objet, vont permettre de regrouper l’ensemble des planches contenant les mêmes mots-clefs et donc la comparaison de spécimens, dépassant alors la problématique abordée par Lisa Chupin, de l’espace documentaire en tant que vecteur d’exploitation et d’interprétation des documents, et fortement lié à la matérialité des herbiers. Par exemple rajouter le tag “graine” sur un spécimen permettra de préciser que celui-ci possède des graines, alors que cette information n’apparaît pas dans les métadonnées.

Le tagging va permettre cette mise en série des spécimens numérisés, et les bases de données vont alors pouvoir assumer les fonctions d’amplification de l’information jusqu’à présent efficientes avec les herbiers physiques mais plus incertaines suite à leur numérisation massive qui individualise, et d’une certaine façon isole, chaque spécimen. Bien entendu la pertinence est de mise. Il est recommandé d’employer des termes propres à favoriser le partage et la mise en commun de corpus, et non d’indexer/tagger pour un usage personnel seulement.

Les Herbonautes sont donc véritablement une entreprise de redocumentarisation collaborative, qui traite les documents primaires, ici les herbiers numérisés, pour les enrichir de métadonnées nouvelles, réorganiser leurs contenus et les faire communiquer.

Interopérabilité et partage

     A long terme l’ambition poursuivie par les Herbonautes, le MNHN et le réseau des herbiers de France, est la mise en réseau de l’ensemble des collections numérisées et l’interopérabilité des bases de données qui accueillent les spécimens ou indexent les herbiers.

Les Herbonautes évoluent déjà vers ce système en proposant aux contributeurs de faciliter leur navigation et d’accéder aux différents outils et projets imbriqués dans la structure e-ReColNat avec les mêmes identifiants en passant par une plateforme commune à chacun des projets qui redirige ensuite l’internaute vers celle souhaitée.

Tela-Botanica quant à lui, propose une interface de recherche des herbiers, dont les informations sont utilisables en licence Creative Commons pour alimenter d’autres bases de données et notamment celles du MNHN dont elle est partenaire.

Une requête formulée dans une base de données unique permettra d’avoir accès à tous les documents indexés du réseau. C’est le rôle de l’infrastructure e-ReColNat, qui revendique par ailleurs le caractère unique et novateur d’une banque d’images d’une telle importance, qui pourra elle-même être considéré comme un objet d’étude pour des recherches dans le domaine de l’indexation multimédia, de la recherche interactive par le contenu et de la visualisation. Impossible de ne pas y voir de corrélation avec les disciplines et la recherche en information-documentation.

Bien sur tous les conservateurs et gestionnaires engagés dans le projet e-ReColNat ne sont pas convaincus de la pertinence de l’ouverture de la base de données aux internautes et à leurs contributions, comme a pu l’analyser Lisa Chupin. Entre erreurs d’interprétations, manque d’expertise, modalités d’interprétations d’une image qui diffèrent de celles d’un spécimen physique, plus grande instabilité du document dont les métadonnées peuvent être modifiées plus souvent et par un plus grand nombre de personnes dès qu’il est accessible en ligne, etc…

Néanmoins certains rappellent que la documentation des images en ligne permet de valoriser les collections physiques, en les mettant en lumière. Cette mise en ligne permet aussi de compléter et de corriger qualitativement des données, grâce à la fréquentation de spécialistes qui y apportent leur expertise autrement inaccessible. Mais au-delà de la valorisation ou de l’expertise scientifique, cette ouverture profite en premier lieu à l’enrichissement et à la documentation de ce patrimoine, qui sans cela serait réduite. Comme le rappellent Marc Pignal et Eva Pérez, mettre en ligne une grande quantité de documents dont on connaît les faiblesses est plus intéressant que de n’en diffuser qu’une poignée complètement validés mais peu exhaustifs. La participation des internautes permet d’indexer plus de documents, de croiser plus d’expertises et donc de mettre à disposition des contenus plus rapidement que ne le pourraient faire des spécialistes seuls, permettant ainsi une utilisation scientifique plus large, et par essence la correction des erreurs rencontrées.

     Il ne reste que des braises dans le foyer et l’herbier va rejoindre son emplacement dans la bibliothèque pour un sommeil hivernal, point aussi long que celui de la Belle au Bois Dormant, jusqu’aux éclosions printanières qui viendront l’enrichir de nouveaux spécimens… Mais grâce au MNHN, aux Herbonautes et plus particulièrement à l’herbier Montpellier Université, je sais désormais comment s’appelle ma belle endormie, il s’agit de Rosa canina L. var. serrata R. Keller !

Eglantine aussi appelée Rose….

Lithographie de Claude Hirlemann illustrant la Belle au bois dormant, de Charles Perrault (édition de 1923). [Bibliothèque nationale de France, Paris.] Ph. Jeanbor © Archives Larbor

Lithographie de Claude Hirlemann illustrant la Belle au bois dormant, de Charles Perrault (édition de 1923). [Bibliothèque nationale de France, Paris.] Ph. Jeanbor © Archives Larbor