Transformations des métiers de l’information-documentation au prisme des humanités numériques : Entretien avec une professionnelle de l'information-documantation au sein du CNRS

juillet 1, 2025 Temps de lecture: 23 minutes

Introduction

Ce billet, disponible ici sous format PDF, prend la forme d’un entretien écrit sur les transformations des métiers de l’information-documentation au prisme des humanités numériques avec une professionnelle de l'information-documentation au sein du CNRS. Cet entretien a été réalisé par quatre étudiant.e.s du Master MAVINUM.

Anna Koleva a suivi le cursus « Information-Documentation » à travers le Master 1 & 2 MAVINUM (Management et Valorisation de l’Information Numérique) au sein de l’université Paul-Valéry Montpellier 3. Elle a bénéficié préalablement d’une expérience de 15 ans en qualité de responsable de la communication et des éditions en agence de communication. Adresse électronique : anna.koleva@mac.com

Romain Lurtz est alternant au sein du Conseil Départemental de l’Hérault. Intégré au Pôle des Systèmes d’Information, il mène des projets en communication et documentation visant à valoriser les savoirs organisationnels de la collectivité. Titulaire d’un BTS Communication et d’une Licence en Sciences du Langage, il a suivi le Master 1 & 2 « Information-Documentation », parcours MAVINUM (Management et Valorisation de l’Information Numérique) à l’université Paul Valéry Montpellier. Adresse électronique : rlurtz.pro@gmail.com

Natacha Fonteneau a suivi le Master 1 & 2 « Information-Documentation », parcours MAVINUM (Management et Valorisation de l’Information Numérique) à l’université Paul-Valéry de Montpellier. Elle a réalisé ses stages au sein de la plateforme NumeRev (MSH-Sud), où elle a mené des projets en refonte de maquettes web, indexation et référencement de revues scientifiques, mise en conformité des politiques éditoriales, et expérimentation de l’intelligence artificielle dans les processus de gestion de l’information et d’édition scientifique. Adresse électronique : natacha.fonteneau.pro@gmail.com

Camille Durocq a suivi le Master 1 & 2 « Information-Documentation », parcours MAVINUM (Management et Valorisation de l’Information Numérique) à l’Université Paul-Valéry Montpellier 3. Elle a mené des projets en datavisualisation, UX design et automatisation documentaire.

L'entretien

Question 1 : Pouvez-vous vous présenter ?

J’occupe un poste en information-documentation au sein du CNRS. Mon parcours m’a amenée à travailler dans différentes structures académiques et de recherche, notamment en bibliothèque de laboratoire, en unité de service dédiée à l’édition scientifique, et dernièrement au sein du Centre Norbert Elias.

Depuis quelques mois, je suis sur un poste d’assistante emploi-formation, dans un service de ressources humaines, pour la Délégation Bretagne et Pays de la Loire, située à Rennes. Ma mission est d’organiser et de gérer au quotidien des actions de formation continue à destination du personnel rattaché au CNRS de la région.

Transformations générales du métier

Question 2 : En quoi l’essor des humanités numériques a-t-il modifié votre pratique en tant que professionnelle de l’information-documentation ?

Aujourd’hui, mon métier n’a plus rien à voir avec ce qu’il était il y a une dizaine d’années. Avant, nos fonds papier étaient essentiels pour les chercheurs et doctorants. Aujourd’hui, ces mêmes abonnements ont quasiment disparu, sauf dans certaines disciplines comme les mathématiques, où les documentalistes conservent encore des revues datant du XIXe siècle. Mais pour la majorité des disciplines, les usagers consultent exclusivement des bases de données bibliographiques et des revues numériques. Dans la bibliothèque où je travaillais, nous avions 100 à 120 abonnements papier ; aujourd’hui, il en reste à peine 30 à 40.

Avec cette transformation, mon rôle a changé : je ne suis plus seulement là pour gérer des collections, mais pour accompagner les chercheurs dans l’usage des plateformes numériques. Mon travail consiste à leur apprendre comment se repérer, comment chercher efficacement, et surtout comment organiser leurs informations avec des outils comme Zotero. Il y a également de plus en plus d’activités de formation et de médiation numérique. J’accompagne, par exemple, les chercheurs sur la gestion de leur identité numérique, en leur expliquant comment optimiser leur profil sur HAL ou ORCID.

Les méthodes de formation ont beaucoup évolué. Avant, nous organisions des séances en présentiel, avec des groupes assis en salle, sur un temps long. Aujourd’hui, il faut s’adapter à des formats plus diversifiés : Moodle, MOOCs, webinaires express de 3 heures, voire des formations entièrement asynchrones. Certains publics préfèrent des formats courts et accessibles à tout moment. La crise du Covid a accéléré cette tendance. Mes attributions s’hybrident de plus en plus avec celles des chargés de communication et des informaticiens ; on nous demande de savoir expliquer comment fonctionnent des bases de données, des API ou encore des outils de text mining. Certains collègues maîtrisent Python ou SPARQL pour interroger des bases de données, et je constate que les attentes en compétences techniques augmentent.

Ce qui est frappant avec les humanités numériques, c’est cette impression de mutation permanente : chaque année, il faut apprendre un nouvel outil, une nouvelle méthode. Ce qui était une nouveauté hier devient un standard aujourd’hui.

Question 3 : Les nouvelles technologies (big data, IA, outils de text mining) ont-elles redéfini votre rôle dans la gestion et la valorisation des données en SHS ?

Avant, mon travail était centré sur la gestion de l’information documentaire au sens classique : cataloguer, diffuser, organiser des ressources accessibles aux chercheurs. Aujourd’hui, avec la montée en puissance de l’ouverture des données de la recherche, on me sollicite de plus en plus pour des missions liées à la qualité et à la structuration des données. L’important n’est plus seulement d’archiver et de rendre accessible, mais aussi d’assurer l’interopérabilité et l’exploitabilité des données.

La gestion de la qualité des données est un enjeu qui soulève des questions d’éthique. Il est essentiel de préciser qui a produit la donnée, dans quel contexte et à quel moment, afin d’en garantir l’exploitation rigoureuse. La description des données via des métadonnées normalisées est une exigence incontournable en science ouverte. Or, les chercheurs rencontrent parfois des difficultés à intégrer ces exigences, notamment en matière de partage des données. Un simple fichier Excel ne suffit pas : il doit être accompagné d’informations précises sur son origine, ses conditions de collecte et sa structure, afin d’assurer sa réutilisation et son interopérabilité. Mon rôle consiste alors à les accompagner, par exemple sur des plans de gestion de données.

L’intégration des nouvelles technologies dans les pratiques documentaires demande aussi d’acquérir des compétences informatiques. Certains de mes collègues se forment au code, comme Python ou SPARQL, pour manipuler des données textuelles, automatiser certaines tâches ou interroger des corpus à grande échelle. Si je ne suis pas informaticienne, il devient malgré tout essentiel de comprendre leur langage, ne serait-ce que pour faciliter les échanges et formuler clairement les besoins documentaires.

D’ailleurs, il existe une vraie différence entre les logiques documentaires et les logiques informatiques. Les informaticiens conçoivent des systèmes pour traiter massivement de la donnée, tandis que nous, professionnels de l’info-doc, insistons sur la qualité et le contexte des données. Or, cette exigence de qualité est souvent négligée au démarrage des projets, ce qui peut poser problème lorsqu’il s’agit de garantir la fiabilité des résultats d’analyse.

Plutôt qu’une dilution, j’observe une transformation des missions. Les fondamentaux du métier restent présents, mais leur application se déplace de la gestion de collections vers la gestion de flux d’information. Nous ne nous contentons plus de fournir des documents aux chercheurs, nous devons aussi leur expliquer comment exploiter ces masses de données, comment choisir les bons outils d’analyse et comment préparer leurs données pour une réutilisation scientifique conforme aux standards de la science ouverte, par exemple. En revanche, cette évolution est exigeante : elle demande une veille permanente et une capacité d’adaptation. Il ne suffit plus de connaître un logiciel, il faut comprendre l’ensemble des enjeux qui gravitent autour de la donnée.

Interdisciplinarité et nouvelles compétences

Question 4 : Les humanités numériques impliquent souvent un croisement entre les SHS et les sciences dures. En quoi cela transforme-t-il les compétences attendues dans votre métier ?

Il y a bien entendu une montée en compétences techniques dans les métiers de l’information-documentation. Aujourd’hui, il ne suffit plus d’avoir une expertise en gestion documentaire, il faut aussi comprendre les logiques de structuration des données, les modèles d’interopérabilité et les infrastructures numériques. Cela implique une familiarisation avec des outils et des concepts qui relevaient autrefois du domaine des informaticiens : modélisation des bases de données, gestion des métadonnées enrichies, organisation des corpus pour le text mining, formats d’archivage pérennes.

Ce qui change, c’est que l’on attend de plus en plus des professionnels de l’info-doc qu’ils comprennent les contraintes des outils qu’ils utilisent et qu’ils puissent participer à des projets de recherche mêlant sciences de l’information, informatique et SHS.

L’injonction à la polyvalence est bien réelle. Je pense qu’il ne s’agit pas de devenir développeur, mais plutôt d’être capable d’aligner les objectifs documentaires avec les exigences technologiques. Mais cette montée en compétences n’est pas systématique. Il existe un tiraillement entre le rôle traditionnel du professionnel de l’info-doc et l’attente de compétences techniques avancées. Certaines structures demandent des profils capables de maîtriser les bases du codage et du scripting, tandis que d’autres privilégient encore des compétences plus classiques en gestion et médiation documentaire, comme les bibliothèques publiques.

Dans certains projets, les documentalistes sont remplacés par des ingénieurs en gestion des données ou des chargés de projet en science ouverte. Mais ce n’est pas toujours fluide : les attentes diffèrent, les méthodes de travail aussi, et il faut un véritable effort pour harmoniser les pratiques.

L’une des grandes difficultés est que les logiques professionnelles entre les informaticiens, les chercheurs et les professionnels de l’info-doc ne sont pas les mêmes. Là où mon rôle évolue, c’est dans cette capacité à créer du lien entre ces différents acteurs.

Question 5 : Observez-vous une tension entre la spécialisation disciplinaire et l’exigence d’interdisciplinarité dans la gestion des ressources documentaires ?

Cette tension est particulièrement visible dans les structures académiques et de recherche où les logiques disciplinaires restent très ancrées, alors même que les politiques de science ouverte et de mutualisation des données encouragent des approches transversales. Dans mon expérience, les chercheurs restent souvent attachés à leurs référentiels disciplinaires et aux pratiques documentaires qui en découlent. Les bases de données, les méthodologies de citation, les formats de publication et même les plateformes de dépôt varient énormément selon les disciplines. Par exemple, les mathématiciens utilisent des archives ouvertes comme ArXiv, tandis que d’autres disciplines privilégient HAL.

Cette diversité de pratiques rend parfois difficile la mise en place d’une véritable mutualisation des ressources. Lorsqu’il s’agit de mettre en place des outils communs pour la gestion des données ou la publication scientifique, on se heurte souvent à des résistances liées aux habitudes disciplinaires et à des normes spécifiques (thésaurus, formats de métadonnées, classifications documentaires). L’interdisciplinarité conduit parfois à un éclatement des normes et à une multiplication des outils sans coordination claire. Chaque discipline tente de conserver son cadre de référence tout en s’ouvrant à de nouvelles approches, ce qui peut aboutir à des solutions fragmentées où la mutualisation est plus théorique que réelle.

Logiques de production et accès aux savoirs

Question 6 : Le développement de l’open access et des plateformes collaboratives modifie-t-il votre rapport à la gestion et à la diffusion du savoir ?

Le passage à l’open access a fait évoluer notre rôle vers une approche plus stratégique, axée sur la gestion des données et la valorisation des publications scientifiques. La médiation scientifique occupe une place croissante : nous ne sommes plus uniquement gestionnaires de ressources, mais des facilitateurs d’accès et de visibilité pour les chercheurs. Par exemple, l’utilisation de SciencesConf, la plateforme du CNRS dédiée à l’organisation de conférences et colloques, peut être recommandée. Cette plateforme interdisciplinaire constitue une base de données riche, diffusant les événements scientifiques des dernières années. Toutefois, son exploitation optimale nécessite un accompagnement spécifique.

L’open access implique également un travail de formation et de sensibilisation. Il est essentiel d’accompagner les chercheurs dans l’usage des outils de dépôt et dans les principes de la science ouverte. Au-delà de la diffusion en libre accès, il s’agit aussi d’apprendre à gérer son identité numérique et à renforcer la visibilité des travaux de recherche.

Chaque plateforme répond à des exigences spécifiques en matière de formats de dépôt, d’indexation et de conservation. Il est donc crucial de maîtriser les aspects politiques ainsi que l’évolution des réglementations encadrant l’accès aux publications et aux données de recherche.

Cette évolution, bien que stimulante, est exigeante. Les outils et plateformes évoluent rapidement, les politiques éditoriales se transforment, et l’accompagnement des chercheurs doit s’adapter en permanence à cet écosystème en constante mutation.

Question 7 : Pensez-vous que les humanités numériques favorisent une réelle démocratisation de l’accès au savoir, ou qu’elles renforcent des inégalités d’accès et de production scientifique ?

En théorie, cela devrait aboutir à une démocratisation réelle, mais dans les faits, cette ouverture se heurte à plusieurs limites qui maintiennent, voire accentuent, certaines inégalités d’accès et de production scientifique.

L’open access permet un accès plus large aux publications, sans barrière financière, mais encore faut-il que les chercheurs aient les moyens techniques et institutionnels de produire et diffuser ces savoirs et d'accéder aux publications produites.

Un chercheur rattaché à une grande université parisienne n’a pas les mêmes facilités qu’un doctorant travaillant dans un laboratoire isolé ou dans un pays où les infrastructures numériques sont limitées. Et l’accès aux bases de données et aux plateformes collaboratives reste conditionné par la politique des institutions et des éditeurs.

Même en France, il existe des disparités : un chercheur affilié à une grande université ou à un organisme comme le CNRS a un accès privilégié à des plateformes de revues et bases de données scientifiques, tandis qu’un chercheur indépendant, un doctorant en fin de contrat ou un acteur du monde associatif doit se débrouiller avec les ressources en libre accès, qui restent parcellaires.

Matérialité et illusion d’immatérialité

Question 8 : Dans un monde où la donnée semble "immatérielle", comment percevez-vous la matérialité du travail documentaire ?

La question de l’archivage est incontournable et concerne tous les secteurs. Dans mon service, dédié à la formation continue, on m’a confié un travail sur la gestion des archives. Dans un premier temps, j’ai organisé les documents en fonction de leur pertinence, en identifiant certains comme potentiellement obsolètes. Toutefois, avant toute suppression, j’ai sollicité mes collègues afin de m’assurer de leur réelle valeur et de leur nécessité de conservation. Cette situation illustre bien les doutes fréquents liés aux réglementations en matière d’archivage dans le secteur public.

En principe, tout document devrait faire l’objet d’une réflexion encadrée avant d’être supprimé, ce qui implique une rigueur particulière dans les processus de gestion des données.

L’archivage ne devrait pas être une réflexion secondaire ou une contrainte administrative, mais une démarche intégrée dès la création des documents et des données. Idéalement, toute production d’information, qu’il s’agisse d’un simple document de travail ou d’une base de données, devrait être accompagnée d’un plan de gestion des données (PGD). Il est essentiel d’anticiper où et comment ces données seront stockées, pour quelle durée, et dans quelles conditions elles pourront être réutilisées ou archivées sur le long terme. Pourtant, cette approche reste souvent négligée dans la formation des professionnels de l’information.

Question 9 : Pensez-vous que la numérisation massive des ressources contribue à un enrichissement ou à un appauvrissement des pratiques documentaires et de recherche ?

L’accumulation massive de ressources numériques a d’un côté permis un accès élargi et instantané à l’information, mais de l’autre, elle peut entraîner un certain appauvrissement, notamment en raison de la perte de la dimension relationnelle et du rôle de médiation humaine.

L’illusion selon laquelle tout est accessible en ligne sans accompagnement est une réalité à déconstruire. En réalité, les professionnels de l’information-documentation restent indispensables pour gérer ces masses de données. Leur rôle évolue, intégrant de nouvelles compétences et s’adaptant aux mutations du secteur, mais leur présence demeure essentielle pour garantir une gestion efficace et éclairée de l’information.

Les Services Communs à la Documentation (SCD) proposent des outils pour se repérer dans leur offre documentaire, mais rechercher avec pertinence dans la masse de documents référencés nécessite un appui.

Dans cette dynamique, la numérisation a élargi l’accès aux savoirs, accéléré l’analyse et favorisé la diffusion des connaissances. Les chercheurs disposent désormais d’archives et de corpus auparavant difficiles d’accès et peuvent exploiter de nouvelles méthodologies. Toutefois, ces avancées s’accompagnent de contraintes. Les moteurs de recherche et plateformes scientifiques, en sélectionnant et hiérarchisant l’information selon des logiques algorithmiques, influencent les pratiques de recherche. Les infrastructures numériques imposent des standards qui peuvent restreindre la diversité des approches et renforcer la dépendance à des dispositifs spécifiques.

L’accompagnement des chercheurs ne se limite pas à la mise à disposition des ressources. Il s’agit de contextualiser l’information pour garantir son exploitation efficace. La diversité des sources, la maîtrise des outils de gestion des données et l’adoption d’une posture critique face aux technologies sont essentielles pour préserver la rigueur des pratiques documentaires et scientifiques. Les professionnels de l’information-documentation assurent ainsi un rôle de médiation indispensable, en facilitant une appropriation éclairée du numérique et en veillant à ce que l’accès aux savoirs s’accompagne d’une compréhension fine des enjeux sous-jacents.

Évolutions politiques et sociales du métier

Question 10 : Les humanités numériques transforment-elles la place des professionnel.le.s de l’information-documentation dans le monde académique ?

Le rôle des bibliothécaires a évolué sans pour autant gagner en notoriété. Pourtant, on les retrouve aujourd’hui là où leur présence semblait moins évidente. Lorsqu’il s’agit de rédiger un plan de gestion des données ou de structurer des connaissances dans une logique de web sémantique, leur expertise devient incontournable.

Dans le monde académique, cette transformation est manifeste. Autrefois centrée sur la gestion des documents et le conseil aux usagers, la profession s’oriente désormais vers l’accompagnement à l’identité numérique, la conservation des références bibliographiques ou encore l’optimisation des dépôts sous Zotero. Cette mutation a des implications directes sur les conditions de travail. Désormais, le quotidien s’organise essentiellement derrière un écran, avec des contraintes physiques similaires à celles des professionnels de l’informatique. Là où l’activité impliquait autrefois des déplacements et la manipulation de documents physiques, elle repose aujourd’hui sur des tâches dématérialisées, modifiant en profondeur l’expérience du travail en bibliothèque.

Question 11 : Voyez-vous une évolution des conditions de travail et des statuts dans votre domaine sous l’influence des transformations numériques ?

Il est essentiel de valoriser son métier sans attendre une reconnaissance extérieure. Il s’agit de démontrer son expertise, d’être créatif et de rendre visible l’impact de son travail. Développer une expertise reconnue passe souvent par l’acquisition de compétences spécifiques et techniques, comme la maîtrise de langages, qui restent peu répandues. L’évolution des missions en bibliothèque s’accompagne d’une transformation profonde des statuts : ces dernières années, 40 % des postes de bibliothécaires ont disparu, absorbés par des restructurations, intégrés à des services universitaires plus larges ou remplacés par des outils numériques.

Parallèlement, de nouveaux métiers émergent sous des intitulés variés : chargé de mission, chargé de veille, chef de projet en gestion documentaire. Si cette évolution entraîne une perte de certaines technicités spécifiques au métier de bibliothécaire, elle ouvre aussi des perspectives pour des profils capables de développer une expertise pointue. La spécialisation dans des compétences techniques peut permettre une meilleure reconnaissance et, dans certains cas, un positionnement plus proche des métiers de l’informatique, où les salaires et la considération professionnelle sont souvent plus avantageux.

Toutefois, cette évolution s’inscrit dans un contexte de précarisation des emplois. Au CNRS, sur les 34 700 agents, plusieurs milliers sont en CDD, et le turnover est important. Le secteur public peine à rivaliser avec le privé en termes de rémunération, ce qui rend le recrutement plus complexe. Malgré la stabilité que peut offrir la fonction publique, l’attractivité des postes souffre de ce décalage, posant la question de l’avenir des métiers de l’information-documentation pour les nouvelles générations.

Discussion ouverte

Nous aurions pu aborder un dernier volet sur le choix de carrière qui, selon moi, repose sur deux dimensions : les responsabilités attachées au poste que l’on souhaite occuper et le type de public avec lequel on veut travailler. Lorsque l’on souhaite prendre des responsabilités de cadre, la gestion des ressources humaines devient incontournable. Être responsable d’une bibliothèque ou d’un service documentaire, ce n’est pas seulement gérer des collections ou structurer des ressources numériques, c’est également gérer une équipe avec son organisation du travail, administrative et financière, sans oublier la gestion de conflits ou encore l’accompagnement au changement organisationnel.

Ce sont des aspects que l’on ne soupçonne pas toujours en début de carrière. Moi-même, j’ai été surprise par l’ampleur de ces missions dans certains postes. Il faut être clair avec soi-même : est-ce que je me vois gérer une équipe et prendre des décisions stratégiques, ou est-ce que je préfère rester dans un rôle plus opérationnel et technique ? Il est important de ne pas sous-estimer son équilibre professionnel, car en prenant davantage de responsabilités, on se retrouve aussi moins sur le terrain, moins au contact des documents et des chercheurs, et plus dans une posture de gestionnaire.

Je suis également convaincue qu’il est essentiel de rester en mouvement, de changer de poste, d’explorer de nouveaux domaines, et surtout de se former en permanence. Notre métier repose sur une évolution constante, et la formation continue est importante. Chaque jour, j’apprends quelque chose de nouveau, et ce processus d’apprentissage ne s’arrête jamais. Il existe un risque de s’éparpiller, d’être submergé par la multiplicité des formations disponibles et de ne plus savoir où se focaliser. Il est facile de se retrouver en position de spectateur, subissant les évolutions sans parvenir à en tirer pleinement parti. Pour éviter cela, il faut se fixer des objectifs clairs, identifier les compétences prioritaires à acquérir et construire son parcours professionnel.

Ce métier exige une posture proactive, une capacité à s’adapter et à intégrer continuellement de nouvelles connaissances.

Transformations des métiers de l’information-documentation au prisme des humanités numériques : Entretien avec Jean-Philippe Moreux

juin 6, 2025 Temps de lecture: 21 minutes

Introduction

Ce billet (disponible ici sous format PDF) prend la forme d’un entretien écrit sur les transformations des métiers de l’information-documentation au prisme des humanités numériques avec Jean-Philippe Moreux, en collaboration avec Emma Lavallée et Sokaina Al Morabit.

Jean-Philippe MOREUX, ingénieur diplômé de l’INSA Toulouse (informatique, 1990), est le chef de mission IA de la Bibliothèque nationale de France. Il a été auparavant l’expert scientifique de la bibliothèque numérique Gallica au département de la Coopération et l’expert OCR et formats éditoriaux du service de la Numérisation. Précédemment, il a exercé les métiers de chef de projet informatique, responsable éditorial et consultant (ingénierie éditoriale, édition scientifique). Il travaille sur l’application de l’intelligence artificielle dans le contexte du patrimoine, les programmes de valorisation du patrimoine numérique et participe à des projets de recherche sur ces sujets. Ses principaux sujets d’activité et de recherche sont la production et la valorisation des ressources patrimoniales numériques, les services aux humanités numériques, l’ingénierie de la donnée et du document (Source : BnF)

Emma Lavallée est diplômée de l’université de Limoges avec une Licence d’Histoire et une Licence Professionnelle Design de l’Information et Rédaction Technique. Elle poursuit actuellement le Master 2 MAVINUM à l'université de Montpellier Paul-Valéry en alternance. Elle réalise cette alternance à Safran Landing Systems, entreprise d’aéronautique, dans le service de documentation technique.

Sokaina Al Morabit est étudiante en Master 2 MAVINUM à l’Université Paul-Valéry Montpellier et documentaliste en alternance à la bibliothèque de TBS Education à Toulouse. Ses missions portent sur l’acculturation des étudiants aux compétences informationnelles, via la conception de contenus pédagogiques sur le LMS Moodle, ainsi que sur le développement de la science ouverte, à travers la création d’une rubrique dédiée sur le site de la bibliothèque et la participation à l'organisation d’ateliers pour les chercheurs. Sokaina Al Morabit s’est orientée vers le domaine de l’information-documentation à la suite d’un Master recherche Langues et Sociétés à l’Université Toulouse 2 Jean-Jaurès, où son travail de recherche l’a amenée à s’intéresser aux techniques documentaires et au monde des bibliothèques.

L'entretien avec Jean-Philippe MOREUX

Pour commencer, pourriez-vous présenter brièvement votre parcours professionnel et décrire vos principales missions au sein de la Bibliothèque nationale de France (BnF), notamment autour de Gallica et du BnF DataLab ?

Moi j’ai une formation initiale d’ingénieur en informatique. Après j’ai travaillé un petit peu dans le logiciel, et après je me suis tourné vers le secteur de l’édition, l’édition scientifique, donc à cheval entre l’édition scientifique, technique et puis un peu après l’édition numérique.

Et plus récemment, il y a dix ans, j’ai basculé du côté des bibliothèques. Donc c’est un parcours centré sur le document. À l’origine, mon premier poste dans l’informatique, c’était la gestion électronique de documents. Donc le fil, c’est le document.

Et aujourd’hui, à la BnF, après avoir longtemps travaillé auprès de la bibliothèque numérique Gallica, depuis plus récemment, deux ou trois années, je me suis occupé beaucoup d’innovation, de recherche-développement autour de l’intelligence artificielle dans le patrimoine.

Donc mon poste aujourd’hui, il est plutôt sur l’accompagnement à la transition vers l’innovation numérique, le lien pour le patrimoine. Et auparavant, dans le précédent poste côté Gallica, encore aujourd’hui, il y a beaucoup d’interactions bien sûr avec les humanités numériques, au sens où les chercheurs sont la principale catégorie d’usagers de la BnF.

Donc effectivement, moi je n’ai pas un parcours classique en info-doc. Je n’ai pas de formation initiale dans les métiers de bibliothèque. Mais je travaille ici depuis douze ans.

Comment définiriez-vous les humanités numériques, et comment cette notion s’est-elle transformée ou enrichie, selon vous, au cours de ces dernières années ?

Écoutez, les humanités numériques, c’est une manière d’envisager la recherche en sciences humaines et sociales en utilisant un outillage… enfin, un outillage numérique qui peut être très divers.

C’est à la fois, je pense, une communauté, une méthodologie de travail, qui s’appuie aussi, bien sûr, sur des bibliothèques d’outils ou des approches techniques, qui relèvent de l’informatique au sens large. Sous ce terme assez générique, on peut mettre beaucoup de choses. Nous, à la BnF, on se positionne en tant que partenaire d’équipes de recherche, ou de chercheurs, qui utilisent ces approches, qui s’inscrivent dans cette communauté, dans cette dynamique.

On fait de la recherche, mais la BnF, c’est une bibliothèque de recherche. Mais quand on parle d’humanités numériques ici, on parle vraiment de services qu’on peut rendre ou de l’accompagnement à des chercheurs, ou des laboratoires de recherche, ou des équipes de recherche, qui ont ce type de pratique. Ce qui a beaucoup changé, je dirais depuis une dizaine d’années, c’est la démocratisation de l’outillage technique, la montée en puissance, en performance, des approches techniques permises, y compris par l’IA.

Donc c’est cette démocratisation qui a permis de constater qu’on avait plus de demandes d’étudiants, de chercheurs, qui se sont engagés pour leur propre activité, pour leurs propres objectifs scientifiques. Ce qu’on fait avec eux aujourd’hui ou ce qu’on faisait il y a cinq ou dix ans, les objectifs restent les mêmes : accompagner, servir des objectifs scientifiques.

Les méthodes sont peu ou prou restées les mêmes, par contre l’outillage a beaucoup changé. Les chercheurs sont plus autonomes aujourd’hui qu’ils ne l’étaient il y a trois ou cinq ans, parce que la technologie est plus performante, parce que les outils se sont démocratisés, et parce qu’il y a aussi plus de pratiquants. Il y a une sorte de communauté qui s’est construite, en France et ailleurs.

Comment les outils et approches des humanités numériques transforment-ils la façon dont vous valorisez et diffusez le patrimoine culturel auprès du public et des chercheurs ?

On s’inscrit dans cette dynamique parce qu’il y avait une demande de la part de nos usagers, une demande renforcée d’accès aux collections numérisées. Pour qu’ils soient en capacité, eux, de travailler avec ces collections, nous, on a été amenés à ouvrir, par exemple, des API. À s’engager dans une dynamique d’ouverture des données, qui est aussi promue par l’État au sens large.

C’est donc cette interaction, cet échange, en termes de demande adressée à la bibliothèque, qui nous a amenés à faire évoluer à la fois la manière dont on envisage les collections lorsqu’elles sont numériques ou numérisées, et puis les portails d’information, les outils qui s’appuient sur ces collections. C’est aussi une réponse de la BnF à des demandes exprimées par ses usagers.

Ce n’est pas qu’une question de demande, c’est aussi l’intérêt de travailler de manière transdisciplinaire avec des usagers ou avec des partenaires, sur des projets concrets qui s’appuient sur les collections. Ça permet de valoriser les collections, pas uniquement en les décrivant dans des catalogues ou en les diffusant sur des portails comme Gallica, mais ça permet d’élargir les usages qui sont faits de ces collections, puisqu’elles redeviennent vivantes dans la manière dont les chercheurs les approprient, les réutilisent pour leurs propres objectifs.

C’est une nouvelle manière de faire vivre, de communiquer, de faire connaître ces collections. C’est intéressant pour toutes les parties prenantes.

Comment décririez-vous votre posture professionnelle face à l’essor des humanités numériques ? Qu’est-ce qui caractérise, selon vous, le « nouveau » rôle du professionnel de l’information-documentation dans ce contexte ?

Je pense qu’il y a quelques années encore, c’était encore relativement nouveau, c’est-à-dire qu’on découvrait cette posture. Aujourd’hui, elle s’est un peu imposée, c’est-à-dire que l’accompagnement de chercheurs dans des pratiques techniques, spécifiques, nouvelles, qui se renouvellent très vite, c’est devenu un peu une mission classique dans une bibliothèque comme la BnF.

Le rôle du professionnel de l’info-doc a un peu évolué, dans le sens où auparavant on orientait les chercheurs dans les catalogues, vers des outils de recherche documentaire.

Aujourd’hui, il faut qu’on soit en capacité de comprendre ce que veulent faire les chercheurs avec les collections, et de leur fournir un accompagnement, qui est à la fois technique, ou bien qui consiste à identifier des sources, ou à les orienter vers des outils, vers des plateformes. Ça fait apparaître aussi des nouveaux profils dans les bibliothèques, c’est-à-dire des gens qui sont un peu à la croisée de plusieurs mondes : de l’informatique, du patrimoine, de l’enseignement supérieur.

On recrute aujourd’hui dans des bibliothèques, nationales ou universitaires, des ingénieurs d’étude ou des ingénieurs de recherche, qui sont capables de dialoguer avec des chercheurs. C’est donc un peu une recomposition des équipes dans les bibliothèques, pour certaines d’entre elles en tout cas.

Sur quels types de projets d’innovation travaillez-vous actuellement, ou prévoyez-vous de travailler, et comment s’inscrivent-ils dans l’évolution plus globale du champ des humanités numériques ?

Il y a un ensemble de projets qui relèvent des missions classiques de la bibliothèque : numériser, cataloguer, diffuser des collections, par exemple à travers Gallica. Et il y a un autre ensemble de projets qui s’appuient plutôt sur une logique de collaboration avec le monde académique. Depuis cinq ou six ans, on participe à des projets transdisciplinaires qui associent à la fois des laboratoires en sciences humaines, des chercheurs en informatique, et puis une bibliothèque patrimoniale comme la BnF.

Ces projets peuvent porter sur des collections spécifiques, par exemple la presse ancienne, les documents iconographiques, les estampes, les manuscrits, etc.

L’intérêt, c’est que chacun y trouve un bénéfice. Le laboratoire en SHS peut faire avancer ses hypothèses ou sa méthode. Le laboratoire en informatique a un corpus à tester. Et la bibliothèque, elle, peut créer des outils, des prototypes qui lui seront utiles ensuite pour ses propres missions. Donc ce sont des projets qui enrichissent toutes les parties.

C’est aussi un moyen pour nous de tester des technologies, d’identifier des besoins, d’expérimenter avec des chercheurs, tout en gardant une maîtrise des usages.

Ce sont des projets qui ne sont pas déconnectés de la bibliothèque : les corpus sont bien les nôtres, les chercheurs sont bien ceux que l’on accueille ou que l’on accompagne, et les outils développés sont pensés pour être utiles à terme.

Quelles sont, selon vous, les transformations majeures qui ont eu lieu ces dernières années sous l’impulsion des humanités numériques, et en quoi ont-elles modifié vos méthodes de travail ?

Je pense que ce qui a le plus changé, c’est le niveau d’exigence des chercheurs. Il y a cinq ou dix ans, les chercheurs qui s’intéressaient aux humanités numériques étaient plutôt des pionniers, des gens très au fait, qui venaient nous voir avec des demandes assez exploratoires.

Aujourd’hui, ce n’est plus le cas. Ce sont des chercheurs qui savent ce qu’ils veulent faire, qui ont souvent les compétences techniques, ou bien qui ont dans leur équipe des personnes capables de développer.

Ils veulent donc utiliser des corpus, des API, des formats de données bien structurés, des jeux de données prêts à l’emploi. Nous, en tant que bibliothèque, ça nous oblige à faire évoluer nos services, à revoir nos systèmes d’information.

Ce n’est pas uniquement le DataLab qui doit répondre à ces demandes : c’est toute la bibliothèque, tout son écosystème technique, qui doit évoluer. On ne peut pas avoir d’un côté un laboratoire innovant, très performant, et de l’autre des systèmes qui datent des années 90 ou 2000. Donc on essaie d’articuler innovation et fonctionnement quotidien. Il faut que l’ensemble suive.

Ce sont des transformations profondes, qui concernent autant les outils que les méthodes de travail, et même les métiers dans la bibliothèque.

Les projets en humanités numériques sont souvent interdisciplinaires. Pourriez-vous nous donner des exemples concrets de collaborations (avec des chercheurs, des développeurs, des conservateurs, etc.) et expliquer comment votre rôle s’articule dans ces dynamiques de travail collaboratif ? Avez-vous déjà rencontré des difficultés ou fait face à des défis à ce niveau ?

Alors oui, chaque année par exemple, le DataLab, qui est un dispositif d’accueil à la BnF pour les chercheurs en humanités numériques, lance un appel à projets.

On sélectionne chaque année entre quatre et six projets, qui sont portés par des chercheurs ou des équipes de recherche. Et ce sont des projets très variés, qui peuvent aller de la littérature à l’histoire de la publicité, des arts du spectacle aux sciences de l’information.

À chaque fois, ces projets impliquent des corpus issus des collections de la BnF, et une équipe de chercheurs qui veut les explorer avec des méthodes numériques.

De notre côté, on constitue une équipe projet en interne, avec des conservateurs, des informaticiens, des responsables de données, etc. On met en place des réunions régulières, on accompagne le projet pendant un an. Ce sont donc des collaborations concrètes, où chacun apporte son expertise.

Les difficultés, on les rencontre surtout sur la question des temporalités. Un chercheur ou un postdoctorant travaille sur un temps court, un an, deux ans, trois ans au maximum.

La BnF, elle, est sur des cycles beaucoup plus longs, cinq, dix ans parfois. Donc il faut synchroniser ces temporalités.

L’autre difficulté, c’est la pérennisation. Comment on fait vivre un outil, un prototype, une méthode développée dans le cadre du projet, une fois que le projet est fini ?

C’est un vrai défi, parce que la BnF n’est pas une entreprise, ce n’est pas une start-up. Intégrer de l’innovation dans une structure publique patrimoniale, ça demande du temps, de l’organisation, des moyens. Mais c’est aussi ce qui rend le travail intéressant.

Selon vous, les professionnel·les de l’information-documentation (archivistes, documentalistes, etc.) sont-ils aujourd’hui suffisamment formé·es aux humanités numériques, ou constatez-vous encore des lacunes dans ce domaine ? Quelles compétences clés (techniques, scientifiques, communicationnelles, etc.) devraient être développées pour répondre aux nouveaux besoins induits par le numérique ?

Selon vous, les professionnel·les de l’information-documentation (archivistes, documentalistes, etc.) sont-ils aujourd’hui suffisamment formé·es aux humanités numériques, ou constatez-vous encore des lacunes dans ce domaine ? Quelles compétences clés (techniques, scientifiques, communicationnelles, etc.) devraient être développées pour répondre aux nouveaux besoins induits par le numérique ?

Ça dépend vraiment beaucoup des filières de formation. Je connais un peu les masters en sciences de l’information, l’ENSSIB, ce genre de formations.

Aujourd’hui, dans n’importe quelle bibliothèque, même une bibliothèque de lecture publique, vous êtes confronté·e au numérique. Il faut savoir que cela dépasse très largement la question des catalogues ou même de Gallica. Donc, ces formations intègrent désormais le numérique.

Mais sur la question plus spécifique des humanités numériques, c’est-à-dire la manière dont les chercheurs vont mobiliser les collections patrimoniales avec des outils d’analyse, d’extraction, de fouille, etc., il y a encore beaucoup à faire, notamment du côté de l’intelligence artificielle.

Aujourd’hui, on reçoit des projets au DataLab : 90 % des projets qui nous sont proposés utilisent des outils d’IA, que ce soit pour faire de la reconnaissance d’entités nommées, de la classification, de l’analyse d’images ou du traitement du langage.

Donc, si on veut pouvoir répondre à ces projets, il faut qu’on comprenne ce que les chercheurs veulent faire. Et pour cela, il faut que les professionnels soient formés, pas forcément pour développer eux-mêmes, mais pour comprendre, pour dialoguer, pour accompagner.

Donc oui, il y a encore un effort de formation à faire, notamment sur ces outils récents et sur les enjeux qu’ils posent.

Quels sont les principaux défis techniques et méthodologiques que vous rencontrez actuellement dans l’exploitation des données ou des corpus pour la recherche en humanités numériques ? La pérennité et l’interopérabilité des données, ainsi que le développement rapide des technologies, font-ils partie de ces défis ?

Oui, absolument. Ce sont des défis majeurs aujourd’hui. Les chercheurs, comme je le disais, sont de plus en plus exigeants, avec des outils de plus en plus puissants, des attentes très précises. Donc, ça veut dire que nous, de notre côté, on doit faire évoluer notre offre de services, notre environnement technique et nos systèmes d’information. Et ce ne sont pas que des questions d’innovation dans un coin de la bibliothèque, comme au DataLab : ce sont des questions qui doivent concerner toute la structure.

Il faut faire en sorte que ce ne soit pas seulement quelques ingénieurs ou quelques bibliothécaires innovants qui soient en capacité de répondre à ces besoins, mais que toute l’institution monte en compétence. Sur les données, les défis sont clairs : qualité, structuration, interopérabilité.

Il faut que les données soient utilisables, bien documentées, compatibles avec les outils des chercheurs. Et puis, il y a aussi la question de la pérennité. Beaucoup d’outils ou de plateformes sont développés dans le cadre de projets de recherche, mais une fois le financement terminé : qui maintient ? Qui héberge ? Qui réutilise ?

Là aussi, les bibliothèques ont un rôle à jouer, à condition d’avoir les ressources et l’appui institutionnel pour le faire.

Pensez-vous que les outils technologiques sont pleinement exploités et optimisés au profit des humanités à l’heure actuelle ? Ou bien leur utilisation reste-t-elle encore limitée ou inégalement généralisée ?

Pensez-vous que les outils technologiques sont pleinement exploités et optimisés au profit des humanités à l’heure actuelle ? Ou bien leur utilisation reste-t-elle encore limitée ou inégalement généralisée ?

Non, je pense que l’utilisation reste encore inégalement généralisée.

Il y a des équipes très structurées, avec des moyens, qui sont capables d’utiliser des outils très puissants. Et puis, à côté de ça, il y a des chercheurs isolés ou des laboratoires qui manquent de moyens, qui redéveloppent parfois des outils qui existent déjà ailleurs, parce qu’ils n’en ont pas connaissance ou parce qu’ils n’y ont pas accès.

Il y a donc un vrai problème de mutualisation, de capitalisation. La communauté des humanités numériques est très dynamique, mais elle est encore jeune, elle fonctionne beaucoup en silos. Il manque parfois des infrastructures pérennes. Huma-Num, par exemple, joue un rôle important pour mutualiser les outils, mais ses moyens sont limités ; ce n’est pas suffisant pour structurer l’ensemble du champ.

Donc oui, les outils technologiques ne sont pas encore pleinement exploités. Il y a un enjeu à mieux les faire connaître, à mieux les partager, à mieux les maintenir aussi dans la durée.

Pour conclure, quels conseils donneriez-vous à un·e futur·e professionnel·le de l’information-documentation souhaitant s’impliquer dans les humanités numériques ? Et, d’après votre expérience, quels sont les principaux impacts que les humanités numériques ont sur la profession aujourd’hui et à l’avenir ?

Je dirais que si c’est un domaine qui l’intéresse, il faut d’abord trouver un établissement qui permet de faire ça.

Ce n’est pas le cas partout. Dans certaines bibliothèques de lecture publique, vous n’aurez pas de projets en humanités numériques.

En revanche, dans les bibliothèques universitaires, les bibliothèques de recherche, les bibliothèques patrimoniales, là, oui, il y a une vraie demande.

Ensuite, il faut se former. Il existe des formations hybrides, des masters croisés entre info-doc, numérique, sciences humaines.

Et puis il faut s’impliquer dans des projets concrets, en stage ou en début de carrière, pour comprendre comment ça fonctionne, pour monter en compétence. Il n’y a pas de profil unique. Certains professionnels viennent de l’informatique, d’autres des sciences humaines, d’autres encore du patrimoine. Ce qui compte, c’est la capacité à comprendre les enjeux du numérique, à dialoguer avec les chercheurs, à construire des services.

Pas besoin d’être développeur, mais il faut pouvoir se repérer dans un environnement technique complexe, et avoir envie de travailler avec des chercheurs sur des projets qui font bouger les lignes.

Les langages de balisage légers : le cas Markdown

février 17, 2025 Temps de lecture: 27 minutes

Ce billet a été rédigé par Julie de Suremain et Lauranne Fougère. Il s'agit d'un travail réalisé dans le cadre de l’enseignement "Document numérique : formats et langages".

Julie de Suremain : Après avoir étudié les Sciences économiques et sociales à la Sorbonne, elle se spécialise dans le secteur de l’audiovisuel, où elle occupe notamment le poste de programmatrice cinématographique pour plusieurs festivals internationaux. Souhaitant se reconvertir, elle intègre le "Master 1 Information-Documentation : Gestion de l'information et médiation documentaire - Métiers des bibliothèques et de la documentation" (GIMD) au sein de l'université Paul-Valéry Montpellier.

Lauranne Fougère est diplômée d’un Master 2 recherche, spécialité cultures et sociétés étrangères. Après avoir étudié à l’université de Poitiers, elle obtient le Capes d’anglais en 2011. Elle enseigne actuellement au lycée et elle a également repris ses études en enseignement à distance au sein du Master 1 GIMD à l'université Paul-Valéry Montpellier.

Introduction

Les logiciels de traitement de texte ont été conçus pour créer, éditer et imprimer des documents, tout en les enregistrant au format électronique. Cependant, les études et les pratiques ont confirmé leur inadaptabilité à des travaux de recherche, en particulier lors de collaborations collectives et dans le milieu scientifique. L’emprise des outils et des formats propriétaires constitue un frein à la pérennité des documents qu’ils génèrent. Les obstacles techniques rencontrés, tels que la compatibilité des formats, entravent la libre circulation des productions. Le choix croissant de modèles économiques visant à rendre payante l'accessibilité aux documents ne garantit pas leur libre consultation. De plus, la difficulté d’intégration des productions sur les sites rend les outils de traitement de texte inadaptés à la production web. Leur faiblesse en matière de gestion lors de l’intégration d’images et de graphismes, ainsi que l’utilisation répétée du « copier/coller », engendrent des documents lourds et énergivores, ne répondant pas aux critères écologiques et aux aspirations de low-tech.

Le Markdown, qui est un langage de balisage dit léger, permet de structurer simplement et rapidement un document, garantissant un rendu intelligible pour l’homme et pour la machine. Les études menées par Marina Parra, Arthur Perret, Benoit Rou et Patrick Mpondo-Dicka offrent un éclairage approfondi sur ce code et ses possibilités d’utilisation. Les regards croisés d’une doctorante en littérature, d’un maître de conférences en sciences de l’information, d’un historien et d’un sémioticien, enseignant-chercheur en sciences de l'information et de la communication, offrent un aperçu riche de ce langage sous différents angles perceptifs : historique, philosophique, méthodologique, théorique et prospectif.

S’il semble incontestable qu’à travers une démarche réflexive, nous devons nous réapproprier nos environnements de travail et les outils que nous utilisons, le système de langage Markdown peut-il constituer un élément de réponse à cet enjeu ? Pour tenter de répondre à cette problématique, nous allons nous intéresser à trois documents :

Marine Parra, Arthur Perret (20323). Écrire autrement : réflexions croisées sur Mardown. Séminaire du Réseau Sociétés et Humanités Numériques en association avec les séminaires So MSH! et PROGEDO-Loire, Julie Aucagne, Jun 2023, Nantes, France, https://hal.science/hal-04162643
Marine Parra et Benoît Roux, Markdown, se réapproprier ses outils d’écriture, in Eveille, 03/02/2022, https://eveille.hypotheses.org/975
Patrick Mpondo-Dicka (2019). Le Markdown, une praxis énonciative du numérique. Interfaces numériques, 8. https://doi.org/10.25965/interfaces-numeriques.3915

Dans un premier temps, nous montrerons en quoi des langages de balisage (LBL) tels que le Markdown représentent une valeur ajoutée pour le document numérique. Puis, nous nous intéresserons à leurs limites et mettrons en évidence l’évolution inévitable du langage Markdown en tant qu’outil dédié à une pratique.

1- Markdown, une valeur ajoutée pour le document numérique

a. Une proposition de réponse aux évolutions technologiques

Bien qu’il ait des caractéristiques similaires au document traditionnel, le document numérique ne peut se définir comme un concept pleinement établi. L'évolution rapide et constante des technologies, la multiplication des fonctionnalités d'un document numérique, la possibilité d'intégrer des éléments multimédias et l'interactivité spécifique des utilisateurs face à ces nouveaux formats sont autant de facteurs qui rendent complexe l'élaboration d'une définition arrêtée. Si Stéphane Crozat s'efforce de donner les contours de ce concept^[1], il souligne également la nécessité de le concevoir en tenant compte de ses spécificités, de ses usages et de ses potentialités dans un contexte numérique en constante évolution. Une étude approfondie et ciblée est essentielle, notamment pour la création d’outils appropriés répondant aux exigences de leurs utilisateurs et aux avancées technologiques.

Dans un contexte collaboratif, de production scientifique ou de diffusion web, l’utilisation de logiciels de traitement de texte pour la production de documents numériques ne répond pas à la nécessité de maniabilité du texte. La pluralité des outils et, de ce fait, des formats, complexifie l’intégration de ressources variées. Les caractéristiques high-tech de ces formats constituent une entrave à la circulation fluide dans la production écrite et induisent un temps de traitement et de mise en forme conséquent.
Enfin, comme mentionné précédemment, ils sont inadaptés à la production web. Les langages de balisages légers en tant que lieu même du dialogue humain machine, comme le souligne Patrick Mpondo-Dicka (2019), peuvent jouer un rôle de substitut.

b. Les caractéristiques de Markdown

L’expansion d’Internet et du Web, dans les années 2000, a favorisé la prolifération de productions numériques telles que les blogs et suscité le besoin de développer des outils simples pour la création de contenus. C’est dans ce contexte qu’en 2004, John Gruber, avec l’aide d’Aaron Swartz, conçoit Markdown, un langage permettant de rédiger et de mettre en forme des textes bruts à l’aide de balises simplifiées, tout en intégrant la possibilité de conversion vers d'autres formats, comme le HTML. Le développement de balisages légers permet de structurer simplement et rapidement une production, tout en garantissant un texte lisible par l’homme et la machine, même sous sa forme brute. La neutralité stylistique et sa simplicité langagière du Markdown augmente la flexibilité et la réutilisation des productions qu’il génère, répondant entre autres aux exigences du Web et à la loi de la moindre puissance (W3C)^[2]. Compatible et léger, il profite à la collaboration et à l’organisation des différentes étapes d’avancement de recherches. Il est accessible sur différents supports, y compris ceux à faibles capacités telles que les téléphones, les tablettes.

Le choix d’une économie de balises associées à des caractères de ponctuations familiers tels que (#,-,*,=) rend ce langage accessible à un large public. Sa spécificité de code open source facilite son appropriation par ses utilisateurs. Markdown répond également au principe de « single-source », un fichier source unique pour des productions dans différents formats. Lors de corrections, seul le fichier source est corrigé permettant de régénérer les autres fichiers selon les besoins. Sa spécificité d’outils libre de droit et compatible avec n’importe quel éditeur de texte brut, assure la fluidité d’utilisation, sa maniabilité et la pérennité du document. De ce fait, il constitue un écosystème de travail global et intégré, un outil de production numérique adapté aux besoins des utilisateurs, dans une démarche low tech. Ces valeurs peuvent expliquer le succès toujours croissant de Markdown et son implémentation sur le site des développeurs.

c. Markdown et ses nombreuses variantes

De nombreux éditeurs de textes, open source, spécialisés dans son écriture ont été développés, offrant une large gamme d’options adaptées à des besoins spécifiques. La plupart d’entre eux proposent une interface qui distingue le fond et la forme, avec une visualisation du texte au format HTML ou PDF, ce qui favorise la concentration. Marp favorise la création de diapositives ; en mode Présentateur, le texte devient un prompteur, tandis que les éléments sélectionnés pour être affichés apparaissent sur les diapos avec une mise en page largement automatisée. D’autre part, iA Presenter permet un export qui se rapproche davantage d'un document traditionnel, intégrant texte et des illustrations. Certains éditeurs répondent aux exigences d’écritures particulières : Zettlr simplifie l’insertion de citations par rapport aux logiciels de traitement de texte classiques, tandis que Zotero facilite la gestion des bibliographies et des prises de notes. Zettlr offre également un espace de travail personnalisé permettant de structurer les connaissances grâce à une organisation non linéaire des notes étiquetées. En tandem Cosma, il permet de visualiser, naviguer et partager une base de connaissances constituée de fichiers Markdown interconnectés.

Par ailleurs, des outils tels que Stylo ont été conçus pour répondre aux différentes étapes de la chaîne éditoriale, permettant la conversion de texte en Markdown vers d’autres formats. Conçu pour le web, Markdown facilite la publication en ligne et certains outils ont été pensés de manière intégrée pour permettre d’envoyer directement le texte vers WordPress depuis l'éditeur. D’autres logiciels tels que écosystème R, Hugo et le tandem Make/ Pandoc intègrent également la création de blogs et de sites web.
La multitude de logiciels et outils intégrant le langage Markdown reflète sa notoriété et la place qu’il occupe dans les productions de documents actuels. Notoriété que le Markdown acquiert notamment avec son implantation sur Stackoverflow, (site de référence des développeurs conçu par Jeff Atwood ^[3]) et sur GitHub (plateforme de dépôt de code).

2- Markdown, un LBL en constante évolution

a. Les limites de Markdown

Cependant, bien que la simplicité soit l’un des fondements du langage Markdown, son utilisation croissante et variée engendre des inconvénients liés à son caractère peu expressif. La gestion d’éléments multimédias complexes, tels que les vidéos et les animations, s’avère limitée par rapport aux possibilités offertes par des outils comme le HTML ou des éditeurs WYSIWYG (logiciels permettant de créer et de modifier du contenu visuel avec un rendu final en temps réel). Dans le cadre de publications, la conversion de fichiers Markdown en d’autres formats peut alourdir le travail et nécessiter des mises à jour fréquentes.

Aussi, la rédaction de documents spécifiques peut s’avérer complexe. Comme le soulignent Marine Parra et Benoît Roux (2023), face aux exigences spécifiques d’un ouvrage, il est essentiel de s’approprier son propre environnement de travail afin d'acquérir toutes les fonctionnalités nécessaires pour le traitement du document. La sélection de ces outils implique une démarche réflexive. Des choix que nous n’avons pas toujours le temps de préciser ou conscientiser et qui peuvent alourdir la charge du travail engagé. Ainsi, la simplicité de Markdown n’est-elle pas altérée par la nécessité de multiples extensions qu’il faut associer aux outils initiaux ?

b. La simplicité de Markdown: force ou faiblesse?

La diversité des utilisateurs soulève la question des limites de Markdown. Son adaptation dépend en grande partie de son degré de standardisation. La flexibilité de Markdown, en tant que langage open source, a encouragé son appropriation par les utilisateurs, conduisant à la création de multiples variantes aux spécificités distinctes, telles que Pandoc Markdown pour l'écriture scientifique ou le R Markdown pour les statisticiens. Babelmark, un outil de test et de comparaison des différentes implémentations de Markdown, en recense vingt-deux versions. Cette multiplicité de versions engendre inévitablement des problèmes d’interopérabilité et complique le processus de standardisation. Jeff Atwood, accompagné d’une communauté de développeurs, a entrepris de mettre au point

« une spécification officielle de Markdown et une suite de tests standards permettant de valider les implantations de Markdown »

donnant lieu en 2014 à une première ébauche de standardisation du langage, puis au CommonMark. Cependant l’IESG, organisme responsable du processus de normalisation, n’a pas entériné sa validité. Un processus en marche mais qui, de par sa complexité, n'a toujours pas été finalisé.

Certaines fonctionnalités, spécifiques à certaines versions, ne sont pas prises en charge par d’autres. C’est notamment le cas d’options proposant la gestion des notes de bas de page ou des tableaux, qui peuvent entraîner des erreurs de formatage ou des pertes d’information lors de la conversion entre différents outils.

De plus, la fiabilité du rendu est remise en question selon l’éditeur de texte choisi, ce qui ne garantit pas la fidélité de la mise en page initiale. Dans un environnement collaboratif, le manque de compatibilité entre les différents éditeurs Markdown entrave également le partage de documents et le travail collectif. Ainsi, bien que la compatibilité de Markdown avec divers outils de traitement de texte soit l’un des principes du langage, elle est désormais compromise.

Enfin, contrairement à l’idéologie initiale d’un code open source, certains outils développés récemment relèvent de la propriété privée. Ils sont accessibles uniquement en ligne et leur code est fermé. C’est le cas de nombreux outils pour l’élaboration de bases de connaissances. L’accès payant et restreint constitue un frein à l’accessibilité des données et ne garantit pas leur pérennité.

c. Les nécessaires adaptations de Markdown

La notoriété du langage Markdown l’a conduit à une transformation inévitable, remettant en question son statut "d’idiolecte numérique" (Mpondo-Dicka, 2019). Initialement considéré comme un outil répondant à des besoins spécifiques et utilisés dans des contextes particuliers, adopté par une large communauté, il est devenu un langage social véhiculaire servant de moyen de communication et d’échange d’informations entre les différents utilisateurs. En tant que "technolecte informatique" (Mpondo-Dicka, 2019), il tend à devenir un standard normalisé, le rendant plus fiable et accessible à tous. Il a perdu en souplesse ce qu’il gagne en interopérabilité, en individualité, ce qu’il gagne en cohérence bien qu’il rencontre encore des imperfections à améliorer. Les langages numériques sont le reflet de leurs utilisateurs, ils évoluent avec les nouveaux besoins rencontrés.

L’évolution technologique tend à complexifier les supports de communication et à accroître les exigences des utilisateurs. Dans ce contexte, les langages de balisage léger sont amenés à se perfectionner pour perdurer. Il en est ainsi pour Markdown qui, tout en gardant sa spécificité de langage léger, doit s’améliorer pour devenir plus complet. Des solutions doivent être apportées pour permettre notamment la fusion des cellules et l’intégration des images dans les tableaux, l’insertion de vidéo et d’audio et la possibilité de redimensionner les images.

De plus, l'association d’outils complémentaires peut favoriser une meilleure organisation de l’espace de travail et de son contenu. Par exemple, l'utilisation conjointe d'une mindmap (carte mentale) et de Markdown dans le cadre d’un projet peut améliorer l’organisation, la planification et la communication des idées. La recherche d’interactivité entre les outils pourrait être une voie d’amélioration.

Conclusion

Pour les futurs documentalistes, Markdown représente un outil précieux pour l’organisation des notes et l’élaboration de projets ou de tutoriels. Convertible en de nombreux formats, il permet la publication en ligne et l’impression ainsi que le partage de documents. Dans le cadre d’études collaboratives, des plateformes telles que GitHub facilitent la création participative en Markdown, tout en gardant une trace des modifications. Sa compatibilité et son caractère open source garantissent la pérennité des documents élaborés, qui est un élément essentiel pour les documents destinés à être archivés et réutilisés. À l’heure de l’urgence climatique, l’adoption d’une démarche low-tech est de mise. Par sa légèreté, Markdown répond à cette exigence.

Conférence de Stéphane Crozat dans le cadre de la Masterclass DNHD HyperEdition, Documentarité, Technologies intellectives qui s’est tenue à Bordeaux les 21 et 22 février 2019, en présence de Jean-Max Noyer et des étudiants de l’Université Bordeaux Montaigne. « On appellera document numérique tout objet numérique qui ressemble à un document par ses propriétés techniques (publication, fixation, fermeture, scénarisation) et surtout par ses propriétés fonctionnelles : transmission, enseignement, preuve.Le projet de l'ingénierie documentaire - et de la littératie numérique - est d'instrumenter (inventer et comprendre) des constructions numériques qui se substituent au document pour remplir ses rôles. » ↩︎
W3C : « moins de puissance augmente la flexibilité avec laquelle les informations peuvent être réutilisées », Berners-Lee Mendelsohn, 2006 ↩︎
Jeff Atwood cofondateur de la plateforme Stack Overflow, lieu de recherche et d’information destiné aux développeurs. ↩︎

ECM et GED : quelles évolutions actuelles ?

juillet 2, 2024 Temps de lecture: 12 minutes

Ce billet a été rédigé par Emma Lavallée et Abigaelle Guttierez. Il s'agit d'un travail réalisé dans le cadre de l’enseignement "Gestion de l’information et de la documentation numérique (GED, GEIDE, ERP)" du master 1 MAVINUM .

Emma Lavallée est diplômée de l’université de Limoges avec une Licence d’Histoire et une Licence Professionnelle Design de l’Information et Rédaction Technique. Elle poursuit actuellement le Master 1 MAVINUM à l’université Paul Valéry Montpellier 3 en alternance. Elle réalise cette alternance à Safran Landing Systems, entreprise d’aéronautique, dans le service de documentation technique.
Abigaelle Guttierez est diplômée de l'Université Paul Valéry Montpellier III d'un master en Histoire de l'art moderne. Après une année de césure, elle poursuit actuellement ses études en Master 1 MAVINUM en distanciel au sein de la même université. Elle est stagiaire au sein de l'équipe de gestion de Numerev, un incubateur scientifique et portail de science ouverte, où elle conçoit et réalise des tests utilisateurs.

Introduction

Dans un monde où le volume des données croît de manière exponentielle et où les technologies évoluent à une vitesse fulgurante, les entreprises et les organisations font face à des défis croissants en matière de gestion de l'information.

La gestion électronique des documents (GED) se présente comme une solution adaptée à ces enjeux. Elle facilite la conservation et l'organisation des documents, mais aussi leur accessibilité et leur sécurité. Pour explorer ces enjeux, nous proposons une synthèse analytique et réflexive autour du Guide pratique 74 d’Archimag, intitulé “ECM, Ged : la gestion de contenu en évolutions”.

Nous examinerons comment les nouvelles tendances de la GED redéfinissent les pratiques et préparent les organisations à être plus agiles, sécurisées et conformes aux normes. Nous chercherons à comprendre comment les organisations peuvent tirer parti des systèmes de GED, tout en abordant les défis de ces technologies. Cette réflexion nous permettra de saisir les perspectives futures de la GED ainsi que son rôle essentiel dans le cadre de la transformation numérique des entreprises.

Adaptation technologique de la GED

Utilisation de l'intelligence artificielle

Dans le cadre de la GED, l'intégration de l'intelligence artificielle (IA) représente un tournant majeur. L’article de Texier montre comment l'IA facilite amplement la capture et le traitement des données à grande échelle, tout en réduisant les coûts associés.

On constate que l'automatisation avancée des processus grâce à l'IA permet une classification précise des documents, une extraction intelligente des métadonnées et la suggestion de corrections ou d'améliorations en temps réel. Par exemple, Google propose Document AI, qui aide à automatiser la saisie des données et à les rendre accessibles pour d'autres applications.

C’est une solution cruciale pour les plateformes utilisant des solutions ECM (Enterprise Content Management). L'IA améliore l'expérience utilisateur en automatisant le marquage des documents et en facilitant les opérations de recherche grâce à des systèmes de reconnaissance. Ce processus enrichit les systèmes de GED et ouvre la voie à des analyses plus complexes et prédictives, essentielles à la prise de décision stratégique dans les environnements d'affaires actuels.

Conformité réglementaire renforcée

La conformité réglementaire est un enjeu central pour les systèmes de GED, notamment à l'ère du Règlement Général sur la Protection des Données (RGPD). Les systèmes de GED doivent garantir la sécurité et la confidentialité des données, mais aussi leur intégrité et leur accessibilité.

Comme le souligne Texier dans son article, cela inclut des mesures telles que la justification de la collecte de données, le consentement des utilisateurs, le droit à l'oubli et la détection de contenus sensibles. Cette mise en conformité découle aussi de la flexibilité des systèmes à s'adapter aux évolutions législatives.

Cela comprend la gestion avancée des métadonnées et la capacité à tracer l'audit complet des documents pour répondre aux exigences de transparence et de responsabilité.

Enfin, les politiques internes, la formation des utilisateurs et la mise en place de procédures sont cruciales pour assurer que les systèmes soient utilisés conformément aux lois et règlements. Cette approche holistique est essentielle pour minimiser les risques légaux et renforcer la confiance des utilisateurs dans le système de GED.

Réponses organisationnelles aux changements de modes de travail

Adaptation au modèle de télétravail

L'adaptation au modèle de télétravail, abordé dans l’article de Buscal, souligne l'importance d'un système de GED flexible et sécurisé face à l'évolution des modes de travail. Les organisations doivent repenser leurs stratégies de GED pour s'adapter à une main-d’œuvre plus dispersée géographiquement, impliquant une accessibilité sans faille et des mesures de sécurité renforcées.

Pour répondre à ces défis, l’intégration de solutions de chiffrement avancé et de gestion des identités doivent être appliquées. De plus, la formation continue des utilisateurs est cruciale pour une transition efficace vers le télétravail. Il est impératif que les employés soient sensibilisés aux meilleures pratiques de sécurité et de collaboration à distance.

Cette démarche assure que la productivité et la collaboration ne soient pas compromises, même en dehors de l'environnement de travail traditionnel. La gestion adaptative des documents, dans un contexte de télétravail, n'est pas seulement une réponse à une crise, mais une évolution nécessaire vers un modèle de travail plus flexible et résilient, préparant les entreprises pour l'avenir du travail.

Automatisation et réduction de la dépendance aux documents physiques

L'automatisation des processus métiers et documentaires est devenue un axe majeur de développement pour les systèmes de GED, comme l’explique Carré son article. Il met en évidence une tendance marquée vers la digitalisation complète des processus, motivée par des gains de productivité et une réduction significative des coûts de traitement des documents. L'impact de l'automatisation se manifeste particulièrement dans les processus tels que : les workflows, la gestion des achats, et les interactions avec les clients et fournisseurs ; l'efficacité opérationnelle peut être grandement améliorée par la réduction des tâches manuelles et l'utilisation de l'IA pour le traitement des données.

Cette transformation numérique est facilitée par des technologies telles que le Business Process Automation (BPA) et le Business Process Management (BPM). Ce sont des solutions de gestion intelligente des documents, qui permettent une gestion plus fluide et intégrée des documents. En réduisant la dépendance aux documents physiques, les entreprises améliorent leur efficacité opérationnelle et répondent aux exigences de durabilité et de responsabilité environnementale.

Ainsi, la GED automatisée se présente comme une solution à des défis immédiats, et s'inscrit dans une perspective stratégique à long terme, visant à transformer les pratiques de travail et soutenir les entreprises dans leur transition vers un environnement de travail plus numérisé et écologiquement responsable.

Sécurité et collaboration améliorées

Sécurisation des données dans un environnement GED

L’article de Buscal explique comment les stratégies de sécurité doivent être intégrées dès la conception des systèmes de GED pour protéger contre les accès non autorisés et les violations de données.

Cette approche est essentielle dans un environnement où les risques de cyberattaques sont croissants, exacerbé par la diversité et la quantité de données gérées. Les systèmes de GED modernes doivent offrir des niveaux de sécurité adaptés aux types de contenus qu'ils gèrent, impliquant des méthodes de cryptage avancées, la gestion des droits d'accès et des profils d'utilisateurs, ainsi que la mise en place de protocoles de traçabilité et d'auditabilité des accès et des modifications.

Selon l’auteur, ces mesures ne se limitent pas à la protection des données contre les intrusions externes, mais englobent également la prévention des fuites internes et la garantie de l'intégrité des données au fil du temps. De plus, la mise en œuvre de politiques de sécurité efficaces nécessite une collaboration étroite entre les départements informatiques et les utilisateurs finaux pour s'assurer que les règles de sécurité ne compromettent pas l’usabilité et l'efficacité des processus métier.

On souligne ici l'importance de formations régulières pour les utilisateurs afin de les sensibiliser aux pratiques de sécurité et de renforcer la culture de la protection des données au sein de l'organisation.

Collaboration et communication facilitées

Le dossier met l'accent sur l'importance de renforcer la collaboration et la communication au sein des organisations via des systèmes de GED.

Cependant, malgré les avancées technologiques, un grand nombre d'organisations continuent de s'appuyer sur des méthodes traditionnelles comme l'email pour le partage de documents internes, ce qui pose des défis significatifs en termes de sécurité et de traçabilité.

De plus, il est avancé que les besoins en partage externe sécurisé des informations sont souvent entravés par des contraintes telles que le volume des données et un contrôle insuffisant des informations partagées. Pour surmonter ces défis, Le Ven propose la création d'espaces collaboratifs dédiés et sécurisés.

Ces espaces, configurés pour être temporaires ou permanents selon les besoins, permettent de centraliser les échanges documentaires et de les sécuriser. Ils offrent une gestion des droits d'accès précise, ce qui garantit que seules les personnes autorisées peuvent accéder aux informations, et facilitent le suivi des modifications et des interactions avec les documents.

Une des suggestions particulièrement mise en avant est l'adoption de technologies permettant une traçabilité accrue des actions entreprises sur les documents partagés. Ceci est essentiel pour une gouvernance efficace des données et pour répondre aux préoccupations de conformité et de sécurité. En effet, environ 53 % des professionnels interrogés dans le cadre de la publication de ce dossier expriment le besoin d'améliorer la définition des règles et des processus.

Ceci témoigne d'une forte demande pour des solutions de GED qui renforcent la collaboration, la sécurité et la responsabilité. En intégrant de telles solutions, les organisations peuvent améliorer leur efficacité opérationnelle, tout en renforçant la sécurité des données et en promouvant une culture de collaboration ouverte. Ces espaces collaboratifs, enrichis de fonctionnalités avancées de GED, représentent une opportunité prometteuse pour les entreprises souhaitant optimiser la gestion de leurs documents dans un environnement évoluant vers le numérique et l’interconnectabilité.

Conclusion

Pour conclure, ce dossier met en lumière l'évolution rapide et significative de la GED dans un contexte professionnel de plus en plus axé sur la digitalisation et l'automatisation.

La nécessité d'intégrer l'intelligence artificielle pour optimiser les processus de classement et d'indexation, la conformité réglementaire renforcée pour répondre aux normes de sécurité et de protection des données, ainsi que l'adaptation aux nouveaux paradigmes de travail comme le télétravail, sont des thèmes qui définissent l'avenir de la GED.

L'automatisation continue de réduire la dépendance aux documents physiques, facilitant des opérations plus écologiques et efficaces, tandis que la sécurité des données devient une priorité incontournable pour protéger les informations sensibles et garantir la confiance des utilisateurs. Les auteurs offrent une perspective approfondie sur les défis et les opportunités de la GED dans le cadre de la transformation numérique des entreprises.

Ils soulignent l'importance d'une approche proactive et bien informée pour exploiter pleinement les potentialités de ces technologies.

On en conclut que les organisations doivent donc rester vigilantes et agiles, prêtes à intégrer de nouvelles solutions pour améliorer leurs systèmes de gestion documentaire, tout en restant attentives aux exigences réglementaires et aux besoins changeants de leur main-d’œuvre.

Usages de HAL : une synthèse

mai 16, 2024 Temps de lecture: 12 minutes

Ce billet a été rédigé par Armelle Paquier. Il s'agit d'un travail réalisé dans le cadre de l’enseignement "Edition savante et communication scientifique" assuré par Anne-Laure Fischer et Hans Dillaerts.

Armelle Paquier est diplômée d'un Master 2 en droit humanitaire et droits de l'homme à l'Université Paris 2. Après avoir travaillé dans le domaine social en milieu associatif, puis exercé la profession d'avocate pendant trois ans, elle décide de se reconvertir et intègre le "Master 1 Information-Documentation : Gestion de l'information et médiation documentaire - Métiers des bibliothèques et de la documentation" au sein de l'Université Paul Valéry Montpellier 3.

La synthèse proposée ci-dessous répond aux objectifs énoncés dans le sujet d'évaluation :

Finalité de l'exercice : Rédaction d'une synthèse (3-4 pages) d'un article de recherche portant sur des questionnements autour des pratiques de dépôt sur HAL. Il s'agit d'un travail d'écriture et de rédaction personnelle qui devra proposer un regard analytique sur l'article proposé ci-dessous.

Modalités de travail : Travail individuel ou en groupe (2 personnes).

L'article à analyser : Joachim Schöpfel, Florence Thiault, Hélène Prost, Bernard Jacquemin et Éric Kergosien, « L’utilisation de HAL par les laboratoires de recherche », Balisages [En ligne], 6 | 2023, mis en ligne le 21 septembre 2023, consulté le 14 décembre 2023. URL : https://publications-prairial.fr/balisages/index.php?id=1166

Dans le cadre d’une politique nationale française de développement de la science ouverte, les archives ouvertes sont devenues des outils indispensables. En effet, les archives ouvertes sont définies par l’article étudié comme des « bases de données documentaires accessibles librement et gratuitement sur Internet dans lesquelles les chercheurs peuvent y déposer un document scientifique ou technique dont ils sont l’auteur et dont ils détiennent les droits de diffusion pour rendre ce document librement accessible ».

Dans ce contexte, l’archive ouverte HAL, créée en 2001, s’est positionnée comme l’outil de référence d’un point de vue institutionnel et étatique. La pratique du dépôt en auto-archivage a également évolué vers une pratique de dépôt par des intermédiaires et notamment les laboratoires.

Ainsi, l’article étudié, intitulé « L’utilisation de Hal par les laboratoires de recherche », vise à présenter les résultats d’une enquête quantitative menée à la suite d’autres études menées entre 2019 et 2022, afin de les compléter et préciser l’analyse de la pratique des laboratoires concernant l’archive ouverte HAL. Elle a été menée en 2023 par Joachim Schöpfel, Florence Thiault, Hélène Prost, Bernard Jacquemin et Eric Kergosien dans le cadre du projet HAL/LO.

Plusieurs questions préalables à l’enquête se sont posées pour étudier la manière dont les laboratoires utilisent HAL et portent sur le nombre de laboratoires utilisant HAL ou non, le nombre et le type de documents déposés, ainsi que la création de collections ou non.

Dans cet article, les auteurs exposent tout d’abord un état de l’art. Ils expliquent ensuite leur méthodologie d’enquête et notamment leur méthode pour définir un échantillon significatif de laboratoires à étudier et leur manière de procéder à l’enquête pour répondre aux questions. Ils présentent ensuite les résultats obtenus quantitativement avant de procéder à une discussion de ceux-ci.

Plusieurs aspects principaux sont relevés par les auteurs qu’il conviendra d’examiner successivement : le rôle des laboratoires dans l’utilisation de HAL (I), l’impact des différences disciplinaires (II) et la transformation de HAL d’une archive ouverte vers un dispositif de suivi et d’évaluation de la production scientifique (III).

Le rôle des laboratoires dans l’utilisation de HAL

Afin d’étudier un échantillon significatif, les auteurs ont choisi d’étudier les pratiques des laboratoires des dix universités membres de l’association Udice, correspondant ainsi à l’identification de 1.246 laboratoires. En effet, ils ont pu établir que ces laboratoires produisent 45% des publications françaises et représentent un tiers de l’ensemble des dépôts sur HAL, ce qui parait représentatif. Ces laboratoires ont été recensés à travers un certain nombre d’informations et notamment leur nom, domaine de recherche et discipline.

Des limites sont apportées à la pertinence de cet échantillon en raison de « l’absence d’un identifiant fiable pour les structures et organisations scientifiques ». Ainsi, des doublons ou des erreurs et imprécisions dans les descriptions ont pu être commis, relativisant la portée des résultats.

Lors de précédentes enquêtes, il a pu être constaté que les laboratoires ont un rôle important dans la pratique de dépôt sur HAL, à travers plusieurs aspects. Tout d’abord, les laboratoires ont un impact d’un point de vue de la communication autour de l’archive ouverte et de la médiation pour inciter les chercheurs à déposer leurs documents et les aider à leur permettre concrètement de le faire. Par ailleurs, ils ont un impact d’un point de vue du soutien de la plateforme, à travers la création de collections. Enfin, il a pu être constaté que les laboratoires présentent des inégalités face à l’utilisation de HAL par les différences d’équipements et de ressources disponibles.

Par ailleurs, il avait été constaté l’existence de pratiques très différentes et notamment trois grands types d’utilisation de HAL par les laboratoires : comme une vitrine c’est-à-dire avec beaucoup de publications et d’accès libre aux entiers documents ; comme un gestionnaire de références bibliographiques, c’est-à-dire avec beaucoup de notices, mais peu de textes intégraux ; et enfin, sans stratégie.

Lors de la présente enquête, les auteurs ont également mis en avant le rôle important des laboratoires. Ils ont tout d’abord pu constater que 99% des laboratoires étudiés utilisent HAL d’une manière ou d’une autre, confirmant ainsi l’utilisation généralisée de cette plateforme.

Par ailleurs, la moitié de ces laboratoires ont procédé à la création d’une collection sur HAL, démontrant le soutien important apporté à la plateforme. Enfin, l’enquête a confirmé l’existence de pratiques très diversifiées par les laboratoires concernant tant le nombre de dépôts et le pourcentage de documents en plein texte que la typologie des documents ou encore les modalités d’alimentation.

Les auteurs ont ainsi développé une nouvelle analyse des pratiques de dépôt par les laboratoires à travers deux grandes tendances et non plus trois : une tendance d’un nombre restreint de laboratoires représentant la majorité des publications, soit environ 20% de laboratoires avec 67% de publications considérés comme les « meilleurs laboratoires », et une autre de la majorité des laboratoires représentant une minorité de publications, soit environ 70% des laboratoires représentant 20% des publications et renommés « la longue traîne ». Le groupe des « meilleurs laboratoires » présente en revanche moins de publications en texte intégral et davantage de notices que ceux de la « longue traîne ».

L’impact des différences disciplinaires dans l’utilisation de HAL

Afin de déterminer les raisons des différences d’utilisation de HAL constatées entre laboratoires, les enquêtes ont tenté d’examiner les facteurs potentiels distinctifs et notamment l’impact ou non des disciplines sur les pratiques d’utilisation.

Lors des précédentes enquêtes, les facteurs potentiels évoqués étaient multiples. Certains facteurs étaient ainsi rattachés à des critères distincts de la discipline de recherche elle-même, par exemple le nombre de chercheurs, les ressources humaines disponibles et notamment la présence ou non d’un documentaliste ou encore le statut de l’unité et la tutelle.

D’autres variables semblaient en revanche rattachées à la discipline et au domaine scientifique et notamment le choix délibéré du laboratoire, la politique d’établissement ou encore les pratiques individuelles. En effet, certains domaines semblaient plus enclins à soutenir HAL et notamment les mathématiques, la physique, l’informatique et les SHS. D’autres, au contraire, paraissaient beaucoup moins actifs, tels que la médecine, la biologie et les sciences de la vie.

Lors de la présente enquête, une distinction est observée au sein de la catégorie des « meilleurs laboratoires », en corrélation notamment avec les disciplines. Ainsi, au sein de cette catégorie, on trouve un groupe de laboratoires qui publient beaucoup de textes intégraux, principalement dans les domaines de l’informatique, les mathématiques et la physique. Ces domaines présentent une communauté acquise à la science ouverte et une tradition forte de dépôt.

L’autre groupe est celui des laboratoires qui présentent peu de textes intégraux, mais publient beaucoup de notices et qui relèvent plus généralement des domaines des SHS, de la biologie, de la chimie et du génie civil. Pour ces domaines, le signalement semble plus important que la communication directe des documents. Cependant, à nouveau, les auteurs constatent que la discipline n’explique pas toutes les variétés de comportements dans l’utilisation de HAL. Par ailleurs, environ un tiers des laboratoires sont des laboratoires mixtes couvrant plusieurs disciplines.

La transformation de HAL vers un dispositif de suivi et d’évaluation

Enfin, les auteurs constatent une transformation de HAL par l’utilisation qui en est faite, notamment de la part des laboratoires. En effet, les auteurs rappellent que la plateforme HAL a été originellement conçue comme une plateforme d’auto-archivage généralisée et ouverte à toutes les disciplines pour la mise à disposition de textes scientifiques intégraux.

Cependant, ils constatent que l’objectif n’a pas été atteint puisque toutes les disciplines ne sont pas représentées de la même façon, il y a peu de textes intégraux et également peu d’auto-archivage. La majorité des documents sont des notices publiées par des intermédiaires. Certains le décrivent ainsi comme une « dérive bibliométrique des archives ouvertes ».

Mais ils constatent également que ce mouvement participe d’une évolution générale des archives ouvertes dans cette direction et qu’il a pour objectif une évaluation des résultats et un suivi de la productivité de la recherche. Les laboratoires qui publient beaucoup, mais peu de textes intégraux visent ainsi l’exhaustivité du contenu et la communication du texte intégral devient secondaire. Cette recherche permet alors de « produire des connaissances fiables sur la recherche et d’aider les institutions scientifiques à assurer le suivi des projets scientifiques ».

Par ailleurs, les auteurs relèvent que la particularité de HAL dans ce domaine est celle de son niveau d’utilisation. La plateforme semble en effet être la seule à disposer d’une aura nationale et faire ainsi l’objet d’une demande de la part des établissements et laboratoires, mais également de l’administration centrale de l’État français.

Cela implique également une incitation renforcée pour l’utilisation de HAL puisqu’elle est appuyée par l’administration centrale et le CNRS. De nouveaux procédés apparaissent également en lien avec ce niveau d’utilisation et notamment des mécanismes automatisés de collecte ciblée des publications afin de mieux référencer d’autres publications.

Conclusion

Ainsi, l’objectif des auteurs était d’étudier, de manière quantitative et auprès d’un échantillon représentatif de laboratoires, les différents types de pratiques d’utilisation de HAL par ces derniers, en complément d’autres enquêtes réalisées précédemment. Ils ont pu confirmer certains constats comme celui de l’utilisation généralisée de HAL par les laboratoires et préciser certaines conclusions concernant, par exemple, les différents comportements dans l’utilisation de HAL entre « meilleurs laboratoires » et « longue traîne » et l’impact des différences disciplinaires dans cette utilisation.

Ils ont également pu constater une évolution évidente de l’utilisation de HAL « d’un dispositif à usage individuel (auto-archivage) vers un dispositif à destination des institutions (suivi, évaluation) », amenant de nouvelles questions telles que la provenance et la qualité des données, leur interopérabilité ou encore la professionnalisation documentaire des déposants. Enfin, les auteurs montrent que cette enquête devra elle-même être complétée pour poursuivre l’étude de ce sujet. Une nouvelle enquête qualitative, à partir d’entretiens auprès de 50 laboratoires est en cours et aura pour but d’affiner les axes relevés et mieux appréhender les variables de comportements qui n’ont pas encore pu être expliqués.

Une proposition d’analyse longue sur plusieurs années est également présentée par les auteurs pour permettre d’étudier l’impact des politiques publiques auprès des différentes communautés et disciplines.

Analyse fonctionnelle comparative de deux SIGB : Koha vs Waterbear

mars 20, 2024 Temps de lecture: 3 minutes

Ce billet a été rédigé par Lauriane Cottel, Emeline Dolet et Pierre Verschave. Il s'agit d'un travail réalisé dans le cadre de l’enseignement "Représentation de l'information et des documents" assuré entre autres par Hélène Bert et Hans Dillaerts.

Lauriane Cottel, dotée d’un diplôme d’ingénieur en aménagement du territoire, a été chargée de projet en santé publique pour une collectivité locale pendant treize ans. En 2023, dans le cadre d’un projet de reconversion professionnelle, elle intègre la licence professionnelle « Métiers du livre : documentation et bibliothèques » au sein de l’université Paul-Valéry Montpellier III.
Emeline Dolet est diplômée de l’Université d’Avignon d’une licence de lettres modernes. Elle poursuit actuellement ses études en licence professionnelle « Métiers du livre : documentation et bibliothèques » en distanciel au sein de l’université Paul-Valéry Montpellier III.
Pierre Verschave, titulaire d’un BTS de design, a travaillé dans l’animation sociale, plus particulièrement dans le domaine du jeu de société, pendant six ans, dans l’agglomération de Lyon. Illustrateur indépendant depuis 2013, il poursuit un travail d’animation d’ateliers dessin dans différentes structures : écoles, collèges, centres sociaux… et en parallèle l’accompagnement d’élèves en situation de handicap en collège depuis 2017. Actuellement en formation à distance en licence professionnelle « Métiers du livre : documentation et bibliothèques » au sein de l’université Paul-Valéry Montpellier III.

Le documents mis à votre disposition ci-dessous répond aux objectifs énoncés dans le sujet d'évaluation :

Finalité du travail : Il faut procéder à une étude fonctionnelle comparative de deux SIGB. Modalités de travail. Travail individuel ou en groupe (max. 3 personnes). L'analyse fonctionne comparative doit comprendre les dimensions et les périmètres suivants :

Le catalogage;
L'échange de notices ;
La circulation de documents;
La recherche documentaire;

Afin de réaliser ce travail, nous vous conseillons de lister de manière exhaustive l'ensemble des fonctionnalités relatives aux quatre thématiques évoquées. Il sera nécessaire d'élaborer une méthodologie (une grille d'analyse) pour produire le cahier des tests fonctionnel (ou autrement dit cahier de recette fonctionnelle) que vous avez à rendre dans le cadre de ce devoir.

Le travail réalisé : https://blogs.infodocs.eu/etu/fichiersuploads/2024/COTTEL-DOLET-VERSCHAVE.pdf

Analyse fonctionnelle comparative de PMB et Waterbear

février 14, 2024 Temps de lecture: 4 minutes

Ce billet a été rédigé par Marie-Mathilde Barcelli et Marie Jansana. Il s'agit d'un travail réalisé dans le cadre de l’enseignement "Représentation de l'information et des documents" dispensé entre autres par Hélène Bert et Hans Dillaerts.

Marie-Mathilde Barcelli est diplômée d'une Licence d'histoire et d'un Master 2 Recherche en Littérature anglaise XIXème à l'Université Lyon 2. Après avoir enseigné pendant près de 15 ans en France et à l'étranger, elle choisit de se reconvertir dans les métiers de la documentation en rejoignant la Licence professionnelle "Gestion des ressources documentaires et de l'information spécialisée" à l'université Montpellier III. Adresse électronique : mmbarcelli@orange.fr
Marie Jansana a effectué une carrière de journaliste en presse écrite pendant quinze ans avant de se reconvertir dans les métiers des bibliothèques. Diplômée d'un DUT information-communication option journalisme, puis d'une licence professionnelle Activités et techniques de communication, spécialité journalisme, elle étudie à l'université Paul-Valéry Montpellier III, en licence professionnelle "Gestion des ressources documentaires et de l'information spécialisée". Adresse électronique : mjansana@yahoo.fr

Les documents mis à votre disposition ci-dessous répondent aux objectifs énoncés dans le sujet d'évaluation.

Finalité du travail : Il faut procéder à une étude fonctionnelle comparative de deux SIGB. Modalités de travail. Travail individuel ou en groupe (max. 3 personnes). L'analyse fonctionne comparative doit comprendre les dimensions et les périmètres suivants :

Le catalogage;
L'échange de notices ;
La circulation de documents;
La recherche documentaire;

Afin de réaliser ce travail, nous vous conseillons de lister de manière exhaustive l'ensemble des fonctionnalités relatives aux quatre thématiques évoquées. Il sera nécessaire d'élaborer une méthodologie (une grille d'analyse) pour produire le cahier des tests fonctionnel (ou autrement dit cahier de recette fonctionnelle) que vous avez à rendre dans le cadre de ce devoir.

Le travail réalisé :

Le cahier des tests : https://blogs.infodocs.eu/etu/fichiersuploads/2024/BARCELLI_JANSANA_Cahier%20des%20tests.pdf
Analyse fonctionnelle de PMB : https://blogs.infodocs.eu/etu/fichiersuploads/2024/BARCELLI_JANSANA_PMB_tableau.pdf
Analyse fonctionnelle de Waterbear : https://blogs.infodocs.eu/etu/fichiersuploads/2024/BARCELLI_JANSANA_Waterbear_tableau.pdf
Difficultés rencontrées : https://blogs.infodocs.eu/etu/fichiersuploads/2024/BARCELLI_JANSANAComparatif%20difficult%C3%A9s%20tableau.pdf

Interopérabilité sémantique appliquée à la santé humaine

janvier 23, 2024 Temps de lecture: 41 minutes

Ce billet a été rédigé par Anna Koleva et Romain LURTZ. Il s'agit d'un travail réalisé dans le cadre de l’enseignement "Document numérique : formats et langages".

Anna Koleva a bénéficie d’une expérience de 15 ans en qualité de responsable de la communication et des éditions en agence de communication. Elle est actuellement missionnée par la plateforme numérique en science ouverte, NumeRev, pour la mise en place d’une stratégie de communication à 360°. Parallèlement, elle poursuit des études en Master 1 « Information-Documentation : Management et Valorisation de l’Information Numérique » au sein de l’université Paul-Valéry Montpellier III. Adresse électronique : anna.koleva@mac.com

Romain Lurtz est chargé de communication et créateur de contenu pédagogique en alternance au sein de la Direction des Services d’Information au conseil départemental de l’Hérault depuis octobre 2023. Diplômé d’un BTS en communication et d’une Licence en « Sciences du Langage », il étudie au sein de l’université Paul-Valéry Montpellier III, Master 1 « Information-Documentation : Management et Valorisation de l’Information Numérique ». Adresse électronique : romain.lurtz@hotmail.fr

Medical technology, innovation health and medical research, healthcare and medicine concept. Doctor or technician working with AI data analysis, lab experiment, data science

SOMMAIRE

I. QU’EST-CE QUE L'INTEROPÉRABILITÉ ?
II. LE CAS DE LA FRANCE - UNE APPROCHE GLOBALE
III. LE CAS ESPAGNOL - UNE SINGULARITÉ TERRITORIALE
IV. LES INITIATIVES AU NIVEAU EUROPÉEN ET INTERNATIONAL
CONCLUSION
BIBLIOGRAPHIE

I. QU’EST-CE QUE L'INTEROPÉRABILITÉ ?

La définition de la notion d'interopérabilité, dans un contexte numérique en constante évolution ne cesse de s’inviter dans le débat public. Car l’interopérabilité n’est pas qu’une question technique. Elle touche aux questions de vocabulaire, de concepts métiers, de principes d’architecture et d’organisation, de réglementation, de droit, de politiques, raisons pour lesquelles, il apparaît évident que pour cerner les contours du concept, il faut s’appuyer sur une définition globalisante et transversale.

C’est partant de ce constat que la Commission Européenne [1] définit dans le Référentiel Général d’Interopérabilité (RGI) la notion d’interopérabilité comme étant

« L'aptitude d’organisations disparates et diverses à interagir en vue de la réalisation d’objectifs communs mutuellement avantageux, arrêtés d’un commun accord, impliquant le partage d’informations et de connaissances entre ces organisations à travers les processus métiers qu’elles prennent en charge, grâce à l’échange de données entre leurs systèmes de TIC respectifs ». (Pierre-Dit-Mery, s. d.)

Par ailleurs, l’Association Francophone des Utilisateurs de Logiciels Libres (AFUL) stipule que :

« L’interopérabilité est la capacité que possède un produit ou un système, dont les interfaces sont intégralement connues, à fonctionner avec d’autres produits ou systèmes existants ou futurs et ce sans restriction d’accès ou de mise en œuvre. »

1.1 - Les différents niveaux d’interopérabilité

Dans son article L’interopérabilité, principe incontournable des libertés numériques, Franck Macrez, Maître de conférences au CEIPI, Université de Strasbourg, précise que :

« L’interopérabilité doit impliquer : une interopérabilité sémantique (« savoir se comprendre »), syntaxique (« savoir communiquer ») » et technique (« pouvoir communiquer »). » (Macrez & Duflot, s. d.)

Par ailleurs, le RGI précise trois autres niveaux d’interopérabilité qui sont : le niveau organisationnel, juridique et politique.

Le niveau technique, tel que précisé par le RGI concerne les questions relatives aux protocoles d’échanges de données.
Le niveau syntaxique quant à lui concerne les formats techniques qui permettent de véhiculer les données (leur structure, leur codification...), indépendamment de leur sens qui lui est traité au niveau sémantique.
Le niveau sémantique est porté par la sémantique, une notion essentielle pour l’interopérabilité ; il concerne la signification des mots, le rapport entre le sens des mots (homonymie, synonymie, etc.), mais aussi le cycle de vie d’une information, ses règles d’agrégation ou de décomposition, etc.
Le niveau organisationnel est lié aux organisations et aux processus mis en œuvre pour favoriser et opérer les échanges.
Le niveau juridique implique de se conformer au cadre légal national et international.
Le niveau politique favorise la communication et les échanges entre les parties prenantes grâce à des visions partagées et stratégies convergentes.

Source : Référentiel Général d’Interopérabilité (RGI)

Sur le Web, l’interopérabilité sémantique repose sur l'utilisation de langages de représentation du savoir, tels que le RDF (Resource Description Framework) ou le OWL (Web Ontology Language). Ces langages offrent une structure formelle pour décrire la signification des données, favorisant ainsi une communication riche en informations et dénuée d’ambiguïtés.[3] Au-delà de son rôle dans les échanges de données, l'interopérabilité sémantique se distingue par sa contribution significative au principe FAIR (Findable, Accessible, Interoperable, Reusable). En effet, en rendant les données compréhensibles pour les systèmes informatiques, elle favorise leur repérage, leur accès, et leur exploitation, contribuant ainsi à une utilisation plus efficiente et réutilisable de l’information.[4]

1.2 - Interopérabilité sémantique et santé

L’interopérabilité sémantique concerne tous les domaines d’activité. En particulier, celui de la santé qui a de quoi donner du fil à retordre aux scientifiques, mais aussi aux professionnels et usagers du secteur.

« La santé est un langage à part entière, ambigu, plein d’éponymes, d’homonymes, de synonymes, d’acronymes et d’abréviations. Elle est vaste et riche en détails, très dépendante du contexte, utilise un jargon particulier, est truffée de localismes et manque souvent de définitions rigoureuses. »

explique l’Organisation panaméricaine de la Santé, dans son Introduction à l’Interopérabilité Sémantique [5].

1.3 - Les enjeux d’interopérabilité en santé

Quels sont les réels enjeux dans la gestion des données en santé ? Quelles sont les ontologies de référence au service de l’interopérabilité dans ce domaine et en quoi leur adoption constituerait un progrès majeur en matière de santé humaine ? Nous tenterons de répondre à cette question en nous appuyant sur différentes études et initiatives en la matière, conduites en France et à l’étranger.

II. LE CAS DE LA FRANCE - UNE APPROCHE GLOBALE

2.1 - Une importance donnée à l'interopérabilité sémantique

En 2009, l'ex-ministre de la Santé et des Sports en France, Mme Roselyne Bachelot, mettait en avant l'importance de l'interopérabilité sémantique dans le système médical. Dans une lettre [6] adressée au professeur Marius Fieschi, elle soulignait la nécessité que :

« Les informations produites par chaque professionnel de santé puissent être communiquées et comprises par les autres acteurs du système de santé, ce qui suppose notamment l’emploi de terminologies médicales communes. » (Bachelot, 2009)

Par demande de la ministre de la Santé, le rapport La gouvernance de l’interopérabilité sémantique est au cœur du développement des systèmes d’information en santé (Fieschi, 2009) a vu le jour et a été mené par le professeur de physiopathologie à l’université de Marseille, Monsieur Marius Fieschi. Ce rapport visait à démontrer l'importance des systèmes terminologiques communs dans l'efficacité des soins aux patients et dans la facilitation des analyses épidémiologiques.

2.2 - Des projets et des initiatives pour surmonter les défis de l'interopérabilité

A) Vers une terminologie commune en santé

Le rapport établit dans un premier temps l'importance d'une terminologie commune en santé, puis se penche sur les résultats de l'acquisition par l'Agence du Numérique en Santé (ANS) de la version francophone de la nomenclature médicale internationale SNOMED (Systematized Nomenclature of Medicine), ontologie de référence pour les terminologies médicales. Le professeur illustre l'impact de cette ontologie en prenant l'exemple d'un clinicien qui peut proposer des diagnostics initiaux grâce à la richesse descriptive de la nomenclature. De plus, l'interopérabilité est renforcée par la mise en commun d'informations (appelés DMR pour Data and Model Resources) provenant d’expériences et d’études issues des professionnels d’un grand champ de domaines scientifiques.

Dans les métiers de la santé, tels que la biologie, l’informatique biomédicale, la pharmacologie et bien d’autres, chaque jour, sont produits des centaines, voire des milliers de données (DMR) à faire transmettre et communiquer avec leurs confrères dans les domaines. Que ce soit des données scientifiques, expérimentales, voire des guides pratiques des laboratoires, les données sont rendues accessibles par différentes méthodes parmi lesquelles on retrouve l’utilisation de langages en Markup comme le SBML (Systems Biology Markup Language) et le CellML (Cell Markup Language); des images, des signaux ou tout simplement des annuaires de données et des modèles. Ainsi pour reprendre les mots du docteur en physiologie, et professeur à l'Université Paris-Sud 11, Stephen Randall Thomas :

« Les ontologies sont le « liant » de cet ensemble : mises en cohérence, elles constituent le langage commun qui permet que ces espaces puissent former une unité explorable informatiquement. » (Stephen Randall Thomas, 2014)

B) La nécessité d’une démarche collaborative

La multiplicité d'acteurs dans les domaines médicaux engendre une myriade de désignations pour des concepts similaires, rendant dès lors les recherches automatisées complexes et difficiles. Les différentes communautés de professionnels tendent à nommer et à décrire les mêmes faits ou situations de façon non uniforme. Il existe des vocabulaires et des ontologies contrôlés nommés CVO (Controlled Vocabulary and Ontology), mais ils sont utilisés de manière inégale et dissemblable conduisant à un chevauchement d’ontologies.

Face à cette situation, le projet RICORDO mis en œuvre par la communauté du VPH (Virtual Physiological Human) en France émerge pour répondre à la question « Comment la documentation pour des projets et des bases de données est-elle réalisée actuellement, et comment peut-on faire mieux ? » [7]

Le projet réunit ainsi plusieurs acteurs industriels (pharmacie, dispositifs médicaux) et académiques ainsi qu’un certain nombre de bases de données clés provenant d’instituts et de laboratoires du monde entier afin de développer des outils d'interopérabilité en anatomie et en physiologie. Les objectifs ont été les suivants :

Développer une annotation commune des métadonnées standards
Uniformiser les annotations des DMR (ex: MIRIAM, RDF, OWL,...)
Rendre les métadonnées interopérables sémantiquement.

Ce dernier point important semble difficile à réaliser pour des concepts complexes comme des processus physiologiques. Il est alors nécessaire de les définir à partir des termes figurants dans des ontologies de référence. Ils peuvent également compter sur la création d’une boîte à outils sur le web afin de permettre aux professionnels d’apporter leur pierre à l’édifice pour créer des termes complexes, annoter des données et stocker des métadonnées.

L’État français mène une politique volontariste pour faire appliquer les référentiels d’interopérabilité. Il a mis en place une nouvelle gouvernance de l’interopérabilité des SI (Systèmes d’Information) de santé et du médico-social à travers un comité de pilotage. [8]

Source : Agence du Numérique en Santé

C) Les projets et initiatives visant l’interopérabilité sémantique

La France a initié de nombreux autres projets. Chaque domaine de la santé semble se doter d’une ontologie spécifique. C’est le cas du domaine de la cancérologie qui, pour coder des diagnostics de cancer, va utiliser le NCI Thesaurus, un thésaurus international des cancers et le CIM-03 (Classification Internationale des Maladies pour l’Oncologie).[9]

L'INRAE de son côté a œuvré pour la création d’un thésaurus de référence structuré en 12 domaines (dont la santé humaine), construit comme une ressource terminologique pour l’interopérabilité sémantique. La version 1.4 basée sur des standards, offre une richesse lexicale avec des synonymes, un vocabulaire pivot pour la recherche d’informations sur une diversité d’objets numériques (textes, données, images...). Cette démarche permet de répondre à des enjeux d’automatisation face à des volumes importants et des ressources humaines en diminution. [10]

Depuis 2009, l’ANS (l'Agence du Numérique en Santé) a défini le CI-SIS (Cadre d’Interopérabilité des Systèmes d’Information de Santé) qui vise à créer des règles de formatage pour la création et le transfert de données. Ce dernier englobe l’ensemble des processus liés directement et/ou indirectement à la prise en charge des patients, des professionnels médicaux, administratifs et du social. S’appuyant sur des normes et standards internationaux, l’ANS propose également des normes et standards qui s'adaptent aux contextes nationaux. [11] [12]

À noter également la création, en 2019, d’un Centre de gestion des Terminologies de santé (CGTS). Il s’agit d’une instance de gouvernance responsable de la gestion opérationnelle de la publication des ressources sémantiques utilisées par les professionnels de santé et du médico-social pour structurer leurs échanges.

Le CGTS doit favoriser l'interopérabilité sémantique grâce à l’usage de vocabulaires contrôlés opérationnels et partagés par tous en publiant les différentes ressources sémantiques (terminologies, jeux de valeurs, alignements). Il garantit la cohérence de ce corpus sémantique et répond aux besoins des utilisateurs en mettant à leur disposition une gamme d'outils opérationnels.

Par ailleurs, le CGTS est partenaire de l’Organisation Mondiale de la Santé (OMS) et soutient les projets européens de l'ANS qui visent à harmoniser les normes utilisées en France et en Europe.

Afin d'accompagner les acteurs du secteur dans la santé dans leur compréhension des enjeux de l’interopérabilité et le bien-fondé du CI-SIS, l’ANS propose des webinaires, dont le dernier a eu lieu en 2020 :

III. LE CAS ESPAGNOL - UNE SINGULARITÉ TERRITORIALE

L’Espagne se caractérise par la décentralisation de son système de santé. Sa singularité réside dans le fait que les compétences en matière de santé sont transférées aux Communautés autonomes. Elles possèdent leur propre législation sur la santé et ont développé divers outils pour la gestion des données de santé. La séparation des responsabilités en matière de santé entre l’État et les Communautés autonomes espagnoles a conduit à la mise en place de dossiers informatisés ou « histoire clinique partagée » (historia clinica digital) du patient (dossier médical électronique) dans chaque Communauté autonome.

3.1 - Les problématiques en matière d'interopérabilité

En dépit d’une évolution positive de l’interopérabilité globale du système national de santé espagnol, de nombreuses Communautés autonomes sont en retard. L’inégal niveau d’informatisation du dossier personnel du patient, ainsi que les déplacements de la population sur le territoire national génèrent forcément des problèmes en termes d’interopérabilité. (Biedma, J. & Bourret, C., 2015) [13]. Garantir la sécurité de l’information pose une question délicate.

3.2 - Les recommandations en vue d’une amélioration du système

En ce sens, Renau et Pérez (2000) [14] mentionnent que, bien que l’utilisation du système des « histoires cliniques partagées » des patients présente des avantages certains, Romero (2012) [15] considère que les informations sur les dossiers médicaux électroniques devront être partagées dans un environnement sûr, accessible et fiable ; de plus, elles devront être supportées par divers systèmes, qui partageront quelques structures de données communes. La terminologie utilisée entre les différents systèmes devra également être partagée sans changement de sens pour assurer l’interopérabilité sémantique. F. Macary souligne que :

« L’interopérabilité est dite sémantique si elle garantit que l’information échangée est interprétée à l’identique par les systèmes d’information destinataires et émetteurs : préservation du sens dans l’espace et dans le temps. »

Il fait également remarquer que :

« En abusant de sigles, abréviations, et anglicismes, ceux-là mêmes qui sont chargés d’établir la compréhension entre les systèmes perdent la compréhension de leurs pairs, compromettant ainsi leurs chances d’aboutir à une véritable interopérabilité. »

La condition de l’interopérabilité sémantique réside donc dans le choix d’une syntaxe commune respectée par chacun des systèmes participants à l’échange. Elle est indispensable à différents niveaux : la prise en charge des patients, la coordination et la continuité des soins, la veille sanitaire en santé publique, la recherche scientifique.

3.3 - Les résultats obtenus

Ayant pris pleinement la mesure du problème, le Système national de santé espagnol a de nombreuses démarches dans le but d’atteindre l’interopérabilité globale entre les Communautés autonomes. Ainsi, grâce au projet Historia Clinica Digital del Sistema Nacional de Salud (HCDSNS), les services de santé ont développé et implanté les systèmes automatisés de collecte et de gestion des données individuelles de santé des personnes supports des processus d’assistance, prévention, etc., des patients, en favorisant une augmentation du niveau de qualité des services fournis aux citoyens. Les résultats sont encourageants, même si l’interconnexion complète entre les Communautés autonomes n’a pas été encore obtenue.

IV. LES INITIATIVES AU NIVEAU EUROPÉEN ET INTERNATIONAL

4.1 - Le projet EpSOS (European Patients Smart Open Services) (2008 à 2014)

Le projet epSOS (Système d'Information Européen sur la Santé) s’est fait à l’initiative de l'Union européenne (20 pays de l’Union européenne et 3 pays non-membres de l’Union) dans le but d’améliorer l'interopérabilité des systèmes de santé numériques entre les pays membres. Il fixait plusieurs objectifs ambitieux :

Améliorer la qualité et l'efficacité des soins de santé transfrontaliers en Europe;
Faciliter l'accès sécurisé aux dossiers médicaux des patients et à la prescription électronique à travers les frontières nationales;
Garantir la compatibilité et l'interopérabilité entre différents systèmes de santé nationaux;

Le projet epSOS a permis de développer des solutions techniques pour faciliter l'échange d'informations médicales entre les différents acteurs de la santé, telles que les médecins, les hôpitaux et les pharmacies. Les principaux résultats du projet ont été la création d'une infrastructure de communication sécurisée et la mise en place de normes communes pour l'échange de données de santé. Ces avancées ont contribué à une meilleure coordination entre les systèmes de santé européens, tout en respectant les normes élevées de protection des données personnelles.

4.2 - Le projet EXPAND (Expanding Health Data Interoperability Services) (2014-2015)

Ce projet a succédé au projet EpSOS. Son objectif a consisté à consolider les avancées en matière d'interopérabilité des données de santé au niveau européen, en prenant appui sur les standards préalablement établis. [18]

Ses objectifs principaux étaient :

Améliorer l'interopérabilité des systèmes de dossiers médicaux électroniques et de la prescription électronique entre les pays membres de l'UE
Promouvoir les normes de santé numérique afin d’harmoniser les pratiques au sein de l’UE
Contribuer à l'échange sécurisé et efficace des données de santé à travers les frontières et assurer une meilleure continuité des soins pour les citoyens européens en déplacement.

4.3 - Le projet e-SENS (2013-2017)

Le projet e-SENS a débuté en avril 2013 et s'est achevé en mars 2017. Il a joué un rôle crucial dans la promotion de l'agenda numérique européen et a posé les bases pour des initiatives futures dans le domaine de l'e-gouvernance et de l'interopérabilité des services publics à l'échelle européenne. [19]

4.4 - Les projets du présent et du futur (2020-2030)

La Commission européenne et l’OMS/Europe se sont engagées dans un nouveau partenariat d’envergure visant à renforcer les systèmes d’information sanitaire et à stimuler la gouvernance et l’interopérabilité des données de santé dans la Région européenne de l’OMS. Le projet de 12 millions d’euros, financé par la Commission européenne, soutiendra les services de soins de santé pour les quelques milliards d’habitants des 53 pays que compte la Région. Le projet approuvé soutiendra les objectifs de la stratégie de l’UE en matière de santé mondiale, ainsi que la Stratégie mondiale de l’OMS pour la santé numérique 2020-2025 et le Plan d’action régional pour la santé numérique dans la Région européenne de l’OMS 2023-2030 et la Stratégie mondiale de l’OMS pour la santé numérique 2020-2025. [20]

Le Plan d’action régional pour la santé numérique [21] dans la Région européenne de l’OMS 2023-2030 vise à orienter et à accélérer l'adoption de la santé numérique dans les États membres de la Région européenne de l'OMS. Ses objectifs stratégiques sont ambitieux :

Promouvoir la collaboration à l’échelle mondiale et faire progresser le transfert de connaissances sur la santé numérique
Faire avancer la mise en œuvre des stratégies de santé numérique nationales
Renforcer la gouvernance de la santé numérique aux niveaux mondial, régional et national
Plaider en faveur de systèmes de santé centrés sur la personne au sein desquels la santé numérique jouerait un rôle catalyseur

Ce plan représente une étape clé dans l'adoption et l'intégration de la santé numérique en Europe, avec pour but ultime d'améliorer la santé globale et le bien-être des populations au sein de la région.

CONCLUSION

Les nouvelles technologies de l’information et de la communication (TIC) sont un facteur clé d’amélioration des performances du secteur de la santé, au bénéfice des patients et des professionnels, mais posent un défi à relever à savoir le partage des données et de l’interopérabilité sémantique des systèmes d’information d’où l’importance d’une politique publique en matière de terminologies médicales.

Les impacts de l’interopérabilité sémantique au niveau santé sont significatifs et multidimensionnels. L'interopérabilité sémantique garantit le fait que les différents systèmes de santé communiquent entre eux de manière efficace, en s'assurant que les données partagées sont comprises de manière uniforme et cohérente. Ainsi les professionnels de la santé peuvent accéder rapidement et avec précision aux dossiers médicaux des patients, ce qui permet de réduire le risque d'erreurs médicales, contribue à la prise de décision rapide et informée sur le traitement du patient.

Par ailleurs, un échange de données de santé cohérent et normalisé facilite la recherche médicale. Les chercheurs peuvent accéder à des données plus larges et plus fiables, ce qui peut conduire à de meilleures compréhensions des maladies et à l'élaboration de traitements plus efficaces.

Enfin, l'interopérabilité sémantique est gage d’amélioration en matière de santé publique. Elle constitue une aide précieuse dans la surveillance et la gestion des épidémies de maladies et les crises sanitaires. En offrant une meilleure analyse des données de santé à grande échelle, elle permet une réponse plus rapide et plus ciblée aux problèmes de santé. Les pouvoirs publics ont pris la pleine mesure des enjeux. De nombreuses initiatives et projets entrepris par les instances administratives, les États, l’Union européenne, ainsi que par les acteurs du secteur de la santé ont permis des avancées significatives en matière d’interopérabilité. La gouvernance se fait de manière pluridisciplinaire en impliquant les professionnels du secteur dans un pilotage basé sur un dialogue constructif, l’échange de connaissances et un processus décisionnel collaboratif.

Ainsi, l’interopérabilité sémantique, bien au-delà de sa complexité technique et sa mise en œuvre exigeante, façonne l’avenir de la médecine mondiale et participe de manière incontestable à l’amélioration de la santé humaine.

BIBLIOGRAPHIE

[1] Article 2 of Decision No 922/2009/EC of the European Parliament and of the Council of 16 September 2009 on interoperability solutions for European public administrations (ISA) OJ L 260, 03.10.2009, p. 20.
[2] Définition de l’Interopérabilité par le groupe de travail Interopérabilité de l’AFUL : http://definition-interoperabilite.info/
[3] Datapartage - Le web sémantique. (n.d.). inra.com. https://datapartage.inrae.fr/Produire-des-donnees-FAIR/Comment-FAIR-en-pratique/Le-web-semantique
[4] Datapartage - interoperable_. (n.d.). inra.com. https://datapartage.inrae.fr/Produire-des-donnees-FAIR/Interoperable
[5] © Organisation panaméricaine de la Santé, 2021. https://iris.paho.org/bitstream/handle/10665.2/55634/OPSEIHIS21023_fre.pdf?sequence=1&isAllowed=y
[6] Rapport à la ministre de la Santé et des sports, Professeur Marius Fieschi, 2009, « La gouvernance de l’interopérabilité sémantique est au cœur du développement des systèmes d’information en santé » https://sante.gouv.fr/IMG/pdf/RapportFieschi.pdf
[7] Thomas, S. R. (n.d.). Les ontologies de référence au service de l’interopérabilité en santé. Cairn.info. https://www.cairn.info/revue-realites-industrielles1-2014-4-page-76.htm?ref=doi
[8] ANS (2020) doctrine2020_2.3_interoperabilite_si_sante_concertation_v1.pdf https://esante.gouv.fr/sites/default/files/media_entity/documents/doctrine2020_2.3_interoperabilite_si_sante_concertation_v1.pdf
[9] ANS (2021) Articles longs des 15es Journées francophones d’informatique médicale, JFIM 2014, pages 44–58, Fès, Maroc, 12–13 juin 2014 https://ceur-ws.org/Vol-1379/JFIM2014-complete.pdf
[10] Sophie Aubin, Emilie Bernard, Sonia Bravo, Colette Cadiou, Eric Cahuzac, et al.. Le thésaurus INRAE : une ressource terminologique pour l’interopérabilité sémantique. Journée du GdR Traitement automatique des langues (GDR TAL), Oct 2022, Rennes, France. .hal-03824794. HAL Id: hal-03824794 https://hal.inrae.fr/hal-03824794
[11] CI-SIS cadre d’interopérabilité système d’information en santé ( de l’Agence du Numérique en Santé https://esante.gouv.fr/sites/default/files/media_entity/documents/CI-SIS_EvolutionGouvernance_V1.0.2.pdf
[12] Cadre d’interopérabilité des systèmes d’information de santé (de l’Agence du Numérique en Santé), 03/08/2021 https://esante.gouv.fr/sites/default/files/media_entity/documents/CI-SIS_DOCTRINE_20210803_V1.1.pdf
[13] Biedma, J. & Bourret, C. (2015). Les enjeux des projets d’interopérabilité en santé pour la mobilité des citoyens. Le cas de l’Espagne. Projectics / Proyéctica / Projectique, 13, 23-36. https://doi.org/10.3917/proj.013.0023
[14] *Renau J., Pérez I. (2000). « La seguridad de la información en las historias clínicas informatizadas », Papeles médicos, vol. 9, n° 1, pp. 4-9.
[15] Romero A. (2012). « Proyecto HCDSNS Historia Clínica Digital del Sistema Nacional de Salud Avances y Perspectivas », Papeles médicos, vol. 21, n° 2.
[16] Stratégie mondiale pour la santé numérique 2020-2025 [Global strategy on digital health 2020-2025]. Genève : Organisation mondiale de la Santé ; 2021. Licence : CC BY-NC-SA 3.0 IGO. https://www.who.int/docs/default-source/documents/gs4dhdaa2a9f352b0445bafbc79ca799dce4d.pdf
[17] Cross-border health project epSOS: What has it achieved? (2014, July 7). Shaping Europe’s Digital Future. https://digital-strategy.ec.europa.eu/en/news/cross-border-health-project-epsos-what-has-it-achieved
[18] Expand Project http://www.expandproject.eu/
[19] E-SENS_. (2023, November 28). Luxembourg Institute of Science and Technology. https://www.list.lu/fr/recherche/projet/e-sens/
[20] World Health Organization : WHO. (2023, 11 décembre). La Commission européenne et l’OMS/Europe concluent un accord de 12 millions d’euros pour renforcer les systèmes d’information sanitaire et stimuler la gouvernance et l’interopérabilité des données de santé en Europe. Organisation Mondiale de la Santé. https://www.who.int/europe/fr/news/item/11-12-2023-european-commission-and-who-europe-sign--12-million-agreement-to-strengthen-health-information-systems-and-boost-health-data-governance-and-interoperability-in-europe
[21] Data and Digital Health (DDH). (n.d.). Plan d’action régional pour la santé numérique dans la Région européenne de l’OMS 2023-2030 (RC72). https://www.who.int/europe/fr/publications/i/item/EUR-RC72-5

Transformations des métiers de l’information-documentation au prisme des humanités numériques : Entretien avec une professionnelle de l'information-documantation au sein du CNRS

juillet 1, 2025 Temps de lecture: 23 minutes

Introduction

L'entretien

Question 1 : Pouvez-vous vous présenter ?

Transformations générales du métier

Question 2 : En quoi l’essor des humanités numériques a-t-il modifié votre pratique en tant que professionnelle de l’information-documentation ?

Question 3 : Les nouvelles technologies (big data, IA, outils de text mining) ont-elles redéfini votre rôle dans la gestion et la valorisation des données en SHS ?

Interdisciplinarité et nouvelles compétences

Question 4 : Les humanités numériques impliquent souvent un croisement entre les SHS et les sciences dures. En quoi cela transforme-t-il les compétences attendues dans votre métier ?

Question 5 : Observez-vous une tension entre la spécialisation disciplinaire et l’exigence d’interdisciplinarité dans la gestion des ressources documentaires ?

Logiques de production et accès aux savoirs

Question 6 : Le développement de l’open access et des plateformes collaboratives modifie-t-il votre rapport à la gestion et à la diffusion du savoir ?

Question 7 : Pensez-vous que les humanités numériques favorisent une réelle démocratisation de l’accès au savoir, ou qu’elles renforcent des inégalités d’accès et de production scientifique ?

Matérialité et illusion d’immatérialité

Question 8 : Dans un monde où la donnée semble "immatérielle", comment percevez-vous la matérialité du travail documentaire ?

Question 9 : Pensez-vous que la numérisation massive des ressources contribue à un enrichissement ou à un appauvrissement des pratiques documentaires et de recherche ?

Évolutions politiques et sociales du métier

Question 10 : Les humanités numériques transforment-elles la place des professionnel.le.s de l’information-documentation dans le monde académique ?

Question 11 : Voyez-vous une évolution des conditions de travail et des statuts dans votre domaine sous l’influence des transformations numériques ?

Discussion ouverte

Transformations des métiers de l’information-documentation au prisme des humanités numériques : Entretien avec Jean-Philippe Moreux

juin 6, 2025 Temps de lecture: 21 minutes

Introduction

L'entretien avec Jean-Philippe MOREUX

Pour commencer, pourriez-vous présenter brièvement votre parcours professionnel et décrire vos principales missions au sein de la Bibliothèque nationale de France (BnF), notamment autour de Gallica et du BnF DataLab ?

Comment définiriez-vous les humanités numériques, et comment cette notion s’est-elle transformée ou enrichie, selon vous, au cours de ces dernières années ?

Comment les outils et approches des humanités numériques transforment-ils la façon dont vous valorisez et diffusez le patrimoine culturel auprès du public et des chercheurs ?

Comment décririez-vous votre posture professionnelle face à l’essor des humanités numériques ? Qu’est-ce qui caractérise, selon vous, le « nouveau » rôle du professionnel de l’information-documentation dans ce contexte ?

Sur quels types de projets d’innovation travaillez-vous actuellement, ou prévoyez-vous de travailler, et comment s’inscrivent-ils dans l’évolution plus globale du champ des humanités numériques ?

Quelles sont, selon vous, les transformations majeures qui ont eu lieu ces dernières années sous l’impulsion des humanités numériques, et en quoi ont-elles modifié vos méthodes de travail ?

Pensez-vous que les outils technologiques sont pleinement exploités et optimisés au profit des humanités à l’heure actuelle ? Ou bien leur utilisation reste-t-elle encore limitée ou inégalement généralisée ?

Les langages de balisage légers : le cas Markdown

février 17, 2025 Temps de lecture: 27 minutes

Introduction

1- Markdown, une valeur ajoutée pour le document numérique

a. Une proposition de réponse aux évolutions technologiques

b. Les caractéristiques de Markdown

c. Markdown et ses nombreuses variantes

2- Markdown, un LBL en constante évolution

a. Les limites de Markdown

b. La simplicité de Markdown: force ou faiblesse?

c. Les nécessaires adaptations de Markdown

Conclusion

ECM et GED : quelles évolutions actuelles ?

juillet 2, 2024 Temps de lecture: 12 minutes

Introduction

Adaptation technologique de la GED

Utilisation de l'intelligence artificielle

Conformité réglementaire renforcée

Réponses organisationnelles aux changements de modes de travail

Adaptation au modèle de télétravail

Automatisation et réduction de la dépendance aux documents physiques

Sécurité et collaboration améliorées

Sécurisation des données dans un environnement GED

Collaboration et communication facilitées

Conclusion

Usages de HAL : une synthèse

mai 16, 2024 Temps de lecture: 12 minutes

Le rôle des laboratoires dans l’utilisation de HAL

L’impact des différences disciplinaires dans l’utilisation de HAL

La transformation de HAL vers un dispositif de suivi et d’évaluation

Conclusion

Analyse fonctionnelle comparative de deux SIGB : Koha vs Waterbear

mars 20, 2024 Temps de lecture: 3 minutes

Analyse fonctionnelle comparative de PMB et Waterbear

février 14, 2024 Temps de lecture: 4 minutes

Interopérabilité sémantique appliquée à la santé humaine

janvier 23, 2024 Temps de lecture: 41 minutes

Source : ©AdobeStock

SOMMAIRE

I. QU’EST-CE QUE L'INTEROPÉRABILITÉ ?

1.1 - Les différents niveaux d’interopérabilité

Source : Référentiel Général d’Interopérabilité (RGI)

1.2 - Interopérabilité sémantique et santé

1.3 - Les enjeux d’interopérabilité en santé

II. LE CAS DE LA FRANCE - UNE APPROCHE GLOBALE

2.1 - Une importance donnée à l'interopérabilité sémantique

2.2 - Des projets et des initiatives pour surmonter les défis de l'interopérabilité

A) Vers une terminologie commune en santé