Usages de HAL : une synthèse

mai 16, 2024 - Temps de lecture: 12 minutes

Ce billet a été rédigé par Armelle Paquier. Il s'agit d'un travail réalisé dans le cadre de l’enseignement "Edition savante et communication scientifique" assuré par Anne-Laure Fischer et Hans Dillaerts.

Armelle Paquier est diplômée d'un Master 2 en droit humanitaire et droits de l'homme à l'Université Paris 2. Après avoir travaillé dans le domaine social en milieu associatif, puis exercé la profession d'avocate pendant trois ans, elle décide de se reconvertir et intègre le "Master 1 Information-Documentation : Gestion de l'information et médiation documentaire - Métiers des bibliothèques et de la documentation" au sein de l'Université Paul Valéry Montpellier 3.

La synthèse proposée ci-dessous répond aux objectifs énoncés dans le sujet d'évaluation :


Finalité de l'exercice : Rédaction d'une synthèse (3-4 pages) d'un article de recherche portant sur des questionnements autour des pratiques de dépôt sur HAL. Il s'agit d'un travail d'écriture et de rédaction personnelle qui devra proposer un regard analytique sur l'article proposé ci-dessous.

Modalités de travail : Travail individuel ou en groupe (2 personnes).

L'article à analyser : Joachim Schöpfel, Florence Thiault, Hélène Prost, Bernard Jacquemin et Éric Kergosien, « L’utilisation de HAL par les laboratoires de recherche », Balisages [En ligne], 6 | 2023, mis en ligne le 21 septembre 2023, consulté le 14 décembre 2023. URL : https://publications-prairial.fr/balisages/index.php?id=1166


Dans le cadre d’une politique nationale française de développement de la science ouverte, les archives ouvertes sont devenues des outils indispensables. En effet, les archives ouvertes sont définies par l’article étudié comme des « bases de données documentaires accessibles librement et gratuitement sur Internet dans lesquelles les chercheurs peuvent y déposer un document scientifique ou technique dont ils sont l’auteur et dont ils détiennent les droits de diffusion pour rendre ce document librement accessible ».

Dans ce contexte, l’archive ouverte HAL, créée en 2001, s’est positionnée comme l’outil de référence d’un point de vue institutionnel et étatique. La pratique du dépôt en auto-archivage a également évolué vers une pratique de dépôt par des intermédiaires et notamment les laboratoires.

Ainsi, l’article étudié, intitulé « L’utilisation de Hal par les laboratoires de recherche », vise à présenter les résultats d’une enquête quantitative menée à la suite d’autres études menées entre 2019 et 2022, afin de les compléter et préciser l’analyse de la pratique des laboratoires concernant l’archive ouverte HAL. Elle a été menée en 2023 par Joachim Schöpfel, Florence Thiault, Hélène Prost, Bernard Jacquemin et Eric Kergosien dans le cadre du projet HAL/LO.

Plusieurs questions préalables à l’enquête se sont posées pour étudier la manière dont les laboratoires utilisent HAL et portent sur le nombre de laboratoires utilisant HAL ou non, le nombre et le type de documents déposés, ainsi que la création de collections ou non.

Dans cet article, les auteurs exposent tout d’abord un état de l’art. Ils expliquent ensuite leur méthodologie d’enquête et notamment leur méthode pour définir un échantillon significatif de laboratoires à étudier et leur manière de procéder à l’enquête pour répondre aux questions. Ils présentent ensuite les résultats obtenus quantitativement avant de procéder à une discussion de ceux-ci.

Plusieurs aspects principaux sont relevés par les auteurs qu’il conviendra d’examiner successivement : le rôle des laboratoires dans l’utilisation de HAL (I), l’impact des différences disciplinaires (II) et la transformation de HAL d’une archive ouverte vers un dispositif de suivi et d’évaluation de la production scientifique (III).

Le rôle des laboratoires dans l’utilisation de HAL

Afin d’étudier un échantillon significatif, les auteurs ont choisi d’étudier les pratiques des laboratoires des dix universités membres de l’association Udice, correspondant ainsi à l’identification de 1.246 laboratoires. En effet, ils ont pu établir que ces laboratoires produisent 45% des publications françaises et représentent un tiers de l’ensemble des dépôts sur HAL, ce qui parait représentatif. Ces laboratoires ont été recensés à travers un certain nombre d’informations et notamment leur nom, domaine de recherche et discipline.

Des limites sont apportées à la pertinence de cet échantillon en raison de « l’absence d’un identifiant fiable pour les structures et organisations scientifiques ». Ainsi, des doublons ou des erreurs et imprécisions dans les descriptions ont pu être commis, relativisant la portée des résultats.

Lors de précédentes enquêtes, il a pu être constaté que les laboratoires ont un rôle important dans la pratique de dépôt sur HAL, à travers plusieurs aspects. Tout d’abord, les laboratoires ont un impact d’un point de vue de la communication autour de l’archive ouverte et de la médiation pour inciter les chercheurs à déposer leurs documents et les aider à leur permettre concrètement de le faire. Par ailleurs, ils ont un impact d’un point de vue du soutien de la plateforme, à travers la création de collections. Enfin, il a pu être constaté que les laboratoires présentent des inégalités face à l’utilisation de HAL par les différences d’équipements et de ressources disponibles.

Par ailleurs, il avait été constaté l’existence de pratiques très différentes et notamment trois grands types d’utilisation de HAL par les laboratoires : comme une vitrine c’est-à-dire avec beaucoup de publications et d’accès libre aux entiers documents ; comme un gestionnaire de références bibliographiques, c’est-à-dire avec beaucoup de notices, mais peu de textes intégraux ; et enfin, sans stratégie.

Lors de la présente enquête, les auteurs ont également mis en avant le rôle important des laboratoires. Ils ont tout d’abord pu constater que 99% des laboratoires étudiés utilisent HAL d’une manière ou d’une autre, confirmant ainsi l’utilisation généralisée de cette plateforme.

Par ailleurs, la moitié de ces laboratoires ont procédé à la création d’une collection sur HAL, démontrant le soutien important apporté à la plateforme. Enfin, l’enquête a confirmé l’existence de pratiques très diversifiées par les laboratoires concernant tant le nombre de dépôts et le pourcentage de documents en plein texte que la typologie des documents ou encore les modalités d’alimentation.

Les auteurs ont ainsi développé une nouvelle analyse des pratiques de dépôt par les laboratoires à travers deux grandes tendances et non plus trois : une tendance d’un nombre restreint de laboratoires représentant la majorité des publications, soit environ 20% de laboratoires avec 67% de publications considérés comme les « meilleurs laboratoires », et une autre de la majorité des laboratoires représentant une minorité de publications, soit environ 70% des laboratoires représentant 20% des publications et renommés « la longue traîne ». Le groupe des « meilleurs laboratoires » présente en revanche moins de publications en texte intégral et davantage de notices que ceux de la « longue traîne ».

L’impact des différences disciplinaires dans l’utilisation de HAL

Afin de déterminer les raisons des différences d’utilisation de HAL constatées entre laboratoires, les enquêtes ont tenté d’examiner les facteurs potentiels distinctifs et notamment l’impact ou non des disciplines sur les pratiques d’utilisation.

Lors des précédentes enquêtes, les facteurs potentiels évoqués étaient multiples. Certains facteurs étaient ainsi rattachés à des critères distincts de la discipline de recherche elle-même, par exemple le nombre de chercheurs, les ressources humaines disponibles et notamment la présence ou non d’un documentaliste ou encore le statut de l’unité et la tutelle.

D’autres variables semblaient en revanche rattachées à la discipline et au domaine scientifique et notamment le choix délibéré du laboratoire, la politique d’établissement ou encore les pratiques individuelles. En effet, certains domaines semblaient plus enclins à soutenir HAL et notamment les mathématiques, la physique, l’informatique et les SHS. D’autres, au contraire, paraissaient beaucoup moins actifs, tels que la médecine, la biologie et les sciences de la vie.

Lors de la présente enquête, une distinction est observée au sein de la catégorie des « meilleurs laboratoires », en corrélation notamment avec les disciplines. Ainsi, au sein de cette catégorie, on trouve un groupe de laboratoires qui publient beaucoup de textes intégraux, principalement dans les domaines de l’informatique, les mathématiques et la physique. Ces domaines présentent une communauté acquise à la science ouverte et une tradition forte de dépôt.

L’autre groupe est celui des laboratoires qui présentent peu de textes intégraux, mais publient beaucoup de notices et qui relèvent plus généralement des domaines des SHS, de la biologie, de la chimie et du génie civil. Pour ces domaines, le signalement semble plus important que la communication directe des documents. Cependant, à nouveau, les auteurs constatent que la discipline n’explique pas toutes les variétés de comportements dans l’utilisation de HAL. Par ailleurs, environ un tiers des laboratoires sont des laboratoires mixtes couvrant plusieurs disciplines.

La transformation de HAL vers un dispositif de suivi et d’évaluation

Enfin, les auteurs constatent une transformation de HAL par l’utilisation qui en est faite, notamment de la part des laboratoires. En effet, les auteurs rappellent que la plateforme HAL a été originellement conçue comme une plateforme d’auto-archivage généralisée et ouverte à toutes les disciplines pour la mise à disposition de textes scientifiques intégraux.

Cependant, ils constatent que l’objectif n’a pas été atteint puisque toutes les disciplines ne sont pas représentées de la même façon, il y a peu de textes intégraux et également peu d’auto-archivage. La majorité des documents sont des notices publiées par des intermédiaires. Certains le décrivent ainsi comme une « dérive bibliométrique des archives ouvertes ».

Mais ils constatent également que ce mouvement participe d’une évolution générale des archives ouvertes dans cette direction et qu’il a pour objectif une évaluation des résultats et un suivi de la productivité de la recherche. Les laboratoires qui publient beaucoup, mais peu de textes intégraux visent ainsi l’exhaustivité du contenu et la communication du texte intégral devient secondaire. Cette recherche permet alors de « produire des connaissances fiables sur la recherche et d’aider les institutions scientifiques à assurer le suivi des projets scientifiques ».

Par ailleurs, les auteurs relèvent que la particularité de HAL dans ce domaine est celle de son niveau d’utilisation. La plateforme semble en effet être la seule à disposer d’une aura nationale et faire ainsi l’objet d’une demande de la part des établissements et laboratoires, mais également de l’administration centrale de l’État français.

Cela implique également une incitation renforcée pour l’utilisation de HAL puisqu’elle est appuyée par l’administration centrale et le CNRS. De nouveaux procédés apparaissent également en lien avec ce niveau d’utilisation et notamment des mécanismes automatisés de collecte ciblée des publications afin de mieux référencer d’autres publications.

Conclusion

Ainsi, l’objectif des auteurs était d’étudier, de manière quantitative et auprès d’un échantillon représentatif de laboratoires, les différents types de pratiques d’utilisation de HAL par ces derniers, en complément d’autres enquêtes réalisées précédemment. Ils ont pu confirmer certains constats comme celui de l’utilisation généralisée de HAL par les laboratoires et préciser certaines conclusions concernant, par exemple, les différents comportements dans l’utilisation de HAL entre « meilleurs laboratoires » et « longue traîne » et l’impact des différences disciplinaires dans cette utilisation.

Ils ont également pu constater une évolution évidente de l’utilisation de HAL « d’un dispositif à usage individuel (auto-archivage) vers un dispositif à destination des institutions (suivi, évaluation) », amenant de nouvelles questions telles que la provenance et la qualité des données, leur interopérabilité ou encore la professionnalisation documentaire des déposants. Enfin, les auteurs montrent que cette enquête devra elle-même être complétée pour poursuivre l’étude de ce sujet. Une nouvelle enquête qualitative, à partir d’entretiens auprès de 50 laboratoires est en cours et aura pour but d’affiner les axes relevés et mieux appréhender les variables de comportements qui n’ont pas encore pu être expliqués.

Une proposition d’analyse longue sur plusieurs années est également présentée par les auteurs pour permettre d’étudier l’impact des politiques publiques auprès des différentes communautés et disciplines.