Les langages de balisage légers : le cas Markdown

février 17, 2025 - Temps de lecture: 27 minutes

Ce billet a été rédigé par Julie de Suremain et Lauranne Fougère. Il s'agit d'un travail réalisé dans le cadre de l’enseignement "Document numérique : formats et langages".

Julie de Suremain : Après avoir étudié les Sciences économiques et sociales à la Sorbonne, elle se spécialise dans le secteur de l’audiovisuel, où elle occupe notamment le poste de programmatrice cinématographique pour plusieurs festivals internationaux. Souhaitant se reconvertir, elle intègre le "Master 1 Information-Documentation : Gestion de l'information et médiation documentaire - Métiers des bibliothèques et de la documentation" (GIMD) au sein de l'université Paul-Valéry Montpellier.

Lauranne Fougère est diplômée d’un Master 2 recherche, spécialité cultures et sociétés étrangères. Après avoir étudié à l’université de Poitiers, elle obtient le Capes d’anglais en 2011. Elle enseigne actuellement au lycée et elle a également repris ses études en enseignement à distance au sein du Master 1 GIMD à l'université Paul-Valéry Montpellier.

Introduction

Les logiciels de traitement de texte ont été conçus pour créer, éditer et imprimer des documents, tout en les enregistrant au format électronique. Cependant, les études et les pratiques ont confirmé leur inadaptabilité à des travaux de recherche, en particulier lors de collaborations collectives et dans le milieu scientifique. L’emprise des outils et des formats propriétaires constitue un frein à la pérennité des documents qu’ils génèrent. Les obstacles techniques rencontrés, tels que la compatibilité des formats, entravent la libre circulation des productions. Le choix croissant de modèles économiques visant à rendre payante l'accessibilité aux documents ne garantit pas leur libre consultation. De plus, la difficulté d’intégration des productions sur les sites rend les outils de traitement de texte inadaptés à la production web. Leur faiblesse en matière de gestion lors de l’intégration d’images et de graphismes, ainsi que l’utilisation répétée du « copier/coller », engendrent des documents lourds et énergivores, ne répondant pas aux critères écologiques et aux aspirations de low-tech.

Le Markdown, qui est un langage de balisage dit léger, permet de structurer simplement et rapidement un document, garantissant un rendu intelligible pour l’homme et pour la machine. Les études menées par Marina Parra, Arthur Perret, Benoit Rou et Patrick Mpondo-Dicka offrent un éclairage approfondi sur ce code et ses possibilités d’utilisation. Les regards croisés d’une doctorante en littérature, d’un maître de conférences en sciences de l’information, d’un historien et d’un sémioticien, enseignant-chercheur en sciences de l'information et de la communication, offrent un aperçu riche de ce langage sous différents angles perceptifs : historique, philosophique, méthodologique, théorique et prospectif.

S’il semble incontestable qu’à travers une démarche réflexive, nous devons nous réapproprier nos environnements de travail et les outils que nous utilisons, le système de langage Markdown peut-il constituer un élément de réponse à cet enjeu ? Pour tenter de répondre à cette problématique, nous allons nous intéresser à trois documents :

  • Marine Parra, Arthur Perret (20323). Écrire autrement : réflexions croisées sur Mardown. Séminaire du Réseau Sociétés et Humanités Numériques en association avec les séminaires So MSH! et PROGEDO-Loire, Julie Aucagne, Jun 2023, Nantes, France, https://hal.science/hal-04162643
  • Marine Parra et Benoît Roux, Markdown, se réapproprier ses outils d’écriture, in Eveille, 03/02/2022, https://eveille.hypotheses.org/975
  • Patrick Mpondo-Dicka (2019). Le Markdown, une praxis énonciative du numérique. Interfaces numériques, 8. https://doi.org/10.25965/interfaces-numeriques.3915

Dans un premier temps, nous montrerons en quoi des langages de balisage (LBL) tels que le Markdown représentent une valeur ajoutée pour le document numérique. Puis, nous nous intéresserons à leurs limites et mettrons en évidence l’évolution inévitable du langage Markdown en tant qu’outil dédié à une pratique.

1- Markdown, une valeur ajoutée pour le document numérique

a. Une proposition de réponse aux évolutions technologiques

Bien qu’il ait des caractéristiques similaires au document traditionnel, le document numérique ne peut se définir comme un concept pleinement établi. L'évolution rapide et constante des technologies, la multiplication des fonctionnalités d'un document numérique, la possibilité d'intégrer des éléments multimédias et l'interactivité spécifique des utilisateurs face à ces nouveaux formats sont autant de facteurs qui rendent complexe l'élaboration d'une définition arrêtée. Si Stéphane Crozat s'efforce de donner les contours de ce concept[1], il souligne également la nécessité de le concevoir en tenant compte de ses spécificités, de ses usages et de ses potentialités dans un contexte numérique en constante évolution. Une étude approfondie et ciblée est essentielle, notamment pour la création d’outils appropriés répondant aux exigences de leurs utilisateurs et aux avancées technologiques.

Dans un contexte collaboratif, de production scientifique ou de diffusion web, l’utilisation de logiciels de traitement de texte pour la production de documents numériques ne répond pas à la nécessité de maniabilité du texte. La pluralité des outils et, de ce fait, des formats, complexifie l’intégration de ressources variées. Les caractéristiques high-tech de ces formats constituent une entrave à la circulation fluide dans la production écrite et induisent un temps de traitement et de mise en forme conséquent.
 Enfin, comme mentionné précédemment, ils sont inadaptés à la production web. Les langages de balisages légers en tant que lieu même du dialogue humain machine, comme le souligne Patrick Mpondo-Dicka (2019), peuvent jouer un rôle de substitut.

b. Les caractéristiques de Markdown

L’expansion d’Internet et du Web, dans les années 2000, a favorisé la prolifération de productions numériques telles que les blogs et suscité le besoin de développer des outils simples pour la création de contenus. C’est dans ce contexte qu’en 2004, John Gruber, avec l’aide d’Aaron Swartz, conçoit Markdown, un langage permettant de rédiger et de mettre en forme des textes bruts à l’aide de balises simplifiées, tout en intégrant la possibilité de conversion vers d'autres formats, comme le HTML. Le développement de balisages légers permet de structurer simplement et rapidement une production, tout en garantissant un texte lisible par l’homme et la machine, même sous sa forme brute. La neutralité stylistique et sa simplicité langagière du Markdown augmente la flexibilité et la réutilisation des productions qu’il génère, répondant entre autres aux exigences du Web et à la loi de la moindre puissance (W3C)[2]. Compatible et léger, il profite à la collaboration et à l’organisation des différentes étapes d’avancement de recherches. Il est accessible sur différents supports, y compris ceux à faibles capacités telles que les téléphones, les tablettes.

Le choix d’une économie de balises associées à des caractères de ponctuations familiers tels que (#,-,*,=) rend ce langage accessible à un large public. Sa spécificité de code open source facilite son appropriation par ses utilisateurs. Markdown répond également au principe de « single-source », un fichier source unique pour des productions dans différents formats. Lors de corrections, seul le fichier source est corrigé permettant de régénérer les autres fichiers selon les besoins. Sa spécificité d’outils libre de droit et compatible avec n’importe quel éditeur de texte brut, assure la fluidité d’utilisation, sa maniabilité et la pérennité du document. De ce fait, il constitue un écosystème de travail global et intégré, un outil de production numérique adapté aux besoins des utilisateurs, dans une démarche low tech. Ces valeurs peuvent expliquer le succès toujours croissant de Markdown et son implémentation sur le site des développeurs.

c. Markdown et ses nombreuses variantes

De nombreux éditeurs de textes, open source, spécialisés dans son écriture ont été développés, offrant une large gamme d’options adaptées à des besoins spécifiques. La plupart d’entre eux proposent une interface qui distingue le fond et la forme, avec une visualisation du texte au format HTML ou PDF, ce qui favorise la concentration. Marp favorise la création de diapositives ; en mode Présentateur, le texte devient un prompteur, tandis que les éléments sélectionnés pour être affichés apparaissent sur les diapos avec une mise en page largement automatisée. D’autre part, iA Presenter permet un export qui se rapproche davantage d'un document traditionnel, intégrant texte et des illustrations. Certains éditeurs répondent aux exigences d’écritures particulières : Zettlr simplifie l’insertion de citations par rapport aux logiciels de traitement de texte classiques, tandis que Zotero facilite la gestion des bibliographies et des prises de notes. Zettlr offre également un espace de travail personnalisé permettant de structurer les connaissances grâce à une organisation non linéaire des notes étiquetées. En tandem Cosma, il permet de visualiser, naviguer et partager une base de connaissances constituée de fichiers Markdown interconnectés.

Par ailleurs, des outils tels que Stylo ont été conçus pour répondre aux différentes étapes de la chaîne éditoriale, permettant la conversion de texte en Markdown vers d’autres formats. Conçu pour le web, Markdown facilite la publication en ligne et certains outils ont été pensés de manière intégrée pour permettre d’envoyer directement le texte vers WordPress depuis l'éditeur. D’autres logiciels tels que écosystème R, Hugo et le tandem Make/ Pandoc intègrent également la création de blogs et de sites web.
La multitude de logiciels et outils intégrant le langage Markdown reflète sa notoriété et la place qu’il occupe dans les productions de documents actuels. Notoriété que le Markdown acquiert notamment avec son implantation sur Stackoverflow, (site de référence des développeurs conçu par Jeff Atwood [3]) et sur GitHub (plateforme de dépôt de code).

2- Markdown, un LBL en constante évolution

a. Les limites de Markdown

Cependant, bien que la simplicité soit l’un des fondements du langage Markdown, son utilisation croissante et variée engendre des inconvénients liés à son caractère peu expressif. La gestion d’éléments multimédias complexes, tels que les vidéos et les animations, s’avère limitée par rapport aux possibilités offertes par des outils comme le HTML ou des éditeurs WYSIWYG (logiciels permettant de créer et de modifier du contenu visuel avec un rendu final en temps réel). Dans le cadre de publications, la conversion de fichiers Markdown en d’autres formats peut alourdir le travail et nécessiter des mises à jour fréquentes.

Aussi, la rédaction de documents spécifiques peut s’avérer complexe. Comme le soulignent Marine Parra et Benoît Roux (2023), face aux exigences spécifiques d’un ouvrage, il est essentiel de s’approprier son propre environnement de travail afin d'acquérir toutes les fonctionnalités nécessaires pour le traitement du document. La sélection de ces outils implique une démarche réflexive. Des choix que nous n’avons pas toujours le temps de préciser ou conscientiser et qui peuvent alourdir la charge du travail engagé. Ainsi, la simplicité de Markdown n’est-elle pas altérée par la nécessité de multiples extensions qu’il faut associer aux outils initiaux ?

b. La simplicité de Markdown: force ou faiblesse?

La diversité des utilisateurs soulève la question des limites de Markdown. Son adaptation dépend en grande partie de son degré de standardisation. La flexibilité de Markdown, en tant que langage open source, a encouragé son appropriation par les utilisateurs, conduisant à la création de multiples variantes aux spécificités distinctes, telles que Pandoc Markdown pour l'écriture scientifique ou le R Markdown pour les statisticiens. Babelmark, un outil de test et de comparaison des différentes implémentations de Markdown, en recense vingt-deux versions. Cette multiplicité de versions engendre inévitablement des problèmes d’interopérabilité et complique le processus de standardisation. Jeff Atwood, accompagné d’une communauté de développeurs, a entrepris de mettre au point

« une spécification officielle de Markdown et une suite de tests standards permettant de valider les implantations de Markdown »

donnant lieu en 2014 à une première ébauche de standardisation du langage, puis au CommonMark. Cependant l’IESG, organisme responsable du processus de normalisation, n’a pas entériné sa validité. Un processus en marche mais qui, de par sa complexité, n'a toujours pas été finalisé.

Certaines fonctionnalités, spécifiques à certaines versions, ne sont pas prises en charge par d’autres. C’est notamment le cas d’options proposant la gestion des notes de bas de page ou des tableaux, qui peuvent entraîner des erreurs de formatage ou des pertes d’information lors de la conversion entre différents outils.

De plus, la fiabilité du rendu est remise en question selon l’éditeur de texte choisi, ce qui ne garantit pas la fidélité de la mise en page initiale. Dans un environnement collaboratif, le manque de compatibilité entre les différents éditeurs Markdown entrave également le partage de documents et le travail collectif. Ainsi, bien que la compatibilité de Markdown avec divers outils de traitement de texte soit l’un des principes du langage, elle est désormais compromise.

Enfin, contrairement à l’idéologie initiale d’un code open source, certains outils développés récemment relèvent de la propriété privée. Ils sont accessibles uniquement en ligne et leur code est fermé. C’est le cas de nombreux outils pour l’élaboration de bases de connaissances. L’accès payant et restreint constitue un frein à l’accessibilité des données et ne garantit pas leur pérennité.

c. Les nécessaires adaptations de Markdown

La notoriété du langage Markdown l’a conduit à une transformation inévitable, remettant en question son statut "d’idiolecte numérique" (Mpondo-Dicka, 2019). Initialement considéré comme un outil répondant à des besoins spécifiques et utilisés dans des contextes particuliers, adopté par une large communauté, il est devenu un langage social véhiculaire servant de moyen de communication et d’échange d’informations entre les différents utilisateurs. En tant que "technolecte informatique" (Mpondo-Dicka, 2019), il tend à devenir un standard normalisé, le rendant plus fiable et accessible à tous. Il a perdu en souplesse ce qu’il gagne en interopérabilité, en individualité, ce qu’il gagne en cohérence bien qu’il rencontre encore des imperfections à améliorer. Les langages numériques sont le reflet de leurs utilisateurs, ils évoluent avec les nouveaux besoins rencontrés.

L’évolution technologique tend à complexifier les supports de communication et à accroître les exigences des utilisateurs. Dans ce contexte, les langages de balisage léger sont amenés à se perfectionner pour perdurer. Il en est ainsi pour Markdown qui, tout en gardant sa spécificité de langage léger, doit s’améliorer pour devenir plus complet. Des solutions doivent être apportées pour permettre notamment la fusion des cellules et l’intégration des images dans les tableaux, l’insertion de vidéo et d’audio et la possibilité de redimensionner les images.

De plus, l'association d’outils complémentaires peut favoriser une meilleure organisation de l’espace de travail et de son contenu. Par exemple, l'utilisation conjointe d'une mindmap (carte mentale) et de Markdown dans le cadre d’un projet peut améliorer l’organisation, la planification et la communication des idées. La recherche d’interactivité entre les outils pourrait être une voie d’amélioration.
 

Conclusion


Pour les futurs documentalistes, Markdown représente un outil précieux pour l’organisation des notes et l’élaboration de projets ou de tutoriels. Convertible en de nombreux formats, il permet la publication en ligne et l’impression ainsi que le partage de documents. Dans le cadre d’études collaboratives, des plateformes telles que GitHub facilitent la création participative en Markdown, tout en gardant une trace des modifications. Sa compatibilité et son caractère open source garantissent la pérennité des documents élaborés, qui est un élément essentiel pour les documents destinés à être archivés et réutilisés. À l’heure de l’urgence climatique, l’adoption d’une démarche low-tech est de mise. Par sa légèreté, Markdown répond à cette exigence. 


  1. Conférence de Stéphane Crozat dans le cadre de la Masterclass DNHD HyperEdition, Documentarité, Technologies intellectives qui s’est tenue à Bordeaux les 21 et 22 février 2019, en présence de Jean-Max Noyer et des étudiants de l’Université Bordeaux Montaigne. « On appellera document numérique tout objet numérique qui ressemble à un document par ses propriétés techniques (publication, fixation, fermeture, scénarisation) et surtout par ses propriétés fonctionnelles : transmission, enseignement, preuve.Le projet de l'ingénierie documentaire - et de la littératie numérique - est d'instrumenter (inventer et comprendre) des constructions numériques qui se substituent au document pour remplir ses rôles. » ↩︎
  2. W3C : « moins de puissance augmente la flexibilité avec laquelle les informations peuvent être réutilisées », Berners-Lee Mendelsohn, 2006 ↩︎
  3. Jeff Atwood cofondateur de la plateforme Stack Overflow, lieu de recherche et d’information destiné aux développeurs. ↩︎