Interroger la place de l’écrit chez les datajournalistes

Avant-propos: Cet article a été écrit dans le cadre de l’atelier internet, animé par Eric Guichard, à l’Ecole Normale Supérieure de la rue d’Ulm. Il n’implique pas l’accord de celui-ci aux propos qui y sont tenus. L’atelier Internet propose un regard particulièrement enrichissant sur la place de l’écrit. Il s’appuie sur un réseau d’intellectuels d’horizons très larges, réunis par la grande force fédératrice d’Eric Guichard.

Dans le cadre du Master 2 « Sociologie et Statistiques », je souhaite comprendre dans quelles mesures le travail mené par les datajournalistes évolue en fonction des outils disponibles, et de quelles façons cela affecte les représentations qu’ils ont de leur profession. Je m’intéresserai aux professionnels de trois pays dans lesquels celle-ci s’est développée de façon manifeste : France, Royaume-Uni et Etats-Unis. Ce travail empirique d’enquête se déploiera en trois temps : recensement des travaux des enquêtés, envoi d’un sondage sur leurs valeurs et leurs pratiques professionnelles et enfin observation et entretiens qualitatifs sur deux ou trois lieux de travail.

Je m’appuierai au long de mon enquête sur la définition du datajournalisme proposée par Sylvain Parasie et Eric Dagiral.

Qu’ils s’appellent « data-journalistes », « journalistes-programmeurs » ou « journalistes hackers », ils revendiquent un positionnement à la fois technique et éditorial (Parasie, 2011). Souvent désignés sous le terme de « news applications », les contenus qu’ils conçoivent sont aussi bien des cartes interactives que des infographies, des bases de données interrogeables ou d’autres formes de présentation en ligne. Leur fabrication repose sur une variété de compétences informatiques permettant de collecter, de traiter, de combiner et de visualiser des données — qu’il s’agisse de chiffres, de textes, de photographies ou de contenus audiovisuels disponibles sur des supports numériques. 1

Depuis le « computer-assisted journalism » des années 1980, qui permettait aux journalistes disposant des savoir-faire traditionnels de recouper des informations en très grandes quantités de façon automatisée, le journalisme de données s’est beaucoup renouvelé, à partir des années 2000, notamment depuis Chicago2. Le développement de la presse en ligne, la libération des données publiques et le développement continu de logiciels payants gratuits d’extraction, d’analyse et de mise en forme de données participent à créer un contexte très favorable au datajournalisme, ou journalisme de données.

Je m’intéresserai principalement au datajournalisme en ce qu’il est une nouvelle forme d’écriture journalistique. Chez les datajournalistes, l’histoire, le chiffre, l’image n’est pas expliqué (uniquement) par l’utilisation du seul texte, lu par un individu.

Au sein de la Charte3 adoptée par le service Les Décodeurs au journal Le Monde, les journalistes proclament que « le texte n’est qu’une option pour raconterl’information » puis, que « les données sont des informations, les informations sont des données ». Un troisième principe est mis en avant : « Rien n’est trop complexe pour être expliqué simplement ». De son côté, Simon Rogers, qui fut à la tête du Datablog du quotidien britannique The Guardian4 avant d’être recruté par l’entreprise de micro-messagerie américaine Twitter, conçoit le datajournalisme en trois points : il s’agirait d’abord d’un moyen pour raconter des histoires en ayant recours à des chiffres, ensuite d’un procédé cherchant à trouver la meilleure façon de raconter cette histoire et enfin, une conscience du fait que la technique change perpétuellement : « technics change all the time ». S’interroger sur le rapport des datajournalistes à leurs outils nécessite, on le voit immédiatement, de poser la question de la place de l’écrit, qu’il soit texte ou code, pour cette « nouvelle » corporation.

Dans ce cadre, il m’a semblé utile de construire une base de données indiquant un certain nombre de caractéristiques des travaux des datajournalistes que je souhaite étudier (celui qui revendique cette appellation est datajournaliste). Je présenterai ici plusieurs questions qui se sont posées lors de mes réflexions pour appréhender la nature de l’écriture datajournalistique, en commençant par les difficultés de recensement de ces travaux, avant de présenter les façons dont on peut tenter de trouver de quoi est faite la plume des datajournalistes. J’expliquerai ensuite les difficultés de conservation de leur travail et la complexité de leur rapport aux sources, avant, enfin, de proposer quelques outils d’analyse, propres à ce nouveau champ du journalisme.

Où commence le datajournalisme ?

Quels travaux recenser ?

Dans le cadre de cette première étude, j’ai dressé une liste indiquant pour cinq travaux d’une dizaine de datajournalistes français plusieurs éléments, s’étalant dans la mesure du possible de 2012 à début 2014. Il s’agissait de la date de parution, du titre de l’article, de son lieu de parution, d’un lien URL vers l’article, de la nature collaborative ou non du projet, si oui du nom des collaborateurs, du thème de l’article, de sa nature (enquête, mise en forme, éclairage, etc.), et d’un ensemble d’éléments descriptifs de l’article : le nombre de signes du chapô, le nombre de signes intégrés dans l’article et le nombre des autres signes présents dans l’article (dans les légendes des photos, les explications, les sources, etc.). Suivaient ensuite le comptage des liens hypertextes présents dans l’article, le nombre d’illustrations fixes (type jpg ou png), le nombre d’illustrations animées (type Vine ou gif), le nombre de vidéos, le nombre de tableaux, le nombre de graphiques fixes et si oui leur type, et enfin le nombre de graphiques interactifs présents dans l’article et si oui leur type.

Mais si les journalistes peuvent être amenés à changer d’employeur5 assez fréquemment, c’est tout autant le cas des datajournalistes : le marché actuel étant composé d’un petit nombre d’acteurs et d’éditeurs qui n’investissent ce domaine que progressivement. Les productions des datajournalistes sont donc souvent réparties entre plusieurs sites. Chacun de ces sites dispose de caractéristiques propres (CMS, chartes éditoriale et graphique, etc.) sans être stables dans le temps. Recenser les travaux des sujets étudiés au fil du temps (et donc des plateformes de publication) induit donc le risque de prendre en compte bien plus la trajectoire professionnelle des datajournalistes que l’évolution des techniques et outils utilisés.

Gurvan Kristanadjaja6, jeune datajournaliste, a d’abord publié sur StreetPress7, plateforme destinée à un public plutôt jeune8 et connecté, avant de passer par le site web du quotidien gratuit Metro9 (mais il n’existe aucun article paru à son nom sur le site, ce qui ne signifie pas qu’il n’a pas participé à la mise en ligne de sujets), puis par le site du quotidien Sud-Ouest10, qui ne propose ses archives qu’à travers un « paywall »11. Il publie ses articles en juin 2014 sur la plateforme Rue8912. Gurvan Kristanadjaja a également recensé plusieurs de ses archives sur son site personnel. Les sources sont donc multiples, mais nécessairement biaisées (cf supra) et loin d’être exhaustives.

Une sélection a priori et a posteriori

Les sources utilisées pour l’élaboration de cette base de données peuvent avoir été trouvées via les moteurs de recherche internes aux médias pour lesquels travaillent les datajournalistes suivis, ou bien via leurs sites personnels, au sein desquels figurent souvent une page d’archives professionnelles. On voit bien ici la première difficulté. Dans le premier cas, compte tenu du fait que la majorité d’entre eux exercent sur des médias en ligne, la question de l’accès aux archives est complexe : le site peut ne pas citer ses contributeurs, le moteur de recherche intégré au site peut ne pas être d’une grande aide,… les obstacles ne manquent pas. D’autre part, en se fiant aux seules archives figurant sur le site web personnel du datajournaliste suivi, le biais de sélection est évident : celui-ci aura volontiers mis en avant les productions dont il est le plus fier, au dépens de tâches peut-être moins valorisante, mais qui font tout autant partie de ses travaux quotidiens, qui ne se trouveront pas sur sa page d’archives.

Le biais de sélection n’est, pour être complet, pas uniquement du au datajournaliste étudié. Il est compliqué à éviter pour l’étudiant seul face à cette tâche. Ayant conscience de mes limites d’extraction de données et d’analyse, j’ai eu tendance à chercher ce que je considérais comme le plus archétypique du datajournalisme.

Toutefois, la question se pose également en sens inverse : pour étudier la place de l’écrit chez les datajournalistes, aurait-il été vraiment enrichissant de se pencher sur les articles « traditionnels » publiés par ceux-ci ? Le datajournalisme commence-t-il avec l’explication « purement textuelle » d’une statistique nationale publiée de façon mensuelle ? A deux moments clés, celui de la recherche et celui de la collecte, la sélection des articles soulève donc davantage d’interrogations que s’il s’agissait de recenser les travaux de journalistes travaillant pour un support papier.

Trouver le clavier et la souris derrière la plume du datajournaliste

Un rapport hybride aux éléments

Le datajournalisme propose des productions extrêmement riches, mêlant cartographies, base de données, infographies, et beaucoup d’autres éléments. Dans le cadre de cette étude, j’ai tenté de recenser quelques éléments qui me paraissaient importants et utiles pour comprendre comment les datajournalistes utilisent l’écriture. Parmi ces éléments figuraient le le nombre de liens URL au cours d’un article. Que faire du cas de liens URL intégrés dans une carte ? Apparaissent-ils à l’internaute car ils ont été placés comme source par le producteur de ce contenu ? Si oui, a-t-il choisi de les afficher ou bien est-ce simplement une possibilité offerte par l’application utilisée ? La solution ne peut être donnée qu’au cas par cas.

Comment prendre en compte une vidéo explicative qui comporterait des infographies ? Comment peut-elle être comptabilisée? Peut-on prendre en compte le commentaire sonore comme une forme d’écriture ? On peut encore interroger les créations graphiques des datajournalistes : les uns peuvent utiliser des images qui en dévoilent une autre au survol de la souris de l’internaute (ne forment-elles plus qu’une image?), les autres vont agglomérer dans une image plusieurs autres afin de créer une illustration adaptée à leur article13. Doit-on recenser chacune des images intégrées à la principale illustration ?

Ecrire ce qui n’est pas lu

Lorsque l’on ouvre son journal, il est relativement aisé de repérer le chapô d’un article, la légende d’une photographie, le début et la fin de l’article. A la suite de la signature du journaliste, il est entendu que les parties textuelles ne relèvent plus de sa plume. La situation est bien différente dans le cas du webjournalisme en général et du datajournalisme en particulier. Dans le cas de l’article « Les artistes ont-ils vraiment plus de risque de mourir à 27 ans ? »14 publié sur la plateforme Les Décodeurs le 6 juin 2014 et mis à jour le lendemain par Maxime Vaudano, les formes d’écriture sont nombreuses et variées : chapô, encadrés, paragraphes traditionnels, bien sûr, mais aussi graphiques et infographies. On peut même indiquer l’écriture ajoutée en surimpression de graphiques qui n’ont pas été réalisés par lui, mais par les chercheurs que le journaliste commente.

Comment appréhender ces « combinatoires scribales » ?

Dans cet article, chaque individu étudié, parce que recensé par le site Wikipedia comme appartenant à une catégorie, est associé à un lien hypertexte. Doit-on prendre en considération comme des liens réalisés volontairement par le datajournaliste ou automatiquement par le code proposé par Wikidata et adapté par le journaliste ?

On voit alors que le traitement des données, rendu possible par l’apprentissage et l’écriture de code, permet la création de formes d’écritures sophistiquées. Une autre question apparaît également : le datajournaliste est-il l’auteur de tous les signes lus par le lecteur, même s’il ne les a pas tous écrits ? Comment prendre en compte le fait que ce qui est lu n’est pas ce qui a été écrit et vice-versa ?

Contrairement aux journalistes exerçant au sein de la presse traditionnelle que l’on recruterait pour leurs qualités rédactionnelles, leur « plume », l’écriture des datajournalistes serait donc davantage contrainte par l’environnement technique de l’éditeur, et paradoxalement d’autant plus contrainte par cet environnement technique que cette écriture se veut théoriquement libérée des contraintes de la presse (puisque « le texte n’est qu’une option pour raconter l’information »). La plateforme de publication peut, par exemple, ne pas nécessairement « supporter » le langage informatique que maîtrise le datajournaliste.

La maîtrise de sa production

Stabilité et durabilité

Problème majeur pour l’ensemble des professions liées à l’informatique, la conservation stable et durable des productions interroge aussi le journaliste qui publie sur internet. Un des datajournalistes a, par exemple, fait appel au « widget » de Radio France, permettant à tout internaute d’intégrer dans une page web un lecteur proposant à l’écoute un extrait spécifique d’une émission du groupe public. Or, l’écoute de ces extraits n’est possible qu’au cours d’une période définie par le diffuseur. En choisissant la solution proposée par Radio France, le journaliste est parvenu à transmettre une information riche en termes de contenu, mais peu durable. Impossible, plusieurs mois après, de parvenir à écouter l’extrait en question. La facilité de copier-coller le code d’un tel module interroge, on le conçoit, la conservation durable de l’intégralité d’un article, la pratique de la citation de ses sources, mais elle interroge aussi sur la place de l’écrit : dans quelle mesure le datajournaliste accepte-t-il de remettre la gestion de ses contenus à des plateformes qu’il ne maîtrise pas ? Quelle place choisit-il de donner à ses productions en dehors d’une diffusion immédiate ?

« Technics change all the time », proclamait Simon Rogers. Injonction à la remise en question et à l’apprentissage permanent, cette affirmation n’est-elle pas un aveu d’impuissance de la part de professionnels face à une offre de services qu’ils ne maîtrisent pas, ou tout du moins pas encore suffisamment ?

Lorsqu’un datajournaliste tente de récapituler les différents points d’un débat public, il peut être amené à insérer un tweet dans son article. Qu’advient-il si le compte qui en est à l’origine choisit de l’effacer ? Le remplacement de ce tweet par une capture d’écran (pour peu qu’elle fut effectuée) ne peut être équivalent. Chaque micro-message possède un code spécifique par lequel il peut être retrouvé et auquel est associé un ensemble d’informations parmi lesquelles la date (et éventuellement lieu) de publication mais aussi le nombre et les identités des comptes ayant retweeté ou placé en favori le message en question. Ces informations, contextuelles puisqu’elles viennent avec le tweet en tant qu’écriture, disparaissent totalement dans le cas de sa substitution par une image.

L’éthique du programmeur et l’éthique du journaliste : quel rapport aux sources ?

A la fois journalistes et programmeurs, ou du moins codeurs, les datajournalistes sont de façon plus ou moins explicite contraints à respecter deux éthiques : celle du programmeur et celle du journaliste. La première s’adresse à des individus souvent impliqués dans une communauté et autour de projets ouverts (développement des logiciels open source, notamment) et pour lesquels la mise en commun de ressources est très valorisée. La seconde est plus connue : autour de la protection des sources, l’éthique du journalisme est constituée d’un ensemble de règles professionnelles et de lois visant à garantir la liberté d’informer en protégeant les sources des journalistes. Concilier ces deux éthiques au sein d’une même profession peut s’avérer complexe.

On le voit, l’émergence de cette figure professionnelle aux frontières de deux mondes socio-professionnels distincts traitant de l’information continue de réactualiser et d’aviver la question des « codages » professionnels (Bastin, 2009) et des tensions inhérentes qui l’accompagnent à travers les identités construites et les termes choisis pour les désigner, particulièrement polémiques dans le cas des journalistes « hackers ».15

Le datajournalisme peut s’appuyer sur la participation du public pour accéder à des données : faire scanner des factures d’eau pour établir un comparatif entre tarifs proposés dans une même région, proposer aux internautes de décrypter et de commenter eux-mêmes les câbles diplomatiques, comme ce fut le cas lors de l’application développée avec Wikileaks… Rendre ces données publiques contient un risque : celui de dévoiler des cas individuels, mais comment justifier les résultats obtenus à l’issue de calculs sur une base de données en rendant impossible sa consultation par le public ?

Pour reprendre l’exemple du tweet développé précédemment, le recours à celui-ci comme source pour une citation d’une personnalité interroge également. Lorsqu’un journaliste insère un tweet, il décide de faire appel à un élément dont il n’est pas l’auteur et dont il ne peut garantir ni l’authenticité puisque de nombreux comptes « parodiques » utilisent des noms et des images qui ne sont pas les leurs, ni la présence permanente au sein de son article et donc une lecture équivalente pour chaque lecteur. Sorti de son contexte, les méta-informations qui l’accompagnent permettent en effet de l’insérer dans un discours plus complet, le tweet ne vaut guère mieux qu’une rumeur16 non vérifiée.

Loin d’incarner le constat d’échec de la construction d’une base de données, ces questions visent au contraire à souligner la richesse des formes d’écriture que l’on peut être amené à croiser dans les travaux de datajournalisme et la nécessité de développer des outils spécifiques pour les mieux appréhender.

Conclusion

Forme de journalisme en ébullition dans un monde de la presse plutôt en berne, le datajournalisme bénéficie depuis les début des années 2010 d’un essor majeur. Ses atouts sont, il est vrai, importants. En ajoutant de très nombreuses formes de visualisation à la démarche argumentative et narrative du journalisme, il peut être conçu comme une réinvention, à la marge, du journalisme et de son écriture. Tels les idéogrammes décrits par Jack Goody18, qu’il n’est pas nécessaire de maîtriser en intégralité pour apprendre à lire et qui ne sont pas associés à une langue particulière, les outils du datajournalisme peuvent permettre à des individus de découvrir les enjeux d’un sujet. Une carte, une courbe, un nuage de points, une frise chronologique ; aucun de ces éléments ne requiert absolument la maîtrise d’une langue.

Sources web

www.addons.mozilla.org

www.gurvankris.com

www.lemonde.fr

www.metronews.fr

www.streetpress.com

www.rue89.nouvelobs.com

www.theguardian.com

www.sudouest.fr

www.twitter.com

Bibliographie

Dagiral Eric et Parasie Sylvain, « Portrait du journaliste en programmeur: l’émergence d’une figure du journaliste «hacker» », Les cahiers du journalisme, 2011, no 22-23, p. 144 155.

Gray Jonathan, Bounegru Liliana, Chambers Lucy, Kayser-Bril Nicolas et Robert Charles, Guide du datajournalisme: collecter, analyser et visualiser les données, Paris, Eyrolles, 2013.

Guichard Eric, « La matière des idées entretien avec Jack Goody », Vacarme, 17 octobre 2009, no 49.

Marchetti Dominique, « Les sous-champs spécialisés du journalisme », Réseaux, 2002, no 1, p. 22 55.

Parasie Sylvain et Dagiral Eric, « Des journalistes enfin libérés de leurs sources? Promesse et réalité du“ journalisme de données” », Sur le journalisme About journalism Sobre jornalismo, 2013, vol. 2, no 1, p. pp 52.

1S. Parasie et E. Dagiral, « Des journalistes enfin libérés de leurs sources? Promesse et réalité du“ journalisme de données” », Sur le journalisme About journalism Sobre jornalismo, 2013, vol. 2, no 1, p. pp 52.

2Ibid. p.56

5Dominique Marchetti, « Les sous-champs spécialisés du journalisme », Réseaux, 2002, no 1, p. 22 55.

8La présentation du site, telle qu’affichée en juin 2014, est la suivante : « Bienvenue chez vous ! StreetPress est un site d’information qui propose des news fraîches du jour et des reportages au long cours. Nos lecteurs comme nos reporters ont pour la plupart entre 20 et 35 ans. Mais l’avis de tous nous intéresse !

Pour participer, connectez-vous :

StreetPress fonctionne en rédaction ouverte : Vous proposez vos idées de sujets, vous rencontrez d’autres reporters bénévoles et les journalistes permanents à l’occasion d’une conférence de rédaction. »

11Un dispositif nécessitant un abonnement de l’internaute qui souhaite accéder au contenu du site.

13En l’occurrence, il s’agit d’un classement musical où cinq albums sont associés à leurs pochettes.

15Eric Dagiral et Sylvain Parasie, « Portrait du journaliste en programmeur: l’émergence d’une figure du journaliste «hacker» », Les cahiers du journalisme, 2011, no 22-23, p. 153.

16On peut rappeler à ce sujet l’abondance de médias ayant pris pour argent comptant le tweet, (https://twitter.com/FIFAWorldCupTM/statuses/476739450450366464) d’un compte parodique de la FIFA selon lequel l’équipe japonaise de football aurait traversé le Pacifique avec un avion aux couleurs des Pokemon. Le compte a, depuis, été suspendu par le service de micro-messagerie.

18Eric Guichard, « La matière des idées entretien avec Jack Goody », Vacarme, 17 octobre 2009, no 49.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *