Data, récits et compagnie [texte]

Quelques notes prises lors de la conférence Data, récits et compagnie, organisée conjointement par Media@McGill et Radio-Canada et animée par Frédéric Bolduc le jeudi 6 septembre dernier.

Data, récits & cie / Data, stories & co / L’avenir du data-journalisme / The future of data journalism from INDIVISU on Vimeo.


Jonathan Stray
The Overview project
New York

Le data n’est pas toujours adapté à la visualisation de données. Il faut bien faire ses choix.

  • Exemple cité: le registre de ProPublica sur l’argent donné par les industriels aux docteurs (une base de données + un moteur de recherche).
  • Exemple cité: le budget intéractif du New York Times.
  • Exemple cité: le Guardian qui tient simplement un registre des données ouvertes gouvernementales à travers le monde.

Définition du journalisme de données:

  1. Trouver les données.
  2. Analyser les données.
  3. Présenter les données.

Définition des données: Une collection de morceaux similaires d’information («A collection of similar pieces of information»)

Ressource: dbpedia.com.

Type de data:

  1. Les données structurées: texte, chiffres, nombres, etc. Données organisées.
  2. Les données non-structurées: livres écrits, objets physiques, photos, images, archives, etc.

Pourquoi faire du journalisme de données?

  1. Car où il y a de l’information il y a des données: de YouTube aux rapports gouvernementaux, aux faits divers.
  2. Car les données offre de la perspective à l’information. Nécessité de bâtir du software pour analyser des sommes immenses de données.
  • Exemple cité: les révoltes de 1967 à Detroit. Contrairement à ce qu’on dit les médias à l’époque, les révoltés n’étaient pas des pauvres ou des non-éduqués. L’analyse de données a posteriori a démontré que la pauvreté ou le manque d’éducation n’était pas en cause.

Comment ça marche?

  1. Travailler d’abord en équipe. Programmeurs, statisticians, rédacteurs, reporters, designers, scientifiques, etc.
  2. Travailler sur ce que l’on connaît le plus. Exemples: How many people have middle names? Where are bike accidents most happen? Where is the dangerous corner for me? We owes whom to Europe?
  3. Se poser les bonnes questions: qu’est-ce ue je veux raconter? À quoi ça sert? Qu’est-ce que cette histoire veut être au final? Se poser des questions nous aide à travailler et non pas seulement jouer avec des ordinateurs.


Lorenz Matzat
Open data City
Berlin

Le journalisme de données n’est en rien différent du journalisme: il s’agit toujours de raconter une histoire.

  1. Exemple cité: Tell-All telephone (Die Zeit): une cartographie des appels, textos, etc. Il ne s’agit pas d’une histoire en tant que tel, mais un travail immense travail de base de données qui peut aider une salle de nouvelles à enrichir leurs histoires ou à en dégager de nouvelles.
  2. Exemple cité: Rail monitor (Suddeutsche.de): une cartographie des trains allemands en temps réel, issu d’une commande d’une salle de nouvelle qui souhaitait connaître l’ampleur des retards de trains et les causes.
  3. Exemple cité: Lokaler. Une cartographie de lieux avec filtres et croisements possibles, détecte des lieux cités dans des documents et les incorpore dans une carte.


Roberto Rocha
The Montreal Gazette

  1. Exemple cite: Une cartographie des accidents de vélo dans la baie de San Francisco. Croisement entre les données officielles et les soumissions du public.
  2. Exemple cité: Une cartographie des accidents entre piétons et voitures dans une ville en Russie. Filtres ingénieux: impliquant le trottoir ou non, le genre et l’âge des conducteurs, le genre et l’âge des piétons, etc.
  3. Exemple cite: Une cartographie des accidents de vélo à Montréal entre 2006 et 2010 (données de la SAAQ). Projet de Roberto Rocha à The Montreal Gazette.
    Il manque malheureusement des infos sur l’âge, le genre, les blessures, ce qui aurait pu être fourni si Rocha avait fait la demande auprès de la SAAQ (c’était son premier projet de cette ampleur). Rocha travaille sur une cartographie des accidents d’autos et une autre sur les accidents de piétons.

Théorie

  • La qualité des données est importante.
  • La présentation se doit d’être soignée.
  • Des connaissances en web et en programmation, c’est non négociable.


Plénière
Animation: Frédéric Bolduc
Jonathan Stray, The Overview project
Lorenz Matzat, Open data City
Louis-Richard Tremblay, Radio-Canada

Matzat: métaphore du cinéma: journaliste (directeur), designer (directeur artistique), programmeur (caméraman).

Stray: «be curious, take some data and try it out. Fail fast is a way to succeed fast.»

Matzat: les cours de journalisme de données, c’est une chose, mais l’équipe importe davantage.

Tremblay: un enjeu corporatif : la culture. Porter de petits projets et préparer les esprits pour faire avancer les plus gros projets.

Stray: l’innovation est d’essayer les choses et de produire des projets rapidement. Le défi est de bien composer les équipes et de bien donner les licences d’autorité.

Tremblay: le «crowdsourcing» tarde à être intégré dans les grands médias mais la volonté est là.

Matzat: les journaux sont les plus avant-gardiste: LA Times, Guardian, NYT, Texas Tribune.

Stray: les bonnes idées font les bonnes visualisation de données. Le journaliste doit se mettre plus que jamais à la place du lecteur ou de l’internaute. En quoi les produits journalistiques vont-ils être utiles aux gens?

Tremblay: sur la question des initiatives personnelles des journalistes vs le leadership corporatif: le management a besoin de retour sur investissement.

Stray: le problème de la confidentialité est un problème liés aux donnée et non un problème de journalisme.

Matzat: les gens n’ont aucune idée des données qui circulent sur eux.

Stray: histoire d’échec: collecte de vidéos de réactions de gens à propos de la mort de Bin Laden. Les journalistes étaient trop occupés pour pour se soucier de la qualité des vidéos, et le retour des vidéos s’est soldé par des soucis technologiques. Parfois, l’opportunisme n’est pas la meilleure idée.

Matzat: histoire d’échec: croiser deux trop grosses bases de données comme la BD des accusations du tribunal et la BD de la police. Trop compliqué à recouper pour créer du sens dans tout ça.

Stray: concernant le design: chaque choix en terme de design set un choir éditorial. La taille, la géolocaisation relative, les couleurs, les graphiques, etc.

Matzat: si vous ne récoltez pas les données par vous-même mais le récupérez par quelqu’un d’autre, toujours se demander quel intérêt a l’auteur de ces données de les rendre publiques ou de vous les remettre.

Comments

One Comment so far. Comments are closed.
  1. Super compte-rendu, Xavier, merci.
    Très utile.