Visualiser des données « propres » et bien formatées est aujourd’hui à la portée de chacun. Mais les données auxquelles ont affaire les data journalistes sont rarement fournies clés en main. C’est pourquoi cette formation met l’accent sur l’extraction, la transformation et l’enrichissement de données brutes (« data wrangling »), qui constituent souvent la partie la plus ardue d’un projet de data journalisme. A l’aide, entre autres, du logiciel OpenRefine, les participants apprendront des méthodes puissantes pour nettoyer et reformater leurs jeux de données d’une manière qui facilitera leurs analyses ou leur visualisations.
Apprendre à travailler plus vite avec des jeux de données « sales », incomplets ou simplement mal formatés.
Prérequis : connaissances de base en informatique (savoir se servir d’un ordinateur). Avoir déjà tenté un projet de data journalisme est un plus.
Un ordinateur portable (PC ou Mac). Une liste de logiciels à installer pourrait être envoyée aux participants dans les jours qui précédent la formation.
Ettore Rizza est développeur et data analyst. Ancien chercheur en Sciences et Technologies de l’Information (ULB), il a également été journaliste durant dix ans, notamment au Soir et au Vif-L’Express.