Open data et jeux de données à long terme/Open data and long term dataset

*English will follow after the French*


Un mois en retard sur les actualités, mais bon, on dirait que je reviens à ma vie habituelle après mon retour d’Australie! Un article que je considère très intéressant a été publié en début du mois d’octobre au sujet du partage des données (Open Data) des études à long terme. Ayant moi-même été formée dans un labo se basant sur des jeux de données de plus de 20 ans, je suis sensible à cette problématique. D’ailleurs, mon codirecteur est coauteur de cet article.

Je suis très positive à l’idée de partager les données scientifiques après publication d’un article. Mais, je comprends les réserves des auteurs de cet article : les jeux de données à long terme sont évidemment longs à produire, mais également coûteux. Ils peuvent être le moteur d’une carrière entière et permettre de former de nombreux étudiants. C’est l’essence de ce que dit cet article. Par contre, je comprends qu’il est essentiel de partager ces données dans le monde actuel.

Ce qui me dérange, c’est la réaction des partisans de l’open data. Au lieu de répondre aux préoccupations des chercheurs qui sont réticents à partager leurs données, ils tendent à les traiter avec dérision. Une courte recherche sur Twitter m’a démontré que la majorité des tweets contre l’article sont des mots esprits peu développés:

Il est vrai que Twitter n’est pas l’endroit pour développer un contre-argumentaire développé.

Ces réactions sont inutiles. J’ai observé cette attitude à plusieurs reprises et elle n’a jamais convaincu qui que ce soit de l’utilité de l’open data. Au lieu de ridiculiser ce que je considère comme des craintes légitimes, il serait pertinent de créer un argumentaire positif. Les auteurs de l’article proposent des solutions qu’ils considèrent comme acceptables. Pourquoi ne pas tenter de partir de ces propositions et tenter de les améliorer?

J’aimerais un comportement moins sectaire de la part des tenants de l’open data et un peu plus de mains tendues. Un peu moins de clash de générations (les vieux contre les jeunes) et plus de discussions complètes. C’est un défi !


I’m one month late, but it seems that I’m slowly returning to my usual life after my Australian internship. A paper I consider highly interesting has been published at the beginning of October about open data of long term dataset. As I’ve been raised in a lab based on long term dataset, I’m sensible to the issues at stake. And my co-advisor is co-author on the paper.

I’m all for open data after an article is published. But I understand why the authors of the article are reticent: long term data set are, obviously, long to produce but are also costly. They can fuel an entire career and allow the mentoring of many students. This is essentially what this article state. I understand, however, why it is needed to share those data in the modern world.

What upset me is the response of open data tenants. Instead of answering to the concerns of researcher with long term data set, they make jokes out of it. A short research on Twitter showed me that the majority of tweets against the paper are funny, but not really developed:

Ok. Twitter is not the place to have a well-develop discussion. But those responses are useless. I’ve seen this attitude in multiple occasions and it never convinced anyone of the usefulness of open data. Instead of making jokes on what I consider to be reasonable concerns, it would be more interesting to answer those concerns. The authors of the article propose solutions that they consider acceptable. Why not starting from those and to try to improve them?

I would like a less sectarian behavior from open data advocates and a bit more of open hands. Less generation clash (old researchers against young ones) and more discussions. A goal for Toorop!