Les données ouvertes, une évidence

Les bénéficiaires d’un subside du FNS doivent désormais aussi assurer le libre accès aux données de recherche. Katrin Beyer et Florian Altermatt, deux chercheurs qui appliquent ce principe depuis des années, nous permettent de faire la lumière sur cette pratique.

Le béton armé résiste-t-il aux forces de déplacement qui agissent sur lui ? Dans le grand laboratoire de l’EPFL, Katrin Beyer et son équipe étudient la déformation des façades lors de tremblements de terre. Chaque série d’essais génère un volume de données de plusieurs centaines de gigaoctets : photos, vidéos, données de mesure, rapports.

Des progrès plus rapides

Depuis le début des essais en 2010, Katrin Beyer, professeure en génie parasismique, a publié beaucoup de ses données. « Dans notre domaine, nous collaborons étroitement avec d’autres universités. Il est donc judicieux de rendre les données accessibles, en particulier celles résultant d’essais complexes. » Ensemble, les équipes de recherche peuvent améliorer plus rapidement la protection antisismique.

« Notre recherche est plus visible, plus souvent citée, et son impact est plus important. »

Katrin Beyer, chercheuse en génie parasismique, EPFL

Pour Katrin Beyer, le partage des données est une évidence pour une autre raison : « Notre recherche est financée par l’argent public. Les données appartiennent donc à la collectivité. »

Gestion des données dès le début du projet

Professeur boursier du FNS en synécologie à l’Université de Zurich et chef de groupe à l’Institut fédéral de recherche Eawag à Dübendorf, Florian Altermatt est du même avis. Depuis dix ans, il dépose les données de sa recherche dans des archives publiques. Il étudie par exemple comment la diversité des organismes dans les cours d’eau est structurée et comment la mesurer à l’aide de l’ADN environnemental (eDNA).

Pour les membres de son équipe, les consignes sont claires : dès le début du projet, les données doivent être gérées et mises à disposition en continu. Ainsi, toute l’équipe peut y accéder, même dans dix ans lorsque l’étudiant en master ou la doctorante ne seront plus là. « La publication des données déjà disponibles n’est que l’étape logique suivante. Elle est rapide et peu onéreuse », indique Florian Altermatt.

L’équipe de Katrin Beyer prépare elle aussi les données pour que les chercheuses et chercheurs internes n’ayant pas participé à l’essai puissent les utiliser. Cela permet ensuite de réduire les frais de publication. Katrin Beyer estiment ceux-ci à 1 % au maximum des coûts d’un projet de recherche.
« Nous bénéficions en contrepartie d’une sauvegarde externe. »

Visibilité et traçabilité

Pour Katrin Beyer, le libre accès aux données est globalement très positif : « Notre recherche est plus visible, plus souvent citée, et son impact est plus important. » Pour Florian Altermatt, l’un des avantages est aussi l’attention accrue portée à sa recherche. « Nous enregistrons à chaque fois entre 20 et 80 accès à nos données. »

Tous deux apprécient la crédibilité que le libre accès aux données confère à leur recherche. Et Florian Altermatt de déclarer : « D’autres chercheurs peuvent retracer mes mesures et vérifier les résultats. C’est pour moi un facteur de sécurité. »

« Nous enregistrons à chaque fois entre 20 et 80 accès à nos données. »

Florian Altermatt, biologiste, Université de Zurich et Eawag de Dübendorf

Protéger les jeunes chercheurs

Et qu’en est-il des limites du libre accès ? Ni Katrin Beyer ni Florian Altermatt ne travaillent avec des données sensibles sur le plan juridique ou éthique. L’obligation de publier ne s’applique pas à ces données. Pour Florian Altermatt, il est impératif que les jeunes chercheurs ne partagent pas leurs données avant d’avoir publié leur travail de master ou leur thèse. « Sinon, quelqu’un d’autre pourrait devancer le membre de mon équipe et, au pire, nuire à sa carrière. » Selon lui, le risque est aussi que quelqu’un analyse les données de manière inappropriée et en tire des conclusions non étayées par les données.

Katrin Beyer évoque quant à elle le problème du volume croissant de données. « La résolution de nos photos des murs en béton est désormais plus élevée et génère donc plusieurs téraoctets par série d’essais. Le système d’archives que nous utilisions jusqu’ici ne suffit plus. » Il faut des offres avec davantage d’espace de stockage.

Dans l’ensemble, ils dressent tous deux un bilan extrêmement positif. Pour eux, le libre accès aux données est un principe évident du monde actuel de la science. C’est exactement l’objectif que se fixe le FNS avec sa nouvelle stratégie.