Notion de données de la recherche

Si la notion de données de la recherche ne fait pas l’objet d’une définition légale au niveau national, le législateur européen l’a, quant à lui, définie.

1. Au niveau européen
  • Lexique : Données de la recherche

« [D]ocuments se présentant sous forme numérique, autres que des publications scientifiques, qui sont recueillis ou produits au cours d’activités de recherche scientifique et utilisés comme éléments probants dans le processus de recherche, ou dont la communauté scientifique admet communément qu’ils sont nécessaires pour valider des conclusions et résultats de la recherche ».

- Article 2, 9° de la Directive n° 2019/1024 du 20 juin 2019 concernant la réutilisation des informations du secteur public offre une définition des données de la recherche

La définition des données de la recherche issue de la directive n° 2019/1024 du 20 juin 2019 comporte quatre éléments : 

1° Élément relatif à l’origine des données : elles incluent toutes les données recueillies ou produites au cours d’activités de recherche scientifique, quels que soient les lieux ou contextes de collecte ou de production.  

2° Élément relatif à la nature des données : elles sont définies comme des « documents » (v. Documents administratifs). Il s’agit une notion centrale du cadre d’ouverture des données publiques, englobant toutes les formes de support (physique ou numérique) et de contenu (informations, données).

3° Élément relatif à la forme des données : elles doivent être disponibles sous une forme numérique, condition essentielle de leur ouverture et de leur réutilisation. 

4° Élément relatif à la fonction des données : les données concernées par le principe d'ouverture sont celles qui sont nécessaires à la validation des résultats de la recherche ou reconnues comme éléments probants. En effet, la fiabilité des données de la recherche doit pouvoir être vérifiée grâce à l’accès aux données qui soutiennent le processus de recherche et permettent d’administrer la preuve scientifique.

Les Lignes directrices sur les règles de l’accès ouvert aux publications scientifiques et aux données de la recherche de la Commission européenne, publiées le 21 mars 2017 (programme H2020), définissaient les données de la recherche  comme les « informations, en particulier les faits et chiffres collectés pour être analysés et traités comme base d’un raisonnement, d’une discussion ou d’un calcul ».

La notion inclut donc : 

  • les statistiques, 
  • les résultats de l’expérience, 
  • les mesures, 
  • les observations résultant d’un travail de terrain, 
  • les résultats d’enquêtes, 
  • les enregistrements d’interview et d’images.

La définition est large ne cantonne pas les données à la forme numérique. En revanche, elle ne comprend pas les publications scientifiques dont elles les distingue.

Sont visées les données associées à une publication qui doivent être diffusées dès que possible (données permettant de valider les résultats présentés dans les publications, y compris les métadonnées décrivant les données de la recherche déposée). 

Sont également visés tous les autres types de données (données ayant fait l’objet d’une curation mais non directement associées à une publication ou données brutes, y compris les métadonnées associées). 

Schéma, Lignes directrices de la Commission européenne, 2017, p. 3

img
2. Au niveau national

Le droit français n’offre pas de définition juridique de la notion de données de la recherche. Il convient donc de se référer à la définition européenne.

Loi pour une République numérique

Le législateur avait proposé, dans les documents préparatoires à la loi pour une République numérique du 8 octobre 2016, une définition :

« Données factuelles issues d’observations, d’enquêtes, de corpus, d’archives, d’expériences ou d’analyses computationnelles, enregistrées sous tout format et sur tout support dans une forme brute ou après avoir été traitées ou combinées, et sur lesquelles se fondent les raisonnements du chercheur et qui sont jugées nécessaires à la validation des résultats de la recherche » – Assemblée nationale, Projet de loi pour une République numérique, Étude d’impact, 9 décembre 2015

Cette définition n’a toutefois pas été reprise dans la loi du 7 octobre 2016 pour une République numérique, ni par conséquent dans le Code de la recherche.