Principe de réutilisation des données de la recherche

Même si elles peuvent être le plus souvent être qualifiées de données publiques, les données de la recherche obéissent à un régime juridique spécifique prévu, en droit de l'Union européenne, par la Directive européenne n° 2019/1024 du 20 juin 2019 et, en droit interne, par le Code de la recherche.

En vertu de l'adage juridique selon lequel « la spéciale déroge à la loi générale », le droit spécial doit s'appliquer par priorité par rapport au droit général. En matière de données de la recherche, le régime applicable est celui prévu par les textes spécifiques relatifs à la recherche qui constituent donc le droit spécial par rapport aux règles contenues par ailleurs dans la directive n° 2019/1024 sur les données publiques en général, ou en droit interne, dans le Code des relations entre le public et l’administration (CRPA) que l'on peut considérer comme le droit général qui s'applique à toutes sortes de données publiques.

Dès lors, les données de la recherche ne sont pas soumises à l'ensemble des règles applicables aux documents administratifs (et données publiques). Par exemple, contrairement aux documents administratifs et aux données publiques qui répondent à une obligation de diffusion, les données de la recherche peuvent être diffusées sur décision du chercheur, laboratoire ou établissement de recherche (art. L. 533-4, II du Code de la recherche).

I. Principe de libre réutilisation des données de la recherche

La libre réutilisation des données de la recherche est l’un des objectifs même de l’ouverture des données de la recherche. Cette finalité doit se comprendre au prisme de la politique d’ouverture des données qui consiste dans le fait pour un organisme public de mettre « à la disposition de tous des données numériques, dans un objectif de transparence ou afin de permettre leur réutilisation, notamment à des fins économiques ». – Commission générale de terminologie et de néologie, Avis et communications, Vocabulaire de l’informatique et du droit, JORF, 3 mai 2014

La réutilisation gratuite des données de la recherche en particulier participe de la politique d'ouverture des données en général. – Considérants 27 et 28 de la Directive n° 2019/1024 du 20 juin 2019 concernant les données ouvertes et la réutilisation des informations publiques

Dans certains domaines scientifiques, comme l'ethnologie ou l'agroécologie, il est nécessaire de prendre en compte les enjeux éthiques, déontologiques et juridiques lors de la réutilisation des données relatives aux personnes ou aux populations concernées par la recherche (modes de vies, savoir-faire, ressources naturelles et culturelles).

Projet de loi pour une République numérique

« Une fois que les chercheurs ou leurs établissements ont décidé de rendre leurs données publiques, aucun obstacle ne doit pouvoir entraver leur libre réutilisation ». 

- Assemblée Nationale, Projet de loi pour une république numérique du 9 décembre 2015, p. 50

A. En droit européen

Selon l’article 10, 2° de la Directive n° 2019/1024 du 20 juin 2019 concernant les données ouvertes et la réutilisation des informations du secteur public, dès lors que les données de la recherche ont été mises à disposition, elles sont librement réutilisables quelle que soit la finalité commerciale ou non commerciale de leur réutilisation.

Plusieurs conditions doivent être respectées : 

  • les données ont été financées au moyen de fonds publics ;
  • les chercheurs, les organismes exerçant une activité de recherche ou les organisations finançant une activité de recherche ont déjà rendues publiques les données de la recherche par l’intermédiaire d’une archive ouverte institutionnelle ou thématique ; 
  • la réutilisation des données ne porte pas atteinte aux intérêts commerciaux légitimes, aux activités de transmission des connaissances ou des droits de propriété intellectuelle préexistants.

Le principe d'une réutilisation gratuite est également affirmé pour les données de la recherche : « La réutilisation des éléments suivants est gratuite pour l’utilisateur : (...) b) les données de la recherche visées à l’article 1er, paragraphe 1, point c) ».Article 6, 6°, b) de la Directive n° 2019/1024 du 20 juin 2019 concernant les données ouvertes et la réutilisation des informations publiques

B. En droit interne

1. Conditions d'application du principe

L’article L. 533-4, II du Code de la recherche prévoit que les données issues d’une activité de recherche sont librement réutilisables dès lors que plusieurs conditions sont réunies : 

  • les données sont issues d'une activité de recherche (Notion de données de la recherche) ;
  • l’activité de recherche a été financée au moins pour moitié par des fonds publics (« dotations de l'État, des collectivités territoriales, des établissements publics, des subventions d'agences de financement nationales ou par des fonds de l'Union européenne »). Il s'agit de permettre de poursuivre l’objectif, conformément aux lignes directrices européennes, de faire bénéficier l’ensemble de la collectivité des retours sur investissements réalisés au travers du financement public de la recherche.

Calcul du financement de la recherche

Pour le calcul de la part de financement privé ou public, le ministère de l'Enseignement supérieur et de la Recherche affirme que le coût à prendre en compte est le « coût complet » de la recherche qui intègre notamment les coûts associés au travail de recherche, dont les salaires. 

- Assemblée nationale, Étude d'impact du projet de loi pour une République numérique, 9 décembre 2015

  • les données ne sont pas protégées par un droit spécifique ou une réglementation particulière. Il s'agit de respecter les règles adoptées par ailleurs et destinées à protéger des intérêts légitimes (v. Limites au principe de réutilisation des données de la recherche) ; 
  • les données ont été rendues publiques par le chercheur, l'établissement ou l'organisme de recherche : la liberté des chercheurs de diffuser ou non les données utilisées ou produites dans leur activité de recherche est préservée par le texte, contrairement à ce qui se produirait si les données de la recherche ne bénéficiait pas de l'application de dispositions spéciales mais étaient soumises aux dispositions d'ouverture et de réutilisation des données public (droit général). Cette importante précaution est assumée par le législateur qui précise, conformément au principe de liberté de la recherche, qu’il ne s’agit que d’une faculté pour les chercheurs qui sont donc libres de ne pas l’exercer, préservant ainsi la liberté de la recherche. - Assemblée nationale, Étude d'impact du projet de loi pour une République numérique, 9 décembre 2015

A contrario, ne sont donc pas librement réutilisables les données :

  • non issues d'une activité de recherche,
  • non issues d'une activité de recherche dont le financement est majoritairement public,
  • non publiées par le chercheur, l'établissement ou l'organisme de recherche,
  • protégées par un droit spécifique ou une réglementation particulière.

Commercialité de la réutilisation

Contrairement aux conditions posées par l'article L. 533-4, I du Code de la recherche relatives à l'ouverture des publications scientifiques, le principe d'ouverture des données de la recherche ne contient pas de condition relative à non-commercialité de l'utilisation des données de la recherche. L'absence de condition de non-commercialité tient à l'indifférence quant à la destination de la réutilisation des données de la recherche, voire à la volonté du législateur de permettre aux entreprises de se saisir des données de la recherche pour créer des produits ou services innovants.

2. Champ d'application du principe

Le principe énoncé par la loi française dont les dispositions sont antérieures à celles de la loi européenne, affirme que :

  • la liberté de réutilisation des données de la recherche ne concerne pas seulement celles qui sont liées à une publication scientifique. L'autonomie formelle de l'article L. 533-4, II du Code de la recherche montre que le législateur n'a pas souhaité faire des données de la recherche des objets accessoires des publications scientifiques. La conséquence directe de cette autonomie est que l'ouverture des données de la recherche ne dépend pas de l'écoulement des délais prévus pour l'ouverture des publications scientifiques.
  • la liberté de réutilisation des données de la recherche s'applique également aux données qui sont liées à une publication scientifique. En effet, l'article L. 533-4, III du Code de la recherche prévoit que l'éditeur d'un écrit scientifique ne peut limiter la réutilisation des données de la recherche rendues publiques dans le cadre de sa publication. Cette disposition permet aux chercheurs de déroger au principe de liberté contractuelle et à la force obligatoire des contrats, en leur offrant, malgré l’exclusivité du contrat d’édition, la faculté de diffuser leurs données par des moyens propres et adaptés. Le législateur interdit donc à l’éditeur de se réserver privativement la maîtrise de l’usage des données associées à la publication scientifique, objet du contrat d’édition.
3. Force juridique du principe

Le principe de liberté de réutilisation se trouve consolidé par le législateur français qui a pris soin d’affirmer à leur égard un caractère d’ordre public. Il s’agit d’empêcher le chercheur considéré ici comme « partie faible », de renoncer par contrat aux prérogatives dont il dispose en vertu de la loi. De ce point de vue, l’ordre public peut être qualifié d’ordre public de protection, même s’il présente également, à notre avis, les caractéristiques d’un ordre public de direction. 

L’étude d’impact de la loi pour une République numérique mentionne ainsi qu’« une atteinte est portée à la liberté contractuelle des auteurs et des éditeurs, le caractère d’ordre public empêchant l’auteur ou son établissement de renoncer au bénéfice du droit qui lui est conféré en ce qui concerne les publications et de céder à l’éditeur des licences tendant à limiter la réutilisation des données de la recherche ». - Assemblée nationale, Étude d'impact du projet de loi pour une République numérique, 9 décembre 2015

Les contrats d’édition ne peuvent donc avoir pour effet de limiter les conditions de publication des écrits scientifiques et de réutilisation des données de la recherche en-deça ou au-delà du seuil autorisé (durée d’embargo, à des fins non commerciales, version finale du manuscrit, etc.). 

Le caractère d’ordre public de la règle devrait également permettre, en tant que loi de police, de faire rayonner les règles tant à l’égard des éditeurs scientifiques établis sur le territoire national qu’à l’égard de ceux établis hors de celui-ci.

4. Effets du principe

De nombreux types de licences peuvent être utilisées dans le contexte de la recherche scientifique et, en particulier :

  • les licences Creative commons (tout type de contenus),
  • les licences Open Database (ODbL).

Licence Etalab

La licence Etalab a, quant à elle, été conçue pour la mise en œuvre du principe de réutilisation des données données publiques. Les licences Etalab sont des licences standardisées encadrant le processus d’autorisation de réutilisation des informations ou des données publiques.

A. Licences Creative Commons

Les Licences Creative Commons

sont au nombre de six et sont soumises aux principes suivants quel que soit le modèle de licence choisi :

  • le droit à la paternité (citation du nom de l’auteur) doit être respecté. Il s’agit d’un droit moral, inaliénable, perpétuel et incessible ;
  • l’autorisation de reproduire, de distribuer et de communiquer l'œuvre au public dans son format original, y compris dans des œuvres composites, est consentie à titre non exclusif et gratuit ;
  • la licence et les options choisies doivent apparaître clairement à chaque utilisation ou diffusion de l’œuvre, si possible sous la forme d’un lien vers la licence ;
  • toutes les clauses, y compris la clause d’attribution, peuvent être levées au cas par cas par le titulaire des droits dans le cadre d’une négociation contractuelle, gracieusement ou à titre onéreux ;
  • lors de la rediffusion d’une œuvre, éventuellement modifiée, il est impossible d’imposer des conditions d'utilisation de l'œuvre qui altèrent ou restreignent les termes de la licence initiale.

Les Licences Creative Commons sont des contrats qui s’appliquent dans tous les pays et qui sont conçus pour être opposables en justice. Elles permettent une cession non exclusive, à titre gratuit et pour le monde entier, de certains droits de propriété intellectuelle.

Ces licences permettent : 

  • aux auteurs d’indiquer facilement et précisément les droits qu’ils veulent conserver et les droits auxquels ils renoncent afin de permettre à d’autres de réutiliser leur œuvre ; 
  • aux utilisateurs d’être informés de ces conditions et de ne pas avoir à demander l’autorisation formelle d’un auteur avant l’utilisation de son œuvre, pour peu que cette utilisation reste dans les limites autorisées par la licence.

Dans le domaine de la recherche scientifique, Creative Commons recommande de ne pas utiliser les clauses NC (pas d’utilisation commerciale) ou ND (pas de modification) pour des jeux de données ou des bases de données destinés à une utilisation scientifique car elles restreignent les possibilités de réutilisation.

Il est conseillé également de ne pas utiliser la clause SA (partage à l’identique) car elle impose la licence de rediffusion et réduit dont l’interopérabilité des données.

La licence CC By 4.0 permet de partager, copier, distribuer et communiquer les données par tous moyens et sous tous formats, de les réutiliser pour créer de nouveaux jeux de données. Toutes les utilisations, y compris commerciales sont possibles, sous réserve de créditer les données à leurs créateurs (obligation d’attribution).

B. Licence Open Database

La Licence Open Database organise la diffusion et le partage de bases de données à titre gratuit. 

Les bases de données collaboratives sont définies comme « une partie d’un ensemble de bases de données toutes indépendantes rassemblées pour former un ensemble collectif ». 

Elles sont distinctes des « bases de données dérivées » qui sont entendues comme les bases de données produites à partir de la base de données collaborative. 

Ces bases de données dérivées comprennent la traduction, l’adaptation, l’arrangement, la modification ou toute autre altération de la base de données collaborative ou d’une partie substantielle de son contenu, ainsi que l’extraction ou la réutilisation de la totalité ou d’une partie substantielle de son contenu dans une nouvelle base de données. 

La licence autorise de manière non exclusive et gratuite, à utiliser la base de données par tous moyens et sous quelque forme que ce soit, en tout ou partie la base de données, pour les opérations suivantes : 

- extraction et réutilisation de la totalité ou d’une partie substantielle de son contenu,

- création de bases de données dérivées, de bases de données collaboratives, 

- création de reproductions temporaires ou permanentes par tous moyens ou sous quelque forme que ce soit,

- distribution, 

- communication, 

- affichage, 

- location, 

- mise à disposition

- diffusion au public.

L’utilisateur a pour obligation de mentionner le nom de la base de données, ainsi que sa source, et d’intégrer la licence ODbL dans la base de données elle-même, sans qu’il soit besoin de concéder une autre licence à des tiers en cas de sous licence.  

Les licences libres sont fondées sur un modèle qui veut que la licence soit « intégrée » à l’œuvre et la suive « en quelques mains qu’elle se trouve » pour en régir l’utilisation. 

La sous-licence ne doit pas pouvoir stipuler de termes plus contraignants que ceux prévus dans la licence de base.

Dans les licences d'exploitation à titre onéreux, ou tout autre type de contrat, il est appliqué le principe selon lequel une personne ne peut transférer plus de droits qu'elle n'en possède elle-même.

De ce point de vue, et paradoxalement, en interdisant de restreindre l'accès à la création, les licences libres contiennent des limites importantes à la liberté contractuelle. Dans le même ordre d'idées, la licence ODbL interdit l'usage de mesures techniques de protection qui auraient pour effet de verrouiller l'accès à la base ou la reproduction des données.

C. Licences ad hoc

D'autres modèles contractuels, plus personnalisés, peuvent être conçus et utilisés pour diffuser gratuitement et librement des données contenues dans des bases de données.