Même si elles peuvent être le plus souvent être qualifiées de données publiques, les données de la recherche obéissent à un régime juridique spécifique prévu, en droit de l'Union européenne, par la Directive européenne n° 2019/1024 du 20 juin 2019 et, en droit interne, par le Code de la recherche.
En vertu de l'adage juridique selon lequel « la spéciale déroge à la loi générale », le droit spécial doit s'appliquer par priorité par rapport au droit général. En matière de données de la recherche, le régime applicable est celui prévu par les textes spécifiques relatifs à la recherche qui constituent donc le droit spécial par rapport aux règles contenues par ailleurs dans la directive n° 2019/1024 sur les données publiques en général, ou en droit interne, dans le Code des relations entre le public et l’administration (CRPA) que l'on peut considérer comme le droit général qui s'applique à toutes sortes de données publiques.
Dès lors, les données de la recherche ne sont pas soumises à l'ensemble des règles applicables aux documents administratifs (et données publiques). Par exemple, contrairement aux documents administratifs et aux données publiques qui répondent à une obligation de diffusion, les données de la recherche peuvent être diffusées sur décision du chercheur, laboratoire ou établissement de recherche (art. L. 533-4, II du Code de la recherche).
La libre réutilisation des données de la recherche est l’un des objectifs même de l’ouverture des données de la recherche. Cette finalité doit se comprendre au prisme de la politique d’ouverture des données qui consiste dans le fait pour un organisme public de mettre « à la disposition de tous des données numériques, dans un objectif de transparence ou afin de permettre leur réutilisation, notamment à des fins économiques ». – Commission générale de terminologie et de néologie, Avis et communications, Vocabulaire de l’informatique et du droit, JORF, 3 mai 2014
La réutilisation gratuite des données de la recherche en particulier participe de la politique d'ouverture des données en général. – Considérants 27 et 28 de la Directive n° 2019/1024 du 20 juin 2019 concernant les données ouvertes et la réutilisation des informations publiques
Dans certains domaines scientifiques, comme l'ethnologie ou l'agroécologie, il est nécessaire de prendre en compte les enjeux éthiques, déontologiques et juridiques lors de la réutilisation des données relatives aux personnes ou aux populations concernées par la recherche (modes de vies, savoir-faire, ressources naturelles et culturelles).
Projet de loi pour une République numérique
« Une fois que les chercheurs ou leurs établissements ont décidé de rendre leurs données publiques, aucun obstacle ne doit pouvoir entraver leur libre réutilisation ».
- Assemblée Nationale, Projet de loi pour une république numérique du 9 décembre 2015, p. 50
Selon l’article 10, 2° de la Directive n° 2019/1024 du 20 juin 2019 concernant les données ouvertes et la réutilisation des informations du secteur public, dès lors que les données de la recherche ont été mises à disposition, elles sont librement réutilisables quelle que soit la finalité commerciale ou non commerciale de leur réutilisation.
Plusieurs conditions doivent être respectées :
Le principe d'une réutilisation gratuite est également affirmé pour les données de la recherche : « La réutilisation des éléments suivants est gratuite pour l’utilisateur : (...) b) les données de la recherche visées à l’article 1er, paragraphe 1, point c) ». – Article 6, 6°, b) de la Directive n° 2019/1024 du 20 juin 2019 concernant les données ouvertes et la réutilisation des informations publiques
L’article L. 533-4, II du Code de la recherche prévoit que les données issues d’une activité de recherche sont librement réutilisables dès lors que plusieurs conditions sont réunies :
Calcul du financement de la recherche
Pour le calcul de la part de financement privé ou public, le ministère de l'Enseignement supérieur et de la Recherche affirme que le coût à prendre en compte est le « coût complet » de la recherche qui intègre notamment les coûts associés au travail de recherche, dont les salaires.
- Assemblée nationale, Étude d'impact du projet de loi pour une République numérique, 9 décembre 2015
A contrario, ne sont donc pas librement réutilisables les données :
Commercialité de la réutilisation
Contrairement aux conditions posées par l'article L. 533-4, I du Code de la recherche relatives à l'ouverture des publications scientifiques, le principe d'ouverture des données de la recherche ne contient pas de condition relative à non-commercialité de l'utilisation des données de la recherche. L'absence de condition de non-commercialité tient à l'indifférence quant à la destination de la réutilisation des données de la recherche, voire à la volonté du législateur de permettre aux entreprises de se saisir des données de la recherche pour créer des produits ou services innovants.
Le principe énoncé par la loi française dont les dispositions sont antérieures à celles de la loi européenne, affirme que :
Le principe de liberté de réutilisation se trouve consolidé par le législateur français qui a pris soin d’affirmer à leur égard un caractère d’ordre public. Il s’agit d’empêcher le chercheur considéré ici comme « partie faible », de renoncer par contrat aux prérogatives dont il dispose en vertu de la loi. De ce point de vue, l’ordre public peut être qualifié d’ordre public de protection, même s’il présente également, à notre avis, les caractéristiques d’un ordre public de direction.
L’étude d’impact de la loi pour une République numérique mentionne ainsi qu’« une atteinte est portée à la liberté contractuelle des auteurs et des éditeurs, le caractère d’ordre public empêchant l’auteur ou son établissement de renoncer au bénéfice du droit qui lui est conféré en ce qui concerne les publications et de céder à l’éditeur des licences tendant à limiter la réutilisation des données de la recherche ». - Assemblée nationale, Étude d'impact du projet de loi pour une République numérique, 9 décembre 2015
Les contrats d’édition ne peuvent donc avoir pour effet de limiter les conditions de publication des écrits scientifiques et de réutilisation des données de la recherche en-deça ou au-delà du seuil autorisé (durée d’embargo, à des fins non commerciales, version finale du manuscrit, etc.).
Le caractère d’ordre public de la règle devrait également permettre, en tant que loi de police, de faire rayonner les règles tant à l’égard des éditeurs scientifiques établis sur le territoire national qu’à l’égard de ceux établis hors de celui-ci.
De nombreux types de licences peuvent être utilisées dans le contexte de la recherche scientifique et, en particulier :
Licence Etalab
La licence Etalab a, quant à elle, été conçue pour la mise en œuvre du principe de réutilisation des données données publiques. Les licences Etalab sont des licences standardisées encadrant le processus d’autorisation de réutilisation des informations ou des données publiques.
Les Licences Creative Commons
sont au nombre de six et sont soumises aux principes suivants quel que soit le modèle de licence choisi :
Les Licences Creative Commons sont des contrats qui s’appliquent dans tous les pays et qui sont conçus pour être opposables en justice. Elles permettent une cession non exclusive, à titre gratuit et pour le monde entier, de certains droits de propriété intellectuelle.
Ces licences permettent :
Dans le domaine de la recherche scientifique, Creative Commons recommande de ne pas utiliser les clauses NC (pas d’utilisation commerciale) ou ND (pas de modification) pour des jeux de données ou des bases de données destinés à une utilisation scientifique car elles restreignent les possibilités de réutilisation.
Il est conseillé également de ne pas utiliser la clause SA (partage à l’identique) car elle impose la licence de rediffusion et réduit dont l’interopérabilité des données.
La licence CC By 4.0 permet de partager, copier, distribuer et communiquer les données par tous moyens et sous tous formats, de les réutiliser pour créer de nouveaux jeux de données. Toutes les utilisations, y compris commerciales sont possibles, sous réserve de créditer les données à leurs créateurs (obligation d’attribution).
La Licence Open Database organise la diffusion et le partage de bases de données à titre gratuit.
Les bases de données collaboratives sont définies comme « une partie d’un ensemble de bases de données toutes indépendantes rassemblées pour former un ensemble collectif ».
Elles sont distinctes des « bases de données dérivées » qui sont entendues comme les bases de données produites à partir de la base de données collaborative.
Ces bases de données dérivées comprennent la traduction, l’adaptation, l’arrangement, la modification ou toute autre altération de la base de données collaborative ou d’une partie substantielle de son contenu, ainsi que l’extraction ou la réutilisation de la totalité ou d’une partie substantielle de son contenu dans une nouvelle base de données.
La licence autorise de manière non exclusive et gratuite, à utiliser la base de données par tous moyens et sous quelque forme que ce soit, en tout ou partie la base de données, pour les opérations suivantes :
- extraction et réutilisation de la totalité ou d’une partie substantielle de son contenu,
- création de bases de données dérivées, de bases de données collaboratives,
- création de reproductions temporaires ou permanentes par tous moyens ou sous quelque forme que ce soit,
- distribution,
- communication,
- affichage,
- location,
- mise à disposition
- diffusion au public.
L’utilisateur a pour obligation de mentionner le nom de la base de données, ainsi que sa source, et d’intégrer la licence ODbL dans la base de données elle-même, sans qu’il soit besoin de concéder une autre licence à des tiers en cas de sous licence.
Les licences libres sont fondées sur un modèle qui veut que la licence soit « intégrée » à l’œuvre et la suive « en quelques mains qu’elle se trouve » pour en régir l’utilisation.
La sous-licence ne doit pas pouvoir stipuler de termes plus contraignants que ceux prévus dans la licence de base.
Dans les licences d'exploitation à titre onéreux, ou tout autre type de contrat, il est appliqué le principe selon lequel une personne ne peut transférer plus de droits qu'elle n'en possède elle-même.
De ce point de vue, et paradoxalement, en interdisant de restreindre l'accès à la création, les licences libres contiennent des limites importantes à la liberté contractuelle. Dans le même ordre d'idées, la licence ODbL interdit l'usage de mesures techniques de protection qui auraient pour effet de verrouiller l'accès à la base ou la reproduction des données.
D'autres modèles contractuels, plus personnalisés, peuvent être conçus et utilisés pour diffuser gratuitement et librement des données contenues dans des bases de données.