Data mining : la loi ne doit pas enterrer la recherche française

Publié le 26 avril 2016, par Thérèse Hameau

Au nom de la protection du droit d’auteur, la loi interdit aux chercheurs de réutiliser des articles scientifiques publiés afin d’en exploiter les données. Une entrave à la recherche qu’il faut supprimer.

En créant des freins juridiques multiples à la fouille massive des données et textes scientifiques (en anglais “TDM”), les députés et les sénateurs pourraient malgré eux handicaper gravement la recherche publique française pour les 10 ans à venir.

Alors que nous commençons à peine à entrevoir les perspectives ouvertes par l’accumulation et la fouille massives de données, tous les acteurs économiques et industriels ont mobilisé leurs ressources et leur intelligence pour explorer les avancées potentielles qu’elles permettent. Paradoxalement et tristement, la Recherche publique française est empêchée de rejoindre ce mouvement à cause de multiples obstacles juridiques.

La fouille de textes et de données (text and data mining - TDM) consiste à explorer, via un algorithme de fouille, des corpus immenses - composés notamment d’articles scientifiques ou de données expérimentales - afin d’en déduire des nouvelles connaissances. Imaginez qu’un chercheur en épidémiologie puisse analyser automatiquement les 2 millions d’articles scientifiques traitant du cancer, afin de déterminer s’il existe une corrélation inconnue à ce jour entre une pratique et l’apparition de la maladie : voilà ce que permet le TDM. Si cela vaut pour l’ensemble des disciplines, cette technique prend tout son sens lorsqu’il s’agit d’objets complexes, qui nécessitent un traitement pluridisciplinaire : les épidémies donc, mais aussi les objets climatiques, les phénomènes politiques, etc.

...

Collectif d’entrepreneurs et de dirigeants du numérique

  • Mounir MAHJOUBI, Président du Conseil national du numérique,
  • Yann BONNET, Secrétaire général du Conseil national du numérique,
  • Jean-Loup SALZMANN, Président de la CPU (Conférence des Présidents d’Université),
  • Alain FUCHS, Président du CNRS,
  • Yves LEVY, Président directeur général de l’INSERM,
  • François HOULLIER, Président de l’INRA,
  • Vincent BERGER, Directeur de la Recherche Fondamentale au CEA
  • Antoine PETIT, Président Directeur Général d’INRIA et membre du Conseil national du numérique,
  • Yves POILANE, Directeur de Télécom ParisTech et membre du Conseil national du numérique,
  • Bruno CAHUDRET, Président du Conseil Scientifique du CNRS,
  • Thierry DAMERVAL, Directeur général de l’INSERM,
  • Christophe PERALES, Président de l’ADBU (Association des directeurs et personnels de direction des bibliothèques universitaires et de la documentation),
  • Jean-Luc BEYLAT, Président de l’Association Française des pôles de compétitivité et President du pole Systematic Paris Region,

...

Le document