La Science des données est un concept récent qui consiste à croiser, regrouper et analyser des données, de préférence massives, quantitatives ou qualitatives, pour y chercher des régularités et faire émerger des modèles ou connaissances. En informatique, une connaissance c’est ce qui sert à résoudre des problèmes comme, parexemple, une règle qui permet de classer une personne dans un groupe de patients répondant à tel traitement. En biologie et en médecine, ces données massives (« Big Data » ou « méga-données ») sont souvent hétérogènes et brouillées.

La Science des données, qui inclut la statistique, propose toute une panoplie d’outils pour faire émerger :

- soit des modèles prédictifs qui permettent par exemple de calculer un score de survie en fonction des valeurs de certains paramètres présentés par un patient

- soit des modèles descriptifs qui caractérisent, si possible dans un langage explicite, ce que les individus d’un groupe ont en commun.

L’exploitation des données biomédicales, pour une meilleure prise en charge des patients, suppose de faire coopérer les savoir-faire des médecins, des biologistes, des informaticiens et des statisticiens.

(Extrait interview Marie-Dominique Devignes, chercheuse CNRS en bio-informatique au LORIA (laboratoire LOrrain de Recherche en Informatique et ses Applications) – Re.Med 2015)