31 / 08 / 2011

e-Santé : un « data deluge » de données médicales

  • Linkedin
e-Santé : un « data deluge » de données médicales

Imagerie de son cerveau, séquençage de son génome, cartographie et statistiques médicales en tout genre… La santé de demain sera hyper personnalisée et brassera des volumes colossaux de données médicales. Comment traiter ce « data deluge » ? La solution se trouve peut-être dans le projet A-Brain, justement pensé pour comparer efficacement d’importants volumes de données médicales et fruit de la collaboration entre deux équipes de l’Inria et Microsoft (qui édite le site RSLNMag).

 

Le projet A-Brain est né d’un constat : nos cerveaux sont tous un peu différents les uns des autres et cette variabilité complique le diagnostic de certaines maladies du système nerveux. Pour affiner l’interprétation médicale, les chercheurs ont eu l’idée de  corréler les vues du cerveau et le patrimoine génétique de chaque patient, afin de mieux délimiter les régions cérébrales qui présentent un intérêt symptomatique.

 

Restait à trouver le moyen de calculer les sommes de données. « Le CV génétique d’un individu comporte environ un million de données, note le site de l’Inria qui rapporte le projet. À cela s’ajoutent des volumes tout aussi colossaux de voxels pour décrire les images. Un « data deluge » comme disent les Américains. La comparaison de ces données entre elles représente la bagatelle de 1015 tests pour chaque patient. Le recours au calcul parallèle s’impose donc comme une évidence pour venir à bout de cette inflation de calcul. »

 

Le calcul parallèle est une méthode qui permet d’accélérer l’exécution de calculs complexes en le divisant sur plusieurs processeurs. Pour le projet A-Brain, c’est le centre de recherche KerData, de l’Inria Rennes, qui est chargé de ces calculs. Ils sont réalisés à partir des données collectées par l’équipe de Pariétal (basée à Saclay), qui croise statistiques génétiques et images IRM. Les données sont ensuite stockées dans le service de cloud computing Azure de Microsoft, où la société met deux millions d’heures de calcul et dix teraoctets d’espace de stockage à la disposition de l’Inria.

 

A l’arrivée, cette synergie devrait permettre aux neurologues de conduire des expériences à grande échelle et faciliter la découverte d’interactions entre certains gènes et certaines différences du fonctionnement du cerveau.

 

(Visuel: PhotonQ-I see myself thinking therefore I am parPhOtOnQuAnTiQuE, Flickr, Licence CC)