En 2021, de nouveaux projets de recherche s’ajoutent à ceux lancés l’année dernière. Suite au dernier appel à projet CominLabs, huit projets scientifiques ont été retenus par le CA du Labex CominLabs avec la contribution de notre International Advisory Committee pour l’évaluation des projets soumis.
CoLearn
La quantité d’information mise en ligne chaque jour est gigantesque et ne cesse de croître. À titre d’exemples, 500 heures de vidéo sont ajoutées sur Youtube toutes les minutes et plus de 240 000 images sur Facebook. Il est donc nécessaire de mettre en place des techniques d’apprentissage automatique pour trier, organiser, recommander ce contenu à des utilisateurs. Cependant, les données doivent d’abord être transmises depuis leur point de collecte ou de création (smartphones, capteurs distribués, etc.) jusqu’à un serveur central qui prendra en charge le traitement de l’information.
Les systèmes classiques de communication de l’information sont conçus pour reconstruire complètement les données transmises (image, vidéo, voix, etc.), avant leur éventuelle utilisation dans un algorithme d’apprentissage automatique. A l’inverse, l’objectif du projet CoLearn sera de concevoir des systèmes de transmission directement dédiés à l’apprentissage automatique et optimisés pour cet usage. Cela nécessitera de repenser complètement la conception des systèmes de transmission, en introduisant notamment de nouvelles métriques de performance, et en développant des techniques de codage de l’information qui permettent de réaliser l’apprentissage sans reconstruction préalable des données. Le projet CoLearn se situe donc à l’interface des domaines de la théorie de l’information, du codage source/canal, et de l’apprentissage automatique.
CYCLE
L’imagerie de l’anatomie du cerveau et de son activité électro-physiologique sont des éléments fondamentaux pour de nombreuses applications telles que la dosimétrie électromagnétique, la neurostimulation et les interfaces cerveau-machine, ainsi que pour le diagnostic de maladies telles que le cancer, l’épilepsie et la maladie de Parkinson. Il existe deux types d’imagerie cérébrale : l’imagerie structurelle et l’imagerie fonctionnelle; la première vise à imager les structures et les propriétés des tissus, alors que la seconde permet de caractériser l’activité électrochimique du cerveau. Jusqu’à présent, l’imagerie structurelle a servi de fondation pour la plupart des techniques d’imagerie fonctionnelle, qui bénéficient ainsi d’une meilleure connaissance anatomique du cerveau. Le projet CYCLE propose de fermer la boucle et, pour la première fois, d’inverser le processus en utilisant l’imagerie fonctionnelle pour améliorer l’imagerie structurelle. Des itérations successives de cette approche cyclique permettraient d’obtenir une amélioration significative des performances des méthodes d’imagerie anatomique et fonctionnelle et de leurs applications, aussi bien à haute qu’à basse fréquence.
LeanAI
Les récents succès de l’apprentissage profond ont provoqué une forte demande pour aller vers des dispositifs embarqués intelligents. Pour la plupart de ces dispositifs, comme par exemple les véhicules autonomes et les dispositifs portables de santé, il y a un fort besoin de pouvoir les entraîner directement sur le système et en temps réel. La conception de systèmes embarqués pour l’apprentissage représente cependant un défi majeur à cause des ressources limitées disponibles et le fait que l’entraînement des réseaux de neurones modernes est très coûteux en calcul et en consommation énergétique. Pour atteindre le plein potentiel de l’apprentissage profond, il est impératif d’améliorer les méthodes d’entraînement des réseaux existants et le matériel utilisé. Le projet LeanAI va attaquer ces problèmes aux niveaux arithmétique et algorithmique, en explorant de nouvelles architectures à précision numérique mixte, qui sont à la fois plus efficaces en énergie et offrent des meilleures performances, dans ce contexte fortement contraint en ressources. Les résultats espérés de ce projet concernent de nouveaux algorithmes à précision numérique mixte pour l’entraînement des réseaux de neurones et des outils logiciels et matériels libres d’accès pour l’accélération du processus d’entraînement sur les dispositifs embarqués.
Mikrolog
Aujourd’hui, quelques mots-clefs suffisent pour trouver un document pertinent parmi les milliards de documents éparpillés sur le web. Si les moteurs de recherche nous permettent d’appréhender la diversité du web, ils nous confrontent aussi à son bruit et la recherche d’informations pertinentes peut être plus difficile que prévu. Quelques mots-clefs sont également les informations nécessaires pour trouver des concepts dans des graphes de connaissances. Qui est l’auteur de Vingt mille lieues sous les mers ? Quelle est la distance entre la terre et la lune ? Les assistants vocaux nous permettent simplement d’accéder à des connaissances contrôlées et vérifiées, mais ce n’est plus le web avec toute sa diversité.
Dans MiKroloG, nous cherchons à établir un lien plus étroit entre les graphes de connaissance et le web. L’idée est de pouvoir rechercher des documents sur le web mais en partant de concepts identifiés dans les graphes de connaissances. De cette manière, nous espérons concilier la haute précision des graphes de connaissances avec la diversité du web. Pour y parvenir, MiKroloG se concentre sur trois défis scientifiques principaux : (i) la résolution des entités entre le web de micro-données et les graphes de connaissances, (ii) l’évaluation des requêtes sur de grands graphes de connaissances et le classement des résultats, (iii) l’expression de requêtes complexes pour les utilisateurs finaux.
NOP
Les capteurs intelligents autonomes, qui s’alimentent en récoltant l’énergie disponible dans leur environnement (par exemple, solaire ou vibratoire) sont aujourd’hui équipés de batterie lithium-ion. Ces batteries posent des problèmes de recyclage, de durée de vie, et de maintenance, en particulier pour les capteurs déployés dans des environnements hostiles ou difficiles d’accès. Or, pour de nombreuses applications, il est possible de se passer de batterie, à condition de savoir gérer correctement les arrêts inopinés dus à une perte d’alimentation. Le calcul intermittent est une approche qui vise à prendre en compte ces arrêts en utilisant des technologies adéquates.
Le projet NOP a pour objectif de faciliter le déploiement et l’utilisation du calcul intermittent par les concepteurs de systèmes. Pour cela, des équipes d’électronique et d’informatique uniront leur savoir-faire pour proposer, sur la base de fondations théoriques consolidées, des modèles des flux d’énergie au sein des systèmes, adaptés à la prise de décision en ligne, et des outils d’analyse permettant de garantir les résultats des calculs même en présence de perte d’alimentation. Ces développements théoriques seront intégrés au sein d’une plateforme d’exécution optimisée, qui sera utilisée pour construire un démonstrateur dans le domaine de la bioacoustique.
PRiCLeSS
Les promoteurs de la blockchain et des crypto-monnaies, ont souvent défendu l’anonymat qu’ils procurent comme un gage de sécurité, et les blockchains ont par conséquent été vues comme un moyen de stocker des données en toute sécurité. Malheureusement, la nature décentralisée, entièrement répliquée, et inaltérable de la blockchain s’oppose aux exigences légales françaises et européennes en matière de stockage des données personnelles, sur plusieurs aspects, tels que le droit de rectification et le consentement. Le projet PriCLeSS établira un partenariat transdisciplinaire entre des chercheurs en informatique et en droit pour comprendre et relever les défis juridiques et techniques liés au stockage des données dans un contexte de blockchain. PriCLeSS étudiera trois axes de recherche parallèles. Le premier explorera les avantages que les blockchains peuvent apporter en termes de vie privée et de conformité juridique lorsqu’il s’agit de données personnelles et confidentielles. Cet axe ouvrira la voie à la conception d’outils qui peuvent automatiser l’audit des mesures de protection de la vie privée. Le deuxième axe portera sur les défis liés à la protection de la vie privée et à la législation, et explorera de nouvelles abstractions qui peuvent aider à aligner le fonctionnement interne d’un système de blockchain avec les contraintes légales. Le troisième axe s’attaquera au sous-ensemble d’exigences juridiques qui sont intrinsèquement incompatibles avec la nature d’une blockchain en s’appuyant sur un plus grand écosystème d’outils construit autour d’elle.
SCRATCHS
Les données d’une application sont normalement inaccessibles depuis une autre application s’exécutant sur le même système. Des attaques dites par canaux cachés parviennent néanmoins à contourner cette isolation. Ainsi, une application malveillante pourrait extraire d’une application victime, des clés cryptographiques ou, plus généralement, des données confidentielles. Les contremesures existantes contre les canaux cachés sont souvent soit entièrement logicielles (on s’assure de produire des programmes qui ne sont pas vulnérables à ces attaques), soit entièrement matérielles (le processeur détecte et/ou empêche ces attaques). Ces approches sécurisent effectivement les applications, mais réduisent les performances de l’ensemble du code de l’application protégée.
Le projet SCRATCHS vise à co-construire un processeur offrant des primitives de sécurité, ainsi qu’un compilateur tirant parti de ces primitives. Cette co-construction permettra d’activer les protections seulement lorsque cela est nécessaire, afin d’obtenir le même niveau de sécurité que les approches existantes, avec un coût en performances moindre.
RETIREX
La technique d’imagerie nucléaire telle que la tomographie par émission de positons (TEP Scan) est devenue un outil indispensable pour détecter les tumeurs cancéreuses. Le PET Scan repose sur l’injection dans le sang d’un traceur radioactif à base d’atomes émetteurs de positrons qui se fixe sur les cellules tumorales. La présence de positrons est détectée dans le scanner pour permettre de reconstruire une image précise. Une nouvelle technique d’imagerie, appelée imagerie gamma à 3 photons, est proposée par le Laboratoire SUBATECH d’IMT Atlantique. Cette technique est basée sur la reconstruction directe en 3D de la position de l’émetteur radioactif Scandium-44. Le troisième gamma permet d’incorporer des informations spatiales supplémentaires par rapport à la TEP classique qui n’en n’utilise que deux. Bien que détectée, la position du troisième gamma est reconstruite à l’aide d’un télescope Compton à xénon liquide. Le croisement des deux informations permet de reconstruire la position du point d’émission de la désintégration, ce qui est actuellement impossible avec les techniques d’imagerie nucléaire actuelles.
L’utilisation de l’imagerie gamma à 3 photons dans les examens oncologiques permettrait plusieurs améliorations comme : une précision accrue, une réduction de la dose du traceur radioactif injecté, une réduction du temps d’exposition du patient et une réduction du temps de prise en charge des patients à l’hôpital.
Une première caméra de 20 000 pixels capable de scanner un petit animal, appelée XEMIS2, est actuellement assemblée au centre d’imagerie du CHU de Nantes, les premières images sont attendues en 2021.
Le projet RETIREX vise à préparer la prochaine phase de cette nouvelle technique d’imagerie médicale en permettant de scanner un humain tout en étant capable d’obtenir une reconstruction d’image en temps réel. La reconstruction d’image en temps réel est primordiale pour faire de la caméra un outil efficace pour traiter le cancer car elle permet de guider le faisceau de radiations traitant la tumeur.