Views
5 days ago

ICTjournal 07/2021

  • Text
  • Wwwnetzmediench
  • Contre
  • Solutions
  • Gestion
  • Selon
  • Technologies
  • Netzmedien
  • Faire
  • Entreprises
  • Suisse
  • Partage

20 partage de données

20 partage de données technologies Quelles techniques atténuent les risques du partage de données? Accès non autorisé aux données, fuites et perte d’intégrité, confidentialité et privacy non respectées… Les risques inhérents au partage des données sont multiples mais peuvent être atténués avec différentes techniques et approches parfois complémentaires. Yannick Chavanne Il convient de faire un compromis entre la valeur business qu’il est possible de tirer des données et le degré d’atténuation des risques permise par différents outils. Les entreprises qui partagent leurs données avec des partenaires externes peuvent espérer y gagner un net avantage concurrentiel. Encore faut-il adopter les outils adéquats à même de faciliter le partage des données. Dans un récent rapport sur le sujet*, le Boston Consulting Group (BCG) fait remarquer que pour choisir ces outils, il convient de faire un compromis en mettant dans la balance la valeur business qu’il est possible de tirer des données et le degré d’atténuation des risques permise par différents outils. Il peut s’agir de risques liés à la gestion des accès, aux fuites de données, à la question de leur intégrité, ainsi que des risques concernant la confidentialité et la protection des données. Le chiffrement et la blockchain, entre autres, permettent d’atténuer les risques du partage de données. Image: FLY:D/Unsplash.com Gestion des accès et fuites de données Quand une entreprise partage ses données, elle doit d’abord s’assurer que seules les personnes autorisées puissent y accéder. Ici interviennent les processus de gestion des identités et des accès (IAM). BCG mentionne également l’utilisation d’API. Mais si un accès non autorisé survient malgré tout, les entreprises doivent faire en sorte que les données qui ont fuité ne puissent pas être lues par des tiers. D’où l’utilité des techniques de masquage (obfuscation) et de chiffrement. Le chiffrement homomorphe permet par exemple des calculs sur des données chiffrées. Revers de la médaille, selon BCG: ces solutions peuvent générer une perte de granularité. Aux techniques de chiffrement servant à l’obfuscation des données s’ajoutent les solutions sécurisées de stockage et de transfert de données, tant au repos qu’en transit. Mise en commun de données confidentielles Aucun des outils abordés précédemment ne permet toutefois, à des entreprises qui le souhaitent, de mettre leurs données sensibles en commun pour en tirer parti sans pour autant les dévoiler. Au cœur du domaine de l’informatique confidentielle, les environnements d’exécution de confiance (Trusted Execution Environments ou TEE) répondent à ce besoin. Ces enclaves sécurisées au niveau du hardware sont par exemple exploitées par la start-up suisse Decentriq. Au niveau logiciel, des techniques telles que le calcul multipartite sécurisé (MPC) permettent une analyse sans révéler les détails des données sous-jacentes. Une recherche impliquant l’EPFL et le CHUV a permis d’élaborer un système couplant MPC et chiffrement homomorphe (lire page 21). (*) Référence The New Tech Tools in Data Sharing, BCG, 2021 Intégrité des données Les entreprises qui partagent leurs données souhaitent en outre pouvoir contrôler si les sources de données sont fiables (qui saisit quelle information) et s’assurer qu’elles n’ont pas été modifiées. La blockchain répond à ces besoins. Son architecture décentralisée rend en effet très difficile la falsification de données. Un atout sur lequel mise notamment la firme romande Farmer Connect, avec sa plateforme qui promet d’assurer traçabilité et validation des données par toutes les parties d’une chaîne d’approvisionnement agricole. La question de la privacy Le domaine de l’IA et du machine learning présente un défi particulier, car la création d’algorithmes performants nécessite l’utilisation d’une grande quantité de données, tout en respectant les principes de confidentialité et de protection des données. L’apprentissage fédéré peut répondre à ce défi: un algorithme centralisé est entraîné de manière distribuée, sans que les utilisateurs n’aient à dévoiler leurs données. Des chercheurs de l’EPFL et de l’INRIA ont d’ailleurs développé un système complexe permettant d’améliorer la performance de cette approche. 07 / 2021 www.ictjournal.ch © netzmedien ag

partage de données technologies 21 Chiffrement homomorphe multipartite et médecine de précision Une recherche impliquant l’EPFL et le CHUV a permis d’élaborer un système de chiffrement homomorphe multipartite pour l’apprentissage fédéré. De quoi répondre aux défis de la sécurité et de la confidentialité des données cliniques dans la recherche biomédicale à grande échelle. Yannick Chavanne Des chercheurs de l’EPFL et du CHUV ont élaboré une technique de chiffrement en mesure de faire progresser la médecine de précision. Impliquant également des équipes du MIT et de Harvard, cette recherche a abouti à l’élaboration d’une solution au principal frein à l’amélioration des diagnostics et des thérapies ciblées: le partage des données sensibles. Approches actuelles limitées et risquées Pour progresser, la recherche biomédicale à grande échelle doit rassembler des données cliniques provenant des hôpitaux, cabinets et cliniques du monde entier, afin de les exploiter pour créer des modèles d’apprentissage fédéré en machine learning. D’où un risque de fuite de données. Or, selon le communiqué de l’EPFL, certaines des approches actuelles n’offrent dans ce cadre qu’une protection limitée de la vie privée des patients, en obligeant les institutions à partager les résultats intermédiaires. Tandis que d’autres approches sacrifient la précision des résultats, en introduisant du bruit dans les données pour limiter les fuites potentielles. Pour relever ces défis, les chercheurs ont mis au point le système FAMHE, une approche de chiffrement homomorphe multipartite appliqué à l’apprentissage fédéré. Selon l’EPFL, le système FAMHE est un bon compromis entre la protection des données, la précision des résultats de recherche et le temps de calcul pratique. Calculs sur des données sans communication entre les parties Dans leur article, publié dans la revue Nature Communications, les chercheurs expliquent que leur approche combine la puissance de chiffrement homomorphe (HE) «pour effectuer des calculs sur des données chiffrées sans communication entre les parties, avec les avantages des protocoles interactifs qui peuvent simplifier considérablement certaines opérations HE coûteuses.» Le système FAMHE introduit une nouvelle approche où chaque institution participante effectue des calculs locaux et chiffre les résultats intermédiaires en utilisant le chiffrement homomorphe multipartite. Les résultats sont ensuite combinés et distribués à chaque institution pour d’autres calculs. «En partageant uniquement des informations chiffrées, notre approche garantit que, lorsque cela est nécessaire, un niveau minimum d’obscurcissement peut être appliqué uniquement au résultat final afin de le protéger des attaques par inférence, au lieu d’être appliqué à tous les résultats intermédiaires», précisent les chercheurs dans leur article. Aussi efficace que les approches moins sécurisées L’efficacité du système FAMHE a été démontrée en reproduisant correctement les résultats des deux études qui reposaient sur le transfert et la centralisation préalables des données. «Jusqu’à présent, personne n’a été capable de reproduire des études montrant que l’analyse fédérée fonctionne à grande échelle. Nos résultats sont précis et ont été obtenus avec un temps de calcul raisonnable», explique Jean-Pierre Hubaux, professeur à l’EPFL et auteur principal de l’étude. Les chercheurs sont déjà en discussions avancées, avec des partenaires à l’échelle mondiale, pour déployer FAMHE à grande échelle. «Nous voulons que cela soit intégré dans les activités normales de la recherche médicale», conclut Jean Louis Raisaro, docteur du CHUV et l’un des chercheurs principaux de l’étude. Listé dans le dernier Hype Cycle des technologies émergentes de Gartner, le chiffrement homomorphe est exploré par les géants de la tech. Mais aussi par la start-up Inpher, en partie basée à l’EPFL, dont les solutions combinent aussi calcul multipartite sécurisé, apprentissage fédéré et chiffrement totalement homomorphe. Image: ©NDABCREATIVITY - stock.adobe.com «Nos résultats sont précis et ont été obtenus avec un temps de calcul raisonnable.» Jean-Pierre Hubaux, professeur à l’EPFL www.ictjournal.ch © netzmedien ag 07 / 2021