Views
2 months ago

ICTjournal juillet - août 2019

  • Text
  • Entreprises
  • Juillet
  • Ainsi
  • Netzmedien
  • Suisse
  • Plateforme
  • Utilisateurs
  • Travail
  • Chez
  • Solutions

16 spécial data data &

16 spécial data data & IA AGENDA DES DSI ROMANDS Quelle priorité donnez-vous à l’amélioration de l’architecture et de la gestion des données? pas une priorité priorité faible priorité moyenne 21 % 43 % (*) Références 1 CIO Agenda, ICTjournal 2019 2 Notes from the AI frontier: AI adoption advances, but foundational barriers remain, McKinsey 2018 3 The State of Dark Data, Splunk 2019 4 Hunting For Fresh Insight? Arm Yourself With Our New Guide To Data Sourcing, Jennifer Belissent, Forrester 2019 5 Data, Analytics, & AI: How Trust Delivers Value, MIT Sloan Management Review 2019 6 Data Quality Predictions for 2019, Geoff Grow, tdwi.org, 2019 7 Suck at Data & Analytics? Then You’re Not Ready for AI, Mariya Yao, Topbots 8 Future-Proofing The Workforce, Adecco et BCG 2018 priorité élevée première priorité 36 % Source: CIO Agenda 2019, ICTjournal (N=28) QUALITÉ DES DONNÉES Que fait votre organisation en matière de qualité de la donnée? Informel: les individus qui produisent ou utilisent les données corrigent réactivement les problèmes d’exactitude, de consistance, de ponctualité et de complétude. Data steward: une personne est responsable d’identifier et de corriger proactivement les causes des problèmes de qualité de la donnée. Formel: la qualité des données est en permanence surveillée, gérée et améliorée dans le cadre des tâches formelles de gouvernance de la donnée. Pas d’efforts en matière de qualité de la donnée AMPLEUR DU DARK DATA Quelle part de vos données estimez-vous être du dark data? 75 % ou plus de 25 à 50 % de 50 à 75 % moins de 25 % Source: Data, Analytics, & AI, How Trust Delivers Value, MIT Sloan Management Review 2019 (N=2413) 29 % Source: The State of Dark Data, Splunk 2019 (N=1300) 21 % 11 % 30 % 27 % 33 % faires», explique Assia Garbinato, Head of Data & Information Management chez Vaudoise Assurances (voir son article en page 18). L’enquête d’ICTjournal témoigne de ce regain d’intérêt: deux DSI romands sur trois considèrent que l’amélioration de l’architecture et de la gestion des données est une priorité élevée. Et les entreprises sont nombreuses à créer des postes d’architectes de la donnée, voire de Chief Data Officer. Pas d’IA sans données riches et variées 42 % Premier chantier sur la data, s’attaquer au manque de données utiles et variées qui alimenteront les algorithmes de machine learning. Si les données manquent, il faut aller en chercher. D’abord à l’intérieur de l’entreprise où les data sont souvent dispersées dans des systèmes disparates (mainframe, bases de données, fichiers, etc.) ou échappent complètement au radar. Selon une enquête récente de Splunk ³, les responsables estiment que 55% de 7 % leurs données sont concernées, constituant ce que l’on appelle le dark data. Autre option, déployer des senseur ou aller chercher des données à l’extérieur de l’entreprise. Qu’il s’agisse de données mises à dispositions par les administrations publiques (open data) ou obtenues sur des places de marché, voire directement auprès de ceux qui les produisent. Selon une étude de Forrester 4 , plus de la moitié des responsables auraient déjà lancé des initiatives pour améliorer leur exploitation de telles données tierces. Certaines sociétés ont même créé le rôle de data hunter dans leur organisation. Pas d’IA sans données fiables Autre chantier majeur, la qualité des data. Il ne suffit pas de collecter et de consolider les données dans de gigantesques data lakes: de mauvaises données produiront de mauvais résultats. En cause, des données non standardisées, dupliquées, incomplètes, périmées, mal orthographiées, mal classées, etc. Juste retour des choses, l’IA apporte certaines réponses techniques à ces problèmes: de nombreux outils et autres API «intelligents» permettent de vérifier les données, de corriger les valeurs absurdes et de remédier aux inconsistances entre données issues de diverses sources. Mais la gouvernance ne s’arrête pas à ce nettoyage permanent. «Nous devons nous assurer d’avoir une vérité partagée sur les données, y compris sur les données sousjacentes, sur la manière dont elles ont été traitées et analysées, sur leur diversité», explique Morgan Vawter, directrice Chief Analytics chez Caterpillar 5 . La plateforme Renku développée à l’EPFL s’attaque précisément à cette problématique de lineage (voir page 21). Sans oublier la question des biais dans les données produisant des résultats naturellement eux aussi biaisés – les exemples ne manquent pas. Selon un rapport du MIT Sloan Review 5 , 40% des organisations traitent toutefois ces questions de manière informelle. Alors même qu’elles conditionnent la confiance dans les résultats fournis par les algorithmes. Utiles pour l’IA, des données standardisées et de qualité sont aussi plus facilement exploitables par les métiers – difficile de faire du marketing efficace lorsque les clients ont un nom différent dans chaque système – et permettent de mieux répondre aux obligations de l’entreprise en matière de privacy. «Il fut un temps où les mauvaises données de contact et le marketing direct bâclé étaient acceptés par beaucoup comme un coût inhérent aux affaires. Aujourd’hui, les menaces d’amendes élevées et l’application de la réglementation incitent tout le monde à faire le ménage dans ses pratiques et ses données client», se réjouit Geoff Grow, CEO de Service Objects 6 , une société justement spécialisée dans la qualité des data. Vers l’entreprise data-driven Au-delà de l’ingénierie de la donnée, le développement de solutions d’intelligence artificielle nécessite le rapproche- juilletaoût 2019 www.ictjournal.ch © netzmedien ag

spécial data data & IA 17 ment entre data owners et data stewards. «Rares sont les entreprises où les propriétaires de données - les responsables métier en charge des informations et des connaissances - côtoient les responsables des données – les ingénieurs qui mettent en œuvre et gèrent la saisie, le stockage et le traitement des données – et apprennent réellement les uns des autres», constate Mariya Yao 7 , Chief Technology Officer de Metamaven, une société spécialisée en data science. Selon le rapport de Splunk³, moins de la moitié des responsables métiers déclarent travailler étroitement avec les équipes data. Faute de collaboration et de connaissances croisées, les projets capotent. «Souvent, nous concluons une vente avec un responsable métier qui affirme avoir toutes les données nécessaires prêtes à l’emploi», explique Robbie Allen, fondateur d’Automated Insights, une plateforme de Natural Language Processing pour entreprises. «Nous découvrons alors qu’ils n’ont aucune idée de la façon dont les données sont stockées, qu’elles sont réparties sur un grand nombre de systèmes et que les compétences techniques nécessaires pour obtenir les données correctement sont engagées pour des mois dans d’autres projets. C’est comme ça qu’un projet de 3 mois se transforme facilement en 6 mois ou plus.» Plus généralement, l’aptitude et la culture de la data doivent progresser dans l’organisation. Selon l’enquête de Splunk³, plus de trois quarts des responsables estiment que la disponibilité des données et la capacité à en extraire de la valeur sera déterminante pour le succès futur de leur organisation. En même temps, plus de la moitié admettent que le terme «data-driven» n’est qu’un slogan dans leur organisation. Idem côté leadership: on juge que demain les décideurs devront être compétents ACTIVITÉS DATA DANS LES ENTREPRISES Activités conduites par les organisations. oui non Gérer les données comme un actif business 31,0 % 69,0 % Forgé une culture de la donnée 47,6 % 52,4 % Innovation basée sur la donnée 59,5 % 40,5 % Compétition sur les données et l’analyse 28,3 % 71,7 % Créé une organisation data-driven 46,9 % 53,1 % Source: Big Data and AI Executive Survey 2019, NewVantage Partners 2019 (N=65) en data, mais on peine à l’appliquer à soi-même. En Suisse, selon un rapport d’Adecco 8 , parmi les professionnels s’étant formés récemment, plus de 60% l’ont fait dans le domaine des méthodes de travail (management, gestion de projet, etc.) et moins de 20% dans le domaine du numérique et de la data (IA, analyse de données, design digital, etc.). Sans goût et compréhension de la data, les décideurs et collaborateurs ne se fieront pas aux résultats fournis par les algorithmes, pour bons qu’ils soient, et ne les intégreront pas à leur pratique quotidienne. L’IT a sans doute son rôle à jouer dans cette évangélisation, en donnant notamment de la transparence à son travail sur la data. Publicité Enterprise Networking and Security Solutions Advanced Technology for Security, Mgmt and Control Synchronized Security YOUR PARTNER FOR IT SECURITY AND MSP PRODUCTS * www.infinigate.ch Human Centric Security SolarWinds MSP - Tools for successful MS(S)Ps The Art of Cybersecurity *www.net-point.ch www.ictjournal.ch © netzmedien ag juilletaoût 2019