Views
3 months ago

ICTjournal juillet - août - septembre 2020

  • Text
  • Solutions
  • Selon
  • Responsable
  • Ainsi
  • Septembre
  • Netzmedien
  • Juillet
  • Gestion
  • Suisse
  • Entreprises

26 data-driven situation

26 data-driven situation d’exception Quelle est l’utilité des données et des algorithmes dans une situation d’exception? Les données historiques et les algorithmes qu’elles ont servi à entraîner sont mis au défi lorsque tout est chamboulé, de la chaîne logistique au comportement des clients et employés. Passées les adaptations ad hoc, des solutions existent pour rendre les systèmes plus robustes et agiles face à l’imprévu. Et les données collectées durant la pandémie pourraient servir dans le futur. Rodolphe Koller Bien des commerces suisses ont vu leur activité bouleversée par le confinement. Fin avril, le propriétaire d’un snack bar bernois confiait à Swissinfo: «Depuis le début du confinement, c’est très calme. À côté des kebabs, je propose aussi d’autres spécialités turques. Concernant la quantité de nourriture, je dois improviser chaque jour. Je ne peux plus me fier à mon expérience pour estimer le nombre de clients que je dois attendre. Le soir, il y a souvent des restes, que je dois malheureusement jeter»¹. La situation du restaurateur n’aurait pas été bien différente s’il avait disposé d’un logiciel puisant dans le machine learning pour prédire l’affluence de son restaurant et les provisions à acheter. Entraînés avec des données historiques, de nombreux algorithmes sont pris au dépourvu lorsque survient un événement imprévisible de grande ampleur tel que le COVID-19. «Les modèles basés sur une situation normale peuvent devenir soudainement inefficaces.» Marcin Pietrzyk, Unit 8 Quand le présent n’a plus rien à voir avec le passé «La plupart de nos clients appliquent des algorithmes dans leurs systèmes industriels, qui sont par nature peu affectés par des événements tels qu’une pandémie. Il en va autrement des algorithmes employés pour prédire la demande ou les stocks nécessaires. Là, les modèles basés sur une situation normale peuvent devenir soudainement inefficaces», avertit Marcin Pietrzyk, CEO de la jeune société suisse Unit 8. Avec la pandémie et les mesures sanitaires décidées par les gouvernements du monde entier, les comportements d’achat des consommateurs ont été chamboulés. Outre la ruée des premières semaines sur des produits inhabituels, les clients ont aussi changé leur façon d’acheter. Spécialisée dans l’optimisation de la présence des e-boutiques sur Amazon, la start-up londonienne Nozzle a notamment constaté un changement des critères d’achat en ligne. Davantage que le prix, le délai de livraison est soudainement devenu un facteur décisif, rendant inopérant des systèmes proposant automatiquement toujours le meilleur prix. «Les tactiques devront être adaptées à ce nouveau monde. Lorsque les données des tendances historiques sont inutiles, l’analyse de la situation devient encore plus importante», explique Victor Malachard, président exécutif, sur le blog de Noozle². Elle aussi touchée, la start-up Phrasee, qui propose des algorithmes générant des textes publicitaires, a dû introduire des contrôles dans ses outils de manière à écarter des expressions en vogue comme «effet viral» et quantité d’autres termes anxiogènes susceptibles d’être contre-productifs pour les marques³. L’explosion soudaine des paiements mobiles a sans doute aussi challengé des algorithmes de détection des fraudes, sans oublier les systèmes antispam et antimalware eux aussi entraînés avec des données historiques. Adaptations «manuelles» et leçons à long terme Face à ces problèmes, plusieurs remèdes: d’abord s’appuyer pour un temps sur les experts humains, comme l’explique Carlos Cordon, Professeur à l’IMD, à propos de la supply chain: «Des changements de volume importants et inattendus rendent les modèles statistiques inutiles. Ils considèrent des événements tels que la pandémie comme des "valeurs aberrantes" et, par conséquent, les écartent des données. Bien que nous ayons besoin de visibilité pour que les personnes de la chaîne d’approvisionnement puissent prendre des décisions, la plupart des décisions devraient être prises manuelle- (*) Références ¹ «Je ne peux plus me fier à mon expérience», Swissinfo.ch, avril 2020 ² «How social distancing has impacted Amazon buying patterns», Victor Malachard, Nozzle, avril 2020 ³ «Our weird behavior during the pandemic is messing with AI models», MIT Technology Review, mai 2020 4 «A post COVID-19 outlook: the future of the supply chain», IMD, mai 2020 5 Accelerating analytics to navigate COVID-19 and the next normal, McKinsey, mai 2020 6 «AI has a big data problem. Here’s how to fix it», ZDNet, juin 2020 7 «How the COVID-19 Pandemic Affects Machine Learning in Business», David Mosen, Crayon, avril 2020 8 «COVID-19 and the Importance of “Obsolete” Data», Bill Schmarzo, datasciencecentral.com, mars 2020 9 «Une étude montre une réduction de moitié du trafic à Genève durant le confinement», HEPIA, avril 2020 juilletaoûtseptembre 2020 www.ictjournal.ch © netzmedien ag

data-driven situation d’exception 27 ment. Par conséquent, le facteur humain est essentiel» 4 . Pour remédier aux déficiences des systèmes entraînés, de nombreuses techniques sont également possibles. Au début de la crise, Mc Kinsey recommandait ainsi que les équipes d’analystes soient «préparées à mettre en œuvre les corrections nécessaires, qui peuvent comprendre le débogage des modèles, l’application de nouvelles techniques de modélisation et l’incorporation de nouvelles sources de données» 5 . Certains suggèrent ainsi de réentraîner rapidement les algorithmes avec des données plus récentes. «Nous voyons maintenant davantage de travaux et projets qui sont déclenchés par la pandémie, en particulier dans le secteur des assurances où les entreprises essaient d’inclure des données relatives au Covid dans leur modélisation des risques», constate Marcin Pietrzyk de Unit 8. Devant l’urgence d’adapter les modèles, David Barber, Professeur de machine learning à l’University College de Londres, propose d’améliorer et d’accélérer l’apprentissage sur les nouvelles données en laissant les machines se charger de la tâche laborieuse de leur étiquetage (apprentissage actif). «Si vous développez l’IA en utilisant l’approche traditionnelle qui consiste à collecter de grandes quantités de données et à entraîner ensuite un modèle de deep learning, il n’y a pas de miracle, confiait-il au site ZDNet 6 . Avec le modèle traditionnel, vous pouvez vous estimer chanceux si un nouveau modèle est mis en production en moins de quelques mois. Mais avec l’apprentissage actif, cela peut ne prendre que quelques jours tout au plus». Plus fondamentalement, les organisations devront sans doute adapter leur manière de faire du machine learning pour gérer ces situations d’exception. «Si vous pensez que l’apprentissage machine est déconnecté de circonstances telles que la pandémie de Covid, détrompez-vous. Aussi abstrait que soit le concept, l’apprentissage machine est directement lié et influencé par le monde réel, avertit David Mosen, Senior Data Scientist chez Crayon, une société spécialisée dans l’IA 7 . C’est particulièrement vrai pour les entreprises qui ont des modèles de machine learning en production pour développer des connaissances pour la prévision des ventes, l’optimisation des stocks ou le comportement des clients. Les entreprises, en particulier celles qui sont data-driven et utilisent des solutions de machine learning, doivent être préparées au changement.» David Mosen propose ainsi plusieurs pistes pour gérer les modèles et améliorer leur capacité face à l’imprévu, comme d’augmenter la fréquence d’entraînement des algorithmes ou de tenir compte d’historiques plus courts et spécifiques ou encore de fonder les prévisions sur des situations analogues concertées avec des experts. La valeur des données d’exception Lorsqu’une crise survient, l’idée de s’appuyer sur des données recueillies durant des situations analogues est frappée de bon sens. Taiwan et la Corée du Sud ont sans doute profité de leur expérience et des données collectées lors des épisodes SARS et H1N1, au moment où il a fallu répondre à COVID-19. Encore faut-il disposer et avoir conservé de telles data… «Certaines personnes s’empressent de rejeter les "vieilles" données comme étant "obsolètes", et jugent que la valeur des données s’érode au fil du temps. Cependant, les données historiques peuvent être tout aussi précieuses que les données actuelles pour tenter de déterminer l’impact commercial et opérationnel potentiel de situations ou d’événements actuels», explique Bill Schmarzo, Chief Innovation Officer chez Hitachi Vantara 8 . Les données collectées lors d’événements rares sont ainsi d’une grande valeur, qu’il s’agisse de manifestations régulières (trafic lors des Jeux Olympiques, ventes de Noël), de situations déclenchées (arrivée d’un nouveau concurrent sur le marché) ou d’événements totalement imprévisibles, comme la pandémie actuelle. «En matière de données, ce qui n’est que du bruit dans un cas, peut s’avérer un signal dans un autre cas», conclut Schmarzo. Au-delà de leur utilité pour faire face à des situations similaires, les données d’exception peuvent aussi servir de référence et d’horizon. A Genève, l’Hepia a ainsi profité du trafic réduit durant le confinement pour établir des valeurs de référence en matière de niveau sonore qui serviront de référence pour l’élaboration de futures politiques liées au bruit 9 . De quoi réfléchir à deux fois avant d’effacer les données collectées ces derniers mois… Image: mick-haupt / unsplash www.ictjournal.ch © netzmedien ag juilletaoûtseptembre 2020