L’analyse de la donnée prend aujourd’hui une place croissante dans la vie des entreprises. Devenir data driven semble vertueux. La question est désormais de savoir jusqu’où il est possible de se baser sur les données de l’entreprise.
Le machine learning : une aide à la prise de décision
Le machine learning sait optimiser des décisions déjà formulées (ex : cibler une campagne de rétention, gérer une maintenance préventive, etc.). Il peut s’agir de décisions complètement automatisées : dans un ciblage de campagne par exemple, personne ne vérifie la liste finale client par client, et personne ne peut expliquer simplement les critères de décision de l’algorithme.
L’objectif peut être aussi de diagnostiquer une activité, un comportement précis : Quels facteurs influencent ce comportement client ? De quelle(s) façon(s) ? Peut-on agir sur ces facteurs ?
Pour réaliser ces prodiges, le machine learning ne crée pas d’information nouvelle. Il apprend à relier entre elles les données déjà connues. Pour que l’apprentissage automatique fonctionne, il lui faut quelques ingrédients fondamentaux :
- Concerner un process récurrent déjà bien établi : répondre à un client, cibler une campagne, etc. ;
- Avoir un historique de gestion un peu chaotique, afin que la donnée soit riche d’enseignements ;
- S’insérer dans un contexte extérieur stable ;
- Disposer de données pertinentes vis à vis de la question posée : avoir plus qu’une adresse IP pour évaluer l’intérêt de cibler un client.
On peut rarement vérifier en amont d’un projet que ces ingrédients sont présents. Le plus souvent on teste, et on vérifie que cela fonctionne.
Le machine learning est une discipline fortement empirique.
Les limites de l’approche data driven
Il existe des décisions à instruire qui ne respectent pas ces conditions. Les décisions stratégiques en font parties. En prendre conscience permet de rester lucide sur ce que peut faire la donnée.
Il est courant de dire que la signature du Big Data est d’identifier les signaux faibles : cela devrait en faire un outil idéal pour alimenter la réflexion stratégique. Attention : ceci est un leurre dangereux.
Les virages stratégiques sont basés sur l’observation de phénomènes nouveaux, de faible amplitude. Avec les mêmes observations, certains prendront le virage, d’autres pas. Il s’agit d’une question d’interprétation. Une décision stratégique ne prédit pas l’avenir : elle le change. Elle cherche une rupture, pas la répétition optimisée d’un process.
L’algorithme, lui, ne sait pas formuler de question ouverte. L’apprentissage automatique optimise des décisions déjà formulées, en les éclatant en une myriade de micro-décisions. La question n’est pas « quelle action réaliser ? », mais elle se limite la plupart du temps à « pour qui ? ».
Pour être sincère, il est quand même possible de poser certaines questions ouvertes : « Qu’est ce qui est nouveau, différent des autres observations ? » par exemple. Cette recherche dite « non supervisée » détecte des signaux faibles, très faibles même. Ces signaux ont trois défauts majeurs :
- Être nombreux, par construction. Une forêt dense de signaux faibles sans vision est un brouillard dangereux pour piloter une entreprise ;
- Donner le sentiment qu’ils sont objectifs, car non liés à une demande précise. C’est un leurre car les signaux détectés sont intimement liés au choix des données utilisées. La donnée brute, objective, n’existe pas ;
- Etre centrés sur les seules données de l’entreprise, et être aveugle aux changements de contexte marché.
On l’observe désormais : exploiter la data ne peut pas piloter la décision stratégique. C’est une stratégie de la micro-décision. Développer l’apprentissage automatique dans son entreprise, c’est optimiser au quotidien des leviers d’action qui sont en nombre limité, et souvent bien identifiés. C’est déjà beaucoup.
Une décision stratégique ne prédit pas l’avenir : elle le change.
Concrètement : un univers quasi illimité de projets à traiter
L’entreprise est en effet un assemblage de milliers de processus à peu près stables un assemblage de milliers de processus à peu près stables. Il serait surprenant de considérer que tous ces process sont déjà parfaits. La question n’est donc pas de savoir si l’entreprise a des besoins d’exploitation de données, mais de savoir les prioriser. Quelle que soit votre culture, le point de départ n’est pas la donnée : c’est votre besoin.
Voici deux chemins possibles :
- L’approche intuitive : quel problème vous est venu spontanément à l’esprit ce matin après le réveil ?
- L’approche consultant : lister vos objectifs d’amélioration à échéance entre 6 mois et 2 ans, et les classer en termes d’enjeu et de disponibilité de données, mais également de motivation de l’expert métier.
Les décisions d’optimisation opérationnelles sont par nature data driven !
Aucun commentaire