Machine Learning : révolution ou résurgence ?
L’apprentissage automatique ou Machine Learning (ML) fait référence un ensemble de techniques visant à extraire des connaissances à partir de grandes masses de données dans le but d’automatiser la prise de décision, ou tout du moins la simplifier dans des situations très complexes, dans des domaines extrêmement variés. Le ML permet, à partir de données historiques ou d’entrainement, d’identifier des structures régulières permettant de faire de la prédiction ou de la classification à partir d’information nouvelles (cf. Encadré 1). Le ML rencontre, depuis une dizaine d’années, un engouement croissant auprès des communautés de chercheurs et de praticiens spécialisés dans l’intelligence artificielle et un intérêt grandissant de la part des géants de l’internet et des grandes puissances mondiales comme le souligne le récent rapport France Intelligence Artificielle (Rapport de Synthèse France Intelligence Artificielle, 2017).
Contrairement aux processus décisionnels classiques qui s’appuient sur des règles établies à partir d’une compréhension théorique du fonctionnement du système étudié, les approches de ML visent à construire des modèles induits par des données d’entrainement selon un processus d’apprentissage adapté à l’objectif recherché. Les modèles ainsi paramétrés sont utilisés sur de nouvelles instances pour une prise de décision efficace qui ne dépend pas d’hypothèses formulées à priori.
Encadré 1 : principe des approches de ML
La notoriété récente du ML est à mettre sur le compte de tendances structurelles consubstantielles à la révolution numérique qui se manifeste notamment à travers la constitution d’un stock de données jusque-là jamais atteint à l’échelle mondiale (selon Al-Jarrah et al. (2015), 90% des données numériques disponibles en 2015 ont été générées en l’espace de 2 ans) et à l’accroissement exponentiel des capacités de calcul des machines permettent aujourd’hui d’utiliser des algorithmes puissants, alimentés par de grandes masses de données, en un temps limité compatible avec les impératifs pratiques liés à la prise de décision. Le développement de technologies adaptées à la gestion des grandes bases de données alimentées continuellement par des milliards d’objets connectés dont le nombre ne cesse de croitre (selon Büyüközkan et Göçer (2018), 26 milliards d’objets connectés devraient être opérationnels à horizon 2020) ainsi que la croissance des capacités de calcul sont donc essentiels aux récentes percées en intelligence artificielle en général et en ML en particulier.
Le ML a été développé dans l’idée d’automatiser la prise de décision à partir d’expériences passée. La démarche est ancienne, mais elle s’inscrit aujourd’hui dans un nouveau contexte économique et technologique. Les premières références explicites au ML remontent aux années 50 avec les travaux d’Arthur L. Samuel en 1954 et 1959 sur la mise au point d’une intelligence artificielle capable de rivaliser au jeu de dames avec un agent humain. Bien que limité en raison des capacités de calcul et de stockage disponibles dans les années 50 (cf. Encadré 2Encadré 2), l’algorithme ainsi mis au point permettait d’anticiper 3 coups d’avance et de prendre une décision qui maximisait les chances de succès compte tenu d’une disposition des pions sur le damier. Il est intéressant de noter que ces premiers travaux s’inscrivaient dans la pure tradition de la recherche en informatique décisionnelle qui visaient à concevoir des algorithmes permettant d’automatiser des tâches jusque-là réalisées par des humains. Les techniques de ML ainsi mobilisées par Arthur L. Samuel étaient les premières émanations d’une discipline qui recouvre aujourd’hui un large spectre de techniques, méthodes et théories : l’intelligence artificielle.
En 1954, A.L. Samuel publiait un article dans la revue IBM Journal of Research and Development où il était question de développer un algorithme capable non seulement d’intégrer les règles du jeu de dames mais aussi de rivaliser dans ses choix de déplacement contre un adversaire humain. L’algorithme a été implémenté sur une machine type IBM 704 et l’auteur notait ceci à ce sujet : « We have at our command computers with adequate data-handling ability and with sufficient computational speed to make use of machine-learning techniques, but our knowledge of the basic principles of these techniques is still rudimentary ».
Encadré 2 : les prémices du ML sur IBM 704 disposant d’une mémoire de 36 bits
En adoptant un point de vue disciplinaire un peu différent, il est possible de trouver une filiation encore plus ancienne dans le domaine des statistiques inférentielles. Même si le terme « Machine Learning » n’était pas encore utilisé, nous retrouvons dans les travaux de Ronald A. Fisher en 1938 les bases de l’analyse discriminante qui est aujourd’hui encore une des techniques phares en ML. Le ML convoque également des concepts issus du domaine de l’analyse de données ou Data Mining en vogue dans les années 80. Nous pouvons remonter le fil de l’histoire vers des origines plus lointaines qu’il est difficile de dater tant leurs héritages, que nous retrouvons aujourd’hui dans le ML comme la régression linéaire, nous semblent communs.
De nos jours, il est communément admis que le ML est une sous-discipline de l’intelligence artificielle qui combine l’informatique, les mathématiques et la statistique. Ce qui constitue réellement la révolution que nous connaissons depuis peu est le couplage désormais permis des algorithmes, qui pour la plupart ont été mis au point dans entre les années 50 et les années 80, avec des données et une capacité de calcul qui n’étaient pas accessibles alors, ouvrant des perspectives dont on ne perçoit pas encore les limites (Rapport de Synthèse France Intelligence Artificielle, 2017). Le projet AlphaGo de Google DeepMind illustre parfaitement cette nouvelle donne (cf. Encadré 3). En 2016, l’équipe de David Silver mettait au point un algorithme de ML basé sur une approche de Deep Learning qui a mis en échec, dans 99,8% des cas, les plus grands champions du jeu de Go. Cette performance, qui est à mettre autant sur le compte la technicité algorithmique que sur celui des capacités de calcul et de stockage des données, contraste avec celle des premières tentatives d’A.L. Samuel dans les années 50.
En 2016, l’équipe Google DeepMind publiait dans Nature les résultats de ses recherches portant sur la mise au point d’un programme informatique nommé « AlphaGo » capable de jouer au complexe jeu de Go. L’algorithme autoapprenant proposé s’appuie sur des techniques combinées de Deep Learning et de Reinforcement Learning. En 2015, une année avant la publication des résultats du projet de recherche, AlphaGo devient le premier programme informatique à battre un joueur professionnel. En juillet 2016, AlphaGo occupe la première place du classement mondial des joueur de Go. En mai 2017, AlphaGo battait le meilleur joueur mondial qui avait initialement refusé de se confronter à la machine.
Encadré 3 : le programme AlphaGo de Google DeepMind surclassant le meilleur joueur mondial au jeu de Go.
Avis de l’observatoire
Au-delà des applications « académiques » qui illustrent la puissance des techniques de ML, l’étonnante efficacité de ces approches dans des aspects plus pratiques n’est pas en reste en raison notamment de leur caractère pragmatique et robuste qui contraste avec les approches « concurrentes ». En effet, par rapport à la statistique, pour prendre cet exemple, qui s’intéresse d’abord à la compréhension des données et notamment à leurs relations causales – c’est-à-dire à démontrer ce qui cause quoi –, l’apprentissage automatique se concentre sur la qualité des prédictions, au détriment éventuel de l’interprétabilité des paramètres estimés. Geoffrey Hinton, éminent spécialiste de l’intelligence artificielle de Google Brain, qualifiait ainsi le Deep Learning, une des techniques de ML actuellement les plus en vue :
“Deep Learning is an algorithm which has no theoretical limitations of what it can learn; the more data you give and the more computational time you provide, the better it is.”
Nous retrouvons dans ce propos la clé du succès des approches de ML : la disponibilité de données en grande quantité et de capacités de calcul permettant de les traiter. La performance des algorithmes de ML est de ce fait indissociable des progrès réalisés dans des domaines connexes comme le « BigData », l’« IoT » et l’informatique au sens large (hardware et software). Dans le secteur industriel, le concept qui traduit le mieux cette combinaison est celui de l’industrie 4.0 qui symbolise l’entrée de l’industrie mondiale dans sa quatrième révolution.
Les applications du ML vont bien au-delà des cas d’usage médiatisés comme le véhicule autonome, la reconnaissance faciale ou encore l’assistance vocale personnalisée. On retrouve désormais des algorithmes de ML à l’œuvre dans des domaines très varié allant de l’astronomie à la finance de marché en passant par la climatologie et l’environnement, la génétique, la prospection commerciale, l’imagerie médicale, le management de la qualité en production industrielle, le management des risques ou encore le management de la chaîne logistique.
Quelques références pour aller plus loin
Al-Jarrah, O. Y. et al. (2015) ‘Efficient Machine Learning for Big Data: A Review’, Big Data Research. Elsevier Inc., 2(3), pp. 87–93. doi: 10.1016/j.bdr.2015.04.001.
Büyüközkan, G. and Göçer, F. (2018) ‘Digital Supply Chain: Literature review and a proposed framework for future research’, Computers in Industry. Elsevier B.V., 97, pp. 157–177. doi: 10.1016/j.compind.2018.02.010.
Fisher, R. A. (1938) ‘The Statistical Utilization of Multiple Measurements’, Annals of Eugenics, 8(4), pp. 376–386. doi: 10.1111/j.1469-1809.1938.tb02189.x.
Samuel, A. L. (1954) ‘Machine Learning Using the Game of Checkers’, IBM Journal of Research and Development, 44(1.2), pp. 206–226. doi: 10.1147/rd.441.0206.
Samuel, A. L. (1959) ‘Some studies in machine learning using the game of checkers’, Ibm Journal, 3(3), p. 210. doi: 10.1016/0066-4138(69)90004-4.
Silver, D. et al. (2016) ‘Mastering the game of Go with deep neural networks and tree search’, Nature. Nature Publishing Group, 529(7587), pp. 484–489. doi: 10.1038/nature16961.