Quel apprentissage machine choisir ?
Les récents développements de la technologie de l'IA (intelligence artificielle) ont conduit à un certain nombre de percées et à une croissance exponentielle des machines. La mesure dans laquelle le monde entier dépend aujourd'hui des machines ne connaît pas de limites. En fait, les solutions d'IA constituent désormais non seulement une opportunité d'investissement clé pour les grandes entreprises, mais elles contribuent aussi largement à la résolution d'innombrables problèmes quotidiens de notre vie.
L'un des sous-ensembles les plus importants de l'IA est l'apprentissage automatique, souvent appelé simplement ML. Ce n'est que grâce au travail inestimable que les chercheurs et les scientifiques ont investi dans les fondements de la ML que nous sommes aujourd'hui en mesure d'extraire des performances maximales de technologies hautement qualifiées basées sur l'IA.
Dans cet article, nous allons voir comment, au fil des ans, les humains ont rendu les machines capables d'intelligence, c'est-à-dire capables d'imiter le processus de pensée humain et de prendre des décisions en fonction de leurs expériences.
Qu'est-ce que l'apprentissage automatique ?
Avant de parler des différentes méthodologies utilisées par les humains pour apprendre aux machines à se comporter comme des humains, passons en revue la définition de base de l'apprentissage automatique.
L'apprentissage automatique est la méthode par laquelle les humains apprennent aux machines à apprendre à partir d'un ensemble de données passées et leur permettent d'effectuer certaines actions dans le futur sur la base de l'apprentissage passé. L'apprentissage automatique est une combinaison de nombreux éléments, des algorithmes informatiques à l'analyse des données en passant par les mathématiques et les statistiques. C'est la technologie sur laquelle la construction de systèmes artificiellement intelligents repose en grande partie.
Comment les machines sont-elles formées ?
Le processus par lequel les machines apprennent à partir de données antérieures est appelé formation.
La science de l'apprentissage automatique consiste à enseigner à une machine en utilisant des ensembles de données contenant des faits utiles ou aléatoires et/ou des données de différentes tailles et en les introduisant dans la machine. L'essence de cette activité est d'aider la machine à observer les données, à établir des liens significatifs entre les différents éléments d'information fournis et à s'entraîner à prendre des décisions sur les données entrantes en incorporant ces relations préconçues, également appelées règles.
Les modèles d'apprentissage automatique suivent souvent une ou plusieurs des principales méthodes de formation suivantes.
- Apprentissage supervisé
- Apprentissage non supervisé
- Apprentissage par renforcement
Pour la formation initiale, on utilise un ensemble de données dont l'entrée et/ou la sortie attendue peuvent ou non être explicitement définies. Le processus de formation utilise des données de formation. Une fois que la machine est entraînée, elle reçoit des données de test pour voir si elle a appris ou non à partir de l'ensemble de données entraînées.
Passons en revue ces méthodes de formation de manière un peu plus détaillée et examinons comment elles sont utilisées pour rendre les machines plus intelligentes.
Apprentissage supervisé
Ce type d'algorithme d'apprentissage automatique utilise un ensemble de données qui contient des données étiquetées. Cela signifie qu'il indique à la machine ce qu'est chaque élément. En théorie, nous pouvons donc prédéfinir les règles et tout ce que la machine doit faire, c'est étudier les correspondances existantes et apprendre ces règles.
Les algorithmes d'apprentissage supervisé peuvent être divisés en deux sous-types : la classification et la régression.
Classification : cette méthode est utilisée lorsque la machine doit être entraînée sur des réponses binaires telles que oui-non, bien-faux ou vrai-faux. Les données d'apprentissage sont constituées d'éléments qui ont déjà été classés dans différentes catégories. Pour chaque catégorie, la machine examine soigneusement chaque élément et identifie les caractéristiques propres à tous les éléments de cette catégorie. Cela permet à la machine de construire des relations entre les éléments et leurs catégories correspondantes. Il utilise ces règles pour identifier et classer correctement les éléments des données de test.
Régression : un modèle de régression est utilisé lorsque des prédictions sont nécessaires pour des valeurs numériques telles que le prix des maisons ou la température. L'ensemble de données d'apprentissage contient plusieurs variables et des sorties qui peuvent dépendre ou non de ces variables. La machine étudie les variables d'entrée et détermine comment chaque variable influence, le cas échéant, la valeur de la sortie, ce qui conduit à la reconnaissance de modèles ou au développement de règles. Pour les données de test, la machine utilise ces règles pour calculer la valeur estimée ou prédite de la sortie.
Apprentissage non supervisé
La principale différence entre l'apprentissage supervisé et l'apprentissage non supervisé est que dans ce dernier ensemble de données, les éléments ne sont pas étiquetés. Prenons un exemple pour mieux illustrer ce point.
Supposons que nous voulions qu'une machine soit capable de classer les éléments d'un ensemble de données contenant des images de différents types d'outils de jardinage, tels que des houes, des pelles, des râteaux et des bêches.
Dans le cas de l'apprentissage supervisé, les données de formation contiennent des images avec leurs identifiants. Par exemple, si vous saisissez l'image d'une pelle, la machine saura qu'il s'agit d'une pelle. La machine va ensuite étudier toutes les pelles et leurs caractéristiques communes pour apprendre à identifier une pelle à l'avenir.
Cependant, si vous utilisez le modèle d'apprentissage non supervisé, vous saisirez des images de toutes sortes d'outils de jardinage sans les étiqueter. Par exemple, si vous saisissez l'image d'une pelle, la machine ne saura pas qu'il s'agit d'une pelle. La machine devra comprendre par elle-même comment chaque image peut (ou non) être liée à celle qui la précède, puis regrouper les images similaires dans une catégorie. La machine apprend donc à créer des catégories par elle-même sans qu'on lui dise explicitement quelles sont ces catégories. Ce type de modèle de formation fonctionne bien pour les ensembles de données dont les structures ou les modèles ne sont pas nécessairement évidents pour le commun des mortels.
Apprentissage par renforcement
La troisième grande méthode est basée sur le concept de renforcement, que certains d'entre vous connaissent peut-être déjà si vous avez déjà suivi un cours de psychologie 101. Si vous avez déjà essayé d'apprendre à votre chien des trucs sympas en le motivant avec des murs de récompense, vous avez utilisé le système de récompense.
Contrairement aux deux premières méthodes, ce modèle s'appuie fortement sur le retour d'information. Pour chaque décision, la machine indique le résultat correct pour voir si elle a fait une bonne ou une mauvaise prédiction. Par des essais et des erreurs répétés, la machine devient plus précise.
Un exemple concret et simple d'apprentissage par renforcement peut être observé dans l'affichage de publicités en ligne. La machine peut déterminer quelle annonce a le plus de succès et mérite d'être affichée en fonction du nombre de clics. Si la machine obtient plus de clics (récompenses plus élevées) d'un groupe cible particulier pour une annonce particulière, elle saura que c'était une bonne décision d'afficher cette annonce à ce groupe.
Dernières réflexions
Si certains semblent déterminés à trancher une fois pour toutes le débat homme/machine, d'autres estiment que ce type de comparaison est futile. Le fait est que l'homme est venu en premier et la machine en second. Tant que notre passion pour la croissance et notre besoin de perfection seront vivants, les algorithmes d'apprentissage automatique continueront à évoluer et à devenir plus précis, nous aidant à atteindre des taux de réussite et de précision qui semblent impossibles.