Pathways, l'IA nouvelle génération multitâche de Google
Le 28 octobre dernier, Google a présenté Pathways, une nouvelle architecture d'IA capable de réaliser plusieurs tâches à la fois.
Google a dévoilé un nouveau modèle d'intelligence artificielle capable d'effectuer un éventail de tâches beaucoup plus large que les modèles spécialisés actuellement utilisés. Le modèle Pathways AI consiste à combiner les systèmes spécialisés actuellement utilisés en un système multimodal et universel. Cette flexibilité pourrait permettre à l'IA de fonctionner comme un cerveau humain, avec les avantages et les inconvénients d'un réseau neuronal.
Le modèle d'IA standard est formé d'une seule manière pour effectuer une seule tâche. Si l'on mélange suffisamment de ces algorithmes, on obtient des moteurs d'IA pour les assistants vocaux et d'autres logiciels qui semblent monolithiques aux utilisateurs qui ne peuvent pas voir la trame complexe qu'ils contiennent. Google affirme que Pathways peut combiner tous ces algorithmes individuels en un réseau neuronal universel capable d'effectuer diverses tâches et d'apprendre. Cela contraste fortement avec le fait de repartir de zéro pour chaque nouvelle fonction que l'IA entraîne, comme si elle avait tout oublié, et nécessite beaucoup de temps et de données supplémentaires de la part des ingénieurs.
Des modèles multitâches
"C'est ainsi ou à peu près que nous formons la plupart des modèles d'apprentissage automatique aujourd'hui. Au lieu d'étendre les modèles existants pour former de nouvelles tâches, nous formons chaque nouveau modèle à partir de rien pour faire une chose et une seule (ou parfois nous spécialisons un modèle générique pour une tâche spécifique). Nous finissons par développer des milliers de modèles pour des milliers de tâches individuelles", explique Jeff Dean, vice-président senior de Google Research, sur le blog Pathways. "Au lieu de cela, nous aimerions former un modèle unique qui puisse non seulement gérer de nombreuses tâches individuelles, mais aussi utiliser et combiner les compétences existantes pour apprendre de nouvelles tâches plus rapidement et plus efficacement."
L'IA, basée sur le modèle Pathways, conservera les apprentissages antérieurs dans son réseau neuronal et les utilisera à l'avenir. L'IA peut appliquer ses connaissances à partir de compétences existantes pour apprendre de nouvelles compétences en tissant des points où des concepts disparates ont des similitudes. Dean a comparé la mémoire contextuelle au mode de fonctionnement du cerveau des mammifères. Il a suggéré qu'une IA entraînée à utiliser des images aériennes pour estimer l'altitude pourrait étendre ces connaissances pour prédire comment une inondation pourrait traverser une vallée de montagne, sans avoir à entraîner spécifiquement un nouvel algorithme comme c'est le cas aujourd'hui.
Pathways multimodal
Pour développer des réponses flexibles aux modèles à l'aide de Pathway AIreport, Google applique un principe similaire pour rendre Pathways multimodal dans la collecte de données en situation réelle. Aujourd'hui, un réseau neuronal typique peut traiter du texte, de l'audio ou de la vidéo, mais pas les trois. Google estime que Pathways est suffisamment avancé pour collecter ces trois types de données et comprendre leur interaction. Ces trois types de données permettent de prendre des décisions dans le réseau neuronal Pathways. La collecte de données peut être traduite d'un format à l'autre, de sorte que Pathways peut être utilisé seul ou en complément des systèmes existants qui peinent à collecter suffisamment de données sans s'ouvrir à de nouveaux modes de communication.
"L'être humain s'appuie sur de multiples sens pour percevoir le monde. C'est très différent de la façon dont les systèmes modernes d'intelligence artificielle digèrent les informations. La plupart des modèles modernes ne traitent qu'un seul type d'information à la fois. Ils peuvent percevoir du texte, des images ou la parole, mais généralement pas les trois à la fois", explique M. Dean. "C'est la raison pour laquelle nous avons créé Pathways", a déclaré Dean. "Pathways permettra à un seul système d'IA de résumer des milliers ou des millions de tâches, de comprendre différents types de données et de le faire avec une efficacité étonnante, ce qui nous permettra de passer d'une ère de modèles à usage unique qui se contentent de reconnaître des modèles, à une ère dans laquelle des systèmes intelligents plus polyvalents reflètent une compréhension plus profonde de notre monde et peuvent s'adapter à de nouveaux besoins."