Google DeepMind est unefilialebritannique de l’entreprise californienneGoogle spécialisée dans l'intelligence artificielle. L'entreprise s'est notamment faite connaitre par son programme dejeu de GoAlphaGo, son logicielAlphaFold (qui permet deprédire la structure des protéines à partir de leursséquences en acides aminés) puis par AlphaGenome (une IA spécialisée dans le génome humain, capable d'aider à mieux comprendre les maladies génétiques, leurs causes, leurs effets fonctionnels et de potentielles nouvelles cibles thérapeutiques). Cette IA pourra aussi faire progresser labiologie synthétique en aidant à cartographier les éléments fonctionnels cruciaux du génome tout en comprenant mieux leurs rôles.
Le 20 avril 2023, la section "Brain" deGoogle Research et Deepmind fusionnent pour devenir Google Deepmind[7]. DeepMind a notamment publié AlphaMissense (base de données sur les mutations génétiques), AlphaGenome (IA prédisant l'impact des mutations de l'ADN humain sur les processus biologiques) et AlphaProteo (IA concevant de nouvelles protéines, par exemple capables de se lier à des molécules cibles).
L'objectif deDeepMind est de « résoudre l'intelligence ». Pour cela l'entreprise essaie de combiner « les meilleures techniques de l'apprentissage automatique et desneurosciences des systèmes pour construire de puissants algorithmes d'apprentissage généraliste ». L'entreprise souhaite non seulement doter les machines d'intelligence artificielle performante, mais aussi comprendre le fonctionnement du cerveau humain.Demis Hassabis explique :
« Tenter de distiller l'intelligence dans une construction algorithmique peut s'avérer être le meilleur chemin pour comprendre le fonctionnement de nos esprits. »
L'entreprise s'est d'abord concentrée sur le développement de systèmes informatiques « intelligents », capables de jouer à des jeux tels que lego ou à des jeux d'arcade. Selon Shane Legg une machine à l'intelligence comparable à l'intelligence humaine peut être réalisée« lorsqu'une machine peut apprendre à jouer à une très large gamme de jeux à partir de flux perceptuels d'entrée et de sortie, et d'utiliser la compréhension acquise entre les jeux [...]. » La présentation d'une intelligence artificielle capable d'apprendre à jouer à sept jeux différents surAtari 2600 (Pong,Breakout, Space Invaders, Seaquest, Beamrider, Enduro, etQ*bert) aurait motivé leur acquisition par Google.
En 2015, dans le numéro de la revueNature de février 2015[8]DeepMind montre que son logiciel est maintenant meilleur qu'un expert humain des jeux vidéo pour 22 titres classiques d'Atari sur 49 testés, mais encore inférieur aux performances humaines dans 20 autres jeux, et ne dépassant pas un joueur humain pour les titres restants. La principale limitation du logiciel est qu'il reste pour l'instant incapable de planifier de longues stratégies dans le temps (plus de 15 secondes)[5].
Un des défis que tente de releverDeepMind est de réaliser unemémoire à court terme similaire à celle du cerveau humain. Le système développé est un type deréseau de neurones qui a été adapté pour fonctionner avec une mémoire externe. Le résultat est un ordinateur qui apprend en stockant des souvenirs et en les réutilisant pour effectuer des tâches logiques qu'il ne saurait faire autrement[9]. Comme cette forme de calcul diffère significativement de celle d'un réseau neuronal classique,DeepMind lui a donné un nouveau nom : « machine de Turing neuronale »[10]. Cette « machine » apprend comme un réseau neuronal classique en utilisant les entrées qu'il reçoit du monde extérieur, mais elle apprend aussi à stocker ces informations et à les récupérer.
DeepMind combine la technique d'apprentissage automatique « Deep Learning » avec une technique appelée l'apprentissage par renforcement inspirée de travaux de psychologues tels queB. F. Skinner, notamment sur leconditionnement opérant. La technique est nommée« Deep reinforcement learning ». Le logiciel apprend en effectuant des actions et en observant les effets et conséquences, de la même manière que les humains ou les animaux. Mais jusqu'à la publication deDeepMind, personne n'avait réussi à construire un système capable de réaliser des actions aussi complexes que jouer à unjeu vidéo. Une partie du processus d'apprentissage consiste à analyser les expériences passées à plusieurs reprises pour tenter d'extraire des informations plus précises pour agir plus efficacement à l'avenir. Ce mécanisme évoque ce qui se passe dans le cerveau humain : quand nous dormons l'hippocampe rejoue la mémoire de la journée à notrecortex[11].
Première victoire contre un joueur professionnel de go
Lejeu de go est considéré comme un des plus difficiles à appréhender pour une intelligence artificielle de par la multiplicité des positions et des placements possibles sur legoban. Le programmeAlphaGo mis au point par DeepMind combine l'algorithme Monte-Carlo et les réseaux de neurones, une méthode qui bat les autres programmes de go dans 99,8 % des cas[12].
En octobre 2015, l'algorithmeAlphaGo deDeepMind a battu le champion européen en titre dego,Fan Hui, par cinq victoires à zéro, première victoire d'un ordinateur contre un joueur professionnel[13],[14]. Pour mieux comprendre l'importance de cet exploit informatique, voir l'articleJeu de go en informatique.
En mars 2016,AlphaGo gagne contre l'un des meilleurs joueurs du mondeLee Sedol (score 4-1)[15], et bat le champion du mondeKe Jie en mai 2017.
Dans deux études parues début juin 2017, les chercheurs de Deepmind détaillent leurs efforts pour développer des agents dotés de capacité de raisonnement relationnel[16] et prédictif[17] ; deux facultés fondatrices de l'intelligence humaines.
Les deux systèmes sont basés sur des méthodes existantes d'apprentissage machine. Le premier apprend à reconnaître des relations spatiales entre des objets et le second prédit des mouvements d'objets se déplaçant dans un environnement en deux dimensions. Il s'agit d'un « moteur physique intuitif ».
Leurs résultats dépassent tout ce qui avait déjà été fait, et les meilleurs performances humaines dans certains cas[18],[16].
Ces travaux ont été salués par certains chercheurs comme un pas dans la bonne direction, mais quelques-uns, commeSam Gershman, professeur de psychologie àHarvard, sont plus critiques, mettant en garde contre une surestimation de l'importance des résultats de DeepMind. Leur argument est qu'obtenir des performances surhumaines pour chacune des tâches séparées ne permettra pas d'obtenir une intelligence générale surhumaine[18],[19].
En février 2016, Google DeepMind a signé un partenariat avec leNational Health Service (NHS), qui gère les dossiers médicaux de 1,6 million de patients de trois hôpitaux deLondres, afin de développer une application, nomméeStreams, aidant les médecins à surveiller les patients ayant des problèmes dereins. Streams est censé éplucher les données en temps réel pour aider le personnel hospitalier à détecter le plus rapidement possible les cas d'insuffisance rénale aiguë, une pathologie dont la prévalence augmente, qui évolue très vite et peut être mortelle si elle n'est pas prise en charge assez tôt. Toutefois, une polémique est née quand il s'est avéré que ce ne sont pas seulement les dossiers des malades des reins qui ont été transmis à l'entreprise, mais ceux de tous les patients, incluant des données sensibles remontant jusqu'à cinq ans : résultats d'examens, indications d'overdose,avortements,VIH, mais aussi des rapports quotidiens de l'hôpital sur l'activité du patient, son emplacement ou encore ses visiteurs ; sans que les patients en soient informés[20].
AlphaFold est un programme d'intelligence artificielle (IA) développé par DeepMind de Google qui cherche àprédire lastructure des protéines à partir de leurséquence enacides aminés. Le programme est conçu comme un système d'apprentissage profond[21]. La deuxième version du logiciel a atteint en novembre 2020[22],[23] un niveau de précision exceptionnel[21],[24]. AlphaFold 2 a été décrit dans un article publié dansNature le 15 juillet 2021[25]. Le logiciel estlibre, de même qu'une base de données regroupant les structures de la plupart des protéines de plusieurs espèces[26], dont 20 000 protéines humaines[27],[28].
Ce modèle complèteAlphaMissense (consacré aux mutations codantes), en se concentrant cette fois sur les 98 % du génome non codant pour des protéines, mais qui peuvent influencer leur activité, souvent qualifiés de « matière noire » de l'ADN. Il pourra peut-être ainsi doper la recherche sur les maladies, la biologie synthétique et la compréhension fondamentale du génome[30]. L'API est gratuitement disponible, permettant à des chercheurs et laboratoires d'affiner ou d'étendre le modèle, encourageant ainsi l'innovation et l'analyse comparativecollaborative.
AlphaChip est une architecture neuronale basée sur l'apprentissage par renforcement qui guide la tâche de placement. DeepMind affirme que cette technique a réduit le temps nécessaire à la création de topologies de puces de plusieurs semaines à quelques heures. Selon l'entreprise, ses conceptions de puces sont utilisées dans chaque itération deTPU depuis 2020[31],[32]. Plusieurs chercheurs indépendants demeurent sceptiques, invoquant l'absence de bancs d'essais publics directs et de preuves indépendantes confirmant la supériorité revendiquée de cette technologie par rapport aux outils commerciaux existants[33]. Les puces TPU ont été co-conçues avecBroadcom[34],[35].Communications of the ACM a noté que, malgré une couverture médiatique importante, DeepMind n'a pas fourni les bancs d'essais comparatifs attendus de longue date par les experts, ce qui suscite un certain scepticisme dans le domaine[36]. De même,New Scientist a rapporté que si Google affirme qu'AlphaChip a généré des topologies « surhumaines » désormais utilisées en production, des spécialistes externes appellent à la publication de données de performance transparentes pour étayer ces affirmations et permettre des comparaisons équitables avec les méthodes de pointe actuelles[37].
En décembre 2020, l'éthicienne de l'IATimnit Gebru a quitté Google[38]. Si la nature exacte de son départ (démission ou licenciement) fait l'objet de débats, il résulte de son refus de retirer un article intitulé « On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? » et d'un ultimatum qu'elle avait posé, exigeant des conditions sous peine de partir[38]. Cet article examinait les risques potentiels liés à l'expansion de l'IA, comme Google Brain, notamment l'impact environnemental, les biais dans les données d'entraînement et la capacité à tromper le public[38],[39]. La demande de retrait de l'article avait été formulée par Megan Kacholia, vice-présidente de Google Brain[40]. En avril 2021, près de 7 000 employés actuels ou anciens de Google et partisans de l'industrie ont signé une lettre ouverte accusant Google de « censure de la recherche » et condamnant le traitement réservé à Gebru[41].
En février 2021, Google a licencié l'une des dirigeantes de l'équipe d'éthique de l'IA,Margaret Mitchell[40]. Selon la déclaration de l'entreprise, Mitchell aurait enfreint la politique interne en utilisant des outils automatisés pour trouver des soutiens à Gebru[40]. Au cours du même mois, plusieurs ingénieurs extérieurs à l'équipe d'éthique ont démissionné, invoquant le licenciement de Gebru comme motif[42]. En avril 2021, le cofondateur de Google Brain,Samy Bengio, a annoncé sa démission de l'entreprise[43]. Bien qu'il ait été le supérieur hiérarchique de Gebru, Bengio n'a pas été informé avant son licenciement, et il a exprimé publiquement son soutien à Gebru et à Mitchell[43]. Si Bengio a évoqué la recherche d'un épanouissement personnel comme raison principale de son départ, des sources anonymes ont indiqué à Reuters que les tensions au sein de l'équipe d'éthique de l'IA ont également pesé dans sa décision[43].
↑a etbAdamSantoro, DavidRaposo, David G. T.Barrett et MateuszMalinowski, « A simple neural network module for relational reasoning »,arXiv:1706.01427 [cs],(lire en ligne, consulté le).
↑NicholasWatters, AndreaTacchetti, TheophaneWeber et RazvanPascanu, « Visual Interaction Networks »,arXiv:1706.01433 [cs],(lire en ligne, consulté le).
↑Igor L.Markov,« Reevaluating Google's Reinforcement Learning for IC Macro Placement »[archive du], surCommunications of the ACM, Association for Computing Machinery, :« A 2021 paper in Nature by Mirhoseini, Goldie, et al. about the use of reinforcement learning (RL) in the physical design of silicon chips raised eyebrows, drew critical media coverage, and stirred up controversy due to poorly documented claims. … This meta-analysis discusses the reproduction and evaluation of results in the Nature paper by Mirhoseini, Goldie, et al., as well as the validity of methods, results, and claims. ».