[
0:01] Comment faire pour que la voiture autonome devienne vraiment autonome ? C'est-à-dire pour qu'elle soit capable de rouler sans chauffeur en tout lieu et en toutes circonstances. Récemment, j'expliquais dans un précédent épisode de Monde Numérique, et aussi dans une petite vidéo que vous avez peut-être vu passer, que les véhicules autonomes actuels, ceux qui circulent notamment aux Etats-Unis ou en Chine, ne sont en réalité que des véhicules autonomes de niveau 4. C'est-à-dire qu'ils ont encore besoin d'avoir été entraînés pendant des mois, par exemple dans les rues de San Francisco ou de Las Vegas, pour pouvoir être exploités en toute sécurité. Ils ne sont pas de niveau 5, c'est-à-dire qu'ils ne peuvent pas être déployés n'importe où, n'importe comment, à Paris, Bombay, Beyrouth, etc. Parce qu'ils ne sont pas capables de se comporter comme des véhicules conduits par un chauffeur humain qui saura s'adapter à toutes les situations. Les véhicules autonomes n'ont pas vraiment d'intelligence qui leur permettrait de faire face à toutes sortes de cas de figure, comme une tempête de neige ou l'arrivée subite d'un animal sauvage en travers de la route ? Non, parce qu'ils n'ont jamais rencontré ce genre de situation au cours de leur entraînement.
[
1:08] Google, ou plutôt sa filiale Waymo, semble avoir trouvé malgré tout une solution pour rendre ces véhicules encore plus intelligents, encore plus aptes à faire face à toutes sortes de situations inattendues. Cette solution, c'est ce qu'on appelle le World Model, Un type d'intelligence artificielle qui se base sur une véritable représentation du monde afin de mieux appréhender la réalité. Waymo affirme avoir développé un World Model spécial pour entraîner ces véhicules autonomes de manière beaucoup plus fine pour leur apprendre à se confronter à toutes les situations. Le Waymo World Model, ce n'est pas exactement un World Model au sens où pourraient l'entendre des spécialistes comme Yann Le Cun par exemple. C'est plutôt une sorte d'émulation. Il s'agit d'un modèle d'IA génératif conçu pour produire des situations de conduite hyper réalistes avec des images très immersives, mais à partir de vidéos toutes simples, en 2D, provenant par exemple de dashcam, des caméras de tableau de bord dans les voitures, ou même de vidéos prises au smartphone.
[
2:07] Cela a permis de créer un environnement d'entraînement hyper réaliste pour les voitures. Le but, c'est de leur permettre de s'entraîner dans cet environnement de manière multimodale, comme on dit, afin d'affronter toutes les situations inattendues qui pourraient se produire sur route ouverte. Avec un tel système, le Waymo Driver, c'est-à-dire le système de pilotage automatique de Waymo, peut se confronter des milliards de fois, car on peut le faire passer plusieurs fois face à ce genre de scènes qui vont être un petit peu différentes à chaque fois, comme s'ils s'entraînaient en situation réelle, dans les rues, d'une ville, n'importe où dans le monde.
[
2:43] Waymo explique tout ça en détail dans un long billet de blog qui présente le système. Les chercheurs disent que, notamment, le Waymo Driver est ainsi parvenu, par exemple, à éviter un véhicule qui roulait à contresens, ce qui, évidemment, n'arrive pas tous les jours, donc il n'avait pas pu vraiment rencontrer ce cas de figure. Et d'ailleurs, de nombreuses situations ont ainsi été testées. D'abord, des conditions météo difficiles, par exemple le pont Golden Gate de San Francisco, sous la neige, ou encore une tornade, ou encore même des situations surréalistes comme la rue d'une ville tropicale bordée de palmiers. Mais couvertes de neige. Il y a aussi des événements rares qui ont été générés, comme un conducteur qui subitement quitte la route, un véhicule qui transporte des meubles mal arrimés sur le toit, ou même un éléphant ou un lion en travers de la voie, ou encore un piéton déguisé en dinosaure. Bref, les chercheurs s'en sont vraiment donnés à cœur joie. Et c'est tout l'intérêt de la chose. Alors, ils ont pu faire ça grâce au système qu'ils ont mis en place, qui s'appelle Génie 3 de Google, un modèle capable de générer ces environnements interactifs à la demande à partir de simples promptes, comme s'il parlait à Gemini, en fait. Selon Waymo, ce world model, donc construit sur Genitroi, serait le modèle généraliste le plus avancé au monde, capable de générer des environnements 3D photoréalistes, adaptés aux exigences de la conduite autonome. Ça va donc beaucoup plus loin que les entraînements dans le monde réel, ou même sur des simulateurs classiques qui ne font que reproduire les conditions de circulation les plus courantes.
[
4:11] Accessoirement, ce système serait beaucoup plus rapide, moins coûteux que les simulations classiques et aussi plus fiables car Waymo explique qu'en général plus une simulation dure longtemps et plus elle est difficile à calculer et surtout à maintenir stable sans perte de qualité Cette innovation semble donc marquer une étape vraiment importante pour le développement des voitures autonomes Alors on ne sait pas si ça les rendra vraiment intelligentes comme un humain on va dire pour arriver à faire des voitures de niveau 5 capables de comprendre très vite une situation nouvelle de s'adapter mais en tout cas ça élargit quand même considérablement la palette des cas de figure auxquels ces véhicules peuvent être confrontés et donc ça leur permet de s'entraîner pour mieux gérer ensuite les situations dans le monde réel. Bon, l'histoire ne dit pas si une voiture ainsi entraînée serait capable de faire mieux qu'un humain face à une situation réellement inattendue. Car au fond, chaque chauffeur en chair et en os, face à une situation extrême, réagira à sa manière. Tout le monde ne va pas se comporter pareil. Par exemple, qu'est-ce qu'on fait face à une attaque à main armée au milieu de la route ? Est-ce qu'il faut s'arrêter, foncer, etc. Dans ce genre de situation vraiment peu ordinaire, chaque humain réagit à sa façon. pas forcément toujours au mieux bien sûr alors on verra si la robotique permet d'apporter des réponses uniformes à ce genre de questionnement, mais ça c'est une autre histoire.