Informations

Linkin-news.com est un journal électronique tunisien développé par la société Linkin Way.

Nous sommes disponibles 24/ 7. Appelez-nous dès maintenant.
4.8/5 - (31 votes)

Google est une entreprise axée sur l’intelligence artificielle depuis près d’une décennie. Maintenant, un an après le début de l’ère de l’intelligence artificielle initiée par ChatGPT, elle fait enfin un grand pas en avant.

C’est le début d’une nouvelle ère de l’intelligence artificielle chez Google, déclare le PDG Sundar Pichai : l’ère Gemini

Gemini est le dernier modèle de grande envergure de Google, que Sundar Pichai a d’abord évoqué lors de la conférence des développeurs I/O en juin et qui est maintenant lancé auprès du public. 

Selon Sundar Pichai et le PDG de Google DeepMind, Demis Hassabis, il s’agit d’un énorme pas en avant dans un modèle d’IA qui influencera finalement pratiquement tous les produits de Google. “L’une des choses puissantes de ce moment”, dit Sundar Pichai, “c’est que vous pouvez travailler sur une technologie sous-jacente et l’améliorer, et elle se propage immédiatement à travers nos produits”.

Gemini n’est pas qu’un simple modèle d’IA. Il existe une version plus légère appelée Gemini Nano qui est destinée à être exécutée nativement et hors ligne sur les appareils Android.

Il existe une version plus puissante appelée Gemini Pro qui alimentera bientôt de nombreux services d’IA de Google et qui est la colonne vertébrale de Bard à partir d’aujourd’hui. Et il y a un modèle encore plus performant appelé Gemini Ultra, qui est le modèle de LLM (large language model) le plus puissant que Google ait créé jusqu’à présent et qui semble principalement conçu pour les centres de données et les applications d’entreprise.

Google lance actuellement le modèle de plusieurs manières : Bard est désormais alimenté par Gemini Pro, et les utilisateurs du Pixel 8 Pro bénéficieront de quelques nouvelles fonctionnalités grâce à Gemini Nano. (Gemini Ultra arrivera l’année prochaine.)

Les développeurs et les clients d’entreprise pourront accéder à Gemini Pro via Google Generative AI Studio ou Vertex AI dans Google Cloud à partir du 13 décembre. Gemini n’est disponible qu’en anglais pour le moment, d’autres langues semblent arriver bientôt. Mais Sundar Pichai indique que le modèle sera éventuellement intégré au moteur de recherche de Google, à ses produits publicitaires, au navigateur Chrome, et plus encore, partout dans le monde. C’est l’avenir de Google, et il est arrivé à point nommé.

Il y a un an et une semaine, OpenAI lançait ChatGPT, et la société ainsi que le produit devenaient immédiatement les éléments les plus importants dans le domaine de l’IA.

Maintenant, Google, la société qui a créé une grande partie de la technologie fondamentale derrière le boom actuel de l’IA, qui se présente comme une organisation “d’abord centrée sur l’IA” depuis près d’une décennie, et qui a clairement été prise au dépourvu par la qualité de ChatGPT et par la rapidité avec laquelle la technologie d’OpenAI a pris le dessus dans l’industrie, est enfin prête à riposter.

Alors, passons directement à la question importante, d’accord ? GPT-4 d’OpenAI contre Gemini de Google : c’est parti. Il est évident que cela préoccupe sérieusement Google depuis un certain temps. “Nous avons réalisé une analyse très approfondie des systèmes côte à côte, ainsi que des tests de référence”, déclare Hassabis.

Google a effectué 32 tests de référence bien établis comparant les deux modèles, allant de tests globaux comme le benchmark Multi-task Language Understanding à celui qui évalue la capacité de deux modèles à générer du code Python. “Je pense que nous sommes nettement en avance sur 30 des 32” de ces tests, dit Hassabis avec un sourire. “Certains sont très spécifiques. D’autres sont plus larges.”

Dans ces tests de référence (qui sont vraiment pour la plupart très proches), l’avantage le plus clair de Gemini réside dans sa capacité à comprendre et interagir avec la vidéo et l’audio. Cela fait partie intégrante du plan de Gemini depuis le début.

Contrairement à OpenAI qui a créé des modèles distincts pour les images (DALL-E) et la voix (Whisper), Google a construit un modèle multisensoriel dès le départ. “Nous avons toujours été intéressés par des systèmes très généraux”, déclare Hassabis. Il s’intéresse particulièrement à la manière de mélanger tous ces modes, de recueillir autant de données que possible à partir de n’importe quel nombre d’entrées et de sens, puis de fournir des réponses avec tout autant de variété.

Actuellement, les modèles les plus basiques de Gemini traitent le texte en entrée et produisent du texte en sortie, mais des modèles plus puissants comme Gemini Ultra peuvent travailler avec des images, des vidéos et de l’audio.

Et “cela va devenir encore plus général que cela”, déclare Hassabis. “Il y a encore des choses comme l’action et le toucher, plus proches des aspects robotiques.” Avec le temps, ajoute-t-il, Gemini développera davantage de sens, deviendra plus conscient et gagnera en précision et en ancrage dans le processus. “Ces modèles comprennent simplement mieux le monde qui les entoure.” Bien sûr, ces modèles ont toujours des hallucinations et des biais, entre autres problèmes. Mais plus ils en savent, selon Hassabis, mieux ils deviendront.

Les benchmarks ne sont que des benchmarks, cependant, et finalement, le véritable test des capacités de Gemini viendra des utilisateurs ordinaires qui veulent l’utiliser pour générer des idées, rechercher des informations, écrire du code, et bien plus encore.

Google semble considérer la programmation en particulier comme une application phare pour Gemini ; il utilise un nouveau système de génération de code appelé AlphaCode 2, affirmant qu’il est plus performant que 85 % des participants aux compétitions de codage, contre 50 % pour l’AlphaCode original. Cependant, Pichai indique que les utilisateurs remarqueront une amélioration dans presque tout ce que le modèle touche.

Également important pour Google, Gemini est apparemment un modèle beaucoup plus efficace. Il a été entraîné sur les propres unités de traitement tensoriel (TPU) de Google et est à la fois plus rapide et moins cher à exécuter que les modèles précédents de Google tels que PaLM.

En parallèle avec le nouveau modèle, Google lance également une nouvelle version de son système TPU, le TPU v5p, un système informatique conçu pour une utilisation dans les centres de données pour l’entraînement et l’exécution de modèles à grande échelle.

En parlant avec Pichai et Hassabis, il est clair qu’ils voient le lancement de Gemini à la fois comme le début d’un projet plus vaste et comme un changement significatif en lui-même. Gemini est le modèle que Google attendait, celui vers lequel il travaillait depuis des années, peut-être même celui qu’il aurait dû avoir prêt avant qu’OpenAI et ChatGPT ne prennent le dessus dans le monde.

Google, qui a déclaré une “alerte rouge” après le lancement de ChatGPT et a été perçu comme étant en mode rattrapage depuis lors, semble toujours essayer de rester fidèle à son mantra “audacieux et responsable”.

Hassabis et Pichai affirment tous deux qu’ils ne sont pas prêts à aller trop vite juste pour suivre le rythme, surtout à mesure que nous nous rapprochons du rêve ultime de l’IA : l’intelligence artificielle générale, le terme désignant une IA qui s’améliore d’elle-même, plus intelligente que les humains, et prête à changer le monde. “À mesure que nous approchons de l’AGI, les choses vont être différentes”, déclare Hassabis. “C’est une technologie active, donc je pense que nous devons approcher cela avec prudence. Prudemment, mais avec optimisme.”

Google affirme avoir travaillé dur pour garantir la sécurité et la responsabilité de Gemini, à la fois grâce à des tests internes et externes et à des simulations d’attaques.

Sundar Pichai souligne que garantir la sécurité des données et la fiabilité est particulièrement important pour les produits axés sur les entreprises, là où la plupart des revenus de l’IA générative sont générés.

Cependant, Hassabis reconnaît qu’un des risques de lancer un système d’IA de pointe est qu’il présentera des problèmes et des vecteurs d’attaque que personne n’aurait pu prédire. “C’est pourquoi vous devez publier des choses”, dit-il, “pour voir et apprendre.” Google adopte une approche particulièrement prudente pour le lancement de Gemini Ultra ; Hassabis le compare à une version bêta contrôlée, avec une “zone d’expérimentation plus sûre” pour le modèle le plus puissant et sans contrainte de Google.

Fondamentalement, si Gemini abrite une personnalité alternative capable de ruiner des relations, Google essaie de la découvrir avant que vous ne le fassiez.

Pendant des années, Sundar Pichai et d’autres cadres de Google ont parlé avec enthousiasme du potentiel de l’IA. Pichai lui-même a déclaré à plusieurs reprises que l’IA serait plus transformative pour l’humanité que le feu ou l’électricité.

Dans cette première génération, le modèle Gemini pourrait ne pas changer le monde. Dans le meilleur des cas, il pourrait simplement aider Google à rattraper OpenAI dans la course pour construire une IA générative de qualité. (Dans le pire des cas, Bard reste ennuyeux et médiocre, et ChatGPT continue de dominer.) Mais Pichai, Hassabis et tous les autres chez Google semblent penser que c’est le début de quelque chose de vraiment énorme.

Le web a fait de Google un géant de la technologie ; Gemini pourrait être encore plus grand.

Share:

Avatar photo

administrator

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *