Lorsque les navigateurs deviennent le prochain champ de bataille de l'IA, qui sera éliminé ?

L’avenir de l’IA réside dans des agents capables de naviguer sur les pages Web de manière autonome. Les entreprises technologiques investissent dans le développement de proxys de navigateur pour automatiser les tâches Web et augmenter la productivité. Cet article explore ses cas d’utilisation, les défis actuels et les opportunités présentées par les scénarios natifs du Web3. Cet article a été écrit par Mario Chow et Figo, @IOSG, et a été compilé, compilé et contribué par BlockBeats. OpenAI Sam Altman : Je suis intéressé par l’acquisition de Google Chrome !) La plus grande bataille de navigateurs sur les marchés participants) (Contexte ajouté : Perplexity offre 34,5 milliards de dollars pour acquérir le navigateur Chrome, les minions des moteurs de recherche IA combattent des géants) Au cours des 12 derniers mois, la relation entre les navigateurs Web et l’automatisation a radicalement changé. Presque toutes les grandes entreprises technologiques se démènent pour créer leur propre (browser agent) de proxy de navigateur. À partir de la fin de l’année 2024, cette tendance s’accentue : OpenAI a lancé le mode Agent en janvier, Anthropic a sorti « l’utilisation de l’ordinateur » pour le modèle Claude, Google DeepMind a lancé Project Mariner, Opera a annoncé le navigateur proxy Neon et Perplexity AI a lancé le navigateur Comet. Le signal est clair : l’avenir de l’IA réside dans des agents capables de naviguer sur les pages web de manière autonome. Cette tendance ne consiste pas seulement à ajouter des chatbots plus intelligents aux navigateurs, c’est un changement fondamental dans la façon dont les machines interagissent avec l’environnement numérique. Les agents de navigation sont des systèmes d’IA qui « voient » les pages web et passent à l’action : cliquer sur des liens, remplir des formulaires, faire défiler des pages, saisir du texte : tout comme les utilisateurs humains. Ce modèle promet de débloquer une productivité et une valeur économique énormes en automatisant des tâches encore manuelles ou trop complexes pour les scripts traditionnels. ▲ Démo GIF : Agent de navigateur IA en action : suivez les instructions, accédez à la page de l’ensemble de données cible, prenez automatiquement des captures d’écran et extrayez les données requises. Qui va gagner la guerre des navigateurs IA ? Presque toutes les grandes entreprises technologiques ( ainsi que certaines startups ) développent leurs propres agents d’IA de navigateur. Voici quelques-uns des projets les plus représentatifs : OpenAI – Mode Agent Le mode Agent d’OpenAI ( anciennement connu sous le nom d’Operator, lancé en janvier 2025 ) est un agent IA avec son propre navigateur. Les opérateurs peuvent gérer une variété de tâches répétitives en ligne : remplir des formulaires Web, commander des courses, planifier des réunions, le tout via une interface Web standard couramment utilisée par les humains. ▲ Les agents IA planifient des réunions comme des assistants professionnels : consultez les calendriers, trouvez les créneaux horaires disponibles, créez des événements, envoyez des confirmations et générez .ics documents pour vous. Anthropic – « L’utilisation de l’ordinateur » de Claude À la fin de l’année 2024, Anthropic a introduit une nouvelle fonctionnalité « Utilisation de l’ordinateur ( )Use informatique » pour Claude 3.5, lui donnant la possibilité de faire fonctionner les ordinateurs et les navigateurs comme un humain. Claude peut regarder l’écran, déplacer le curseur, cliquer sur des boutons et saisir du texte. Il s’agit du premier outil proxy de grand modèle de ce type à entrer en version bêta publique, permettant aux développeurs de laisser Claude naviguer automatiquement sur les sites Web et les applications. Anthropic le positionne comme une fonctionnalité expérimentale dont l’objectif principal est d’automatiser les flux de travail en plusieurs étapes sur les pages Web. Perplexity - La startup d’IA Comet Perplexity ( surtout connue pour son moteur de questions-réponses ) a lancé le navigateur Comet à la mi-2025 en tant qu’alternative à Chrome alimentée par l’IA. À la base, Comet est un moteur de recherche conversationnel basé sur l’IA intégré à la barre d’URL (omnibox) qui fournit des questions-réponses et des résumés instantanés au lieu des liens de recherche traditionnels. De plus, Comet intègre Comet Assistant, un agent résident dans la barre latérale qui automatise les tâches de routine sur tous les sites. Par exemple, il peut résumer les messages que vous ouvrez, planifier une réunion, gérer la pagination du navigateur ou parcourir et explorer des informations Web en votre nom. En permettant aux agents d’être au courant du contenu Web actuel grâce à une interface de barre latérale, Comet vise à combiner de manière transparente la navigation avec les assistants d’IA. Dans l’article précédent, nous avons examiné comment ( grandes entreprises technologiques telles que )OpenAI, Anthropic, Perplexity, etc. ont (browser des proxys de navigateur sous différentes formes de produits agents) Injecter la fonctionnalité. Pour comprendre leur valeur de manière plus intuitive, nous pouvons examiner de plus près comment ces capacités peuvent être appliquées à la vie quotidienne et aux flux de travail d’entreprise dans des scénarios réels. Automatisation Web quotidienne # E-commerce & Personal Shopping Un scénario très pratique consiste à déléguer les tâches d’achat et de réservation à un agent. Les agents peuvent remplir automatiquement votre panier d’achat en ligne et passer des commandes sur la base de listes fixes, ou ils peuvent trouver les prix les plus bas chez plusieurs détaillants et terminer le processus de paiement en votre nom. Pour les voyages, vous pouvez demander à l’IA d’effectuer des tâches telles que : « Réservez-moi un vol pour Tokyo le mois prochain ( tarif inférieur à 800 $ ) et réservez un hôtel avec Wi-Fi gratuit. » L’agent s’occupe de l’ensemble du processus : recherche de vols, comparaison des options, saisie des informations sur les passagers, réservation d’hôtel, le tout sur les sites Web des compagnies aériennes et des hôtels. Ce niveau d’automatisation va bien au-delà des robots de voyage existants : il ne s’agit pas seulement de recommander, mais d’exécuter directement les achats. # Améliorer l’efficacité du bureau Les proxys sont capables d’automatiser de nombreuses actions commerciales répétitives que les gens effectuent dans leurs navigateurs. Par exemple, organisez vos e-mails et extrayez des listes de tâches, ou vérifiez les lacunes dans plusieurs calendriers et planifiez automatiquement des réunions. L’assistant Comet de Perplexity peut déjà résumer le contenu de votre boîte de réception ou ajouter un ordre du jour pour vous via l’interface Web. Les agents peuvent également se connecter à l’outil SaaS pour générer des rapports réguliers, mettre à jour des feuilles de calcul ou soumettre des formulaires une fois que vous l’avez autorisé. Imaginez un agent RH qui peut se connecter automatiquement à différents sites d’emploi pour publier des offres d’emploi ; Ou un agent commercial qui peut mettre à jour le profil du prospect pour le système CRM. Ces tâches banales auraient pris beaucoup de temps aux employés, mais l’IA peut le faire en automatisant les formulaires Web et les actions de page. En plus d’une seule tâche, les agents peuvent connecter des flux de travail complets sur plusieurs systèmes réseau. Toutes ces étapes doivent être effectuées dans différentes interfaces Web, ce qui fait la force de l’agent du navigateur. Les agents peuvent se connecter à divers tableaux de bord pour le dépannage et même orchestrer des processus tels que l’intégration de nouveaux employés ( la création de ) de compte sur plusieurs sites SaaS. Essentiellement, toute opération en plusieurs étapes qui nécessite actuellement de cliquer sur plusieurs sites peut être effectuée par un agent. Malgré leur potentiel, les proxys de navigateur d’aujourd’hui sont encore loin d’être parfaits. Les mises en œuvre actuelles révèlent des défis techniques et d’infrastructure de longue date : L’inadéquation de l’architecture...

AGENT-5.32%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)