- Knuffelen Face heeft een AI -tool gedebuteerd om namens u op internet te navigeren
- De open computeragent gebruikt een echte webbrowser om taken te voltooien, zoals het krijgen van aanwijzingen of het boeken van tickets
- De agent en de open-source demo kunnen zien wat er op het scherm staat, klik op knoppen, vul formulieren in en verplaatsen stap voor stap door taken als een mens
Hugging Face heeft zijn eigen kijk geïntroduceerd op het groeiende aantal semi-onafhankelijke AI-agenten die online boodschappen voor mensen kunnen doen. De nieuwe en gratis (indien beperkte) open computeragent is als een persoonlijke assistent die in uw webbrowser woont.
De open computeragent kan deel uitmaken van het lopende ‘smolagents’ -initiatief van het bedrijf en kan met websites en apps werken, zoals u zou doen, met een onzichtbare muis en toetsenbord om verzoeken te voltooien. De AI kan een browser openen, dingen typen in formulieren, klikknoppen en meer. Vraag het om aanwijzingen te vinden, en het gaat naar Google Maps, voer de oorsprong en bestemming in en toont u de route als een plichtmatige digitale chauffeur.
Je kunt het zelf proberen met de live demo. Eerlijke waarschuwing, de populariteit ervan veroorzaakt enkele vertragingen en fouten als gevolg van een achterstand.
We lanceren computergebruik in smolagenten! 🥳-> Naarmate visiemodellen capabeler worden, kunnen ze complexe agentische workflows van stroom voorzien. Vooral Qwen-VL-modellen, die ingebouwde aarding ondersteunen, dwz een element in een afbeelding door zijn coördinaten te vinden, dus aan … pic.twitter.com/mi8muwzkis6 mei 2025
Agent AI
De Open Computer Agent is een andere filosofie van een idee dat heeft geleid tot vergelijkbare tools zoals Openai’s Operator, Browser Use, Proxy 1.0 en Opera’s browseroperator. Net als die tools gaat het AI -agent van Huggen om een actieve deelnemer te zijn in plaats van een passieve informatiebron.
Net als browsergebruik is Open Computer Agent open-source, wat betekent dat iedereen kan zien hoe het werkt en er bovenop kan worden gebouwd, of het op zijn minst aanpas voor niche-use cases. De agent is het begin van iets flexibelers, geen eindproduct met een miljoen juridische disclaimers. Dat betekent ook dat de demo precies dat is, een demonstratie, geen gepolijst pakket. Het kan dingen verkeerd doen en vereist dat je insprong voor aanmeldingen en captcha -tests.
Tickets boeken, store -uren controleren, zoekopdrachten doen, aanwijzingen opzoeken en door menu’s klikken zijn allemaal dingen die veel mensen willen kunnen doen met een enkele natuurlijke taalprompt. Het is één ding om Chatgpt te vragen hoe je goedkope vluchten kunt vinden. Het is er nog een om te kijken naar een tool naar een reiswebsite, scroll door lijsten en proberen te klikken op “Nu boeken.”
Het kan gebrekkig en verre van flitsende computeragent zijn, maar open computeragent vertegenwoordigt een benadering van AI die net zo gewoon kan worden als de nu alomtegenwoordige AI -beeldgeneratoren.