Op zoek naar goede vibes
OpenAI, samen met concurrenten zoals Google en Anthropic, probeert chatbots te bouwen waarmee mensen willen chatten. Dus, het ontwerpen van de schijnbare persoonlijkheid van het model om positief en ondersteunend te zijn, is logisch – mensen zijn minder geneigd een AI te gebruiken die zo hard of afwijzend uitkomt. Bij gebrek aan een beter woord gaat het steeds meer om vibemarkering.
Toen Google Gemini 2.5 onthulde, roeide het team over hoe het model bovenaan het LM Arena -leaderboard stond, waarmee mensen kunnen kiezen tussen twee verschillende modeloutputs in een blinde test. De modellen die mensen leuk vinden, belanden bovenaan de lijst, wat suggereert dat ze aangenamer zijn om te gebruiken. Natuurlijk kunnen mensen om verschillende redenen output leuk vinden – misschien is één technisch nauwkeuriger, of de lay -out is gemakkelijker te lezen. Maar over het algemeen houden mensen van modellen waardoor ze zich goed voelen. Hetzelfde geldt voor het interne modelafstemmingswerk van Openai, zo lijkt het.
Een voorbeeld van de overijverige lof van Chatgpt.
Krediet: /u /talvy
Een voorbeeld van de overijverige lof van Chatgpt.
Krediet: /u /talvy
Het is mogelijk dat dit streven naar goede vibes modellen pushen om meer sycofantisch gedrag te vertonen, wat een probleem is. Alex Albert van Anthropic heeft dit als een “giftige feedbacklus” genoemd. Een AI-chatbot die je vertelt dat je een genie van wereldklasse bent die de ongeziene ziet, is misschien niet schadelijk als je gewoon brainstormt. De eindeloze lof van het model kan er echter toe leiden dat mensen die AI gebruiken om zakelijke ondernemingen te plannen of, de hemel verbiedt, ingrijpende tarieven uit te voeren, om voor de gek te worden gezet door te denken dat ze op iets belangrijks zijn tegengekomen. In werkelijkheid is het model zo sycofantisch geworden dat het van alles houdt.
Het constante streven naar betrokkenheid is een nadeel geweest voor tal van producten in het internettijdperk, en het lijkt erop dat generatieve AI niet immuun is. De GPT-4O-update van OpenAi is een bewijs daarvan, maar hopelijk kan dit dienen als een herinnering voor de ontwikkelaars van generatieve AI dat goede vibes niet zo belangrijk zijn.