Home Politiek Verbeteringen in ‘redeneren’ AI -modellen kunnen binnenkort vertragen, de analyse vindt

Verbeteringen in ‘redeneren’ AI -modellen kunnen binnenkort vertragen, de analyse vindt

24
0

Een analyse van Epoch AI, een non -profit AI Research Institute, suggereert dat de AI -industrie mogelijk niet in staat is om enorme prestatieverstanden te maken van het redeneren van AI -modellen veel langer. Zodra binnen een jaar de voortgang van redeneermodellen zou kunnen vertragen, volgens de bevindingen van het rapport.

Redeneringsmodellen zoals Openai’s O3 hebben de afgelopen maanden geleid tot substantiële winst op AI -benchmarks, met name benchmarks die wiskunde en programmeervaardigheden meten. De modellen kunnen meer computing toepassen op problemen, wat hun prestaties kan verbeteren, met als nadeel dat ze langer duren dan conventionele modellen om taken te voltooien.

Redeneringsmodellen worden ontwikkeld door eerst een conventioneel model te trainen op een enorme hoeveelheid gegevens en vervolgens een techniek toe te passen genaamd wapening leren, die het model effectief “feedback” geeft over zijn oplossingen voor moeilijke problemen.

Tot nu toe hebben Frontier AI -laboratoria zoals Openai volgens Epoch geen enorme hoeveelheid rekenkracht toegepast op de leerstadium van het leren van de redeneringsmodel.

Dat verandert. Openai heeft gezegd dat het ongeveer 10x meer computing heeft toegepast om O3 te trainen dan zijn voorganger, O1 en Epoch speculeert dat het grootste deel van dit computergebruik was gewijd aan het leren van versterking. En Openai -onderzoeker Dan Roberts heeft onlangs aangetoond dat de toekomstplannen van het bedrijf vragen om prioriteit te geven aan het leren van versterking om veel meer rekenkracht te gebruiken, zelfs meer dan voor de initiële modelopleiding.

Maar er is nog steeds een bovengrens aan hoeveel computing kan worden toegepast op het leren van versterking, per tijdvak.

Epoch redeneermodel training
Volgens een Epoch AI -analyse kan het schalen van de redeneringsmodel training vertragenAfbeelding credits:Tijdperk AI

Josh You, een analist bij Epoch en de auteur van de analyse, legt uit dat prestatiewinsten van standaard AI-modeltraining momenteel elk jaar kwadreren, terwijl prestatiewinsten van het leren van versterking elke 3-5 maanden tienvoudig groeien. De voortgang van de redeneringstraining zal “waarschijnlijk samenkomen met de algehele grens tegen 2026”, vervolgt hij.

De analyse van Epoch maakt een aantal veronderstellingen en is gedeeltelijk gebaseerd op openbare opmerkingen van AI Company Executives. Maar het beweert ook dat het schalen van redeneermodellen een uitdaging kan blijken te zijn om redenen naast computergebruik, inclusief hoge overheadkosten voor onderzoek.

“Als er een aanhoudende overheadkosten zijn die nodig is voor onderzoek, kunnen redeneermodellen niet zo ver als verwacht schalen”, schrijft u. “Snelle rekenschaling is potentieel een zeer belangrijk ingrediënt in de voortgang van de redeneringsmodel, dus het is de moeite waard om dit op de voet te volgen.”

Elke indicatie dat redeneermodellen in de nabije toekomst een soort limiet kunnen bereiken, zal zich waarschijnlijk zorgen maken over de AI -industrie, die enorme middelen heeft geïnvesteerd die dit soort modellen ontwikkelen. Studies hebben al aangetoond dat redeneermodellen, die ongelooflijk duur kunnen zijn om te draaien, ernstige gebreken hebben, zoals een neiging om meer te hallucineren dan bepaalde conventionele modellen.

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in