Home Politiek Deep Cogito komt uit stealth met modellen met hybride AI ‘redeneren’

Deep Cogito komt uit stealth met modellen met hybride AI ‘redeneren’

20
0

Een nieuw bedrijf, Deep Cogito, is voortgekomen uit Stealth met een familie van openlijk beschikbare AI-modellen die kunnen worden geschakeld tussen “redeneren” en niet-redelijke modi.

Redeneringsmodellen zoals Openai’s O1 hebben een grote belofte getoond in domeinen zoals wiskunde en fysica, dankzij hun vermogen om zichzelf effectief te controleren door stap voor stap complexe problemen te doorlopen. Deze redenering brengt echter kosten met zich mee: hoger computergebruik en latentie. Dat is de reden waarom laboratoria als antropisch “hybride” modelarchitecturen nastreven die redeneercomponenten combineren met standaard, niet-redelijke elementen. Hybride modellen kunnen snel eenvoudige vragen beantwoorden terwijl ze extra tijd besteden aan het overwegen van meer uitdagende vragen.

Alle modellen van Deep Cogito, Cogito 1 genaamd, zijn hybride modellen. Cogito beweert dat ze beter presteren dan de beste open modellen van dezelfde grootte, inclusief modellen van Meta en Chinese AI Startup Deepseek.

“Elk model kan direct antwoorden […] of zelfreflecteren voordat u beantwoordt (zoals redeneermodellen), ‘legde het bedrijf uit in een blogpost.'[All] werden ontwikkeld door een klein team in ongeveer 75 dagen. ”

De Cogito 1 -modellen variëren van 3 miljard parameters tot 70 miljard parameters, en Cogito zegt dat modellen variërend tot 671 miljard parameters zich de komende weken en maanden bij hen voegen. Parameters komen ongeveer overeen met de probleemoplossende vaardigheden van een model, waarbij meer parameters over het algemeen beter zijn.

Cogito 1 is niet helemaal opnieuw ontwikkeld, om duidelijk te zijn. Deep Cogito gebouwd bovenop Meta’s Open Lama en Alibaba’s Qwen -modellen om zichzelf te creëren. Het bedrijf zegt dat het nieuwe trainingsbenaderingen heeft toegepast om de prestaties van de basismodellen te stimuleren en omschakelingsredenen mogelijk te maken.

Volgens de resultaten van de interne benchmarking van Cogito, het grootste Cogito 1 -model, Cogito 70B, met redeneren overtreft het R1 -redeneermodel van Deepseek op enkele wiskunde- en taalevaluaties. Cogito 70B met redenering gehandicapten overschaduwt ook het onlangs uitgebrachte LLAMA 4 Scout-model van Meta op LiveBench, een AI-test met algemene doeleinden.

Elk Cogito 1 -model is beschikbaar om te downloaden of te gebruiken via API’s op Cloud Providers Fireworks AI en samen AI.

Diepe Cogito
De prestaties van Cogito 1 vergeleken met andere populaire openlijk beschikbare AI -modellenAfbeelding credits:Diepe Cogito

“Momenteel zijn we nog steeds in de vroege stadia van [our] Schaalcurve, die slechts een fractie van de reken heeft gebruikt die doorgaans zijn gereserveerd voor traditioneel grote taalmodel Post/voortdurende training, “schreef Cogito in zijn blogpost.” In de toekomst onderzoeken we complementaire naderlijke benaderingen voor zelfverbetering. “

Volgens de aanmeldingen bij California State werd de Deep Cogito in San Francisco in juni 2024 opgericht. De LinkedIn-pagina van het bedrijf geeft twee mede-oprichters, Drishan Arora en Dhruv Malhotra. Malhotra was voorheen productmanager bij Google AI Lab Deepmind, waar hij werkte aan generatieve zoektechnologie. Arora was een senior software -ingenieur bij Google.

Deep Cogito, wiens backers South Park Commons omvatten, volgens Pitchbook, wil ambitieus ‘algemene superintelligence’ bouwen. De oprichters van het bedrijf begrijpen de uitdrukking als AI die taken beter kan uitvoeren dan de meeste mensen en “onthullen volledig nieuwe mogelijkheden die we nog moeten voorstellen.”

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in