Înapoi la știri

Anthropic lansează Claude Opus 4.7: Cum să îl încerci, benchmark-uri, siguranță

4 ore în urmă
6 minute min
Elena Dumitrescu
Anthropic lansează Claude Opus 4.7: Cum să îl încerci, benchmark-uri, siguranță

Anul 2026 a fost unul plin de noutăți pentru Anthropic, care a anunțat joi lansarea modelului Claude Opus 4.7. Acest model reprezintă cea mai inteligentă variantă disponibilă publicului larg. Conform unui comunicat de presă, Opus 4.7 nu este la fel de puternic ca Claude Mythos, considerat prea periculos pentru a fi lansat public, potrivit mashable.com.

👉 Disponibilitatea și utilizarea modelului Claude Opus 4.7

Claude Opus este o familie de modele hibride de raționare capabile de raționare în mai multe etape și codare avansată. Până la anunțul lui Claude Mythos pe 7 aprilie, Claude Opus era considerat cea mai avansată serie de modele AI ale Anthropic.

👉 Beneficii și performanțe îmbunătățite ale lui Claude Opus 4.7

Claude Opus 4.7 este disponibil acum prin intermediul Claude AI, al API-ului Claude și al partenerilor Anthropic, precum Microsoft Foundry. Prețul noului model este același cu cel al lui Claude Opus 4.6. Cu toate acestea, Anthropic a menționat că, deoarece "Opus 4.7 gândește mai mult la niveluri mai înalte de efort", acesta utilizează mai multe token-uri de ieșire decât predecesorul său. Utilizatorii pot citi mai multe despre cum să optimizeze utilizarea token-urilor în ghidul de migrare pentru Opus 4.7.

După cum era de așteptat, Claude Opus 4.7 oferă capabilități îmbunătățite pe toate planurile. În special, Anthropic susține că Opus 4.7 este mai performant în sarcini avansate de codare, inteligență vizuală și analiză de documente. De asemenea, opțiunea 4.7 este "mai rafinată și creativă în finalizarea sarcinilor profesionale, generând interfețe, prezentări și documente de o calitate superioară".

"Utilizatorii raportează că pot delega cele mai dificile sarcini de codare — cele care necesitau anterior o supraveghere atentă — lui Opus 4.7 cu încredere. Opus 4.7 gestionează sarcini complexe, de lungă durată cu rigurozitate și consistență, acordând o atenție precisă instrucțiunilor și concepând modalități de a verifica propriile rezultate înainte de a le raporta," se menționează într-o postare pe blogul Anthropic.

👉 Performanța benchmark și comparații ale Claude Opus 4.7

Anthropic a publicat un card detaliat al modelului care evidențiază cum se compară Claude Opus 4.7 cu alte modele Anthropic și cu modelele de vârf de la OpenAI, Google și xAI. Opus 4.7 este în urmă față de Claude Mythos, care, conform Anthropic, a obținut scoruri semnificativ mai mari la benchmark-uri comune, cum ar fi Examenul Ultim al Umanității. "Claude Opus 4.7 este mai puțin capabil decât Claude Mythos Preview pe fiecare axă relevantă pe care am măsurat-o și nu avansează frontierele noastre de capabilități," se arată în cardul modelului.

Acest lucru înseamnă că Claude Opus 4.7 nu este o dovadă că dezvoltarea AI a accelerat dincolo de liniile de tendință existente. La Examenul Ultim al Umanității (fără instrumente), Anthropic raportează că Claude Opus 4.7 depășește toate celelalte modele de vârf, cu excepția lui Claude Mythos.

  • Claude Mythos a obținut 56.8% la HLE
  • Claude Opus 4.7 a obținut 46.9%
  • Gemini 3.1 Pro a obținut 44.4%
  • GPT-5-4 Pro a obținut 42.7%
  • Claude Opus 4.6 a obținut 40.0%

Cu instrumente, GPT-5-4 Pro a obținut 58.7% comparativ cu 54.7% pentru Opus 4.7. Mythos i-a depășit pe amândoi cu 64.7%. Mashable nu a verificat independent aceste rezultate de benchmark. Rezultatele complete sunt disponibile în cardul modelului Opus 4.7. Credit: Anthropic

În general, Anthropic a clasificat Opus 4.7 peste alte modele de vârf în unele benchmark-uri, deși Gemini 3.1 Pro și GPT-5-4 au obținut scoruri mai mari în anumite domenii.

👉 Siguranța și comportamentul lui Claude Opus 4.7

Anthropic raportează, de asemenea, că Opus 4.7 prezintă un risc scăzut de comportamente aliniate greșit, având un profil de risc similar cu cel al lui Opus 4.6. De exemplu, Anthropic afirmă că Opus 4.7 este mai puțin predispus să aibă halucinații și prezintă rate mai scăzute de hacking al recompenselor.

"Claude Opus 4.7 este mai sincer decât Opus 4.6 sau Sonnet 4.6, cu reduceri mari în rata omisiunilor importante și îmbunătățiri moderate în factualitate și ratele de intrare halucinată," se menționează în cardul modelului.

Dorești să înveți mai multe despre cum să obții cele mai bune rezultate de la tehnologia ta? Rămâi la curent!

Alte postari din Economie
Economie

Planul de revenire al Nissan: AI, hibride și întoarcerea modelului Xterra

Nissan s-a confruntat cu dificultăți bine documentate, dar directorul executiv Ivan Espinosa are un plan pentru a schimba lucrurile. La evenimentul "Nissan Vision" de la sediul companiei din Yokohama, Japonia, producătorul auto a împărtășit noi detalii despre cum intenționează să își redreseze activitatea.

Economie

Prețul petrolului crește cu 7% din cauza blocadei din Hormuz; 3 acțiuni de cumpărat acum

Prețurile petrolului au crescut cu 7%, după ce președintele Trump a ordonat o blocadă a Strâmtorii Hormuz, restricționând oferta globală. În același timp, petrolierele goale destinate inițial Orientului Mijlociu s-au redirecționat către porturile de pe Coasta Golfului din SUA, achiziționând țiței american și sprijinind producătorii locali.

Acasa Recente Radio Județe