Înapoi la știri

Anthropic lansează Claude Opus 4.7: Cum să îl încerci, benchmark-uri, siguranță

18 Apr 2026
6 minute min
Elena Dumitrescu

Anul 2026 a fost unul plin de noutăți pentru Anthropic, care a anunțat joi lansarea modelului Claude Opus 4.7. Acest model reprezintă cea mai inteligentă variantă disponibilă publicului larg. Conform unui comunicat de presă, Opus 4.7 nu este la fel de puternic ca Claude Mythos, considerat prea periculos pentru a fi lansat public, potrivit mashable.com.

👉 Disponibilitatea și utilizarea modelului Claude Opus 4.7

Claude Opus este o familie de modele hibride de raționare capabile de raționare în mai multe etape și codare avansată. Până la anunțul lui Claude Mythos pe 7 aprilie, Claude Opus era considerat cea mai avansată serie de modele AI ale Anthropic.

👉 Beneficii și performanțe îmbunătățite ale lui Claude Opus 4.7

Claude Opus 4.7 este disponibil acum prin intermediul Claude AI, al API-ului Claude și al partenerilor Anthropic, precum Microsoft Foundry. Prețul noului model este același cu cel al lui Claude Opus 4.6. Cu toate acestea, Anthropic a menționat că, deoarece "Opus 4.7 gândește mai mult la niveluri mai înalte de efort", acesta utilizează mai multe token-uri de ieșire decât predecesorul său. Utilizatorii pot citi mai multe despre cum să optimizeze utilizarea token-urilor în ghidul de migrare pentru Opus 4.7.

După cum era de așteptat, Claude Opus 4.7 oferă capabilități îmbunătățite pe toate planurile. În special, Anthropic susține că Opus 4.7 este mai performant în sarcini avansate de codare, inteligență vizuală și analiză de documente. De asemenea, opțiunea 4.7 este "mai rafinată și creativă în finalizarea sarcinilor profesionale, generând interfețe, prezentări și documente de o calitate superioară".

"Utilizatorii raportează că pot delega cele mai dificile sarcini de codare — cele care necesitau anterior o supraveghere atentă — lui Opus 4.7 cu încredere. Opus 4.7 gestionează sarcini complexe, de lungă durată cu rigurozitate și consistență, acordând o atenție precisă instrucțiunilor și concepând modalități de a verifica propriile rezultate înainte de a le raporta," se menționează într-o postare pe blogul Anthropic.

👉 Performanța benchmark și comparații ale Claude Opus 4.7

Anthropic a publicat un card detaliat al modelului care evidențiază cum se compară Claude Opus 4.7 cu alte modele Anthropic și cu modelele de vârf de la OpenAI, Google și xAI. Opus 4.7 este în urmă față de Claude Mythos, care, conform Anthropic, a obținut scoruri semnificativ mai mari la benchmark-uri comune, cum ar fi Examenul Ultim al Umanității. "Claude Opus 4.7 este mai puțin capabil decât Claude Mythos Preview pe fiecare axă relevantă pe care am măsurat-o și nu avansează frontierele noastre de capabilități," se arată în cardul modelului.

Acest lucru înseamnă că Claude Opus 4.7 nu este o dovadă că dezvoltarea AI a accelerat dincolo de liniile de tendință existente. La Examenul Ultim al Umanității (fără instrumente), Anthropic raportează că Claude Opus 4.7 depășește toate celelalte modele de vârf, cu excepția lui Claude Mythos.

  • Claude Mythos a obținut 56.8% la HLE
  • Claude Opus 4.7 a obținut 46.9%
  • Gemini 3.1 Pro a obținut 44.4%
  • GPT-5-4 Pro a obținut 42.7%
  • Claude Opus 4.6 a obținut 40.0%

Cu instrumente, GPT-5-4 Pro a obținut 58.7% comparativ cu 54.7% pentru Opus 4.7. Mythos i-a depășit pe amândoi cu 64.7%. Mashable nu a verificat independent aceste rezultate de benchmark. Rezultatele complete sunt disponibile în cardul modelului Opus 4.7. Credit: Anthropic

În general, Anthropic a clasificat Opus 4.7 peste alte modele de vârf în unele benchmark-uri, deși Gemini 3.1 Pro și GPT-5-4 au obținut scoruri mai mari în anumite domenii.

👉 Siguranța și comportamentul lui Claude Opus 4.7

Anthropic raportează, de asemenea, că Opus 4.7 prezintă un risc scăzut de comportamente aliniate greșit, având un profil de risc similar cu cel al lui Opus 4.6. De exemplu, Anthropic afirmă că Opus 4.7 este mai puțin predispus să aibă halucinații și prezintă rate mai scăzute de hacking al recompenselor.

"Claude Opus 4.7 este mai sincer decât Opus 4.6 sau Sonnet 4.6, cu reduceri mari în rata omisiunilor importante și îmbunătățiri moderate în factualitate și ratele de intrare halucinată," se menționează în cardul modelului.

Dorești să înveți mai multe despre cum să obții cele mai bune rezultate de la tehnologia ta? Rămâi la curent!

Alte postari din Economie
Economie

Argumentele Curții Supreme subliniază că amenzile FCC sunt „neobligatorii”

Argumentele Curții Supreme au clarificat că amenzile impuse de FCC (Comisia Federală de Comunicații) sunt „neobligatorii” dacă nu sunt confirmate de un juriu. În acest context, AT&T și Verizon contestă sistemul FCC, susținând că acesta le-a încălcat dreptul la un proces cu juriu.

Economie

Aeroporturile se pregătesc să rămână fără combustibil pentru avioane din cauza războiului din Iran

Sezonul de călătorii de vară părea deja nefavorabil, dar pregătește-te: ar putea deveni și mai rău. Pe lângă tarifele mai mari și taxele în urma războiului din Iran, companiile aeriene din Europa și Asia, multe dintre care depind de combustibilul pentru avioane importat, se confruntă acum cu o potențială penurie, ceea ce crește șansele anulării zborurilor și reducerii programului.

Economie

Suspiciuni de tranzacționare internă în timpul președinției lui Trump

Conform bbc.com, în timpul celui de-al doilea mandat al președintelui american Donald Trump, traderii au pariat milioane de dolari cu puțin timp înainte de anunțurile sale majore. O analiză a datelor privind volumul tranzacțiilor a relevat un model consistent de creșteri ale activității comerciale înainte de postările pe rețelele sociale sau interviurile media ale președintelui.

Acasa Recente Radio Județe