Le pedí a GPT Imagen 2.0 que creara una tabla de referencia de opus 4.7 vs gpt 5.5.


Ese modelo de imagen mejoró mucho.
GPT-5.5 gana en la tabla de puntuaciones principal. Pero mira más de cerca.
OSWorld 78.7 vs 78.0. GDPval 84.9 vs 80.3. Toolathlon 55.6 vs 54.6 (más de 5.4, no Opus).
Opus todavía mantiene SWE-Bench Pro, MCP Atlas, GPQA Diamond, HLE sin herramientas.
OpenAI obtiene el cinturón general. Anthropic mantiene la corona de codificación. En papel.
Ver originales
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado