Un modelo chino de IA supera a Claude Opus 4.7 y GPT-5.5 en tareas agentivas por 9 veces menos coste
Qwen 3.7-Max de Alibaba ha superado a Claude Opus 4.7 y GPT-5.5 en un benchmark agentivo real: escribir un bot de Tetris que se entrena a si mismo en 10 iteraciones. Qwen logro una mejora del 56% por solo 1,32 dolares, mientras Claude consiguio un 28% por 12,15 dolares. GPT-5.5 quedo eliminado.
El modelo chino que nadie esperaba ganar
Un benchmark publicado por Atomic Chat ha generado un gran revuelo: Qwen 3.7-Max de Alibaba ha derrotado a Claude Opus 4.7 y GPT-5.5 en una tarea agentiva real, a una fraccion del coste.
La prueba: un bot de Tetris que se entrena a si mismo
Cada modelo tenia que escribir un bot de Tetris capaz de leer su propio codigo, ejecutar benchmarks y reescribirse en 10 iteraciones. Al final, los tres bots se enfrentaron cara a cara.
Resultados:
- Qwen 3.7-Max: ,32 de coste — mejora del +56%
- Claude Opus 4.7: 2,15 de coste — mejora del +28%
- GPT-5.5: ,85 de coste — mejora del +7% (eliminado)
Qwen gano en todo: mayor salto, 9 veces mas barato que Claude, 2 veces mas barato que GPT.
Que es Qwen 3.7-Max
Es el modelo flagship de Alibaba lanzado el 19 de mayo de 2026, disenado para la era de los agentes:
- 1 millon de tokens de contexto
- Ejecucion autonoma de hasta 35 horas
- Mas de 1.000 llamadas a herramientas sin perder el hilo
- Precio: ,50/M tokens (vs 5/M de Claude Opus)
- Compatible con la API de Anthropic de forma nativa
El dato que lo explica todo
Este resultado no es un caso aislado. Los modelos chinos ya consumen el 61% del trafico global de tokens. La brecha de rendimiento entre los mejores modelos americanos y chinos es de solo 2,7 puntos porcentuales, a pesar de que EEUU invierte 23 veces mas en IA.
Para tareas agentivas con muchas iteraciones, Qwen 3.7-Max es hoy una alternativa seria — y mucho mas barata — a los grandes labs americanos.
¿Te ha gustado esta noticia? No te pierdas las siguientes
Suscríbete gratis y recibe cada semana las noticias más importantes de IA en tu correo.
Comentarios(0)
Sé el primero en comentar.