Empleados de OpenAI acusan públicamente que los resultados de las pruebas de referencia del último modelo de IA de xAI, Grok3, son engañosos
Recientemente, un empleado de OpenAI acusó públicamente a la empresa xAI de Elon Musk de publicar resultados engañosos en pruebas de referencia para su último modelo de IA, Grok3. En respuesta, Igor Babushkin, cofundador de xAI, insistió en que no hubo ninguna irregularidad.
El gráfico de xAI muestra que dos versiones de Grok3 - Grok3 Reasoning Beta y Grok3 mini Reasoning - superaron al modelo actualmente más fuerte disponible de OpenAI, o3-mini-high, en AIME 2025. Sin embargo, un empleado de OpenAI señaló rápidamente en la plataforma X que el gráfico de xAI no incluía la puntuación de o3-mini-high bajo la condición "cons@64" en AIME 2025.
En la plataforma X, Babushkin argumentó que OpenAI también había publicado en el pasado gráficos de referencia engañosos similares. A pesar de que estos gráficos se utilizaban para comparar el rendimiento de sus propios modelos.
Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.
También te puede gustar
Tim Draper predice que el precio de Bitcoin alcanzará los $250,000 para fin de año
Wyoming emitirá la primera stablecoin a nivel estatal en EE. UU. en julio
Grayscale transfiere 9,843 ETH por un valor de más de $24 millones
El LAUNCHCOIN de un usuario pasó de cero a 2,7 millones de dólares en 3 meses
En tendencia
MásPrecios de las criptos
Más








