La semana pasada, Openai introducido GPT-4.5, su modelo fronterizo más grande hasta la fecha. Operai afirmó que GPT-4.5 es el modelo más conocedor hasta ahora y que se construyó al ampliar aún más el proceso de pre-entrenamiento. Además de tener más conocimiento, el modelo GPT-4.5 presenta habilidades de escritura mejoradas y una personalidad refinada en comparación con los modelos más antiguos de OpenAI.
Hoy, el modelo GPT-4.5 hizo su debut en Chatbot Arena con la posición #1 en la mayoría de las categorías. GPT-4.5 encabezó las siguientes categorías, con un cable claro en múltiples vueltas. GPT-4.5 también lidera en la tabla de clasificación de control de estilo.
- Múltiple
- Indicaciones duras
- Codificación
- Matemáticas
- Escritura creativa
- Instrucción siguiente
- Consulta más larga
El último de Xai Modelo GROK-3 (Grok-3-Preview-02-24) también hizo su debut en la clasificación de la arena con la posición #1 sobre indicaciones duras (inglés) y empatado #1 en general, y en codificación, matemáticas, escritura creativa, seguimiento de instrucciones y consultas más largas. Las mejoras rápidas exhibidas por GPT-4.5 y Grok-3 destacan la competencia intensificadora dentro del panorama de IA.
El GPT-4.5 de Openai ha superado varios otros puntos de referencia de IA. Anotó el #1 en el punto de referencia del juego de eliminación. El juego de eliminación es un torneo de múltiples jugadores que prueba los LLM en razonamiento social, estrategia y engaño. En las clasificaciones de puntaje de prueba de IQ, GPT-4.5 funcionó mejor que todos los otros modelos que no son de condición en la industria. En el punto de referencia de tasa de alucinación Simpleqa, GPT-4.5 obtuvo el más bajo entre todos los modelos de idiomas grandes de OpenAI.
El mes pasado, el CEO de Operai, Sam Altman reveló Ese GPT-4.5 es el último modelo de pensamiento de pensamiento de Openai. Además, Operai ya no lanzará O3 como un modelo independiente. En su lugar, OpenAI unificará los modelos O-Series y GPT-Series mediante la creación de sistemas que pueden determinar el tiempo de pensamiento apropiado en función de la consulta del usuario.
Sam Altman también confirmó que incluso los usuarios de nivel gratuito de ChatGPT tendrán acceso a GPT-5, pero bajo la configuración de inteligencia estándar. Los suscriptores de ChatGPT Plus podrán ejecutar GPT-5 en un nivel más alto de inteligencia, mientras que los suscriptores profesionales podrán ejecutar GPT-5 en un nivel aún más alto de inteligencia. Además, el modelo unificado admitirá todas las características de ChatGPT existentes, como voz, lienzo, búsqueda, investigación profunda y más.