Se acerca el segundo cumpleaños de ChatGPT, y hasta el propio Sam Altman se hizo eco de ello y planteó la llegada de un posible "regalo de cumpleaños". Una reciente filtración hace que tengamos potenciales detalles sobre ese regalo, y hay buenas noticias (nuevo gran modelo) y malas noticias (que no será revolucionario). Veámoslo.
Orion. Así se llama el nuevo gran modelo de IA de OpenAI. Así lo indican empleados de la empresa en comentarios filtrados en The Information. La noticia llega poco antes de que se produzca el segundo aniversario del lanzamiento de ChatGPT, el 30 de noviembre de 2022. Como indican en TechCrunch, OpenAI negó tener previsto lanzar un modelo llamado Orion este año.
Expectativas a la baja. Dichos empleados han probado el nuevo modelo y han descubierto algo preocupante: su rendimiento es mejor que el de los modelos existentes de OpenAI, pero el salto es mejor del que hubo entre GPT-3 y GPT-4 o incluso al llamativo GPT-4o.
Cómo se enfrentan al problema. La relativa versión "evolucionaria" de ChatGPT parece haber hecho que en OpenAI busquen formas alternativas de mejorarlo. Por ejemplo entrenando Orion con datos sintéticos producidos por sus propios modelos, y también puliéndolo más en el proceso inmediatamente posterior al entrenamiento.
Desaceleración de la IA. De confirmarse ese dato, estaríamos ante una prueba clara de cómo el ritmo de mejoras en los modelos de IA generativa se ha reducido notablemente. El salto de GPT-2 a GPT-3 fue colosal, y también fue muy sensible el que vimos entre GPT-3 y GPT-4, pero el incremento de prestaciones en Orion (¿GPT-5?) parece que puede no ser el que muchos esperarían.
Sam Altman y sus afirmaciones. Eso además contrastaría con el optimismo desaforado del CEO de OpenAI, Sam Altman, que hace pocas semanas indicaba que estábamos a "miles de días de una superinteligencia". Su mensaje era lógico, ya que buscaba cerrar una colosal ronda de inversión, pero también era preocupante: si las expectativas empiezan a convertirse en promesas incumplidas, los inversores podrían retirar el apoyo que ahora están dando a la empresa.
Pero es que ya son muy buenos. En realidad esa desaceleración es razonable: los modelos son realmente buenos ya en muchos ámbitos, y aunque siguen cometiendo errores e inventando cosas, lo hacen cada vez menos y además estamos más concienciados sobre hasta qué punto podemos fiarnos de sus respuestas. En ámbitos como la programación, por ejemplo, parece que Orion no será especialmente superior a su predecesor.
¿Y ahora, qué? Esa desaceleración de la IA plantea no obstante otras oportunidades que ya estamos vislumbrando. Si los modelos logran pulirse lo suficiente para que nos fiemos más de ellos, los futuros agentes de IA podrán ser un nuevo impulso para este tipo de funciones.
Ver 8 comentarios
8 comentarios
p2dzca
(..., pero el salto es mejor del que hubo ...: supongo que querías decir 'menor')
Se sabe que el entrenamiento con datos sintéticos producen el llamado colapso de los modelos de IA:
Model collapse explained: How synthetic training data breaks AI
https://www.techtarget.com/whatis/feature/Model-collapse-explained-How-synthetic-training-data-breaks-AI
Mejorar los actuales modelos de LLM es muy complicado.
The more sophisticated AI models get, the more likely they are to lie
https://arstechnica.com/science/2024/10/the-more-sophisticated-ai-models-get-the-more-likely-they-are-to-lie/
Usuario desactivado
"[...]entrenando Orion con datos sintéticos producidos por sus propios modelos[...]"
Como suele decirse en Estadística, "procesa basura y obtendrás basura procesada" :-)
drzog
Si la IA crece rápido, es preocupante. Si la IA desacelera, es preocupante. Os deberíais de preocupar más por ser un poco menos sensacionalistas.
santuxi
Tambien hay que decir, que no podemos hacer que crezca a este nivel, habría que ponerle un poco de freno o límite, ya esta pasando que muchas empresas el personal de Helpdesk, propios desarrolladores, o gente de ventas estan siendo despedidos porque la IA realiza tareas muy profesionales.
A día de hoy yo lo uso a diario basicamente por no usar Google y comerte 47 webs de contenido, mas cookies mas anuncios, y suele acertar bastante, lo proximo es decirle que coja el puntero y lo haga él.
Por lo tanto y viendo lo rapido que ha crecido veo bastante normal que no haya un incremento tan notorio, ya es muy bueno, esto es como los móviles, no pueden sacar a día de hoy nada que digas WOWWW, sacarán gadget de tipo gafas, relojes, anillos para complementar lo que a día de hoy es un PEPINO de telefono, desde un s24 ultra, iphone 15 o cualquier trasto de 200 euros de alixpress ya es MUY bueno y hace funciones que hace años eran inviables.
alexkult
Y que tal el consumo? Quizas la mejora es para openAi teniendo menos gasto...no se, pregunto
ultraverse
Parece que la etapa de incrementos marginales en los resultados llegó muy temprano. Con esto, más la bronca que llevan con Microsoft (y si no logran recaudar más capital fresco, hablaban de US$ 10,000 M), ya pueden ir pensando en vender la empresa a ¿Elon Musk?