Qué tiene de nuevo Chat GPT 4

Ya tenemos aquí la nueva versión de Chat GPT. Esta vez toca la GPT-4. Si aún no has pillado el tren de la AI y quieres subirte a él, de repente verás que hay una nueva versión y te preguntarás si vale la pena o no usarla. Primero de todo, avisar de que no todo el mundo puede acceder a Chat GPT 4. Básicamente porque está aún en versión de pruebas (beta) y falta un tiempo para que se decidan a ofrecerla de manera extensiva a todos los usuarios.

Yo sí tengo acceso a Chat GPT 4 y te cuento ahora lo que he visto de diferente y lo que hace esta nueva versión.

Novedades Chat GPT 4

Índice de contenidos

1. GPT-4 puede ver y entender imágenes

La cambio más notable en este sistema versátil de aprendizaje automático es que es “multimodal”, lo que significa que puede entender más de una “modalidad” de información. ChatGPT y GPT-3 se limitaban al texto: podían leer y escribir, pero eso era todo (aunque era suficiente para muchas aplicaciones).

Sin embargo, GPT-4 puede recibir imágenes y procesarlas para encontrar información relevante. Por supuesto, uno podría simplemente pedirle que describa lo que hay en una imagen, pero lo más importante es que su comprensión va más allá de eso. El ejemplo proporcionado por OpenAI lo tiene explicando el chiste en una imagen de un conector de iPhone increíblemente grande y divertido, pero la asociación con Be My Eyes, una aplicación utilizada por personas ciegas y con baja visión para permitir que voluntarios describan lo que ve su teléfono, es más reveladora.

2. Es más difícil de engañar a GPT-4

Los chatbots de hoy en día aún tienden a desviarse fácilmente. Un poco de persuasión puede hacer que crean que simplemente están explicando lo que haría una “mala IA”, u otra pequeña ficción que permite al modelo decir todo tipo de cosas extrañas y francamente inquietantes. Incluso las personas colaboran en provocaciones de “jailbreak” que rápidamente permiten que ChatGPT y otros salgan de sus “jaulas” y digan cosas que en principio no deberían decir.

Por otro lado, GPT-4 ha sido entrenado en una gran cantidad de provocaciones maliciosas, que los usuarios amablemente proporcionaron a OpenAI en el último año o dos. Con esto en mente, el nuevo modelo es mucho mejor que sus predecesores en “factualidad, capacidad de dirección y capacidad para no salirse de los límites”.

Como lo describe OpenAI, GPT-3.5 (que impulsó a ChatGPT) fue una “prueba” de una nueva arquitectura de entrenamiento, y aplicaron las lecciones aprendidas de esa prueba a la nueva versión, que fue “sin precedentes estable”. También pudieron predecir mejor sus capacidades, lo que significa menos sorpresas.

3. GPT-4 tiene más memoria

Estos grandes modelos de lenguaje se entrenan en millones de páginas web, libros y otros datos de texto, pero cuando están realmente teniendo una conversación con un usuario, hay un límite en cuanto a cuánto pueden mantener “en mente”. Ese límite con GPT-3.5 y la versión antigua de ChatGPT era de 4.096 “tokens”, lo que equivale a alrededor de 8.000 palabras, o aproximadamente cuatro o cinco páginas de un libro. Así que más o menos perdía el hilo de las cosas después de que pasaban tan lejos en su función de atención.

GPT-4 tiene un recuento máximo de tokens de 32.768, que es 2^15, si te preguntas por qué el número te resulta familiar. Eso se traduce en alrededor de 64.000 palabras o 50 páginas de texto, suficientes para una obra completa o un cuento.

Esto significa que en una conversación o en la generación de texto, podrá mantener alrededor de 50 páginas en mente. Así que recordará de qué hablaste hace 20 páginas de chat, o, al escribir una historia o ensayo, puede hacer referencia a eventos que ocurrieron hace 35 páginas. Esa es una descripción muy aproximada de cómo funciona el mecanismo de atención y el recuento de tokens, pero la idea general es de una memoria expandida y las capacidades que la acompañan.

4. Es más “multilingüe”

El inglés es el idioma dominante en el mundo de las inteligencias artificiales. Los datos, la documentación, todo está en inglés. Pero por supuesto, las capacidades de los grandes modelos de lenguaje son aplicables en cualquier idioma escrito y deberían estar disponibles en esos idiomas.

GPT-4 da un paso hacia esto al demostrar que es capaz de responder miles de preguntas de opción múltiple con alta precisión en 26 idiomas, desde el italiano hasta el ucraniano y el coreano. Se desempeña mejor en los idiomas romances y germánicos, pero se generaliza bien a otros.

Esta prueba inicial de las capacidades de lenguaje es prometedora pero está lejos de ser una aceptación completa de las capacidades multilingües; los criterios de prueba se tradujeron del inglés para empezar, y las preguntas de opción múltiple no representan realmente el habla cotidiana. Pero lo hizo un gran trabajo en algo para lo que no fue entrenado específicamente, lo que habla de la posibilidad de que GPT-4 sea mucho más amigable para los hablantes de otros idiomas que no sean el inglés.

5. GPT-4 tiene más personalidades

“Steerability” es un concepto interesante del mundo de las inteligencias artificiales, que se refiere a su capacidad para cambiar su comportamiento bajo demanda. Esto puede ser útil, como cuando adopta el papel de un oyente comprensivo, o peligroso, como cuando las personas convencen al modelo de que es malvado o está deprimido.

GPT-4 integra la steerability de manera más nativa que GPT-3.5, y los usuarios podrán cambiar la “personalidad clásica de ChatGPT con una verbosidad, tono y estilo fijos” a algo más adecuado a sus necesidades. “Dentro de ciertos límites”, señala rápidamente el equipo, y señala esto como la forma más fácil de hacer que el modelo rompa el personaje.

Esto podría lograrse de alguna manera al preparar al chatbot con mensajes como “Pretende que eres un DM en un RPG de mesa” o “Responde como si fueras una persona siendo entrevistada para las noticias de la tele”. Pero en realidad, solo estabas haciendo sugerencias a la personalidad “predeterminada” de GPT-3.5. Ahora, los desarrolladores podrán incorporar una perspectiva, estilo conversacional, tono o método de interacción desde el principio.

Cómo probar Chat GPT 4

Si quieres probar esta nueva versión (aunque aún parece que no tenemos acceso a la funcionalidad de reconocimiento y comprensión de imágenes), tendrás que tener una suscripción de Chat GPT. Entonces te dejarán poder interactuar con la nueva versión aunque de momento de forma limitada.

De todos modos, ahora mismo te recomiendo seguir con Chat GPT 3.5 que es la versión que tenemos activa y oficialmente ahora, tanto de manera gratuita como si eres suscritor, e ir interactuando con la nueva versión a medida que se haga más “oficial” y menos “beta”. Es decir, para lo que puedes usar Chat GPT ahora mismo a nivel de trabajo y vida cotidiana, te vale con la versión 3.5 y no hace falta que saltes a la 4 hasta que esté más adelantada.

Nuevo: Curso Chat GPT

No hay nada como experimentar para darse cuenta de que Chat GPT tiene un potencial brutal, no en vano hay empresas que están buscando a “prompt engineers”, que sería traducido como “ingenieros de indicaciones” para crear bibliotecas de indicaciones que el usuario final pueda utilizar. Porque si bien usar Chat GPT es tan fácil como crear una cuenta y empezar a hablar, conseguir buenas respuestas requiere de un entendimiento sobre cómo funciona, cierto espíritu hacker y ganas de descubrir nuevos usos de la inteligencia artificial de manera constante.

Recuerda, mi Curso de Chat GPT está en promoción ahora mismo, por solo 37€.

Ya ves que lo podría vender por mucho más 🙂