Hace cuatro meses, una pequeña empresa de San Francisco se convirtió en el tema de conversación de la industria tecnológica cuando presentó un nuevo chatbot en línea que puede responder preguntas complejas, escribir poesía e incluso imitar las emociones humanas.
Ahora, la empresa está de vuelta con una nueva versión de la tecnología que impulsa sus chatbots. El sistema subirá la apuesta en la carrera de Silicon Valley para adoptar la inteligencia artificial y decidir quién será la próxima generación de líderes de la industria tecnológica.
OpenAI, que tiene alrededor de 375 empleados pero está respaldada por miles de millones de dólares en inversiones de Microsoft y luminarias de la industria, dijo el martes que lanzó una tecnología que llama GPT-4. Está diseñado para ser el motor principal que impulsa los chatbots y todo tipo de otros sistemas, desde motores de búsqueda hasta tutores personales en línea.
La mayoría de las personas usará esta tecnología a través de una nueva versión del chatbot ChatGPT de la compañía, mientras que las empresas la incorporarán en una amplia variedad de sistemas, incluido el software comercial y los sitios web de comercio electrónico. La tecnología ya impulsa el chatbot disponible para un número limitado de personas que utilizan el motor de búsqueda Bing de Microsoft.
El progreso de OpenAI en solo unos meses ha puesto a la industria tecnológica en uno de sus momentos más impredecibles en décadas. Muchos líderes de la industria creen que el desarrollo de la IA representa un cambio tecnológico fundamental tan importante como la creación de los navegadores web a principios de la década de 1990. La rápida mejora asombró a los informáticos.
GPT-4, que aprende sus habilidades mediante el análisis de grandes cantidades de datos recopilados de Internet, mejora lo que impulsó al ChatGPT original de varias maneras. Es más preciso Puede, por ejemplo, manejar el examen de la barra unificada, calcular instantáneamente la responsabilidad fiscal de alguien y proporcionar descripciones de imágenes detalladas.
Pero la nueva tecnología de OpenAI todavía tiene algunos de los extraños defectos humanos que han desconcertado a los expertos de la industria y a las personas que han trabajado con los últimos chatbots. Es un experto en algunos temas y un diletante en otros. Puede hacerlo mejor en las pruebas estandarizadas que la mayoría de las personas y ofrecer consejos médicos precisos a los médicos, pero también puede estropear la aritmética básica.
Las empresas que apuestan su futuro por la tecnología pueden, al menos por ahora, tener que soportar las imprecisiones que durante mucho tiempo han sido tabú en una industria construida desde cero sobre la idea de que las computadoras son más exigentes que sus creadores humanos.
“No quiero que suene como si hubiéramos descubierto la lógica o la inteligencia, lo que ciertamente no hemos hecho”, dijo Sam Altman, director ejecutivo de OpenAI, en una entrevista. “Pero es un gran paso adelante de lo que ya existe”.
Es probable que otras empresas de tecnología incorporen características de GPT-4 en una gama de productos y servicios, incluido el software de Microsoft para realizar tareas comerciales y sitios de comercio electrónico que desean brindar a los clientes nuevas formas de probar virtualmente sus productos. Varios gigantes de la industria, como Google y la empresa matriz de Facebook, Meta, también están trabajando en sus propios chatbots y tecnología de IA.
ChatGPT y tecnologías similares ya están cambiando el comportamiento de los estudiantes y educadores que intentan determinar si las herramientas deben adoptarse o prohibirse. Como los sistemas pueden escribir programas informáticos y realizar otras tareas comerciales, también están a punto de cambiar la naturaleza del trabajo.
Incluso los sistemas más impresionantes tienden a complementar a los trabajadores calificados en lugar de reemplazarlos. Los sistemas no se pueden utilizar en lugar de médicos, abogados o contadores. Todavía se necesitan expertos para detectar sus errores. Pero pronto podrían reemplazar a algunos asistentes (cuyo trabajo es revisado y editado por abogados capacitados), y muchos expertos en inteligencia artificial creen que reemplazarán a los trabajadores que moderan el contenido en Internet.
“Definitivamente hay una interrupción, lo que significa que algunos trabajos están desapareciendo y se están creando nuevos”, dijo Greg Brockman, presidente de OpenAI. “Pero creo que el efecto neto es que las barreras de entrada se reducen y la productividad de los expertos aumenta”.
El martes, OpenAI comenzó a vender acceso a GPT-4 para que las empresas y otros desarrolladores de software puedan crear sus propias aplicaciones. La compañía también está utilizando la tecnología para construir una nueva versión de su popular chatbot, que está disponible para cualquiera que compre acceso a ChatGPT Plus, un servicio de suscripción de $20 al mes.
Varias empresas ya están trabajando con GPT-4. Morgan Stanley Wealth Management está construyendo un sistema que extraerá instantáneamente información de los documentos de la empresa y otros registros y se la proporcionará a los analistas financieros en prosa conversacional. Khan Academy, una empresa de aprendizaje en línea, utiliza tecnología para crear un tutor automatizado.
“Esta nueva tecnología puede actuar más como un educador”, dijo el CEO y fundador de Khan Academy, Sal Khan. “Queremos enseñar al estudiante nuevas técnicas mientras el estudiante hace la mayor parte del trabajo”.
Al igual que tecnologías similares, el nuevo sistema a veces “alucina”. Genera información completamente falsa sin previo aviso. Preguntar sobre sitios web que presentan las últimas investigaciones sobre el cáncer puede generar varias direcciones de Internet que no existen.
GPT-4 es una red neuronal, un tipo de sistema matemático que aprende habilidades mediante el análisis de datos. Es la misma tecnología que usan los asistentes digitales como Siri para reconocer los comandos hablados y los autos autónomos para identificar a los peatones.
Alrededor de 2018, empresas como Google y OpenAI comenzaron a construir redes neuronales que aprendían de grandes cantidades de texto digital, incluidos libros, artículos de Wikipedia, registros de chat y otra información publicada en Internet. Estos se denominan modelos de lenguaje grande o LLM.
Al identificar miles de millones de patrones a lo largo de este texto, los LLM aprenden a generar texto ellos mismos, incluidos tweets, poemas y programas de computadora. OpenAI lanzó más y más datos en su LLM. La compañía esperaba que más datos significaran mejores respuestas.
OpenAI también está refinando esta tecnología utilizando los comentarios de evaluadores humanos. A medida que las personas probaban ChatGPT, evaluaban las respuestas del chatbot, separando las que eran útiles y veraces de las que no lo eran. Luego, utilizando una técnica llamada aprendizaje de refuerzo, el sistema pasó meses analizando esas calificaciones y obteniendo una mejor comprensión de lo que debería y no debería hacer.
“La gente juzga qué cosas les gusta ver y cuáles no”, dijo Luke Metz, investigador de OpenAI.
El ChatGPT original se basa en un gran modelo de lenguaje llamado GPT-3.5. GPT-4 de OpenAI aprende de cantidades de datos significativamente mayores.
Los ejecutivos de OpenAI se negaron a revelar exactamente cuántos datos aprendió el nuevo chatbot, pero Brockman dijo que el conjunto de datos era de “escala de Internet”, lo que significa que cubría suficientes sitios web para proporcionar una muestra representativa de todos los angloparlantes en Internet.
Las nuevas capacidades de GPT-4 pueden no ser obvias para la persona promedio que usa la tecnología por primera vez. Pero es probable que se enfocan rápidamente a medida que los legos y los expertos continúan usando el servicio.
Dado un artículo largo de The New York Times y se le pide que lo resuma, el bot proporcionará un resumen preciso casi siempre. Agregue algunas oraciones aleatorias a este resumen y pregúntele al chatbot si el resumen revisado es correcto y señalará las oraciones agregadas como las únicas inexactitudes.
Altman describió el comportamiento como “razonamiento”. Pero la tecnología no puede duplicar el razonamiento humano. Bueno para analizar, resumir y responder preguntas complejas sobre un libro o artículo de noticias. Es mucho menos experto cuando se le pregunta sobre eventos que aún no han ocurrido.
Puede escribir un chiste, pero no demuestra que entiende lo que realmente hace reír a alguien. “Él no capta los matices de lo que es divertido”, dijo Oren Etzioni, director ejecutivo del Instituto Allen para la IA, un laboratorio destacado en Seattle.
Al igual que con tecnologías similares, los usuarios pueden encontrar formas de obligar al sistema a tener un comportamiento extraño y siniestro. Cuando se le pide que imite a otra persona o juego, este tipo de bot a veces se dirige a áreas de las que fue diseñado para mantenerse alejado.
GPT-4 también puede responder a las imágenes. Dada una foto, un gráfico o un diagrama, la tecnología puede proporcionar una descripción larga y detallada de la imagen y responder preguntas sobre su contenido. Esta puede ser una tecnología útil para las personas con discapacidad visual.
En una tarde reciente, el Sr. Brockman demostró cómo responde el sistema a las imágenes. Le dio al nuevo chatbot una imagen del Telescopio Espacial Hubble y le pidió que describiera la foto “en detalle meticuloso”. Respondió con una descripción de cuatro párrafos que incluía una explicación de la línea blanca etérea que cruzaba la foto. “Un rastro de un satélite o una estrella fugaz”, escribió el chatbot.
Los ejecutivos de OpenAI dijeron que la compañía no lanzará de inmediato la descripción de la imagen como parte de la tecnología porque no están seguros de cómo se podría abusar de ella.
Construir y mantener chatbots es extremadamente costoso. Como está entrenado en cantidades de datos aún mayores, el nuevo chatbot de OpenAI aumentará los costos de la empresa. Meera Murati, directora de tecnología de OpenAI, dijo que la empresa podría limitar el acceso al servicio si genera demasiado tráfico.
Pero a largo plazo, OpenAI planea construir e implementar sistemas que puedan hacer malabarismos con múltiples tipos de medios, incluidos audio y video, así como texto e imágenes.
“Podemos tomar todas estas habilidades de conocimiento de propósito general y extenderlas a todo tipo de áreas diferentes”, dijo Brockman. “Esto lleva la tecnología a un área completamente nueva”.