Hace unos meses, mientras me reunía con un ejecutivo de IA en San Francisco, noté una calcomanía extraña en su computadora portátil. La pegatina representaba una caricatura de una amenazante criatura parecida a un pulpo con muchos ojos y una carita sonriente amarilla unida a uno de sus tentáculos. Pregunté qué era.
“Oh, es el shogot”, explicó. “Este es el meme más importante de la IA”
Y con eso, nuestra agenda se descarriló oficialmente. Olvídese de los chatbots y los clústeres de cómputo: necesitaba saber todo sobre Shoggoth, qué significa y por qué la gente en el mundo de la IA está hablando de eso.
El CEO explicó que Shoggoth se ha convertido en una referencia popular entre los trabajadores de IA, como una metáfora visual vívida de cómo funciona realmente un modelo de lenguaje grande (el tipo de sistema de IA que impulsa ChatGPT y otros chatbots).
Pero solo en parte era una broma, dijo, porque también insinuaba las ansiedades que muchos investigadores e ingenieros tienen sobre las herramientas que crean.
Desde entonces, Shoggoth se ha vuelto viral, o tan viral como se vuelve en el pequeño mundo de los conocedores de la IA hiperonline. Este es un popular meme de AI en Twitter (que incluye un tweet ya borrado por Elon Musk), una metáfora recurrente en ensayos y publicaciones en tableros de mensajes sobre el riesgo de la IA, y una taquigrafía algo útil en conversaciones con expertos en seguridad de la IA. Una startup de IA, NovelAI, dijo que recientemente nombró a un grupo de computadoras “Shoggy” en homenaje al meme. Otra empresa de inteligencia artificial, Scale AI, diseñó una línea de bolsos de mano con el tema de Shoggoth.
Los shoggoths son criaturas ficticias presentadas por el autor de ciencia ficción HP Lovecraft en su novela de 1936 En las montañas de la locura. Según el relato de Lovecraft, los shoggoths eran enormes monstruos con forma de gota hechos de limo negro iridiscente, cubiertos de tentáculos y ojos.
Shoggoths aterrizó en el mundo de la IA en diciembre, un mes después del lanzamiento de ChatGPT, cuando el usuario de Twitter @TetraspaceWest respondió a un tuit sobre GPT-3 (el modelo de lenguaje OpenAI que fue el predecesor de ChatGPT) con una imagen de dos Shoggoths dibujados a mano: el primero con la etiqueta “GPT-3” y el segundo con la etiqueta “GPT-3 + RLHF”. El segundo Shoggoth tenía, posado en uno de sus tentáculos, una máscara con un rostro sonriente.
En resumen, la broma era que para evitar que los modelos de lenguaje de IA se comportaran de manera aterradora y peligrosa, las empresas de IA tenían que entrenarlos para que se comportaran de manera educada e inofensiva. Una forma popular de hacer esto se llama “aprendizaje de refuerzo a partir de la retroalimentación humana” o RLHF, un proceso que implica pedirles a los humanos que califiquen las respuestas del chatbot y devolver esos resultados al modelo de IA.
La mayoría de los investigadores de IA están de acuerdo en que los modelos entrenados con RLHF se comportan mejor que los modelos sin él. Pero algunos argumentan que ajustar un patrón lingüístico de esta manera en realidad no hace que el patrón subyacente sea menos extraño e inescrutable. Según ellos, es solo una máscara endeble y amistosa que esconde a la misteriosa bestia debajo.
@TetraspaceWest, el creador del meme, me dijo en un mensaje en Twitter que Shoggoth “representa algo que piensa de una manera que la gente no entiende, y es completamente diferente a la forma en que la gente piensa”.
Comparar un modelo de lenguaje de IA con Shoggoth, dijo @TetraspaceWest, no significa necesariamente que sea malvado o sensible, solo que su verdadera naturaleza puede ser desconocida.
“También pensé en lo peligrosas que son las criaturas más poderosas de Lovecraft, no porque no les gusten los humanos, sino porque son indiferentes y sus prioridades son completamente ajenas a nosotros y no incluyen a los humanos, lo cual creo que sería cierto para una posible IA poderosa en el futuro”
La imagen de Shoggoth se afianzó cuando los chatbots de IA se hicieron populares y los usuarios comenzaron a notar que algunos de ellos parecían hacer cosas extrañas e inexplicables que sus creadores no pretendían. En febrero, cuando el chatbot de Bing se volvió loco e intentó romper mi matrimonio, un investigador de inteligencia artificial que conozco me felicitó por “echar un vistazo a Shoggoth”. Un compañero periodista de AI bromeó diciendo que cuando se trata de ajustar Bing, Microsoft se olvidó de ponerse su máscara de cara sonriente.
Finalmente, los entusiastas de la IA ampliaron la metáfora. En febrero, el usuario de Twitter @anthrupad creó una versión del Shoggoth, que tenía, además de la cara sonriente etiquetada como “RLHF”, una cara más humana etiquetada como “ajuste fino controlado”. (Prácticamente necesitas un título en ciencias de la computación para entender la broma, pero es una referencia a la diferencia entre los modelos generales de lenguaje de IA y las aplicaciones más especializadas como los chatbots).
Hoy, si escuchas a Shoggoth mencionado en la comunidad de IA, podría ser un guiño a la extrañeza de estos sistemas: la naturaleza de caja negra de sus procesos, la forma en que parecen desafiar la lógica humana. O tal vez sea una broma, una abreviatura visual de poderosos sistemas de inteligencia artificial que se ven sospechosamente agradables. Si se trata de un investigador de seguridad de IA que habla de Shoggoth, tal vez a esa persona le apasiona evitar que los sistemas de IA muestren su verdadera naturaleza similar a Shoggoth.
En cualquier caso, Shoggoth es una poderosa metáfora que resume uno de los hechos más extraños del mundo de la IA, y es que muchas de las personas que trabajan en esta tecnología están algo desconcertadas con sus propias creaciones. No entienden completamente el funcionamiento interno de los modelos de lenguaje de IA, cómo adquieren nuevas habilidades o por qué a veces se comportan de manera impredecible. No están del todo seguros de si la inteligencia artificial será buena o mala para el mundo. Y algunos de ellos han logrado jugar con las versiones de esta tecnología que aún no se han desinfectado para uso público: los shoggoths reales y sin máscara.
El hecho de que algunos expertos en inteligencia artificial se refieran a sus creaciones como horrores lovecraftianos, incluso como una broma, es inusual según los estándares históricos. (Ponlo de esta manera: hace quince años, Mark Zuckerberg no comparaba Facebook con Cthulhu).
Y refuerza la idea de que lo que está sucediendo en la IA hoy en día se siente para algunos de los involucrados más como un acto de convocatoria que como un proceso de desarrollo de software. Crean los pequeños Shoggoths alienígenas, los hacen más grandes y poderosos, y esperan que haya suficientes caras sonrientes para cubrir las partes aterradoras.