Un nuevo oficio acaba de nacer: el ingeniero de solicitudes
6 Marzo 2023

Un nuevo oficio acaba de nacer: el ingeniero de solicitudes

El arte de dar instrucciones a las plataformas de Inteligencia Artificial generativa se abre paso, gracias al auge de ChatGPT, que no sirve para nada si no sabe preguntarle correctamente.

Por: Álvaro Montes

Entre aquí para recibir nuestras últimas noticias en su WhatsAppEntre aquí para recibir nuestras últimas noticias en su WhatsApp

La ingeniería de prompts (indicaciones) es el oficio de más reciente aparición en la historia. Debe tener menos de dos años, pero apenas se hizo conocida ampliamente hace unas cuantas semanas, después de que irrumpiera en nuestras vidas ChatGPT, que entró en operación pública a finales de noviembre pasado. ¿Sabe qué es un prompt? En el mundo de la informática es una instrucción que se escribe mediante el uso del teclado para solicitarle al computador que realice una tarea específica. Línea de comandos, si se quiere ser rigurosamente técnico, o simplemente indicaciones, como las que se le escriben a ChatGPT o a Midjourney, tan de moda por estos días.

Resulta que si se le pide a estas populares plataformas de Inteligencia Artificial lo que se desea, así no más, lo primero que se le ocurre y brote de una cabeza, el resultado será tan pobre como hemos visto: frases repetitivas y generalidades sin sustancia, como los textos que suele arrojar ChatGPT; o retratos absurdos y rostros desfigurados, como la mayoría de imágenes que salen de Midjourney. Pero si se sabe pedir, el resultado será mejor. Esa es la máxima que inspiró el nacimiento del novel oficio de ingeniería de prompts.

Algunos comparan la aparición del nuevo ingeniero de prompts con el surgimiento, un par de décadas atrás, del community manager, alguien especializado en sacarle el jugo a las redes sociales, que eran la novedad tecnológica entonces.

En enero pasado, una empresa de tecnología llamada Anthropic publicó en Linkedin una convocatoria de empleo que llamó poderosamente la atención: necesitaban con urgencia un prompt engineer, con un salario entre 175.000 y 335.000 dólares al año, más otros beneficios. No existe formalmente tal título profesional, pero un ingeniero de prompts es un experto en hablarle a las plataformas de IA, alguien suficientemente familiarizado con los grandes modelos de lenguaje (LLM, como se conoce a la Inteligencia Articial que puede comunicarse con los humanos de manera más o menos natural), con habilidades básicas de programación y que pueda escribir un poco en lenguaje Python, que se encargaría de preparar las solicitudes con las que sea posible entrenar y sacar el máximo provecho a Claude, la nueva plataforma de IA que la empresa está desarrollando, y que será competencia en breve de ChatGPT. Anthropic es un startup con sede en San Francisco, fundada por exempleados de OpenAI (la creadora de ChatGPT) y acaba de recibir como socio a Alphabeth (Google), que invirtió 400 millones de dólares para hacerse con el 10 por ciento de la propiedad.

Para aplicar al puesto, los aspirantes debían demostrar que han logrado obtener comportamientos complejos –es decir, respuestas interesantes y ricas– a partir de una serie de solicitudes bien elaboradas. Los grandes modelos de lenguaje son un nuevo tipo de inteligencia y el arte de entrenarlos para que arrojen mejores resultados aún está en pañales, como reconoce Anthropic. La ingeniería de prompts es un híbrido entre programar, entrenar al algoritmo y documentar el método para lograr los mejores resultados. El especialista en este campo conoce – por ensayo y error– cuáles son las palabras claves que debe emplear para que el modelo del lenguaje construya el producto más cercano a lo imaginado.

Parece sencillo, pero no lo es. De hecho, buena parte de la decepción que producen las plataformas de IA generativas entre usuarios no expertos se debe a los pobres resultados que arroja. No es lo mismo indicarle a Midjourney que cree la imagen de un niño con un perro en un bosque, que escribirle: "Foto en estilo realista tomada con lente Canon en dslr 64 megapixeles enfoque nítido, de un niño tomándose una selfie junto a un perro pastor alemán. Ambos sonríen y el sol cae perpendicular desde el lado izquierdo, en el fondo un bosque húmedo tropical, a la media tarde". La diferencia de resultados hará que usted mejore su opinión sobre la Inteligencia Artificial generativa. Si formula la solicitud en inglés el resultado será más preciso que en cualquier otro idioma, y puede adicionar indicaciones de formato que Midjourney entenderá perfectamente, como "--ar 16:9", que arrojará la ilustración en formato apaisado (ar significa "aspect ratio", o relación de aspecto de una imagen).

Buena parte de la decepción que producen las plataformas de IA generativas entre usuarios no expertos se debe a los pobres resultados que arroja.

Pedir una imagen resulta demasiado general para que cualquiera, sea humano o máquina, lo entienda. Es mejor indicar si se desea un dibujo al carboncillo, una acuarela o una fotografía. Indicar el tipo de iluminación es esencial, y ser lo más preciso posible es una buena recomendación. Las posibilidades de indicar detalles son prácticamente infinitas. En iluminación, por ejemplo, se pueden incluir indicaciones muy específicas como suave, neón, soleado, de frente, por encima, lateral, bajo el agua, pastel, oscura, nebulosa. La lista es inagotable.

Algunos comparan la aparición del nuevo ingeniero de prompts con el surgimiento, un par de décadas atrás, del community manager, alguien especializado en sacarle el jugo a las redes sociales, que eran la novedad tecnológica entonces. Y empiezan a aparecer los servicios de pago para asesorar a empresas que quieren obtener lo mejor de las plataformas de moda. En su web de capacitación, el experto español en marketing digital Joan Boluda, recomienda cobrar entre 25 y 30 euros por cada prompt desarrollado para una empresa que lo necesita.

Herramientas gratuitas para hacer mejores prompts

Su juventud no impide a la ingeniería de prompts disponer ya de literatura abundante para entrenarse en el oficio de dar el input correcto a las plataformas inteligentes. Hay un libro titulado Dall-E 2 prompts book, que ofrece las pistas y trucos claves para lograr lo mejor de esta popular herramienta de generación de imágenes. También hay una profusa lista de publicaciones similares para Stable Diffusion, e incluso existe un motor de búsqueda de reciente aparición, denominado Lexica, especializado en encontrar imágenes de Stable Diffusion. Por ejemplo, si usted introduce la palabra "Colombia" en este buscador, verá todas las imágenes sobre el país (personajes, paisajes, abstracciones) creadas en Stable Diffusion, y cualquiera puede copiar el prompt utilizado para crear cada imagen y realizar variaciones sobre él.

¿Parece insuficiente? Bueno, promtomania.com ofrece gratis un servicio de construcción de prompts para casi cualquier plataforma popular de IA generativa. Es un prompt builder libre, que ayuda crear las indicaciones más adecuadas para Midjourney, DreamStudio, Stable Diffusion, CD Spark, NightCafe, wombo.art, Craiyon y otras.

Los grandes modelos de lenguaje son un nuevo tipo de inteligencia y el arte de entrenarlos para que arrojen mejores resultados aún está en pañales.

En Google se pueden encontrar interesantes artículos para hacer buenos prompts en Midjourney, y en learnprompting.org encuentra un curso gratuito de cómo hablar con una AI para obtener lo que quiera. El curso contiene capítulos para programadores, entendidos en asuntos de código, pero también incluye secciones prácticas para cualquier ciudadano, repletas de ejemplos y guías.

Prompts para ChatGPT

Las plataformas para crear imágenes llevan un poco más de tiempo en funcionamiento, por lo que hay un mayor conocimiento general sobre buenos prompts. No así para el caso de las plataformas que generan texto, como ChatGPT, Writesonic o Copy.ai, que el público está apenas descubriendo. En este ámbito importa indicar claramente el tema, el tipo de recurso que se desea generar (un eBook, el copy para un anuncio publicitario, o responder un correo electrónico), además, desde luego, del estilo, el tono, y los temas muy claros que deben ser tratados en el resultado.
 

Este es un ejemplo real de una petición para la plataforma Chatsonic:
Prompt: “Escribe un libro electrónico de 4.500 palabras sobre 'La mejor estrategia de venta digital', en estilo formal, que ayude a los emprendedores digitales a conseguir más clientes y a ganar más dinero en 30 días. Al final, pide a los lectores que se registren en emprendiendoendigital.com”. Desde luego, el resultado no será un texto original ni un aporte novedoso al campo del mercadeo, pero servirá como lectura para iniciados, que recopila ideas tomadas de Internet y será completamente funcional.

Las posibilidades de indicar detalles son prácticamente infinitas. En iluminación, por ejemplo, se pueden incluir indicaciones muy específicas como suave, neón, soleado, de frente, por encima, lateral, bajo el agua, pastel, oscura, nebulosa. La lista es inagotable.

Los colombianos Felipe Guarín y Laura Gutiérrez, creadores del estudio de diseño Whatever Works, recién lanzaron wawo.ai, un servicio basado en ingeniería de prompts con el que quieren lograr que ChatGPT sea realmente útil para el mercado latinoamericano. Aprovechando la posibilidad de ser aliado comercial de OpenAI (la empresa creadora de ChatGPT), desarrollaron una plataforma que adecua las prestaciones de esta Inteligencia Artificial a diferentes necesidades. Por ejemplo, para las personas que trabajan en marketing hay una sección en la que cualquiera puede pedir textos publicitarios concretos. El usuario que se registra en wawo.ai sólo escribe lo que quiere, sin preocuparse por la estructura de la solicitud y wawo.ai se encarga de la ingeniería de prompts.
 

“ChatGPT no está hoy calibrada para sacar los mejores resultados y nosotros nos encargamos de ese ajuste fino”, explica Felipe Guarín, de wawo.ai. “Nosotros nos especializamos en las necesidades de los colombianos y de los latinoamericanos, porque siempre habrá problemas muy locales y queremos estar allí para adaptar la IA a tales necesidades”, agrega.
Hay quienes ponen en duda el futuro de lo que hoy se conoce como ingeniería de prompts. Podría durar poco, en la medida en que los LLM evolucionen y se aproximen mejor al lenguaje natural de las personas, y aparezcan servicios automáticos que faciliten al usuario el aprovechamiento de las inteligencias artificiales de moda. De momento, hay gente haciendo buenos negocios gracias a su habilidad con este oficio.

Conozca más de Cambio aquíConozca más de Cambio aquí