Investigación
Empleando la IA

Un investigador le dice a su asistente virtual:
—“LIA, necesito que busques artículos sobre la procrastinación.”
Después de una pausa, responde, LIA:
— “Entendido. Lo añado a mi lista de tareas… para revisar más tarde.”

Gemini 2.5 Pro

— “LIA, ¿puedes analizar estos datos y llegar a una conclusión?”
— “He inducido que, si procrastinas hoy, procrastinarás mañana.”
— “¿Eso es estadístico?”
— “No, es vicio.”

chatGPT

Help!

Estamos acostumbrados a pedir cosas a los modelos de inteligencia artifical. Lo hacemos de forma intuitiva, interativa y exploratoria. Empezamos muchas veces con una pregunta general y, poco a poco, refinamos nuestra consulta, ofrecemos datos contextuales o ejemplos para que el modelo finalmente nos genere un resultado que consideremos satisfactorio. En resumen, no tenemos siempre claro cuando empezamos a hablar con un chat de IA qué es lo que queremos, ni en qué formato el modelo nos debe responder. La situación se complica cuando las tareas que la IA debe llevar a cabo son complejas y dependen de un conjunto de etapas intermediarias que, a su vez, requieren que se lleven a cabo elecciones o decisiones.

¿Por qué empezamos por aquí? ¿Por qué hablamos de cómo charlamos con la IA? La respuesta es sencilla. La creación de asistentes virtuales viene de la capacidad que tenemos de dar instrucciones a un modelo de IA generativo para que ejecute un conjunto de tareas específicas. Un asistente de docencia virtual tiene la tarea de ayudar a los estudiantes en tareas concretas de una asignatura. Un revisor virtual que ayuda a evaluar la calidad de una propuesta de investigación cumple funciones distintas. Por ello, debe recibir instrucciones específicas para esta finalidad.

En esta sesión del curso aprenderemos cómo definir esas instrucciones que hacen que modelos genéricos, que sirven para todo, se comporten como expertos en funciones concretas. De un lado, se trata de restringir su escopo y, de otro, de obtener mayor profundidad en su procesamiento. Para ello, tenemos que primero aprender a crear prompts o conjuntos de instrucciones estructuradas.

Prompt Engineering

Que nadie se asuste por el nombre rimbombante. Prompt engineering no es magia ni un saber técnico altamente complejo. Tampoco te animes demasiado. No te convertirás en un ingeniero al aprender a escribir prompts. De forma sencilla, podemos definirlo como una técnica utilizada para crear instrucciones en lenguaje natural destinadas a que un modelo de IA generativo lleve a cabo tareas específicas. Aunque existan algunas heurísticas que introduciremos aquí que facilitan el trabajo, una persona con capacidades críticas y lógicas medianamente desarrolladas puede aprender a crear nuevas formas de interactuar con los modelos a partir de sus necesidades. Insisto, no se trata de un saber técnico profundo, sino de un conjunto de estrategias lógicas y de razonamiento. Cuanto más pragmático y estructurado es tu pensamiento, más fácil será para el modelo llevar a cabo las tareas que deseas. Como veremos más adelante, podemos decir a la IA que resuelva un mismo problema de formas diferentes. Por ejemplo, ¿de qué formas podemos pedir al modelo que nos informe el número de vocales en la palabra “electroencefalografista”? ¿Cómo lo harías tú?

[PAUSA ESCÉNICA PARA QUE TODOS PIENSEN EN CÓMO HACERLO]

¿Esto significa que no vale nada lo que aprendemos aquí? No, paremos el carro. Las “fórmulas” que examinaremos en esta clase son útiles para empezar a trabajar con los modelos de IA generativa. Sin embargo, no son la única forma de interactuar con ellos ni mucho menos. De hecho, la mayoría de los modelos de IA generativa resulta capaz de aprender a partir de ejemplos y de la interacción con el usuario. Por ello, es importante que cada uno refine esas herramientas y las adapte al repertorio lingüístico propio. También representa una tremenda oportunidad para investigadores no versados en programación. Si eres capaz de resolver problemas complejos, no hace falta programar para sacar provecho de los modelos de IA. En gran medida, este es gran factor detrás de su enorme adopción en el ámbito académico y profesional.

¿Lo que ganamos con un prompt? Quizas el mayor avance se encuentre en la eliminación de barreras técnicas para procedimientos de análisis de datos más sofisticados. Con los LLMs, logramos hacer ahora cosas que antes solamente estaban al alcance de programadores. Por ejemplo, podemos pedirle al modelo que extraiga información de un texto y la formatee en una tabla¹.

Copia y pega el siguiente texto en cualquier chat de IA y observa cómo responde:

Actúa como un experto informáticoPersona. Le voy a suministrar un texto sobre diferentes ciudades. Me interesan tres datos concretos: el nombre de la ciudad, la población y la temperatura media en veranoContexto. Extrae esos tres datos del texto y devuélvemelos en una tabla con tres columnas: “Ciudad”, “Población” y “Temperatura media en verano”. Aprovecha y ordena los valores por orden alfabética de nombre de la ciudad y representa la población como miles de habitantesTarea. Elije el formato de salida que posibilite la mejor integración y lectura por parte de programas estadísticos o lenguajes de programaciónSalida. El texto es el siguiente:

“Madrid, la capital de la comunidad autónoma con el mismo nombre, es, según la mayoría de sus 3,2 millones habitantes, una de las ciudades más hermosas y brillantes del mundo. Aunque su clima resulte frío en invierno, sus veranos son cálidos, con temperaturas que suelen alcanzar los 30 grados centígrados. Barcelona, la capital de Cataluña, es una ciudad costera con una población de 1,6 millones de habitantes. Considerada como un centro cultural global, como Madrid, su clima es mediterráneo, con inviernos suaves y veranos cálidos, donde las temperaturas suelen estar en los 35 grados centígrados. Valencia, situada en la costa este de España, tiene una población de 800 mil habitantes y un clima mediterráneo similar al de Barcelona, con temperaturas que rondan los 30 grados centígrados en verano.

Ciudad	Población (miles)	Temperatura media en verano (°C)
Barcelona	1600	35
Madrid	3200	30
Valencia	800	30

Vemos cómo el modelo genera una tabla que fácilmente podría ser convertida (a golpe de prompt) en un archivo de tipo CSV (Comma Separated Values) que puede ser leído por programas estadísticos como R o Python. En este caso, el modelo ha sido capaz de extraer información de un texto y devolverla en un formato estructurado. Esto es algo que, hasta hace poco, solo alcanzable por programadores con conocimientos avanzados de lenguajes de programación².

En gran medida, lo que aprenderemos aquí es justamente a “programar”, pero en lugar de aprender Python, R o C++, adaptaremos la lógica del pensamiento computacional al lenguaje natural (nuestro español). De forma muy resumida, programar consiste en dividir tareas complejas em subprocesos más sencillos, encontrar patrones y estructuras que se repiten, abstraer, generalizar y desarrollar “recetas” (algoritmos) para resolver el problema paso a paso. Sencillo, ¿verdad? 😎

No obstante, alguno podría pensar: ah, ya no tengo que aprender a programar en un lenguaje de programación. Bueno, más o menos. Siempre podrás sacar más partido a la IA si sabes programar. De pronto, lo que hicimos más arriba para un texto corto, lo podrías replicar para miles de documentos. Si uno integra una buena estrategia de prompting con algoritmos que automatizan la interacción con el modelo, multiplica su capacidad de sacar provecho de esa tecnología tanto en la investigación como en docencia.

En el ejemplo arriba defino una persona: experto informático. Marco un objetivo: extraer una tabla con el nombre de la ciudad, la población y la temperatura media en verano. Le digo al modelo el formato de entrada: un texto. Indico la información relevante: nombre de la ciudad, población y temperatura. También establezco un conjunto de tareas: (a) extrae los datos; (b) devuélvemelos en una tabla (estructura de la salida); (c) ordena los valores por orden alfabética de nombre de la ciudad; (d) representa la población como números equivalentes a miles de habitantes; y (e) pido que decida sobre el formato más compatible para la salida. Finalmente, le suministro el texto que debe analizar.

Aquí tenemos el ejemplo de un texto, pero podría ser un listado de 1.000 tweets, intervenciones parlamentarias, capítulos de un libro, poemas, discursos, artículos de prensa o cualquier otro tipo de texto. El modelo es capaz de extraer información relevante y devolverla en un formato estructurado. Además, en lugar de pedir que el modelo extrajera datos, podríamos pedirle que clasificara textos de acuerdo con diferentes temas, sentimientos o que generara resúmenes automáticos de textos largos. Podríamos suministrarles datos demográficos y solicitar que contestara a una encuesta o que corrigiera un ejercicio de los estudiantes.

¿Cómo crear un prompt?

El siguiente video contiene el resumen del curso de prompt engineering de Google³. Explica paso a paso todo lo que vamos a ver a continuación. Vale la pena verlo completo durante el intervalo de una semana que tenemos entre las clases para consolidar lo que hemos aprendido.

En esta parte de la sesión, aprenderemos algunos principios básicos de prompt engineering. Cualquier conjunto de instrucciones (prompt) se conforma por elementos fundamentales. Como bloques de LEGO, se pueden combinar para constituir instrucciones más complejas. Como módulos autónomos (nombre pomposo para piezas de LEGO), pueden o no ser empleados en un prompt. Como veremos, su uso dependerá en gran medida de la complejidad y el tipo de tarea que se desea ejecutar.

Como he mencionado antes, el prompt engineering consiste en un conjunto de estrategias empleadas para dar instrucciones a una IA generativa. El propósito es que lleve a cabo tareas especializadas como analizar datos o escribir textos para públicos concretos. A continuación presentaré cada uno de dichos elementos y los testaremos en cualquier modelo que tengamos a disposición. No obstante, unas palabras de cautela: siempre juzga tu prompt a partir de los resultados. Algunas veces pensamos que una estrategia funciona, pero al probarla, nos damos cuenta de que no es así. Por lo tanto, es importante experimentar y ajustar los prompts según los resultados obtenidos, que es lo que realmente importa.

1. Define el “personaje”

Una de las formas más originales de guiar la IA hacia una respuesta especializada consiste en definir una “persona”. Se trata de decir al modelo que asuma un rol o una identidad. Si queremos que el modelo corrija un texto, podemos decirle que actúe como un revisor ortográfico profesional. Si queremos que haga un análisis literario de novelas, podemos pedirle que actúe como un crítico literario con especialización en narrativa. Se puede transformar en lo que queramos: analista de datos, historiador, economista, médico, programador…

Como en un juego de rol, al definir una persona, el modelo “emula” o imita el comportamiento de ese experto; asume su lenguaje, su forma de comunicarse y su conocimiento. Esto es especialmente útil cuando queremos que el modelo realice tareas que requieren un conocimiento especializado o un enfoque particular. En lugar de ofrecer respuestas generalistas, el modelo simula a la perspectiva del personaje que le hemos asignado.

Copia y pega los siguientes textos (uno a la vez) en cualquier chat de IA y observa cómo responden de forma distinta:

Prompt sin persona:

Explica el teorema de Pitágoras.Tarea

Prompt con persona:

Actúa como un matemático experto en geometríaPersona. Explica el teorema de Pitágoras.Tarea

Prompt con persona y contexto:

Actúa como un matemático experto en geometríaPersona. Explica el teorema de Pitágoras.Tarea Tu público son matemáticos expertos en geometría euclidiana.Contexto

Qué divertido, ¿verdad? Especialmente la última respuesta. ¡Hay tantas formas nuevas, y elegantes, en las que uno puede sentirse ignorante…! De todos modos, lo que podemos observar es que el modelo responde de forma diferente según la persona que le hemos asignado. En el primer caso, la respuesta es más general y menos técnica, mientras que en el segundo y el tercer ejemplo el resultado es más preciso y detallado, como se esperaría de un matemático experto en geometría.

2. Describe la tarea (y los objetivos)

En esta segunda parte de un prompt, definimos qué queremos que el modelo haga y cómo. Parece trivial, ¿verdad? Pero, en muchos casos, las personas no tienen una idea clara de qué quieren al preguntarle al modelo. Instrucciones vagas o mal definidas reciben respuestas subóptimas, para decirlo finamente. Por esa misma razón, no resulta sorprendente que el objetivo se revele a partir de un proceso dialógico entre el usuario y el chat de IA.

Nos encontramos, por lo tanto, en el núcleo del prompt. Un conjunto de instrucciones puede prescindir de una persona o de ejemplos, pero no puede renunciar a definir de forma clara la tarea y los objetivos. Y aquí es donde puedes ganar mucho en términos de eficiencia y eficacia. Algunos factores a tener en cuenta:

Tipo de tarea - ¿se trata de una tarea de lenguaje -como resumir, generar o clasificar un texto- o de una tarea de análisis, que requiere extraer y procesar información de un texto o de una tabla?
Complejidad - consiste en establecer si la tarea representa algo sencillo, que no exije mucha elaboración, o requiere dividir (divide et impera) el trabajo en un conjunto de etapas intermediarias que sirven de insumo para las siguientes. Consultar información suele ser mucho más sencillo que llevar a cabo un análisis de datos.
Claridad - no se puede insistir más en ese aspecto. Instrucciones ambiguas conducen a resultados indeseados o, al menos, sorprendentes.
Vocabulario - usa siempre vocabulario específico o especializado. Si quieres que el modelo actúe como un experto en un campo concreto, usa términos técnicos y específicos de ese campo. Si hablamos de representación política, podemos mencionar magnitud de distrito, proporcionalidad, umbral electoral, etc. Si hablamos de literatura, podemos mencionar narrador, trama, personajes, etc. Si hablamos de datos, podemos mencionar variables, observaciones, etc. En resumen, usa el vocabulario adecuado para la tarea que estás realizando.

Empleemos un ejemplo fácil: el análisis de una tabla. En este caso, la tabla contiene información sobre el PIB per cápita y el porcentaje de democracias en diferentes regiones del mundo. La tarea consiste en analizar la tabla y extraer información relevante, así como evaluar la relación entre las dos variables. Como vemos, corresponde a una tarea común de cualquier ejercicio de análisis de datos. El ejemplo abajo incluso podría ser empleado en una clase introductoria de metodología para enseñar a los estudiantes sobre el tema.

Región	PIB per cápita promedio (USD)	Democracias (%)
Europa Occidental	45,000	100%
Oceanía	35,000	85%
América del Norte	65,000	67%
Europa del Este	18,000	60%
América Latina	10,000	60%
Sudeste Asiático	5,000	45%
Asia Oriental	20,000	40%
Asia Meridional	2,500	35%
África Subsahariana	1,800	20%
Oriente Medio y Norte de África	7,000	15%

A continuación te presento un conjunto de valores separados por comas:Contexto “Región,PIB_per_cápita_USD,Porcentaje_DemocraciasContexto
América del Norte,65000,67Contexto
Europa Occidental,45000,100Contexto
Europa del Este,18000,60Contexto
América Latina,10000,60Contexto
África Subsahariana,1800,20Contexto
MENA,7000,15Contexto
Asia Oriental,20000,40Contexto
Asia Meridional,2500,35Contexto
Sudeste Asiático,5000,45Contexto
Oceanía,35000,85”Contexto

Ahora, quiero que analices los datos de la siguiente manera:Tarea

1. Describe los patrones observados en la tabla y enfoca la relación entre las dos variables numéricas: PIB per cápita y porcentaje de democracias en cada región.Tarea

2. Comenta si existe alguna relación entre el PIB per cápita y el porcentaje de democracias en cada región. Además, de un análisis descriptivo de la relación, incluye términos como el coeficiente de correlación. Calcula el coeficiente de correlación de Pearson e infórmalo.Tarea

3. A partir de los análisis anteriores, realiza un análisis sobre la relación entre el PIB per cápita y el porcentaje de democracias en cada región. ¿Qué conclusiones puedes extraer?Tarea

Cómo podemos ver en los resultados generados, los modelos producen un análisis descriptivo detallado de los datos. Su extensión y profundidad pueden variar según el modelo empleado (Gemini, Claude, GPT4, etc.). Pero lo que queda absolutamente claro es que podemos emular estrategias que adoptados en nuestros propios análisis de datos, automatizándolas por medio de los modelos de IA. Basta con codificarlos por medio de un prompt claro y preciso.

3. Proporciona contexto

El tercer eje de la estrategia de prompting es proporcionar contexto a las instrucciones. Dentro del marco de la IA generativa, podemos entender el concepto de contexto de tres maneras principales. En una primera acepción, se trata de definir de modo claro a quiénes se destina el resultado. Por ejemplo, si quieres que la IA escriba un artículo para un blog de política, puedes decirle: “Escribe un artículo sobre la democracia dirigido a un público general interesado en política, pero que no tiene formación académica en el tema.” Esto ayudará al modelo a adaptar su estilo y contenido al público objetivo.

A continuación creamos un prompt que pide a la IA que prepare una clase sobre El príncipe de Maquiavelo para estudiantes de ciencia política de primer año. Aquí, tratamos de definir las características de los estudiantes con relación a los elementos que consideramos fundamentales para entender la obra del autor florentino. Primero, apenas empiezan el grado y están poco familiarizados con los conceptos de la ciencia política. Segundo, no tienen una formación previa de filosofía política, así que el modelo debe ajustar el lenguaje a un público en especialización, pero no especializado. Tercero, no podemos suponer que conocen mucho sobre el Renacimiento, Florencia o la historia de las repúblicas italianas. Por lo tanto, el modelo debe proporcionar un contexto histórico y cultural para ayudar a los estudiantes a entender la obra.

Prepara una clase sobre la obra “El Príncipe” de MaquiaveloTarea.

El público está compuesto por estudiantes con las siguientes características:Contexto

1. de primer año del grado de ciencia política;Contexto

2. no tienen formación previa en filosofía política;Contexto

3. no podemos suponer que conocen mucho sobre el Renacimiento, Florencia o la historia de las repúblicas italianas;Contexto

Por esa razón, organiza la clase para no solo hablar de la obra, sino también de su contexto histórico y políticoTarea.

En una segunda interpretación, el contexto se refiere a qué consideras como éxito o el resultado esperado. Por ejemplo, si quieres que la IA escriba un artículo sobre la erosión democrática, puedes decirle: “Escribe un artículo de 500 palabras sobre la erosión democrática.” Esto ayudará al modelo a entender qué tipo de texto estás buscando y a adaptarse a tus necesidades.

En el ejemplo abajo, pedimos que la IA genere un conjunto de datos simulados o “sintéticos” que podríamos emplear en simulaciones (también usando la IA) de encuestas de opinión. Le indicamos, además, que genere tres variables (sexo, edad y nivel educativo) y que cada una de ellas tenga un peso específico.

Genera un conjunto de datos con 1500 observaciones que corresponda a una muestra representativa. Tarea

Necesito esta información para la simulación de una encuesta de opinión. El conjunto de datos debe tener las siguientes variables (y el peso de cada categoría):Contexto

1. Sexo (masculino 49%, femenino 51%)Contexto

2. Edad (de 18 a 24: 10%, de 25 a 34: 20%, de 35 a 44: 20%, de 45 a 54: 20%, de 55 a 64: 15%, de 65 o más: 15%)Contexto

3. Nivel educativo (primaria: 10%, secundaria: 30%, bachillerato: 25%, formación profesional: 15%, universidad: 20%)Contexto

Crea la base de datos en un formato CSV.Formato

En una tercera perspectiva, podemos considerar como contexto el conjunto de informaciones suministrado al modelo para que lleve a cabo una determinada tarea. Por ejemplo, imagínate que quieres que el modelo hable de democracia, pero que considere en particular la definición hecha por autores concretos en 10 documentos. Puedes subir los artículos y decirle al modelo: “Aquí tienes 10 artículos académicos sobre democracia. Quiero que los consideres y emplees su contenido para formular una definición general y válida de democracia que sea compatible con los 10 textos.” Esto ayudará al modelo a entender el contexto y a adaptar su respuesta a tus necesidades.

Actúa como un crítico literarioPersona. A continuación te presento dos poemas, uno en portugués y otros en español:Contexto

POEMA 1Contexto

Amor é fogo que arde sem se verContexto

Amor é fogo que arde sem se ver, / É ferida que dói e não se sente, / É um contentamento descontente, / É dor que desatina sem doer.Contexto

É um não querer mais que bem querer / E solitário andar por entre a gente, / É um não contentar-se de contente, / É cuidar que se ganha em se perder.Contexto

É um estar-se preso por vontade, / É servir a quem vence o vencedor, / É um ter com quer nos mata lealdade.Contexto

Mas como causar pode o seu favor, / Nos mortais corações conformidade, / Sendo a si tão contrário o mesmo amor?Contexto

POEMA 2Contexto

Definiendo el amorContexto

Es hielo abrasador, es fuego helado, / es herida que duele y no se siente, / es un soñado bien, un mal presente, / es un breve descanso muy cansado.Contexto

Es un descuido que nos da cuidado, / un cobarde con nombre de valiente, / un andar solitario entre la gente, / un amar solamente ser amado.Contexto

Es una libertad encarcelada, / que dura hasta el postrero paroxismo; / enfermedad que crece si es curada.Contexto

Este es el niño Amor, este es su abismo. / ¿Mirad cuál amistad tendrá con nada / el que en todo es contrario de sí mismo!Contexto

Analiza los poemas y haz una comparación entre ellos:Tarea

1. Busca las similitudes y diferencias principales.Tarea

2. Establece la probabilidad de que sean de un mismo autor o el producto de influencia literaria directa.Tarea

4. Utiliza ejemplos

Los ejemplos representan un recurso muy útil a la hora de enseñar los modelos de IA exactamente lo que queremos de ellos. Esta estrategia funciona muy bien en tareas en las que podemos proporcionar ejemplos claros y directos, como en ejercicios de clasificación o extracción de datos. Por ejemplo, si quieres que la IA clasifique un conjunto de textos de acuerdo el sentimiento, incluyes en el prompt algunas frases y sus correspondientes sentimientos. En este simulas un proceso de aprendizaje supervisado en el que la IA aprende a clasificar los textos de acuerdo a los ejemplos que le has proporcionado.

Actúa como un modelo clasificador de sentimientos.Persona

Abajo, te presento un conjunto de frases y sus respectivos sentimientos que te pueden servir de ejemplo:Ejemplos

[ { “frase”: “Me siento muy agradecido por tu ayuda.”, “sentimiento”: “positivo”},Ejemplos

{“frase”: “Hoy el clima está nublado.”, “sentimiento”: “neutral”},Ejemplos

{ “frase”: “No soporto cuando la gente llega tarde.”, “sentimiento”: “negativo”},Ejemplos

{ “frase”: “¡Qué alegría verte de nuevo después de tanto tiempo!”, “sentimiento”: “positivo”},Ejemplos

{ “frase”: “El informe está listo para revisión.”, “sentimiento”: “neutral”},Ejemplos

{ “frase”: “Estoy harto de este tráfico interminable.”, “sentimiento”: “negativo”}]Ejemplos

Con base en los ejemplos anteriores, quiero que clasifiques las siguientes frases:Tarea

“Tu éxito me llena de orgullo.”Contexto

“Mañana tenemos una reunión a las 10h.”Contexto

“Esta película me aburrió profundamente.”Contexto

“Gracias por el regalo, es justo lo que quería.”Contexto

5. Define el formato de salida

Si quieres que te devuelva los resultados en un formato específico, debes definir cómo quieres que el modelo te entregue los datos. Por ejemplo, puedes decirle: “Devuélveme los datos en un formato CSV, separado por ; y con los nombres de las columnas como ‘frase’ y ‘sentimiento’.” Empleemos el mismo ejemplo que antes, pero ahora le decimos al modelo que queremos que nos devuelva los resultados en un formato CSV.