Así , parece demostrado que, especialmente en el caso de las generaciones más jóvenes, la costumbre de los continuos estímulos, y del uso de mensajes cortitos en los móviles y en las redes sociales, están conduciendo a la dificultad para mantener la atención durante mucho tiempo (en realidad, ni siquiera hace falta que sea mucho). También el uso de los sistemas de mensajería lleva, por ejemplo, a la adopción de abreviaturas, emojis y otros recursos (o directamente errores) que se traducen en el uso de un lenguaje muy deficiente. O la disponibilidad de datos en el buscador o en wikipedia, el almacenamiento de los números de teléfonos en los móviles o la existencia de sistemas de guiado como Google Maps corren en contra de nuestra capacidad de memorizar.
Sin embargo, quizá exista una disciplina y una tecnología, el 'prompt engineering' y los grandes modelos de lenguaje respectivamente que, sorprendentemente, nos reclamen la recuperación de una de esas capacidades: el manejo del lenguaje, especialmente el lenguaje escrito.
Prompt engineering
Como probablemente conozcan muchos de los lectores de este blog, el 'prompt engineering' es una especie de disciplina que nos enseña a cómo redactar unos 'prompts' (instrucciones) efectivos, es decir a a saber cómo relacionarnos con un gran modelo de lenguaje.
Esta interacción se produce en ocasiones, las más conocidas, a través de una aplicación de tipo chat o generativa. Pero también se hace, y esto es menos conocido, en código escrito por parte de desarrolladores que están creando esas aplicaciones basadas en modelos de lenguaje.
En esta disciplina del 'prompt engineering' se enseñan, por ejemplo, las mejores estructuras de un prompt (qué apartados debe incluir) o técnicas, algunas de ellas fuertemente respaldadas por sesudos análisis estadísticos y otras más intuitivas. Entre las técnicas más conocidas (y estudiadas) se encuentran, por ejemplo, la cadena de pensamiento ('Chain of Thought') o el uso de unos pocos ejemplo ('Few-Shot prompting').
Sin embargo, al fin y a la postre, un 'prompt' no es más que un texto, un texto que normalmente escribimos (aunque se puede dictar de viva voz) y mediante el cual aportamos información al modelo de lenguaje y, sobre todo, de alguna forma le indicamos lo que queremos de él.
Dos habilidades verdaderamente importantes
Aunque saber estructurar un 'prompt', conocer las técnicas o entender cómo se maneja el contexto es importante, en mi experiencia hay dos competencias fundamentales, tanto o más que las anteriores y que, en el fondo, exceden o incluso son previas al 'prompt engineering'.
La primera de ellas es, simplemente, el conocimiento. Me refiero el conocimiento del dominio del problema en el marco del cual estás interactuando con el modelo del lenguaje o sobre el que le está preguntando. Si quieres pedir un análisis financiero, te conviene muy mucho tener conocimientos financieros, saber dar el contexto adecuado y pedirle cosas que tienen sentido en un contexto financiero. Si estás interrogando sobre un tema jurídico, debes conocer cómo funcionan los sistemas legales, qué legislación existe y, de nuevo qué le puedes o debes pedir al modelo de lenguaje. Incluso en el ámbito artístico, si quieres crear una imagen o un vídeo te conviene muy mucho tener conceptos de diseño gráfico o 'storytelling'. Si quieres, en fin, pedir a un modelo de lenguaje algo que te ayude en tu trabajo, necesitas saber, y aportar el conocimiento del contexto de la empresa, de su sector y de qué necesitas.
Ese conocimiento, remarco, se necesita, no sólo para saber evaluar críticamente la respuesta del modelo de lenguaje, que también, sino para 'saber preguntar' correctamente. Y el resultado obtenido puede depender en gran medida de ello
La otra gran competencia necesaria es saber escribir o, por mejor decirlo, la capacidad de expresar de forma correcta, estructurada, clara y precisa, lo que se necesita y en qué contexto.
El renacimiento de la escritura
En efecto, aunque es cierto que los modelos de lenguaje presentan bastante tolerancia al error en temas como errores tipográficos o gramaticales, aunque son resilientes y pueden dar una respuesta razonable ante entradas no del todo correctas, también es cierto que el resultado mejora cuando se expresa de forma clara, correcta y precisa lo que el usuario desea del modelo de lenguaje.
En general, el resultado se beneficia de un 'prompt' bien estructurado, bien escrito, con frases breves y que transmita de forma clara y correcta la información de contexto y la o las acciones solicitadas. He podido observar, de hecho, de primera mano, cómo personas por lo demás competentes, tenían dificultad para escribir un 'prompt' cuando éste no era trivial, no por falta de conocimientos, sino por dificultad para plasmarlos por escrito.
Además de la redacción correcta y precisa, en ciertos casos es importante tener dominio de vocabulario. Por un lado, claro, el vocabulario propio del dominio del problema (técnico, económico, jurídico o lo que sea), pero también vocabulario más general, como el necesario para saber indicar el estilo o tono que debe adoptar el modelo de lenguaje o, en un ámbito más concreto, vocabulario de estilos musicales, pictóricos o fotográficos si queremos generar música, imagen o vídeo.
Con esto, el uso de grandes modelos de lenguaje, ya sea vía API en desarrollo, o a través de una interfaz de usuario, como en los famosos chatbots generativos como ChatGPT o Gemini, parece que nos está pidiendo usar de forma correcta y rica el lenguaje, nuestro precioso lenguaje. Y así, sorprendente y paradójicamente, la tecnología que más ha hecho por automatizar todo lo que tiene que ver con el uso del lenguaje, no sólo no nos lleva a olvidarlo, sino que nos demanda conocerlo y usarlo bien.
¿Este renacimiento tiene futuro?
A pesar de todo, tampoco conviene ser muy optimistas.
Por un lado, como ya he dicho, los modelos de lenguaje, aunque se benefician de recibir un texto correcto, detallado y preciso en su entrada, son bastante tolerantes con los textos mal escritos, así que, aunque 'nos piden' un buen texto de entrada, tampoco 'son tan exigentes'. Y especulo con que, con evoluciones tecnológicas que seguramente vendrán, y con el mero conocimiento acumulado del usuario, los modelos de lenguaje se pueden volver cada vez más tolerantes con las entradas mal escritas.
Por otra parte, además, aunque nos piden recibir un prompt bien escrito, también tienden a privarnos de las ocasiones para practicar la correcta escritura. Ya que algunos de los casos de uso más populares tiene que ver con la redacción de documentos, informes, ejercicios, correos electrónicos, etc, ya que, por tanto, el modelo de lenguaje (o, mejor, la aplicación que lo recubre) nos lo da hecho, perdemos esa ocasión de redactar nosotros mismos y, con ello, de mejorar nuestro uso del lenguaje.
¿Quién será el vencedor de esa dualidad?
Conclusiones
Sin embargo, vamos a finalizar de manera optimista, recordando y destacando cómo el empleo de los grandes modelos de lenguaje o las aplicaciones que los recubren nos exigen dos competencias valiosas: conocer el dominio del problema y usar correctamente y de forma precisa el lenguaje.
Alegrémonos de ello y desarrollemos esas competencias.








No hay comentarios:
Publicar un comentario