Por Marcos Yebra, Marketing y Desarrollo de Negocio en Normadat
En cualquier buen relato las verdades ocultas, esas que el sabio debe desentrañar, siempre se esconden en el archivo. En El Señor de los Anillos Gandalf va al archivo de Minas Tirith a buscar información sobre el Anillo. O en Juego de Tronos, Samwell Tarly recorre montañas de libros en la Ciudadela para encontrar respuestas que otros habían pasado por alto. Es un momento crucial para la trama, encontrar o no el secreto que se oculta entre estanterías interminables y legajos cubiertos de polvo. Por eso buscan sabios y magos, porque necesitan de una gran dosis de paciencia y conocimiento para hallar la respuesta.
¿Os imagináis esto hoy en día?
La secuencia sería mucho más corta. Gandalf abriría su portátil y preguntaría «¿Qué sabes sobre este anillo que brilla cuando lo arrojas al fuego?». Chim pum. En pocos segundos, un sistema de inteligencia artificial revisaría el fondo documental, localizaría las referencias relacionadas y presentaría una respuesta acompañada de sus fuentes. No sería lo mismo.
La IA empezó hace muy poco tiempo (es increíble su evolución) generando textos o imágenes. Hoy transforma procesos. También en el archivo, nos ayuda a encontrar una respuesta concreta entre miles de documentos.
La IA ha cambiado nuestra forma de preguntar
La escena del Gandalf buceando entre legajos durante días (y bebiendo y fumando en el archivo…vaya tela…) es, efectivamente, de otros tiempos.
Y no es que los archivos sean cosa de otro tiempo, están más vivos que nunca, ya os hablaba de eso aquí. Pero hemos cambiado la forma de atacar las consultas de información.
Durante años aprendimos a hablar el idioma de los buscadores. Elegíamos dos o tres palabras, probábamos distintas combinaciones, abríamos enlaces y descartábamos resultados hasta encontrar algo útil. Hoy eso empieza hasta a sonar extraño. Yo personalmente he sustituido ese método por entrar en el modo IA de Google y preguntarle directamente lo que quiero saber.
Y esto es una gran diferencia. Hemos pasado de buscar coincidencias a plantear una necesidad.
Google declara que, lógicamente, los usuarios formulan consultas más largas y complejas cuando utilizan sus funciones de inteligencia artificial.
Nos estamos acostumbrando a que la información no solo aparezca ante nosotros, sino que se ordene, se resuma y responda a una pregunta concreta.
¿Por qué no vamos a hacer lo mismo en nuestro trabajo?
Internet responde, pero la empresa todavía busca
Dentro de una empresa o una administración hay una especie de Internet privado.
Está formado por la documentación que hemos ido generando, por la propia naturaleza de nuestro negocio, a lo largo de los años. Podemos encontrar contratos, informes, expedientes, manuales, correos y todo tipo de documentación acumulada durante años. ¡Hay que sacar provecho de eso!
El conocimiento que hasta ahora se reparte por silos de información debido a que cada área organiza su propia información, ahora puede ser transversal (si tienes los suficientes permisos para consultarlo).
La IA ya ha ido entrando en muchos espacios empresariales. Ayuda a programar, resumir reuniones, analizar datos financieros, preparar documentos o atender consultas. El siguiente paso lógico era que todo ese corpus documental pudiera ser aprovechado por todos. Y además de la manera más sencilla posible, simplemente hablando.
Volvamos por un momento a nuestro mago. En una empresa actual, Gandalf no tendría que conocer el título exacto del informe, el año en que se redactó ni la carpeta donde alguien decidió guardarlo. Podría preguntar:
¿Qué sabemos sobre este anillo y por qué debería preocuparnos?
El sistema revisaría la documentación a la que Gandalf tuviera acceso (imagino que sería bastante), localizaría las referencias relevantes y elaboraría una respuesta basada en ellas. Podría indicarle, además, en qué documentos aparece la información para que él mismo comprobara las fuentes.
Seguramente Peter Jackson habría perdido una buena escena y la lucha contra Sauron (el malo) mucho más corta.
La gran barrera no es tecnológica
Para que una inteligencia artificial responda sobre nuestros documentos, tendrá que tenerlos. Y ¿dónde se alojan esos documentos?
Y ahí se encienden todas las alarmas.
¿Qué ocurre con la información confidencial? ¿Puede terminar fuera de la organización? ¿Se utilizará para entrenar un modelo? ¿Podría otro usuario recibir parte de nuestros contratos, expedientes o datos internos en una respuesta?
Y estas son preguntas más importantes que la velocidad del sistema o lo bien que redacte.
No todas las herramientas de IA funcionan igual. Introducir documentos corporativos en un servicio abierto y construir una solución controlada sobre un fondo documental definido son escenarios muy distintos.
En un modelo basado en recuperación aumentada, conocido habitualmente como RAG, no es necesario reentrenar el modelo con todos los documentos de la empresa. El sistema recupera, en el momento de la consulta, los fragmentos que interesan del repositorio autorizado y los utiliza como contexto para preparar la respuesta.
La idea no es alojar en un servidor todos nuestros documentos para la IA. La IA no tiene que memorizar el archivo. Lo que va a hacer es consultar la información dentro de nuestros repositorios (no fuera) y va a consultar únicamente aquello que necesita para responder.
Pero no seamos ingenuos y pensemos que utilizar RAG garantiza por sí solo la privacidad. También hay que definir dónde se procesa la información, qué proveedor interviene, qué registros se conservan, quién puede acceder a cada documento y si los datos se reutilizan para otros fines.
El Supervisor Europeo de Protección de Datos recomienda comprobar expresamente qué controles aplica cada proveedor y cómo se procesan los datos durante todo el ciclo de vida del sistema.
Un archivo al que se puede preguntar sin abrir la puerta
Lo bonito de esta nueva tecnología es conseguir que tu archivo te responda sin dejar de comportarse como tal. Es decir, el archivo debe respetar perfiles, permisos y niveles de acceso.
Si una persona no puede abrir un expediente, tampoco debería obtener su contenido a través de una pregunta ingeniosa. Las consultas tienen que quedar registradas y las respuestas deben remitir a los documentos que las sustentan.
Tampoco sería plato de buen gusto que tu información corporativa se utilizara para entrenar modelos de terceros. Es más, no debe salir de tu organización.
Ese es el planteamiento de herramientas como ArchivIA, que trabaja mediante RAG sobre la documentación definida por la propia organización. Esta herramienta IA hace lo que os venía contando. Según su diseño, los documentos del cliente no se emplean para entrenar modelos externos y las consultas se realizan dentro de un entorno gobernado mediante permisos, roles y trazabilidad.
La IA no se conecta a todas las carpetas de la empresa. Construimos una capa de consulta sobre el archivo sin desactivar las reglas que protegen su contenido.
Del buscador a la curiosidad
El cambio de paradigma es importante. Y no precisamente por ahorrarnos tiempo en las búsquedas de información. Es que cambia el propio camino o método de la búsqueda de información.
En las búsquedas de siempre teníamos que saber qué es lo que estábamos buscando. Ahora podemos explorar y llegar a sitios que ni nos imaginábamos encontrar.
¿Qué asuntos se repiten en las reclamaciones de los últimos años? ¿Qué criterios se han aplicado en expedientes similares? ¿Qué contratos contienen una determinada obligación? ¿Cómo ha evolucionado una decisión a lo largo del tiempo? ¿Qué antecedentes debería conocer alguien antes de incorporarse a un proyecto? Y suma y sigue.
La inteligencia artificial no crea ese conocimiento. Ya estaba allí. Lo que hemos conseguido cambiar es la posibilidad de acercarse a él sin tener que recorrer previamente todas las estanterías, comprender cada sistema de clasificación o pasar varias noches bajo la luz de una vela.
Seguiremos necesitando archivos, archiveros, especialistas y buenos criterios de gestión documental. Gandalf también habría tenido que comprobar las fuentes antes de partir hacia la Comarca.
Pero podría haber empezado con una pregunta. Y el archivo le habría respondido.





