Una IA con acento español 

Francisco Pérez Bes, experto en derechos digitales, analiza la reciente propuesta del Gobierno de crear un modelo fundacional de inteligencia artificial potenciando el español y las lenguas cooficiales.

Hace unos días, durante la inauguración del Mobile World Congress (MWC), el presidente del Gobierno, Pedro Sánchez, anunciaba el desarrollo de un “gran modelo fundacional de lenguaje de inteligencia artificial, entrenado específicamente en español y en las lenguas cooficiales, en código abierto y transparente”. 

En palabras del presidente, el objetivo de esta iniciativa es el de incorporar a los países iberoamericanos. Pero ¿es técnica y económicamente viable lo que plantea el presidente del Gobierno? 

En primer lugar, hay que definir el concepto de “modelo fundacional” para poder comprender el alcance de tal propuesta. 

¿Qué es un modelo fundacional? 

Los modelos fundacionales son redes neuronales de aprendizaje profundo (Deep learning) que, desde el año 2018, permiten describir los modelos de IA entrenados en un amplio espectro de datos sin etiquetar (generalmente mediante aprendizaje autosupervisado), que son aquellos capaces de realizar una gran variedad de tareas, como las de generar texto e imágenes y conversar en lenguaje natural. Sobre ellos se construyen los sistemas de IA. 

Algunos ejemplos de modelos fundacionales son GPT, BART, Claude, Amazon Titan o Stable Diffusion, este último muy difundido estos últimos meses gracias a su capacidad de transformar texto en imágenes con un alto nivel de realismo, abriendo un sinfín de posibilidades creativas. 

El nuevo Reglamento de IA 

La versión aprobada del próximo Reglamento de IA incluyó normas específicas para los modelos fundacionales. 

Así, por ejemplo, el Reglamento establece que los modelos fundacionales deben cumplir obligaciones específicas en materia de transparencia antes de ser introducidos en el mercado.

Asimismo, se ha introducido un régimen más estricto para los modelos de «gran impacto», entendidos como modelos fundacionales entrenados con gran cantidad de datos y con capacidades más avanzadas, aunque también pueden difundir riesgos sistémicos a lo largo de la cadena de valor. 

El Reglamento de la IA establece que los modelos fundacionales deben cumplir obligaciones específicas en materia de transparencia antes de ser introducidos en el mercado

Una IA en español 

La primera versión de la Estrategia Nacional de Inteligencia Artificial (por sus siglas, ENIA), publicada por el Gobierno de España en noviembre del año 2020, hacía referencia a la importancia de la lengua española en el entorno tecnológico. Y lo hacía destacando la necesidad de liderar la inclusión y el uso de la lengua española en la Inteligencia Artificial (IA) mediante varios aspectos, como son:

Tal aspiración se incluía, asimismo, como uno de los siete objetivos que contiene la ENIA, en particular el que lleva por título “proyección de la lengua española”, que se fija como meta la de liderar, a nivel mundial, el desarrollo de herramientas, tecnologías y aplicaciones para la proyección y uso de la lengua española en los ámbitos de aplicación de la IA. 

La primera versión de la Estrategia Nacional de Inteligencia Artificial, publicada por el Gobierno de España en noviembre del año 2020, hacía referencia a la importancia de la lengua española en el entorno tecnológico

En dicho documento, resulta especialmente relevante la referencia que se hace al idioma español y a las lenguas cooficiales, cuando se trata el asunto relativo al procesamiento del lenguaje natural, con respecto al cual se afirma que: 

Un componente básico de la infraestructura para la IA es el tratamiento del lenguaje natural, en el que España dispone de una ventaja importante: el talento especializado en la tecnología y en el idioma español. En este ámbito, España ya cuenta con el Plan de Impulso de las Tecnologías del Lenguaje, para fomentar el desarrollo del procesamiento del lenguaje natural, la traducción automática y los sistemas conversacionales en lengua española y lenguas cooficiales, ayudando a la internacionalización de las empresas e instituciones que componen el sector, ampliando la participación española en I+D+I en TIC en el ámbito internacional, y mejorando la cooperación con la comunidad iberoamericana. 

Además, la Real Academia Española (RAE) ha promovido un acuerdo con los principales operadores de plataformas digitales para impulsar el Plan Nacional de Tecnologías del Lenguaje y lanzar el Proyecto LEIA (Lenguaje Español e Inteligencia Artificial), que tiene por objeto la defensa, proyección y buen uso de la lengua española, especialmente, en el ámbito de la Inteligencia Artificial. 

Un puente hacia Hispanoamérica

El pasado lunes 26 de febrero, en la ponencia que dio Josep Borrell en la escuela de negocios Next, confirmaba que Europa había vuelto a considerar a Latinoamérica dentro de su estrategia a futuro. 

A mi entender, y en línea con lo afirmado por el vicepresidente de la Comisión Europea, conseguir que el español sea una lengua sobre la cual se desarrolla la Inteligencia Artificial (y otras que se construyan soportadas sobre tal tecnología) se trata también de una cuestión geopolítica de alto nivel estratégico para España.

No sólo por el posicionamiento internacional que tal desarrollo permitirá a nuestro país, y la posibilidad de fomento de la industria y la I+D+i nacional. Sino porque, en lo que se refiere a las relaciones internacionales, esto puede evitar un eventual aislamiento de los países hispanoparlantes en este nuevo mundo regido por la Inteligencia Artificial. 

Conseguir que el español sea una lengua sobre la cual se desarrolla la Inteligencia Artificial (y otras que se construyan soportadas sobre tal tecnología) se trata también de una cuestión geopolítica de alto nivel estratégico para España

En cualquier caso, habrá que centrar los esfuerzos en lograr una adecuada colaboración público-privada y una suficiente inversión. Ya encontramos algún caso de éxito en España, como puede ser el caso de MIAbogado, que puede servirnos como referencia del esfuerzo que puede conllevar un proyecto de tal magnitud. 

SOBRE LA FIRMA
Francisco Pérez Bes es socio en el área de Derecho Digital de Ecix Group y ex Secretario General del Instituto Nacional de Ciberseguridad (INCIBE)
Salir de la versión móvil