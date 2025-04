Antonio Paniagua Madrid Jueves, 14 de marzo 2024, 17:44 | Actualizado 18:38h. Comenta Compartir

A mediados de 2025 ya estarán disponibles las herramientas de inteligencia artificial que permitirán a la Real Academia Española (RAE) dar un salto cualitativo en la estudio y preservación del idioma. La institución pondrá en marcha un observatorio de neologismos, términos y variaciones del español, así como un verificador lingüístico en abierto que hará posible una correcta escritura desde un punto de vista ortográfico, gramatical y léxico.

Estas iniciativas se inscriben en la segunda fase del proyecto Lengua Española e Inteligencia Artificial (LEIA), para el que se ha arbitrado un presupuesto de cinco millones de euros. Según dijo el director de la RAE, Santiago Muñoz Machado, la organización aspira a estar en el centro de una gran base de datos para alimentar un corpus lingüístico que esté liberado de sesgos discriminatorios y que procure un lenguaje de calidad.

Con respecto al verificador, se podrá introducir una duda en un buscador y el sistema seleccionará la respuesta de entre los cientos de miles almacenadas en la plataforma. En caso de que el modelo, carezca de una respuesta exacta para la pregunta planteada, el usuario podrá enviarla a través de un cuestionario y recibirá la contestación personalizada de los lingüistas de la RAE. El verificador no solo sugerirá cambios en la redacción, sino que explicarán las razones de la propuesta.

Radiografía del español

Para la académica y experta en computación Asunción Gómez Pérez, el observatorio se alimentará de fuentes de información muy diversas, como periódicos, blogs, redes sociales y otras obras de la RAE que aporten palabras y expresiones que no estén registradas en el diccionario de la organización. El objetivo no solo es hacer un mapa de la lengua en España, sino de todos los países hispanohablantes. Con las herramientas de la IA se podrá saber con rapidez el uso de nuevos vocablos y la frecuencia con que se usan. Ello podrá acortar los plazos para la incorporación de nuevos términos y acepciones al diccionario de la institución. «Las entradas serán mucho más rápidas, así como la presentación final de las modificaciones que hacemos cada año, pues podrán estar también mucho más motivadas», alegó Muñoz Machado.

En la nueva fase del proyecto, se recopilará material de las distintas variedades geográficas del español. Para hacer esta radiografía, se podrá colocar una imagen para que cada usuario aporte información de viva voz sobre cómo se llama en su tierra la figura en cuestión. Con estas grabaciones, se pretende crear un corpus oral que permita entrenar a los sistemas en la detección de los distintos acentos para que la máquina pueda reconocerlos con facilidad.

«Hay gente que piensa si acaso no estaremos metiéndonos en un terreno que no forma parte de la actividad ordinaria de la academia. Y tienen razón. Esto no forma parte de nuestra actividad tradicional, pero esto es la tecnología, y la tecnología no hay quien la pare», dijo Muñoz Machado.

Además del personal de la RAE, el proyecto LEIA cuenta con la participación de empresas externas subcontratadas, como es Fujitsu, con tecnología de Amazon Web Services (AWS), para el observatorio, el verificador, y los aspectos relacionados con la diversidad y accesibilidad, y VASS, para la elaboración de la herramienta de consultas y respuestas.