Actualidade
Portada » Actualidad » Noticias » Unión Europea » Agenda Digital »Nace la Alianza para las Tecnologías Lingüísticas (ALT-EDIC)
— En diciembre de 2023 se propuso la creación de un nuevo Consorcio Europeo de Infraestructuras Digitales (EDIC), llamado Alianza para las Tecnologías Lingüísticas (ALT-EDIC).
— La Alianza tiene como objetivo impulsar la diversidad, riqueza y competitividad lingüística europeas a través de la creación de una infraestructura europea común en el ámbito de las tecnologías lingüísticas.
Bruselas, 7 de febrero de 2024. El ALT-EDIC, Alianza para las Tecnologías Lingüísticas, fue propuesto en diciembre de 2023 como uno de los primeros EDIC (Consorcio de Infraestructuras Digitales Europeas) en el marco del Programa Político 2030 de la Década Digital.
El 7 de febrero de 2024, la Comisión Europea creó oficialmente la ALT-EDIC con la Decisión de Ejecución (UE) 2024/458. La Alianza está coordinada por Francia y cuenta con:
- Doce Estados miembros: Bulgaria, Croacia, Eslovenia, España, Francia, Grecia, Irlanda, Italia, Letonia, Lituania, Países Bajos y Polonia;
- Siete Estados miembros observadores: Austria, Bélgica, Dinamarca, Estonia, Malta, Rumanía y Eslovaquia.
La misión de ALT-EDIC es desarrollar una infraestructura europea común en el ámbito de las tecnologías lingüísticas, especialmente a través de la creación de grandes modelos lingüísticos de las lenguas oficiales y regionales europeas.
Su objetivo es mejorar la competitividad europea, aumentar la disponibilidad de datos lingüísticos europeos y mantener la diversidad lingüística y la riqueza cultural de Europa.
Más concretamente, este nuevo consorcio pretende utilizar los modelos de lenguaje creados para impulsar el desarrollo de modelos avanzados de inteligencia artificial (IA) capaces de comprender y generar un lenguaje similar al humano, haciendo así frente a la escasez de datos lingüísticos europeos disponibles.
El plan de acción del ALT-EDIC se centra en cinco áreas temáticas:
- Datos: Desarrollar una plataforma central de recursos lingüísticos europeos y recopilar conjuntos de datos de alta calidad, basándose en el Espacio de Datos Lingüísticos. Se prestará especial atención a la creación de datos estratégicos para las lenguas con pocos recursos.
- Modelos de lenguaje existentes: recopilar modelos de código abierto, afinarlos, reducirlos y optimizarlos para su uso en las pymes europeas, y proporcionar metodologías para su evaluación, certificación y normalización.
- Nuevos modelos lingüísticos: lanzar nuevos modelos de código abierto (incluidos modelos con capacidades multimodales), coordinar eficazmente el acceso a los ordenadores EuroHPC para las empresas e industrias de la UE y prestar apoyo a expertos públicos y privados para desarrollar nuevos modelos.
- Evaluación, certificación y normalización: proporcionan metodologías para abordar la discriminación y el sesgo potenciales introducidos por el procesamiento del lenguaje natural.
- Ecosistema: desarrollar una incubadora de empresas emergentes para las empresas que participen en el EDIC, fomentar los vínculos entre la industria y la investigación, actuar como actor clave del plan europeo coordinado sobre IA, reunir y reforzar la comunidad de la LT (tecnologías lingüísticas), prestar apoyo específico a las instituciones para que inviertan en LT y desarrollar programas culturales basados en la IA para el lenguaje.
¿Cuál es el vínculo entre ALT-EDIC y LDS?
El LDS (acrónimo en inglés de “Espacio de datos lingüísticos”) es uno de los diversos espacios de datos apoyados por la Comisión para fomentar un ecosistema de datos en muchos sectores.
El LDS establecerá una estructura de gobernanza para el intercambio de datos de diversos sectores, que podrán utilizarse para desarrollar herramientas de tecnología lingüística. Estos datos también estarán a disposición del ALT-EDIC.
El ALT-EDIC es un proyecto multinacional, dirigido y financiado por los Estados miembros que han acordado unirse a él. Mediante la puesta en común de recursos, los miembros deberían alcanzar la masa crítica de datos y otros recursos necesarios para crear y poner a punto Grandes Modelos Lingüísticos.
Aunque LDS y ALT-EDIC son iniciativas conectadas y ambas trabajan en la digitalización y las lenguas, lo hacen desde ángulos diferentes.
Mientras que LDS se centra en la creación de un ecosistema en torno al intercambio de datos lingüísticos, ALT-EDIC se centra en la creación de un ecosistema a escala europea en torno a las tecnologías lingüísticas, que requieren grandes cantidades de datos lingüísticos.
Ambos mecanismos pretenden implicar a los Estados miembros y a la industria europea en sus esfuerzos, de acuerdo con el Programa de Trabajo Europa DIGITAL para el LDS y el Programa Político de la Década Digital para el ALT-EDIC.
Esto se refleja en el doble modelo de gobernanza adoptado por las iniciativas, que facilitará una transición fluida entre ambas una vez que el proyecto LDS llegue a su fin
Contexto
Los Consorcios Europeos de Infraestructuras Digitales (EDIC) son instrumentos puestos a disposición de los Estados miembros para acelerar y simplificar la creación y ejecución de proyectos multinacionales en el marco del Programa Político 2030 de la Década Digital.
Este Programa establece metas y objetivos en los ámbitos de las competencias digitales, la infraestructura digital, la digitalización de las empresas y de los servicios públicos y crea un nuevo marco para proyectos multinacionales que permitirá a los Estados miembros aunar fuerzas en iniciativas digitales.
Los EDIC son marcos jurídicos que ayudan a los Estados miembros a crear y ejecutar proyectos multinacionales, permitiéndoles poner en común financiación y otros recursos de manera flexible y eficiente, para invertir en proyectos digitales transformadores. Los EDIC también pueden garantizar normas comunes e interoperabilidad.
Cada EDIC es una persona jurídica creada por decisión de la Comisión previa solicitud de al menos tres Estados miembros y aprobación de la Comisión. Su presupuesto se basa en las contribuciones de sus miembros complementadas por otras fuentes de ingresos, que pueden incluir subvenciones de la UE y nacionales.
Un EDIC puede ejecutar un proyecto multinacional desplegando infraestructuras conjuntas, prestando servicios y reuniendo -según consideren oportuno los Estados miembros fundadores- a entidades públicas, entidades privadas, usuarios finales y la industria.
En este marco, la ALT-EDIC, cuyo nombre completo es “Consorcio de Infraestructuras Digitales Europeas de la Alianza para las Tecnologías Lingüísticas”, ha sido el primer EDIC lanzado por la Comisión Europea y los Estados miembros, junto con el Consorcio de Infraestructuras Digitales Europeas para Gemelos Digitales Locales en Red orientados hacia el CitiVERSE (LDT CitiVERSE EDIC).
Más información: Comisión Europea