Com la Intel·ligència Artificial pot accelerar (o frenar) l'extinció de les llengües minoritzades com el català
Un estudi editat per la Fundació Irla i Coppieters Foundation revela que el factor determinant perquè una llengua tingui presència en un model d'IA no és tant el nombre de parlants com la disponibilitat de dades digitals de qualitat

Barcelona-
La Intel·ligència Artificial (IA) suposarà -o ja està suposant- un repte per a molts sectors laborals i en molts àmbits de la societat. Concretament la IA generativa està transformant de manera profunda com ens produïm, distribuïm i consumim informació. També serà un repte per a les llengües minoritzades com el català, el gallec o el basc, que ja porten anys -des dels inicis d'internet- remant a contracorrent per estar presents en el món digital, basat en una sèrie d'algorismes que sovint les invisibilitza. Com afectarà ara la IA a les llengües europees no hegemòniques?
És una de els preguntes que respon l'estudi La IA en el futur de les llengües europees no hegemòniques, d'Albert Cuesta i editat per la Fundació Irla -vinculada a Esquerra Republicana de Catalunya- i Coppieters Foundation, que afirma que el desplegament accelerat de la IA pot esdevenir tant una oportunitat històrica per a la preservació de la diversitat lingüística com un factor d'agreujament de les desigualtats ja existents entre llengües dominants i llengües minoritzades.
El més lògic és pensar que com més parlants té una llengua, més presència té al món digital. Però l'estudi desmonta aquesta tèsi, ja que conclou que el factor determinant perquè una llengua tingui espai en un model d'IA no és tant el nombre de parlants com la disponibilitat de dades digitals de qualitat. Això són grans corpus de text, enregistraments de veu, diccionaris, dades anotades i recursos lingüístics estructurats.
L'estudi parteix del fet que Europa és un dels territoris amb més riquesa lingüística del món. Hi conviuen més de 250 llengües, moltes de les quals són regionals, minoritàries o minoritzades. Entre 40 i 50 milions de ciutadans de la Unió Europea parlen habitualment alguna d'aquestes llengües. Però aquesta diversitat no té un reflex proporcional en l'entorn digital. La majoria d'aquestes llengües tenen una presència escassa o marginal a internet i als sistemes tecnològics avançats. De fet, menys del 5% de les llengües del món disposen d'una representació significativa a internet.
Aquesta desigualtat no és accidental. Segons l'estudi, és el resultat de processos històrics de minorització, assimilació lingüística i desigualtats de poder que han limitat l'ús públic, educatiu i administratiu de moltes llengües. La IA, lluny de corregir automàticament aquestes desigualtats, tendeix a reproduir-les i fins i tot a amplificar-les, ja que els models d'aprenentatge automàtic aprenen a partir de les dades existents. Per tant, si una llengua és invisible en l'àmbit digital, també ho serà per als sistemes d'IA.
La majoria de les llengües tenen una presència escassa o marginal a internet i als sistemes tecnològics avançats
Però la IA ofereix eines que la tecnologia convencional no oferia, com les tecnologies de processament del llenguatge natural, que permeten documentar llengües amb una forta tradició oral mitjançant la transcripció automàtica de veu, facilitar la creació de diccionaris i gramàtiques, i construir arxius digitals consultables que assegurin la preservació del coneixement lingüístic a llarg termini. Aquestes eines redueixen de manera dràstica els costos i el temps necessaris per a tasques que fins ara requerien una dedicació manual molt elevada.
Per tant, la IA pot contribuir a la revitalització d'algunes llengües minoritzades. Les aplicacions basades en IA poden connectar parlants nadius i aprenents separats geogràficament, oferir pràctica lingüística continuada i adaptar els continguts al nivell i al ritme de cada usuari. En termes d'accessibilitat i drets lingüístics, la traducció automàtica i els assistents digitals poden facilitar l'accés a serveis públics, sanitaris i educatius en llengües no hegemòniques, millorant la participació social i reduint barreres comunicatives.
La manca de transparència dels grans models comercials, sovint concebuts com a caixes negres
Però no tot són flors i violes, l'estudi alerta de diversos riscos. El primer és l'ampliació de l'escletxa digital. Les llengües que no estan ben representades als models d'IA queden excloses dels nous serveis i aplicacions, cosa que genera una nova forma d'exclusió. A això s'hi afegeixen els biaixos algorítmics, ja que els models tendeixen a reflectir les normes, valors i visions del món de les llengües dominants, sovint en detriment de les cultures minoritzades.
Un altre risc clau és l'homogeneïtzació cultural. La producció massiva de continguts en poques llengües globals pot desplaçar les llengües no hegemòniques dels espais de creació simbòlica i narrativa. A més, la manca de transparència dels grans models comercials, sovint concebuts com a caixes negres, dificulta saber com tracten realment aquestes llengües i limita la capacitat de les comunitats per intervenir-hi o corregir-ne els dèficits.
Com es pot revertir aquesta situació?
L'estudi mostra que hi ha maneres de revertir aquesta situació. A través de diversos casos d'estudi —com el Projecte AINA per al català, les iniciatives de traducció automàtica en basc o l'experiència islandesa amb models globals— es demostra que la proactivitat institucional, la inversió en dades obertes, la col·laboració publicoprivada i la implicació de la comunitat són factors determinants per garantir una presència digital.
L'estudi també defensa la necessitat que les grans empreses tecnològiques apostin per indicadors més justos que permetin avaluar la qualitat dels sistemes d'IA més enllà del simple rendiment estadístic, i que no penalitzin sistemàticament les llengües minoritzades.
La Llei d'Intel·ligència Artificial de la Unió Europea no aborda explícitament la qüestió lingüística
Pel que fa a la regulació, segons l'estudi, la Llei d'Intel·ligència Artificial de la Unió Europea no aborda explícitament la qüestió lingüística, però estableix principis com la transparència, la seguretat i la protecció dels drets fonamentals que poden tenir un impacte indirecte en la diversitat lingüística. L'estudi assenyala que la implementació d'aquesta normativa és una oportunitat per incorporar una vessant lingüística que eviti reforçar encara més el predomini de les llengües hegemòniques.

Comentaris dels nostres subscriptors
Vols comentar-ho?Per veure els comentaris dels nostres subscriptors, inicia sessió o registra't.