Sephatrad: Els perills amagats de la traducció automàtica

La major part dels textos que consumim són traduccions, sobretot a les xarxes.

Escrit per Esther Monzó-Nebot

Professora de l'àrea de Traducció i Interpretació, Universitat Jaume I

La traducció i la interpretació amb intel·ligència artificial ja formen part de la vida quotidiana. La major part dels textos que consumim són traduccions, sobretot a les xarxes. En el dia a dia, utilitzem la traducció automàtica per entendre articles de diari o documents sanitaris.

En un context com el català, marcat pel plurilingüisme i pel valor social de les llengües, aquesta tecnologia, però, també reconfigura les relacions socials de poder i l’accés als drets en exacerbar estereotips i oferir més o menys qualitat en funció de la llengua que es parla.

I és que, com amb qualsevol altra tecnologia, el que veritablement importa són les implicacions polítiques i socials: què passa quan deleguem la nostra comunicació a sistemes automatitzats que ni volen ni poden entendre el context social en què operen?

Ho fan millor que abans, però al·lucinen

El 2016 el món de la traducció va canviar. La intel·ligència artificial (IA) va entrar en la traducció automàtica de la mà de Google Translate, amb el que s’anomena traducció automàtica neuronal. Poc a poc, tots els sistemes de traducció automàtica han anat incorporant models d’aprenentatge profund entrenats amb grans quantitats de textos. Aquests models calculen probabilitats del que traduiria una persona. Ho fan a partir dels patrons estadístics que es generen amb les traduccions que ja han fet altres persones.

Aquests models han portat una millora notable: si abans les frases tenien errors lingüístics bàsics, ara els textos pareixen correctes. Els problemes han deixat de veure’s a simple vista. Vol dir que no n’hi ha? Malauradament, no.

Només són més difícils de detectar i necessiten coneixements de la llengua original per veure, per exemple, quan el que ofereix el sistema és una al·lucinació. Perquè les màquines al·lucinen. Ens donen solucions que han aprés amb els textos d’entrenament, independentment de si consten en el text original. El que és probable i majoritari passa per davant del que és real.

La màquina no entén el context

I n’hi ha més: les màquines no entenen els contextos en què s’usaran els textos, de manera que, si hi confiem, podem acabar presentant-nos com a persones maleducades perquè no comprenen que la cortesia no és igual en tots els grups lingüístics; mentideres, perquè no poden resoldre ambigüitats més enllà d’unes quantes paraules; ignorants, perquè no poden comprendre distincions entre conceptes que solen aparèixer junts; a més de racistes, masclistes o capacitistes.

Malauradament ja tenim casos en què aquesta confiança en la traducció automàtica ha comportat deportacions i detencions, donacions d’òrgans no consentides o caos en la informació pública proporcionada durant la pandèmia, per posar només uns exemples. I, en tots els casos, la responsabilitat recau en qui usa l’eina, perquè la informació sobre els límits i riscos dels sistemes de traducció automàtica no sempre es presenta de manera clara ni proporcional als possibles impactes.

Prejudicis que s’exageren

Un dels problemes que aconsellen no confiar en la traducció automàtica és que aquests sistemes aprenen els prejudicis dels textos amb què s’han entrenat i els usen com a norma. Si ens mirem les societats en què vivim, podem imaginar què comporta això: biaixos de gènere, de classe, d’edat, culturals, lingüístics…

La traducció automàtica tradueix sistemàticament en masculí, excepte les professions relacionades amb la cura, i parla com una persona major.

No són errors innocus, ni tan sols aïllats: és una regularitat estructural que perpetua estereotips. La traducció automàtica és a tot arreu i, per això mateix, té un gran poder per normalitzar el que diu.

També cal considerar que el català, com moltes altres llengües minoritzades, està menys present en els corpus que alimenten aquests sistemes. Això fa que les traduccions cap al català o des del català tendisquen a ser menys precises, menys variades i més dependents d’estructures d’altres llengües dominants. El resultat n'és que els coneixements d’uns grups lingüístics s'imposen sobre d’altres i s'estableixen jerarquies en l’ecosistema digital.

A costa del planeta

La publicitat dels sistemes de traducció automàtica amb IA els presenta com a solucions eficients i ràpides, tant que pareixen immaterials. Tanmateix, darrere hi ha una infraestructura física amb un gran impacte ecològic, tant en l’entrenament dels models com en l’ús quotidià a gran escala, en especial per als sistemes de generació de textos que solen funcionar gràcies a megacentres de dades.

Els centres que allotgen i fan possible el funcionament dels servidors, sistemes d’emmagatzematge, xarxes i sistemes de refrigeració que sostenen aquests serveis digitals consumeixen grans quantitats d’energia i, malgrat que alguns proveïdors incorporen energies renovables, la demanda creixent ha portat les grans empreses tecnològiques a abandonar els seus objectius de sostenibilitat.

Traficar amb dades

Tan amagat com el cost ambiental és el cost que paguem amb dades. Ja ho diuen: quan no paga pel producte, el producte es vostè. Concretament, les seues dades.

La relació que establim amb els nostres ordinadors i mòbils acaba sent una d’identificació. Sense parlar-ho, hi col·laborem i n’esperem col·laboració. En aquest context quasi íntim, donar les nostres dades és pràcticament un acte reflex. Però les eines de traducció solen funcionar amb infraestructures al núvol i poden emmagatzemar els continguts processats i reutilitzar-los en altres traduccions. O analitzar-los.

Això planteja interrogants sobre la confidencialitat, especialment en àmbits protegits pel secret professional. És conegut el cas d’un professor holandés que va pujar les dades de tota la seua classe a una eina d’IA. Tot i que l’eina que utilitzava deia que processava les dades localment, les enviava als servidors d’OpenAI.

Podem reduir els riscos?

Aprendre quins són els riscos que amaguen aquests sistemes ens permet decidir quan utilitzar-los i quan els perjudicis són excessius. La nostra imatge, la nostra salut, les nostres dades, els nostres drets, l'aire que respirem o la disponibilitat d’aigua són tot riscos materials d'una subordinació generalitzada als gegants tecnològics.

De forma semblant a triar si agafar el cotxe o la bicicleta, la traducció automàtica requereix usos conscients. I de la mateixa manera, requereix límits generals que no depenguen de decisions individuals: una regulació que obligue a la transparència, limite les emissions, el tràfic de dades i la distribució dels prejudicis que empitjoren la nostra vida en societat.

Quan traduir no és triar sinó calcular

El llenguatge és l'eina més poderosa de construcció social. La traducció automàtica neuronal tria els mots per càlculs estadístics. Traduir patrons de llengua anul·la la força dels silencis, les ironies, les ambigüitats estratègiques i les formes de cortesia culturalment marcades, i ens deixa sense armes per contribuir a les nostres relacions i les nostres societats.

En usos quotidians o serveis públics, decidir com, quan i amb quines garanties utilitzem aquestes tecnologies hauria de ser, en última instància, una decisió col·lectiva. Però ho és?

[Foto: Anna Gawlik/Shutterstock - font: www.theconversation.com ]

Sephatrad

Páginas

terça-feira, 10 de março de 2026

Els perills amagats de la traducció automàtica

Sem comentários:

Enviar um comentário

Etiquetas