quarta-feira, 5 de setembro de 2018

Novèl traductor automatic del francés a l’occitan

Ven tot bèl just de se publicar una primièra version d’ensag d’un traductor automatic del francés a l’occitan


Aqueste traductor es estat desvolopat sus la plataforma de còde dobèrt e de logicial liure Apertium, ont fins ara i aviá 48 traductors automatics. Dins aquel environament se pòt remarcar lo trabalh fach per las lengas minorizadas e/o qu’an pas gaire de ressorsas electronicas, coma l’aragonés, l’asturian, lo bielorús, lo breton, lo maltés, lo sami septentrional, lo sarde, lo tatar e lo tatar de Crimèa. E durant lo mes de junh s’i apondèt lo traductor automatic polonés-silesian.
 
Apertium, pr’aquò, es pas sonque de traductors automatics, mas un ensemble d’aisinas lingüisticas que permeton de produire diferentas ressorsas lingüisticas, coma de diccionaris bilingües, de correctors ortografics e d’analisadors morfologics, emplegats dins de còrpus lingüistics. De fach, actualament Apertium amassa de ressorsas lingüisticas per gaireben 80 lengas. Estent que son de ressorsas liuras, son utilizadas dins maitas aplicacions o programas e mai dins de sits web. Per exemple, Wikipèdia utiliza los traductors d’Apertium dins son esplech Content Translation per tal de facilitar la traduccion d’articles d’una lenga a una autra.
 
Lo traductor francés-occitan comencèt de se desvolopar tre lo mes de mai, gràcias a una borsa del programa Google Summer of Code, que dempuèi 2005 lo famós gigant informatic american dona d’ajudas cada estiu a d’estudiants e d’organizacions pr’amor de desvolopar de logicials liures. Ongan, demest las 14 borsas qu’Apertium a recebut d’aqueste programa son a se desvolopar, en mai del traductor francés-occitan, de traductors guaraní-espanhòl, canarés-marati, sakha-cazac, tatar-chovash, tatar-bashkir, odmort-komi e oigor-turc.

Al projècte sus la revirada francés-occitan a trabalhat Claudi Balaguer jos la direccion e supervision d’Hèctor Alòs. Claudi Balaguer es ensenhaire, dialectològ, e membre de l’Acadèmia Aranesa de la Lenga Occitana; participèt ja anteriorament a la comission del traductor de la Val d’Aran.
 
L’occitan es estat una de las primièras lengas a èsser introduchas dins Apertium, amb los traductors occitan-catalan e catalan-occitan que foguèron publicats en 2006. En 2008, i foguèron aponduts l’occitan-espanhòl e l’espanhòl-occitan. Foncionan totes tant per l’occitan referencial coma per la varietat aranesa. Lo francés, de son costat, ten mai de traductors incorporats dins Apertium: cap al catalan, l’espanhòl, l’esperanto e mai lo breton.
 
La version actuala del traductor automatic sonque permet de traduire del francés a l’occitan. Compren un diccionari bilingüe de 27 000 mots, sens comptar los noms d’ostal, orientat devèrs la traduccion d’articles enciclopedics e jornalistics. Dona un taus d’errors d’un 10% pels articles de la Wikipèdia, çò qu’es considerat coma sufisent per ne publicar una primièra version e d’esperar lo feedback dels utilizaires.
 
Jornalet i a contribuit en permetent un accès liure a tot son còrpus.
 
 
 
 



[Poblejat dins www.jornalet.com]

Sem comentários:

Enviar um comentário