El servei de traducció automàtica de la Generalitat de Catalunya incorpora l’occità

El servei de traducció automàtica que la Generalitat de Catalunya ofereix en línia per a la ciutadania i les empreses (http://www.gencat.cat/traductor) ha incorporat els parells de llengües català-occità-català i castellà-occità-castellà.

El sistema de traducció automàtica per a l’occità ofereix les mateixes prestacions que les que actualment hi ha per als altres parells de llengües (català-castellà-català, català-anglès-català, català-francès-català i català-alemany-català): traducció de textos breus i pàgines web i possibilitat d’integració de botons de traducció als webs.

El sistema permet distingir l’occità general de la varietat dialectal aranesa. Així, a l’hora de fer una traducció es pot triar entre les direccions de traducció següents: català-occità, occità-català, català-occità aranès, occità aranès-català, castellà-occità, occità-castellà, castellà-occità aranès, i occità aranès-castellà.

El desenvolupament l’ha dut a terme l’empresa Taller Digital mitjançant l’adjudicació d’un concurs públic i es basa en la plataforma de traducció automàtica de codi obert Apertium (http://www.apertium.org).

Pel que fa als recursos lingüístics, d’una banda, s’han completat les dades del paquet lingüístic català-aranès-català de codi obert desenvolupat amb anterioritat per la Universitat d'Alacant i la Universitat Pompeu Fabra en un projecte finançat per la Generalitat de Catalunya i, de l’altra, s’han generat les dades del nou paquet lingüístic català-occità-català. Paral·lelament, a partir d’aquesta feina de desenvolupament i d’altres dades lliures disponibles per al castellà, s’han elaborat les dades lingüístiques del parell castellà-occità i castellà-occità aranès.

Tècnicament els recursos lingüístics estan completament separats del motor, fan servir un format estàndard (XML) i són lliures (GPL). Això deixa oberta la possibilitat de fer-los servir per a altres tasques relacionades amb les tecnologies lingüístiques per a l’occità, com ara correctors ortogràfics i sintàctics, analitzadors morfològics, lematitzadors, conjugadors verbals, altres parells de llengües de traducció, etc.

Amb aquest projecte, la Generalitat de Catalunya aposta pel desenvolupament de programari obert i pel suport a la llengua occitana i, en concret, a l’aranès, varietat de l’occità que a Catalunya comparteix oficialitat amb el català i el castellà arran del que estableix l’Estatut d’autonomia de Catalunya de 2006.

Lo servici de traduccion automatica de la Generalitat de Catalonha incorpora l’occitan

Lo servici de traduccion automatica que la Generalitat de Catalonha oferís en linha pels ciutadans e las entrepresas (http://www.gencat.cat/traductor) a incorporat lo parelh de lengas catalan-occitan-catalan e castelhan-occitan-castelhan.

Lo sistèma de traduccion automatica per l’occitan oferís las meteissas prestacions que los altres actuals parelhs de lengas (catalan-castelhan-catalan, catalan-anglés-catalan, catalan-francés-catalan e catalan-alemand-catalan): traduccion de tèxtes brèus e paginas de ret e possibilitat d’integracion de botons de traduccion als sites de ret.

Lo sistèma permet de distinguir l’occitan general de la varietat dialectala aranesa. Atal, per far una traduccion, se pòt triar entre las direccions de traduccion seguentas: catalan-occitan, occitan-catalan, catalan-occitan aranés, occitan aranés-catalan, castelhan-occitan, occitan-castelhan, castelhan-occitan aranés, e occitan aranés-castelhan.

Lo desvolopament es estat portat per l’entrepresa Talher Digital per adjudicacion d’un concors public basat sus la plataforma de traduccion automatica de còdi obèrt Apertium (http://www.apertium.org).

Per çò de las ressorsas lingüisticas, d’un costat, s’a completat las donadas del paquet lingüistic catalan-aranés-catalan de còdi obèrt desvolopat anteriorament per l’Universitat d'Alacant e l’Universitat Pompeu Fabra en un projècte finançat per la Generalitat de Catalonha e, de l’altre, s’a generat las donadas del nòu paquet lingüistic catalan-occitan-catalan. Parallèlament, a partir d’aquest trabalh de desvolopament e d’altras donadas liuras disponiblas pel castelhan, s’a elaborat las donadas lingüistiques del parelh castelhan-occitan e castelhan-occitan aranés.

Tecnicament las ressorsas lingüisticas son completament separadas del motor, utilizan un format estandard (XML) e son liuras (GPL). Aiçò daissa obèrta la possibilitat de los utilizar per altres trabalh relacionats amb las tecnologias lingüisticas per l’occitan (correctors ortografics e sintactics, analizadors morfologics, lematizadors, conjugadors verbals, altres parelhs de lengas de traduccion, etc.)

Amb aquest projècte, la Generalitat de Catalunya s’engatja pel desvolopament de la programacion obèrta, e pel supòrt a la lenga occitana e, en concret, a l’aranés, varietat de l’occitan que en Catalonha parteja l’oficialitat amb lo catalan e lo castelhan coma o establís l’Estatut d’autonomia de Catalonha de 2006.