GL | ES | CA | EU | EN | PT | FR

Eleka desenvolveu unha versión mellorada de Matxin, o tradutor automático para o par de linguas castelán-eúscaro

15/12/2009

Nova: Eleka desenvolveu unha versión mellorada de Matxin, o tradutor automático para o par de linguas castelán-eúscaro

O desenvolvemento da versión mellorada do tradutor automático para o par de linguas castelán-eúscaro foi realizado en colaboración coa Fundación Elhuyar e o grupo IXA da UPV/EHU. 

Pasaron cinco anos desde que Eleka Ingeniaritza Linguistikoa, SL comezase a desenvolver a plataforma Opentrad de tradución automática en código aberto xunto con empresas e universidades de Galicia e dos Países Cataláns. (www.opentrad.com). A versión mellorada de Matxin (castelán-eúscaro) forma parte da plataforma Opentrad, onde se utilizaron diversas técnicas de tradución.

A presentación realizada hoxe no Koldo Mitxelena Kulturunea contou coa participación de Inaki Irazabalbeitia (xerente de Eleka), de Josu Waliño (director proxectos da Fundación Elhuyar) e de Iñaki Alegria (do grupo IXA da UPV-EHU). Tal e como se mencionou, a versión que se mostrou hoxe é a evolución da versión anterior do tradutor automático para o par castelán-eúscaro.

Matxin é unha aplicación de código aberto, e forma parte da plataforma Opentrad. A versión renovada que se presentou hoxe mostra dúas características particulares. Por unha banda, mellorouse o tradutor de castelán a eúscaro. É dicir, esta é unha versión renovada do prototipo que se presentou en 2006, e cabe destacar que mellorou notablemente a súa calidade na tradución. Por outra banda, creouse o primeiro prototipo do tradutor Matxin para a dirección eúscaro-castelán. Os dous tradutores poden ser utilizados de forma gratuíta na páxina web www.opentrad.com.

No mundo da tradución automática utilízanse dous métodos para a tradución: o que está baseado nas regras sintácticas e o estatístico. O sistema baseado en regras funciona con información lingüística, é dicir, créanse regras segundo a estrutura sintáctica do idioma. Pola contra, o sistema estatístico baséase en traducións xa realizadas con anterioridade, e utiliza eses datos á hora de realizar as traducións. No caso de Matxin desenvolvéronse e integrado as dúas técnicas para a combinación castelán-eúscaro; e  só se utilizou o método estatístico para a combinación eúscaro-castelán.

O valor engadido máis importante de Matxin para o par castelán-eúscaro é que forma parte do sistema de código aberto Opentrad. Por tanto, o motor de tradución castelán-eúscaro queda ao servizo da comunidade despois do seu desenvolvemento. Así, calquera usuario poderá adaptalo ás súas necesidades, sen ter que pagar ningunha licenza.

Pódese acceder ao motor desenvolvido por Eleka na páxina web www.opentrad.com.

Expresáronse mostras de agradecemento aos concellos de Donostia-San Sebastián, de Vitoria-Gasteiz e de Arrasate, a IVAP, a Eroski, a EiTBNET e á revista Aldaketa 16, polas memorias de tradución que prestaron, posto que foron de gran utilidade para o adestramento do sistema estatístico.

Esta iniciativa foi subvencionada polo Departamento de Industria, Comercio e Turismo do Goberno Vasco, e polo Ministerio de Industria, Turismo e Comercio, cos programas Gaitek e Profit, respectivamente.

 

invasión