Choose your language
Eleka ha desenvolupat una versió millorada de Matxin, el traductor automàtic per al parell de llengües castellà-basca
15/12/2009
El desenvolupament de la versió millorada del traductor automàtic per al parell de llengües castellà-basca ha estat realitzat en col·laboració amb la Fundació Elhuyar i el grup IXA de la UPV/EHU.
Han passat cinc anys des que Eleka Ingeniaritza Linguistikoa, SL comencés a desenvolupar la plataforma Opentrad de traducció automàtica en codi obert juntament amb empreses i universitats de Galícia i dels Països Catalans. (www.opentrad.com). La versió millorada de Matxin (castellà-basc) forma part de la plataforma Opentrad, on s'han utilitzat diverses tècniques de traducció.
La presentació realitzada avui en el Koldo Mitxelena Kulturunea ha comptat amb la participació d'Inaki Irazabalbeitia (gerent d'Eleka), de Josu Waliño (director projectes de la Fundació Elhuyar) i d'Iñaki Alegria (del grup IXA de la UPV-EHU). Tal com s'ha esmentat, la versió que s'ha mostrat avui és l'evolució de la versió anterior del traductor automàtic per al parell castellà-basc.
Matxin és una aplicació de codi obert, i forma part de la plataforma Opentrad. La versió renovada que s'ha presentat avui mostra dues característiques particulars. D'una banda, s'ha millorat el traductor de castellà a basc. És a dir, aquesta és una versió renovada del prototip que es va presentar en 2006, i cap destacar que ha millorat notablement la seva qualitat en la traducció. D'altra banda, s'ha creat el primer prototip del traductor Matxin per a l'adreça basca-castellà. Els dos traductors poden ser utilitzats de forma gratuïta en la pàgina web www.opentrad.com.
Al món de la traducció automàtica s'utilitzen dos mètodes per a la traducció: el que està basat en les regles sintàctiques i l'estadístic. El sistema basat en regles funciona amb informació lingüística, és a dir, es creen regles segons l'estructura sintàctica de l'idioma. Per contra, el sistema estadístic es basa en traduccions ja realitzades amb anterioritat, i utilitza aquestes dades a l'hora de realitzar les traduccions. En el cas de Matxin s'han desenvolupat i integrat les dues tècniques per a la combinació castellà-basca; i solament s'ha utilitzat el mètode estadístic per a la combinació basca-castellà.
El valor afegit més important de Matxin per al parell castellà-basc és que forma part del sistema de codi obert Opentrad. Per tant, el motor de traducció castellà-basca queda al servei de la comunitat després del seu desenvolupament. Així, qualsevol usuari podrà adaptar-ho a les seves necessitats, sense haver de pagar cap llicència.
Es pot accedir al motor desenvolupat per Eleka a la pàgina web www.opentrad.com.
S'han expressat mostres d'agraïment als ajuntaments de Donostia-Sant Sebastià, de Vitòria-Gasteiz i d'Arrasate, a IVAP, a Eroski, a EiTBNET i a la revista Aldaketa 16, per les memòries de traducció que van prestar, ja que han estat de gran utilitat per a l'entrenament del sistema estadístic.
Aquesta iniciativa ha estat subvencionada pel Departament d'Indústria, Comerç i Turisme del Govern Basc, i pel Ministeri d'Indústria, Turisme i Comerç, amb els programes Gaitek i Profit, respectivament.


