Calidade que marca: comparativa Opentrad-Google para o par español-galego

26/04/2011

Nova: Calidade que marca: comparativa Opentrad-Google para o par español-galego

Dúas das principais tendencias na tradución automática actual son as representadas polos tradutores de transferencia estrutural (con información lingüística) e polos tradutores estatísticos (sen coñecementos lingüísticos). Cando a distancia entre os idiomas é reducida, como no caso dos idiomas románicos (español, galego, portugués ou catalán, entre outros), onde o foco de atención se centra máis en cuestións lingüísticas que nas de estrutura, resulta evidente, como mostraremos, que os tradutores de transferencia estrutural ofrecen uns resultados moi superiores aos estatísticos.

 

A seguir ofrecemos unha comparativa entre o tradutor estatístico de Google e o de transferencia estrutural utilizado por Opentrad para o par español-galego:

 

tradutor automático

dirección de tradución

NIST*

BLEU*

Google

es > gl

7.5654

0.3299

Opentrad

es > gl

12.6131

0.8977

Google

gl > es

7.9922

0.4136

Opentrad

gl > es

12.1724

0.9062

 

Como podemos ver o tradutor de Google (que utiliza o modelo estatístico, por tanto sen coñecementos lingüísticos) obtén uns resultados claramente inferiores aos do tradutor utilizado por Opentrad segundo os métodos de avaliación NIST e BLEU, que comparan textos traducidos por un humano cos traducidos por un tradutor automático. A medida BLEU puntúa cunha cifra entre 0 e 1, que indica a similitude entre o texto traducido automaticamente e o usado como referencia (traducido por un humano); o valor máis achegado a 1 representa unha maior similitude. A medida NIST é unha evolución derivada de BLEU e que ten en conta máis parámetros para medir a precisión dunha tradución; canto máis alta sexa a puntuación máis precisa será a tradución.

 

*Resultados obtidos mediante medicións realizadas co script mteval-v11b.pl en base á tradución dun documento de 500 liñas e cunha tradución humana como referencia.

 

 
  • imaxin|software
  • Eleka