Qualidade que marca: comparativa Opentrad-Google para o par espanhol-galego

26/04/2011

Notícia:Qualidade que marca: comparativa Opentrad-Google para o par espanhol-galego

Duas das principais tendências na tradução automática atual são as representadas pelos tradutores de transferência estrutural (com informação linguística) e pelos tradutores estatísticos (sem conhecimentos linguísticos). Quando a distância entre os idiomas é reduzida, como no caso dos idiomas românicos (espanhol, galego, português ou catalão, entre outros), onde o foco de atenção se centra mais em questões linguísticas que nas de estrutura, resulta evidente, como mostraremos, que os tradutores de transferência estrutural oferecem uns resultados muito superiores aos estatísticos.

 

A seguir oferecemos uma comparativa entre o tradutor estatístico de Google e o de transferência estrutural utilizado por Opentrad para o par espanhol-galego:

 

tradutor automático

direção de tradução

NIST*

BLEU*

Google

es > gl

7.5654

0.3299

Opentrad

es > gl

12.6131

0.8977

Google

gl > es

7.9922

0.4136

Opentrad

gl > es

12.1724

0.9062

 

Como podemos ver o tradutor de Google (que utiliza o modelo estatístico, por tanto sem conhecimentos linguísticos) obtém uns resultados claramente inferiores aos do tradutor utilizado por Opentrad segundo os métodos de avaliação NIST e BLEU, que comparam textos traduzidos por um humano com os traduzidos por um tradutor automático. A medida BLEU pontua com uma cifra entre 0 e 1, a qual indica a similitude entre o texto traduzido automaticamente e o usado como referência (traduzido por um humano); o valor mais próximo de 1 representa uma maior similitude. A medida NIST é uma evolução derivada de BLEU e que tem em conta mais parâmetros para medir a precisão de uma tradução; quanto mais alta for a pontuação mais precisa será a tradução.

 

*Resultados obtidos por meio de medições realizadas com o script mteval-v11b.pl em base à tradução de um documento de 500 linhas e com uma tradução humana como referência.

 

 
  • imaxin|software
  • Eleka