Calidade que marca: comparativa Opentrad-Google para o par español-galego
26/04/2011
Dúas das principais tendencias na tradución automática actual son as representadas polos tradutores de transferencia estrutural (con información lingüística) e polos tradutores estatísticos (sen coñecementos lingüísticos). Cando a distancia entre os idiomas é reducida, como no caso dos idiomas románicos (español, galego, portugués ou catalán, entre outros), onde o foco de atención se centra máis en cuestións lingüísticas que nas de estrutura, resulta evidente, como mostraremos, que os tradutores de transferencia estrutural ofrecen uns resultados moi superiores aos estatísticos.
A seguir ofrecemos unha comparativa entre o tradutor estatístico de Google e o de transferencia estrutural utilizado por Opentrad para o par español-galego:
|
tradutor automático |
dirección de tradución |
NIST* |
BLEU* |
|
|
es > gl |
7.5654 |
0.3299 |
|
Opentrad |
es > gl |
12.6131 |
0.8977 |
|
|
gl > es |
7.9922 |
0.4136 |
|
Opentrad |
gl > es |
12.1724 |
0.9062 |
Como podemos ver o tradutor de Google (que utiliza o modelo estatístico, por tanto sen coñecementos lingüísticos) obtén uns resultados claramente inferiores aos do tradutor utilizado por Opentrad segundo os métodos de avaliación NIST e BLEU, que comparan textos traducidos por un humano cos traducidos por un tradutor automático. A medida BLEU puntúa cunha cifra entre 0 e 1, que indica a similitude entre o texto traducido automaticamente e o usado como referencia (traducido por un humano); o valor máis achegado a 1 representa unha maior similitude. A medida NIST é unha evolución derivada de BLEU e que ten en conta máis parámetros para medir a precisión dunha tradución; canto máis alta sexa a puntuación máis precisa será a tradución.
*Resultados obtidos mediante medicións realizadas co script mteval-v11b.pl en base á tradución dun documento de 500 liñas e cunha tradución humana como referencia.

