Qualitat que marca: comparativa Opentrad-Google per al parell espanyol-gallec

26/04/2011

Notícia:Qualitat que marca: comparativa Opentrad-Google per al parell espanyol-gallec

Dues de les principals tendències en la traducció automàtica actual són les representades pels traductors de transferència estructural (amb informació lingüística) i pels traductors estadístics (sense coneixements lingüístics). Quan la distància entre els idiomes és reduïda, com en el cas dels idiomes romànics (espanyol, gallec, portuguès o català, entre uns altres), on el focus d'atenció se centra més en qüestions lingüístiques que en les d'estructura, resulta evident, com mostrarem, que els traductors de transferència estructural ofereixen uns resultats molt superiors als estadístics.

 

A continuació oferim una comparativa entre el traductor estadístic de Google i el de transferència estructural utilitzat per Opentrad per al parell espanyol-gallec:

 

traductor automàtic

adreça de traducció

NIST*

BLEU*

Google

es > gl

7.5654

0.3299

Opentrad

es > gl

12.6131

0.8977

Google

gl > es

7.9922

0.4136

Opentrad

gl > es

12.1724

0.9062

 

Com podem veure el traductor de Google (que utilitza el model estadístic, per tant sense coneixements lingüístics) obté uns resultats clarament inferiors als del traductor utilitzat per Opentrad segons els mètodes d'avaluació NIST i BLEU, que comparen textos traduïts per un humà amb els traduïts per un traductor automàtic. La mesura BLEU puntua amb una xifra entre 0 i 1, la qual indica la similitud entre el text traduït automàticament i l'usat com a referència (traduït per un humà); el valor més voltat a 1 representa una major similitud. La mesura NIST és una evolució derivada de BLEU i que té en compte més paràmetres per mesurar la precisió d'una traducció; com més alta sigui la puntuació més precisa serà la traducció.

 

*Resultats obtinguts mitjançant mesuraments realitzats amb el script mteval-v11b.pl sobre la base de la traducció d'un document de 500 línies i amb una traducció humana com a referència.

 

 
  • imaxin|software
  • Eleka