Qualité qui marque: rapport comparatif Opentrad-Google pour la paire espagnole-galicien

26/04/2011

Nouvelle:Qualité qui marque: rapport comparatif Opentrad-Google pour la paire espagnole-galicien

De nos jours, les deux tendances principales dans la traduction automatique sont les traducteurs de transfert structurel (avec de l’information linguistique) et les traducteurs statistiques (sans connaissances linguistiques).Lorsque la distance entre les langues est petite, comme dans le cas des langues romans (espagnol, galicien, portugais ou catalan, entre autres),  où le centre d'attention est surtout dans des questions linguistiques plutôt que sur des questions de structure, il résulte évidente, comme on le montrera tout de suite, que les traducteurs de transfert structurel offrent des résultats très supérieurs par rapport aux statistiques.

 

Voici un petit rapport comparatif entre le traducteur statistique de Google et celui de transfert structurel utilisé par Opentrad pour la paire espagnole-galicien:

 

Traducteur automatique

Direction de traduction

NIST*

BLEU*

Google

Il est > gl

7.5654

0.3299

Opentrad

Il est > gl

12.6131

0.8977

Google

gl > Est

7.9922

0.4136

Opentrad

gl > Est

12.1724

0.9062

 

Il est claire que le traducteur de Google (qui utilise le modèle statistique, par conséquent sans des connaissances linguistiques) obtient des résultats clairement inférieurs par rapport aux ceux du traducteur utilisé par Opentrad, comme il est montré par les méthodes d'évaluation NIST et BLEU, qui comparent des textes traduits par un humain avec les textes traduits par un traducteur automatique. La mesure BLEU évalue avec un chiffre entre 0 et 1, et ce chiffre indique la similitude entre le texte traduit automatiquement et le texte utilisé comme référence (traduit par un humain); la valeur la plus proche à 1 représente une similitude plus grande. La mesure NIST est une évolution dérivée du BLEU, qui tient en compte plusieurs paramètres pour mesurer la précision d'une traduction; plus grande est la ponctuation, plus précise est la traduction.

 

*Résultats obtenus à travers des mesures réalisées avec le script mteval-v11b.pl sur la base de la traduction d'un document de 500 lignes, et avec une traduction humaine comme référence.

 

 
  • imaxin|software
  • Eleka