Ferramentas de tradução automática

De Tradwiki
Ir para: navegação, pesquisa

...

É uma ferramenta de tradução automática do tipo RBMT (Rule Based Machine Translation - Tradução automática baseada em regras), na qual o usuário define diversas regras que controlam aspectos da tradução, como tempo verbal, uso de artigos, registro formal ou informal, entre outras. A personalização do resultado também é obtida por meio de glossários e listas de palavras protegidas (Reserved Words) criados e editados pelo usuário.

Pode ser integrada aos programas do pacote MS Office e a diversos outros programas no OS Windows. Não há versão disponível ou prevista atualmente (março/2014) para outros sistemas.

Apresenta diversos recursos adicionais, como a integração a software OCR, para facilitar o uso com documentos digitalizados, uso de macros e Text Speech.

A integração com ferramentas de auxílio ao tradutor (CAT tools) é possível com o uso de recursos como a exportação e importação de memórias no padrão TMX. Esse tipo de ferramenta não funciona como uma SMT (Statistical Machine Translation) ou uma EBMT (Example-Based Translation Machine), ou seja, não há "aprendizado" da ferramenta a partir de textos bilíngues. Isso significa que a vantagem de adicionar uma memória de tradução é pequena, limitando-se ao aproveitamento de segmentos inteiros com o match definido pelo usuário.

...

...

...

É um conjunto de scripts desenvolvidos a partir do software livre Moses. Os scripts são executados na plataforma Linux, tendo também dois add-ons que podem ser executados em Windows, para a criação e separação (em textos paralelos) de uma memória de tradução em formato TMX.

Os scripts são divididos em "create" (cria um modelo linguístico que gera os dados estatísticos no qual as traduções se basearão), "train" (treina o sistema e o "afina" para a tradução), "translate" (traduz o arquivo). É necessário preparar corpora para treino, o que pode ser trabalhoso. Uma vez que o sistema é estatístico, quanto mais treinado o programa estiver, melhores serão os resultados.

Os detalhes sobre a preparação para treino da ferramenta e sobre os scripts podem ser consultados neste documento.