Ferramentas de auxílio ao tradutor

De Tradwiki
Ir para: navegação, pesquisa

As ferramentas de auxílio ao tradutor são programas de computador desenvolvidos para auxiliar o tradutor em seu trabalho. São bastante conhecidas pelo nome em inglês computer-assisted/computer-aided translation tools, ou, mais comumente, CAT tools.

Embora a função mais conhecida desse tipo de programa seja o gerenciamento de memórias de tradução, o que acabou fazendo com que ficassem conhecidos também como "ferramentas de memória de tradução", geralmente têm muitos outros recursos, como gerenciamento de terminologia, controle de qualidade, autocompletamento, além de diversas opções de configuração. Dependendo do texto que se esteja traduzindo, esses outros recursos podem ter até mais relevância que a memória de tradução. Dessa forma, "ferramentas de auxílio ao tradutor" seria uma denominação mais precisa que "ferramentas de memória de tradução".

Uma confusão bastante comum é entre ferramentas de auxílio ao tradutor e ferramentas de tradução automática. Porém, enquanto a tradução automática (também chamada de tradução de máquina) consiste no desenvolvimento de algoritmos para que o computador produza uma tradução para o texto original (que pode ou não passar por uma pós-edição por um tradutor humano), as ferramentas de auxílio ao tradutor não envolvem essa pretensão: é o tradutor humano que realiza a tradução, utilizando-as apenas como mais um recurso para facilitar seu trabalho, além das consultas a dicionários, glossários e gramáticas, que fazem parte do cotidiano da tradução.

Hoje em dia existem várias possibilidades de combinar as duas tecnologias — ferramentas de auxílio ao tradutor e tradução por máquina — no processo tradutório, e a tendência é que elas se integrem cada vez mais.

Recursos comuns[editar]

Memória de tradução[editar]

As ferramentas baseadas em memória de tradução, em sua maioria, trabalham com qualquer par de idiomas. A ideia geral é de que tudo aquilo que traduzimos vai sendo armazenado, frase a frase, num arquivo ou base de dados (que seria a memória de tradução em si). Toda vez que nos deparamos com uma frase igual ou parecida com alguma que esteja na memória de tradução, o programa nos mostra a tradução anterior para ser reaproveitada no todo ou em parte, ou apenas para servir de referência, a critério do tradutor.

Vejamos esse procedimento com um pouco mais de detalhe. As ferramentas de auxílio ao tradutor dividem automaticamente os arquivos em partes ou segmentos. De forma padronizada, os segmentos são definidos por um ponto seguido de um espaço, dois pontos, uma marca de fim de parágrafo, um signo de pergunta ou exclamação (essas regras de segmentação podem alterar-se de acordo com as necessidades do usuário). Geralmente, os segmentos correspondem a frases ou títulos.

À medida que o tradutor avança na tradução, ele interage basicamente de duas formas com a memória. A primeira é a alimentação. Cada segmento na língua de origem, junto com o correspondente segmento na língua de destino constitui o que se denomina uma unidade de tradução (também conhecida como TU, pela sua sigla em inglês). Essas unidades de tradução vão sendo armazenadas na memória cada vez que o tradutor passa para o próximo segmento. Ou seja, o tradutor vai gerando a memória ao avançar na tradução.

A segunda forma de interação é a recuperação. Cada vez que o tradutor abre ou entra em um segmento durante o processo de tradução, o programa procura na memória um segmento igual ou similar que tenha sido traduzido e armazenado anteriormente. Em caso de que essa procura tenha um resultado positivo, a correspondência entre o segmento que se está traduzindo e o segmento armazenado na memória pode ser total ou parcial. Se a correspondência for total, o programa apresentará a tradução armazenada sugerindo a sua utilização exatamente na forma em que se guardou. Então, podemos dizer que existe 100% de correspondência (ou match) entre o segmento do arquivo que se está traduzindo e aquele guardado na memória. Isso implica duas unidades de tradução exatamente iguais.

Também pode acontecer que a correspondência entre o segmento do arquivo que se está traduzindo e aquele armazenado na memória seja parcial. Nesse caso, o programa avalia essa correspondência em termos percentuais e, por padrão, sugere a utilização da tradução armazenada sempre que esse percentual de similitude seja de 75% ou mais (essa configuração também pode ser alterada pelo usuário). Ao sugerir o uso da unidade de tradução similar armazenada, a ferramenta indica onde está a diferença para que o tradutor possa reaproveitar a frase incorporando as alterações necessárias.

Em qualquer um dos casos anteriores, correspondência total ou parcial, o trabalho do tradutor se reduz, gerando um aumento da produtividade, e também se mantém a consistência na tradução, garantindo que frases iguais sejam traduzidas de forma exatamente igual, seja em um mesmo arquivo, em um conjunto de arquivos que compõem um projeto, ou em diversos arquivos de um mesmo cliente ao longo do tempo.

Embora as memórias de tradução das diversas ferramentas de auxílio ao tradutor possam ter formatos diferentes, uma iniciativa do comitê OSCAR (Open Standards for Container/Content Allowing Re-use) criou um padrão aberto, o TMX (Translation Memory eXchange), que permite o intercâmbio de memórias entre usuários de diferentes ferramentas, facilitando o trabalho colaborativo.

Gerenciamento de terminologia[editar]

A grande maioria das CAT tools oferece a possibilidade de integrar o uso de bases terminológicas ou glossários (bilíngues ou multilíngues) como parte do fluxo de trabalho de tradução. O objetivo desse recurso é conferir consistência terminológica aos textos individuais e/ou manter a consistência entre textos que fazem parte de um mesmo projeto ou pertencem a um mesmo cliente. Além disso, possibilita um importante aumento de produtividade, já que evita que o tradutor pesquise um termo mais de uma vez, e inclusive permite que as bases terminológicas sejam compartilhadas entre tradutores, clientes e agências.

O uso de bases terminológicas, que podem estar localizadas no computador do tradutor ou em um servidor, se realiza através de duas operações: incorporação e recuperação de termos. A incorporação é efetuada pelo tradutor na medida em que avança no processo de tradução, ao deparar-se com termos que considera importantes ou complexos. Dependendo do programa, é possível introduzir informação adicional que esclareça algum aspecto do termo incorporado ou do contexto. A recuperação se produz quando o termo já incorporado na base terminológica aparece novamente no arquivo que se está traduzindo e o programa o identifica e sugere o uso do termo introduzido anteriormente.

Muitas ferramentas permitem a utilização de bases terminológicas prontas, em formatos como Word, Excel e outros, mediante um simples processo de conversão ao formato de arquivo específico utilizado pelo programa, para permitir a sua incorporação no fluxo de trabalho.

Controle da qualidade[editar]

A função de controle de qualidade nos softwares de auxílio à tradução analisa a tradução pronta, comparando-a ao original e aos recursos já incluídos no projeto (memórias, glossários) ou outros que podem ser usados somente nesta etapa. É um recurso de extrema utilidade, principalmente em projetos maiores, para uniformizar a terminologia técnica, ajudar na qualidade da formatação e consequentemente facilitar a revisão. Essa análise pode conferir:

- se itens específicos do texto original, como números, tags, sinais de pontuação, estão presentes na tradução. O software deve avisar, por exemplo, se o tradutor tiver trocado a ordem de dois números ou tags ou digitado um número incorretamente. Pode avisar também se os sinais de pontuação estão presentes, se trocas necessárias de um idioma para outro foram feitas (eliminar a interrogação invertida ao traduzir do espanhol, por exemplo), se a pontuação do final da frase ou o uso de maiúsculas e minúsculas não for igual no original e na tradução, ou conforme configurado para o projeto.

- se há segmentos idênticos com traduções diferentes. Isso pode ser uma escolha consciente ou necessária para o contexto, mas também pode ser falta de aplicação do vocabulário correto.

- se há segmentos diferentes com traduções idênticas, o que pode ser sinal de um erro na tradução.

- quando há um termo glossarizado no original, se a tradução do glossário está presente no segmento traduzido.

- se há espaços duplos no meio do segmento ou espaços extras ao final.

- se palavras definidas como "proibidas" em um glossário específico (que pode incluir baixo calão, termos incorretos comuns na área da qual o texto trata, erros de digitação que o tradutor costuma cometer) estão presentes na tradução.

- se os segmentos não excedem os limites de extensão específicos para o projeto (esse tipo de restrição é comum em localização de software ou jogos e em tradução para dublagem ou legendagem). A restrição pode ser definida em termos absolutos (número máximo de palavras ou caracteres) ou relativos (comprimento proporcional ao segmento original).

Autocompletamento[editar]

Exemplos do funcionamento do AutoSuggest no Wordfast Classic

Um recurso cada vez mais comum nas CAT tools é o autocompletamento, ou previsão de digitação (predictive typing). O recurso recebe diferentes nomes dependendo da ferramenta, dos quais o mais comum atualmente é "AutoSuggest".

O autocompletamento pode envolver diversos itens, variando conforme o programa e também conforme a configuração feita pelo usuário: nomes próprios, números, termos dos glossários, sequências de palavras que já ocorreram em traduções anteriores, sequências de palavras traduzidas automaticamente. Quando o tradutor começa a digitar um desses elementos (por exemplo, um nome próprio do segmento original ou um termo que conste no glossário), o programa oferece o restante da palavra ou expressão e o tradutor pode completá-las automaticamente com Enter, Tab ou outra tecla ou combinação de teclas.

Pesquisas de concordância[editar]

A pesquisa de linhas de concordância (Concordance Search) permite buscar uma palavra ou expressão na(s) memória(s) de tradução. Isso permite ao tradutor, mesmo quando não há uma frase inteira que seja suficientemente parecida com o segmento atual para ser apresentada pelo programa como match, consultar todas as ocorrências de certa palavra ou expressão em traduções anteriores e ver as soluções que já utilizou para traduzi-las.

Normalmente o resultado da pesquisa de concordância mostra, além dos segmentos originais e traduzidos, outras informações, como data e horário de criação da entrada na memória, usuário que a criou, etc. Em geral é possível pesquisar por ocorrências tanto em segmentos originais como nos traduzidos.

Em alguns programas a função pode ter nomes diferentes. No Wordfast Pro, por exemplo, chama-se TM Lookup.

Análise[editar]

A análise é um procedimento que permite obter informação estatística sobre um arquivo ou um conjunto de arquivos a serem traduzidos. Quase todas as ferramentas de auxílio ao tradutor oferecem essa importante função que possibilita ao tradutor calcular o tempo e o esforço que demandará um determinado projeto considerando o número total de palavras, a presença de segmentos repetidos dentro de um arquivo (ou entre arquivos) e a correspondência entre esses segmentos e a memória de tradução utilizada para efetuar a análise. Ao efetuar uma análise, as ferramentas classificam os segmentos (lembrando que o segmento é a unidade que preside a lógica do funcionamento das ferramentas) em uma série de categorias que variam dependendo do programa utilizado. As categorias mais básicas, compartilhadas pela grande maioria dos programas, são: segmentos repetidos, segmentos com algum grau de correspondência com a memória (em termos percentuais) e segmentos novos.

A categoria de segmentos repetidos inclui aqueles segmentos que se repetem dentro de um arquivo ou entre arquivos diferentes analisados juntos. A categoria de segmentos com correspondência, como se explica na seção #Memória de tradução, inclui aqueles que têm algum grau de similitude (indicada em termos percentuais) com os segmentos armazenados na memória de tradução utilizada na análise. A categoria de segmentos novos inclui aqueles segmentos que não são repetidos nem tem nenhuma relação de similitude com os segmentos armazenados na memória.

Exemplo de análise com o SDL Trados Studio

Considerando que muitos tradutores utilizam como medida de produtividade a unidade palavra, que a palavra também é utilizada de forma predominante no mercado da tradução técnica, alvo principal dos desenvolvedores de ferramentas, e que outros tradutores, como os juramentados e literários, utilizam como unidade de medida a lauda, composta por um número determinado de caracteres, as ferramentas também oferecem a informação resultante da análise em palavras e caracteres. Mas é importante salientar que essa informação é simplesmente uma forma diferente de apresentar os dados de classificação dos segmentos: as palavras e caracteres sempre correspondem ao conteúdo dos segmentos e nunca a palavras ou caracteres soltos.

Uma vez efetuada a análise, o tradutor poderá ter uma ideia mais precisa do trabalho que exigirá um projeto e também poderá efetuar análises sucessivas ao longo do trabalho para verificar o progresso. Para as agências de tradução, esse cálculo também será a base para determinar o pagamento aos tradutores. Uma prática comum entre as agências é a definição de uma tabela com valores diferenciados para palavras novas, repetições e os diferentes percentuais de correspondência, utilizando as categorias analíticas das ferramentas.

Outros recursos[editar]

Além das funções acima, a utilização de ferramentas de auxílio ao tradutor traz ainda outras vantagens, como:

  • Como o texto é segmentado (aproximadamente) frase a frase, o tradutor não corre o risco de saltar trechos do texto;
  • O tradutor trabalha sempre visualizando o trecho original e sua tradução juntos na tela, o que é benéfico inclusive em termos de ergonomia;
  • A formatação do texto original é reproduzida no texto traduzido.
  • Algumas ferramentas oferecem a possibilidade de trabalhar com uma grande variedade de formatos de arquivo (além da suite do Office), como html, xml, inx, idml e mif, entre muitos outros. Isso permite traduzir arquivos gerados por programas específicos como, por exemplo, Indesign e FrameMaker, sem necessidade de ter esses programas instalados.

Exemplos de ferramentas de auxílio ao tradutor[editar]

  • Wordfast Anywhere (online, uso gratuito)


Para uma comparação entre diferentes CAT tools alimentada pelos próprios usuários, pode-se utilizar a ferramenta de comparação do ProZ.com.

Tópicos relacionados[editar]