-
Das 30 letras do alfabeto extinto, o sistema foi capaz de mapear corretamente 29 com seus correspondentes em hebraico
No livro Lost Languages, de 2002, o então editor do suplemento de educação superior do jornal inglês The Times, Andrew Robinson, afirmou que o trabalho arqueológico de decifrar lÃnguas extintas exige uma mistura de lógica e intuição que os computadores são incapazes de possuir.
Pesquisadores do Instituto de Tecnologia de Massachusetts e da Universidade do Sul da Califórnia, nos Estados Unidos, tentam mostrar que Robinson estava errado.
Em estudo que será apresentado esta semana na reunião anual da Associação para LinguÃstica Computacional, em Uppsala, na Suécia, o grupo apresentará um novo programa de computador que foi capaz de decifrar grande parte do extinto idioma ugarÃtico, descoberto a partir de escritos encontrados na cidade perdida de Ugarit, na SÃria, cujas ruÃnas foram encontradas em 1928.
O ugarÃtico era uma lÃngua semÃtica escrita em alfabeto cuneiforme com 27 consoantes e três vogais. Os escritos encontrados foram importantes para estudiosos do Velho Testamento, por auxiliar a clarificar textos hebraicos e revelar como o judaÃsmo utilizava frases comuns, expressões literárias e frases empregadas pelas culturas gentis que o cercavam.
O sistema, além de ajudar a decifrar lÃnguas antigas que continuam a resistir aos esforços de especialistas, poderá expandir o número de idiomas que sistemas automatizados de tradução, como o Google Tradutor, são capazes de manejar.
Para simular a intuição que falta aos computadores, Regina Barzilay, do Laboratório de Inteligência Artificial e Ciência da Computação do MIT, e colegas fizeram várias proposições. A primeira é que a lÃngua a ser decifrada pelo computador estaria próxima de outra. Para isso, foi escolhido o hebraico.
Outra asserção é que haveria um modo sistemático de mapear o alfabeto de uma lÃngua com relação ao alfabeto de outra, e que os sÃmbolos relacionados deveriam ocorrer com frequências semelhantes nas duas lÃnguas.
O sistema também fez asserções no nÃvel semântico, no sentido de que as lÃnguas relacionadas teriam pelo menos alguns cognatos, isto é, palavras com raÃzes em comum.
Por meio de um modelo probabilÃstico usado em pesquisas em inteligência artificial, os pesquisadores determinaram nos mapeamentos os radicais semelhantes e conjuntos de sufixos e prefixos consistentes, entre outras relações entre as palavras das duas lÃnguas.
O ugarÃtico já havia sido decifrado. Se não tivesse sido, os autores do estudo não teriam como avaliar a performance do sistema que desenvolveram.
“O sistema repetiu as análises dos dados resultantes centenas de vezes. E, a cada vez, os acertos eram mais frequentes, pois estávamos chegando mais perto de uma solução consistente. Finalmente, chegamos a um ponto no qual a alteração do mapeamento das similaridades não aumentava mais a consistência dos resultados�, disse outro autor do estudo, Ben Snyder, também do MIT.
Das 30 letras do alfabeto extinto, o sistema foi capaz de mapear corretamente 29 com seus correspondentes em hebraico. Cerca de um terço das palavras em ugarÃtico tem cognato em hebraico e, desse total, o sistema identificou corretamente 60%.
“Das palavras identificadas incorretamente, na maior parte das vezes o erro foi por apenas uma palavra. Ou seja, o sistema deu palpites bem razoáveis�, disse Snyder.
Apesar dos Ãndices de acerto, os pesquisadores destacam que o sistema não é suficientemente bem resolvido para substituir os tradutores humanos. Mas, segundo eles, é uma ferramenta poderosa cujo desenvolvimento poderá ajudar no processo de decifrar lÃnguas desconhecidas e de traduzir outras existentes mais eficientemente.
O artigo A Statistical Model for Lost Language Decipherment, de Regina Barzilay e outros, pode ser lido em people.csail.mit.edu/bsnyder/papers/bsnyder_acl2010.pdf.

Nenhum comentário:
Postar um comentário