to be alive: Computador decifra lÃngua extinta

sexta-feira, 30 de julho de 2010

Computador decifra lÃngua extinta

Da AgÃªncia Fapesp

Das 30 letras do alfabeto extinto, o sistema foi capaz de mapear corretamente 29 com seus correspondentes em hebraico

No livro Lost Languages, de 2002, o entÃ£o editor do suplemento de educaÃ§Ã£o superior do jornal inglÃªs The Times, Andrew Robinson, afirmou que o trabalho arqueolÃ³gico de decifrar lÃnguas extintas exige uma mistura de lÃ³gica e intuiÃ§Ã£o que os computadores sÃ£o incapazes de possuir.

Pesquisadores do Instituto de Tecnologia de Massachusetts e da Universidade do Sul da CalifÃ³rnia, nos Estados Unidos, tentam mostrar que Robinson estava errado.

Em estudo que serÃ¡ apresentado esta semana na reuniÃ£o anual da AssociaÃ§Ã£o para LinguÃstica Computacional, em Uppsala, na SuÃ©cia, o grupo apresentarÃ¡ um novo programa de computador que foi capaz de decifrar grande parte do extinto idioma ugarÃtico, descoberto a partir de escritos encontrados na cidade perdida de Ugarit, na SÃria, cujas ruÃnas foram encontradas em 1928.

O ugarÃtico era uma lÃngua semÃtica escrita em alfabeto cuneiforme com 27 consoantes e trÃªs vogais. Os escritos encontrados foram importantes para estudiosos do Velho Testamento, por auxiliar a clarificar textos hebraicos e revelar como o judaÃsmo utilizava frases comuns, expressÃµes literÃ¡rias e frases empregadas pelas culturas gentis que o cercavam.

O sistema, alÃ©m de ajudar a decifrar lÃnguas antigas que continuam a resistir aos esforÃ§os de especialistas, poderÃ¡ expandir o nÃºmero de idiomas que sistemas automatizados de traduÃ§Ã£o, como o Google Tradutor, sÃ£o capazes de manejar.

Para simular a intuiÃ§Ã£o que falta aos computadores, Regina Barzilay, do LaboratÃ³rio de InteligÃªncia Artificial e CiÃªncia da ComputaÃ§Ã£o do MIT, e colegas fizeram vÃ¡rias proposiÃ§Ãµes. A primeira Ã© que a lÃngua a ser decifrada pelo computador estaria prÃ³xima de outra. Para isso, foi escolhido o hebraico.

Outra asserÃ§Ã£o Ã© que haveria um modo sistemÃ¡tico de mapear o alfabeto de uma lÃngua com relaÃ§Ã£o ao alfabeto de outra, e que os sÃmbolos relacionados deveriam ocorrer com frequÃªncias semelhantes nas duas lÃnguas.

O sistema tambÃ©m fez asserÃ§Ãµes no nÃvel semÃ¢ntico, no sentido de que as lÃnguas relacionadas teriam pelo menos alguns cognatos, isto Ã©, palavras com raÃzes em comum.

Por meio de um modelo probabilÃstico usado em pesquisas em inteligÃªncia artificial, os pesquisadores determinaram nos mapeamentos os radicais semelhantes e conjuntos de sufixos e prefixos consistentes, entre outras relaÃ§Ãµes entre as palavras das duas lÃnguas.

O ugarÃtico jÃ¡ havia sido decifrado. Se nÃ£o tivesse sido, os autores do estudo nÃ£o teriam como avaliar a performance do sistema que desenvolveram.

â€œO sistema repetiu as anÃ¡lises dos dados resultantes centenas de vezes. E, a cada vez, os acertos eram mais frequentes, pois estÃ¡vamos chegando mais perto de uma soluÃ§Ã£o consistente. Finalmente, chegamos a um ponto no qual a alteraÃ§Ã£o do mapeamento das similaridades nÃ£o aumentava mais a consistÃªncia dos resultadosâ€�, disse outro autor do estudo, Ben Snyder, tambÃ©m do MIT.

Das 30 letras do alfabeto extinto, o sistema foi capaz de mapear corretamente 29 com seus correspondentes em hebraico. Cerca de um terÃ§o das palavras em ugarÃtico tem cognato em hebraico e, desse total, o sistema identificou corretamente 60%.

â€œDas palavras identificadas incorretamente, na maior parte das vezes o erro foi por apenas uma palavra. Ou seja, o sistema deu palpites bem razoÃ¡veisâ€�, disse Snyder.

Apesar dos Ãndices de acerto, os pesquisadores destacam que o sistema nÃ£o Ã© suficientemente bem resolvido para substituir os tradutores humanos. Mas, segundo eles, Ã© uma ferramenta poderosa cujo desenvolvimento poderÃ¡ ajudar no processo de decifrar lÃnguas desconhecidas e de traduzir outras existentes mais eficientemente.

O artigo A Statistical Model for Lost Language Decipherment, de Regina Barzilay e outros, pode ser lido em people.csail.mit.edu/bsnyder/papers/bsnyder_acl2010.pdf.

Nenhum comentário:

Postar um comentário

Páginas

sexta-feira, 30 de julho de 2010

Computador decifra lÃ­ngua extinta

Nenhum comentário:

Computador decifra lÃngua extinta