quarta-feira, 22 de dezembro de 2010

Google para Historiadores

Extraido do CafeHistoria

Empresa americana lança aplicativo que promete conquistar historiadores e pesquisadores de ciências humanas em geral. O que ele faz? Permite traçar tendências culturais e políticas nos últimos duzentos anos.

O Google Labs, inovadora seção de aplicativos protótipos do Google, lançou no último dia 16 de dezembro o "Google Books Ngram Viewer", uma ferramenta elegante e que pode em breve se tornar um verdadeiro aliado para pesquisadores, professores ou mesmo estudantes. O "Books Ngram Viewer" utiliza o banco de dados do "Google Books" (sistema de livros digitalizado online para consulta gratuita) para contar quantas vezes um mesmo nome, frase, termo, expressão ou conceito foi utilizado entre 1800 e 2000. Assim, com apenas alguns cliques é possível saber em menos de um segundo a trajetória de uma palavra ao longo de dois séculos de cultura escrita e descobrir um pouco mais sobre as tendências culturais, políticas e sociais de nosso tempo.

Em um primeiro momento, o Books Ngram Viewer (http://ngrams.googlelabs.com/) não chama muito a atenção dos internautas, hoje acostumados às dezenas cores, animações e outras pirotecnias que os grandes sites promovem para conquistar o público. Em sua tela, o internauta precisa preencher apenas três espaços: palavra(s), período e a língua a ser pesquisada. Depois, basta clicar em "Search lot of books". O sistema, então, irá consultar um banco de dados de mais de 500 bilhões de palavras, divididas entre 5 milhões de livros, publicados entre 1800 e 2008 e digitalizados pelo Google nos últimos anos. Essa consulta - que não leva mais do que dois segundos - gera um gráfico no qual é possível observar a evolução (ou involução) de uma palavra ao longo do tempo.

Essa simplicidade arrasadora é o suficiente para oferecer um mar de possibilidade de estudos. Atualmente, é possível consultar bancos de dados de livros em inglês, francês, espanhol, alemão, chinês e russo. Pode-se inserir uma ou mais palavras. Pode-se ainda comparar os resultados de uma palavra dentro do universo de livros em inglês e em chinês ou espanhol. Por exemplo: o grau de incidência da palavra "terrorism" dentro das publicações em inglês é muito diferente desta mesma palavra em outras línguas, mostrando o lugar que esta expressão tem na cultura americana.

Como tudo começou

O "Books Ngram Viewer" nasceu da necessidade de uma pesquisa acadêmica. Em 2004, Jean-Baptiste Michel e Lieberman Aiden, de Harvard, começaram uma pesquisa sobre verbos irregulares no inglês. Eles desejavam determinar quando formas verbais específicas deixaram de ser usadas em detrimento de outras, mais modernas. Na época, esse tipo de pesquisa implicava na leitura, página por página, de milhares de livros. O processo todo lhes custou longos 18 meses. Pouco mais de um ano depois, os acadêmicos de Harvard souberam dos planos do Google para digitalizar todos os livros do mundo, algo que foi parcialmente alcançado com o Google Books, que digitalizoiu 11% dos livros do mundo. Aquele parecia ser o tipo de tecnologia ideal para a pesquisa de Aiden e Michel e provavelmente para outros milhares de pesquisadores em todo o mundo. Assim, os dois entraram em contato com Peter Novig, diretor de pesquisa do Google. Novig logo percebeu a importância daquela idéia para a ciência e deu carta branca para os desenvolvedores. O Books Ngram Viewer é a versão mais acabada desta idéia e utiliza 4% do banco de dados do Google Books. A nova ferramenta foi lançada na última semana e descrita em um artigo intulado "Quantitative Analysis of Culture Using Millions of Digitized Books", publicado  na revista Science (tiny.cc/td0rd). O Google Books Ngram Viewer utiliza um método de modelagem chamado N-gram, que possibilita buscas em sequências de linguagem natural. Para os pesquisadore envolvidos na criação, a ferramente significa a abertura de uma nova abordagem para os estudos culturais. Nos últimos dias, não se fala em outra coisa nos principais círculos das ciências humanas. A sensação é que algo revolucionário está sendo criado.

Historiadores

Para os historiadores, o programa desenvolvido pelo Google é uma ferramenta incrível de auxílio à pesquisa. Como bem se sabe, as palavras não são entidades estáticas, programadas para ter um começo, meio e fim. Mas pelo contrário: são vivas, políticas, sujeitas à ação dos homens em sociedade. E o Books Ngram Viewer mostra muito bem isso. Com ele torna-se possível identificar quais termos são mais sensíveis que outros, desvendar dimensões até então pouco abordadas da memória social e outros processos polítcos e sociais de diversos períodos históricos.

O Café História testou várias combinações. No clássico Brazil x Argentina, na língua inglesa, por exemplo, nós continuamos dando de goleada. O Brasil sempre foi muito mais citado do que o vizinho. No entanto, é curioso observar que tanto o crescimento quanto a queda das referências a ambos seguem o mesmo padrão. A década de 1940 representa o período de maior menção aos dois países, o que pode ser explicado pelo auge da cultua do American Way of Life e sua influência na América do Sul. Confira no gráfico abaixo:
Curioso também notar a trajetória de palavras caras à historiografia. É o caso do termo "holocaust", utilizado para se referir ao extermínio de seis milhões de judeus durante o Terceiro Reich (1933-1945). Segundo o Books Ngram Viewer, a palavra conheceu um verdadeiro boom na década de 1980, o que reforça decisivamente teses acadêmicas já existentes e que apontavam aquela década como um período de consolidação da memória do genocídio nazista. Para os historiadores, a década de 1980 testemunhou uma proliferação de filmes, museus e outros eventos memorialísticos que tiveram um grande impacto na representação do extermínio dos judeus no século pasado, sobretudo na produção de referências bibliográficas.

Esse processamento dos dados, que Lieberman chamou de "culturomics" ("cultorômica", em língua portuguesa), está ao alcance de todos. O site já está no ar, é gratuito e o melhor: pode ser baixado por qualquer usuário e explorado em detalhes, a partir de suas próprias ferramentas de busca. Além do Google e de Harvard, fazem parte da equipe de gerenciamento do Ngram pesquisadores da Enciclopédia Britânica e do Dicionário Americano Heritage. Confira o site sobre a recém-batizada "Culturômica": http://www.culturomics.org/

Enquanto isso, mesmo para os não-acadêmicos, o programa já diverte os meios de comunicação. O jornal OGLOBO fez um contraste entre "women" (mulher) e "man" (homem), descobrindo que o primeiro era raramente mencionado até o início dos anos 1970, momento em que o feminismo ganha força. A partir daquela década as duas linhas do gráfico movem em direções opostas até se encontrarem em 1986. Já o site Read Write Web fez uma série de 10 comparações, que você pode conferir clicandono seguinte link. Destaque para a comparação entre os meios de comunicação:

Não perca tempo. Visite esta importante novidade na internet e faça uso dela para aprimorar suas pesquisas e estudos. A história vem passando por grandes transformações e você não precisa ser um mero espectador.

Nenhum comentário: