quinta-feira, 2 de março de 2017

Google no século 19? O 'big data' que ilumina é o mesmo que confunde


Visita à sede do Google, em São Francisco (EUA), durante conferência anual da empresa

Escrito por Sérgio Rodrigues

O uso de ferramentas de "big data" nos estudos linguísticos abre tantas possibilidades de pesquisa ainda pouco exploradas no Brasil que nem precisa de defesa. Por que a língua seria exceção se praticamente todos os campos do saber vêm sendo revirados por esse tsunami?

Para quem não está familiarizado com a ideia, "big data" (ou "megadados", em tradução correta, mas pouco usada) é o nome que se dá aos conjuntos gigantescos de informação que o mundo digital permite reunir e analisar com velocidade impensável até pouco tempo atrás.

O desafio reside no fato de que esses dados são uma massa a princípio ininteligível que pode levar a iluminações ou a armadilhas, dependendo do recorte, dos critérios, da análise que se faça. A curiosa história do nome da maior empresa da era "big data", Google, ilustra tanto a oportunidade quanto o risco. Já chegaremos a ela.

Primeiro vale partir do degrau mais intuitivo e elementar. Há muitos anos, antes de ouvir falar em "big data", comecei a recorrer ao Google para avaliar a frequência aproximada de certas expressões no português do Brasil. No meu livro "Viva a Língua Brasileira!" consta, por exemplo, que entre "poço do elevador" e "fosso do elevador" nossa preferência pelo primeiro fica na proporção de dois para um.

Do emprego rudimentar ao mais complexo, análises quantitativas são só um instrumento. Seu valor vai depender do uso que delas se fizer. O italiano Franco Moretti, pioneiro em sua aplicação aos estudos literários, extraiu resultados instigantes da ideia de ver a literatura "de longe", processando grandes massas de texto em busca de padrões -o oposto da leitura microscópica do "close reading".

O mesmo recurso, usado com menos critério, rendeu recentemente um "estudo comparativo" de ritmo entre grandes escritores brasileiros, com base no número de palavras por frase, que ilumina suas obras com a força de uma lâmpada queimada.

Mas vamos à história de "Google". Contada na página da empresa, a origem da palavra é manjada. Nos anos 1930, o matemático americano Edward Kasner pediu a um sobrinho de 9 anos que batizasse o imenso número 10 elevado à centésima potência. O menino saiu-se com "googol". O que os fundadores do Google fizeram em 1997, ao registrar seu primeiro domínio, foi pegar essa palavra e alterar-lhe a grafia.

Há poucos anos, graças a uma pesquisa feita justamente no Google Books por um curioso, veio à tona que o termo "google" podia ser encontrado em livros do século 19 -algumas décadas antes de nascer o número "googol", portanto, e já com a grafia que viraria marca registrada! Mas como? Quer dizer que o Google mentiu e foi desmascarado por sua própria ferramenta?

Não exatamente. Passando da vista "de longe" para a de perto, descobrimos que aqueles "googles" precoces são quase todos variantes -talvez provocadas por erros de composição- de "goggle", isto é, "arregalar os olhos". Há também registros mais raros de "google" como onomatopeia de gorgolejo ou fala infantil, o que joga uma luz nova sobre a criação de "googol" por uma criança.

Muito curioso, sem dúvida. Só não faz sentido imaginar que a turma do Google tivesse nada disso em mente ao escolher seu nome. Como ninguém ignora, o risco de ver tudo "de longe" é o de não enxergar direito. 




[Foto: Kimihiro Hoshino - fonte: www.folha.com.br]

Nenhum comentário:

Postar um comentário