Não leve o Índice TIOBE tão a sério

Não leve o Índice TIOBE tão a sério

O Índice TIOBE, embora muito conhecido por indicar a "popularidade" de linguagens de programação, não deveria ser levado tão a sério. Leia mais e entenda os motivos...


Provavelmente você já ouviu falar do Índice TIOBE, que mede a “popularidade” das linguagens de programação. Vira e mexe sai alguma notícia dizendo que linguagem X entrou no top 50, ou linguagem Y passou a linguagem Z e agora é a primeira, etc. E aí aparecem os inevitáveis comentários de gente comemorando que sua linguagem favorita subiu (ou que a linguagem que não gosta caiu) N posições. E o pior, usam isso como argumento para defender que uma linguagem é “melhor” ou “pior” que a outra.

Bem, discutir qual linguagem é melhor, e/ou ser torcedor/fanboy/cheerleader de linguagem, já é algo que eu acho - pra não dizer outra coisa - ridículo. Além de ser uma discussão muitas vezes inútil e improdutiva. E usar o Índice TIOBE como argumento nessa discussão é pior ainda, e nos parágrafos seguintes explicarei os motivos (disclaimer: este post é baseado neste comentário que fiz no TabNews).


Como o Índice TIOBE é calculado

No próprio site do índice tem a explicação completa. Aqui eu traduzirei e comentarei apenas alguns trechos que são pertinentes ao ponto que quero discutir.

Em resumo, é feita uma busca pelo termo +"<language> programming", para várias linguagens. Por exemplo: +"JavaScript programming", +"Python programming", etc. O sinal de mais e as aspas são uma “sintaxe comum” em muitos mecanismos de busca, para indicar que deve obrigatoriamente buscar por esses dois termos exatamente nesta ordem. Esta busca é feita em vários sites diferentes, e a quantidade de hits (resultados) é usada para calcular o valor daquela linguagem no índice. Basicamente, quanto mais resultados, maior é o valor (e melhor a classificação da linguagem).

A lista de linguagens, os sites onde a busca é feita, e a fórmula para calcular o valor estão bem explicados no link já citado. Lá também tem os critérios para escolher as linguagens e sites. Mas vamos focar em um ponto específico, e que na minha opinião mostra como o índice não deve ser levado tão a sério.

Escolha dos sites

São escolhidos os 25 melhores sites do ranking da Similarweb (empresa que fornece serviços de Web Analytics), que satisfaçam os seguintes critérios:

A partir disto temos uma lista de 25 sites, que pelos critérios acima podem variar dependendo da época. Olhando hoje (11 de abril de 2023), a lista contém alguns sites “óbvios” como o Google, Bing e Wikipedia. Mas tem dois que me chamaram a atenção: o Walmart.com (??) e o Etsy.com (que é um site que vende roupas, calçados, artigos para a casa, cozinha, etc).

Sério, por que buscas feitas nesses dois sites são consideradas em um ranking de popularidade de linguagens de programação?

Só por curiosidade, fiz uma busca por +"Java programming" em ambos.

No Etsy, a busca retornou adesivos, canecas e camisetas:

Adesivos e canecas

Camisetas e canecas

Já no site do Walmart, retornou livros:

Livros

Só o fato disso ser considerado no índice já deveria servir para desqualificá-lo, na minha opinião.

Então da próxima vez que você pensar em usar o Índice TIOBE para argumentar que uma linguagem é “melhor” ou “pior”, pense nisso.