0

Analisando o Brasileirão: Como a Estatística pode Ajudar o Esporte

Leonardo Nogueira
Leonardo Nogueira

Você já assistiu ao filme Moneyball?


Baseado em uma história real, o ator Brad Pitt interpreta um diretor executivo de um time de baseball (Oakland Athetics) que está perdendo seus melhores jogadores para times com maiores orçamentos e melhores oportunidades de vitória. Pensando em como sair desta situação, o diretor decide contrariar o hábito de mercado de usar olheiros para escolher os melhores jogadores e contrata um recém formado em Economia pela Universidade de Yale para analisar a performance de jogadores e tomar decisões baseadas em estatística.


O resultado foi uma série de vitórias que foi considerada a melhor de todos os tempos na National Baseball League.


No curso "Foundations of Sports Analytics: Data, Representation and Model in Sports" que estou fazendo na Universidade de Michigan, USA, além de analisar dados estatísticos de várias modalidades de esportes, o maior objetivo é ver além dos números, ou seja, buscar padrões que normalmente não veríamos em uma simples olhada na tabela de vencedores e perdedores.


Foi aí que tive a ideia de analisar os dados históricos das partidas do Campeonato Brasileiro. No site Football.data.uk encontramos dados do Brasileirão, compilados de forma a mostrar todas as partidas com os resultados dos jogos entre 2012 e 2021. Será que conseguimos descobrir alguns fatos interessantes? Vamos ver neste artigo!

Iniciamos carregando nosso dataset e analisando que informações ele possui:

Não foi fornecido texto alternativo para esta imagem


Temos no total 3.486 jogos registrados com 10 variáveis conforme abaixo:


  • Country - país que o jogo foi realizado
  • League - Série que o time pertence
  • Season - temporada que o jogo foi realizado
  • Date - data que o jogo foi realizado
  • Time - hora que o jogo foi realizado
  • Home - nome do time jogando em casa
  • Away - nome do time jogando fora de casa
  • HG - gols do time que está jogando em casa
  • AG - gols do time que está jogando fora de casa
  • Res - resultado do jogo (H: time de casa ganhou, A: time fora de casa ganhou, D: empate)

Olhando a média de gols em todo o período notamos que os times que jogaram em casa tiveram uma média de um pouco mais de 1 gol por partida, mas quando jogaram fora de casa a média caiu para menos de 1 gol. O número máximo de gols na temporada foi de 6 gols.


Não foi fornecido texto alternativo para esta imagem


Agora veja que interessante, quase metade (49,3%) da vitórias acontecem quando o time joga em casa, contra 24% de vitórias fora de casa:

Não foi fornecido texto alternativo para esta imagem


Vamos olhar com mais detalhe esta questão de jogos em casa e fora de casa para ver como é comportamento individual dos times:


Não foi fornecido texto alternativo para esta imagem


Nas figuras acima podemos tirar algumas conclusões interessantes:


  1. Os times que melhor performaram em todo o período foram Flamengo, Gremio, Atletico MG, São Paulo e Santos.
  2. Quando jogando em casa, os melhores times foram Atletico MG, Gremio, Santos e Flamengo. Os times Santa Cruz e Juventude foram os piores times quando jogaram em casa, perdendo mais de 50% das vezes. O Paraná foi o time que mais empatou em casa.
  3. Quando jogando fora de casa, os melhores times foram Flamengo, Atletico PR, São Paulo e Palmeiras. Os piores times jogando fora de casa foram Paraná, Joinville, America MG e Nautico. O Cuiabá foi o time que mais empatou fora de casa.


Se analisarmos o número de gols realizados pelos times temos os gráficos abaixo:


Não foi fornecido texto alternativo para esta imagem


Concluímos pelos gráficos acima que:

  1. Os times Atletico MG, Santos, Flamengo, Gremio e Palmeiras foram os que mais golearam em casa;
  2. Flamengo, Atletico MG, São Paulo, Fluminense e Gremio foram os times que mais golearam fora de casa.


Nos gráficos abaixo você pode ver todos os jogos e seus resultados considerando as partidas dentro e fora de casa (ok, a imagem ficou pequena, mas dá para ler):


Não foi fornecido texto alternativo para esta imagem


Finalmente, a título de diversão resolvi ver a correlação entre gols realizados e partidas ganhas, será que a frase "time que não marca não ganha" é verdade? :)


Não foi fornecido texto alternativo para esta imagem


Note que existe uma forte correlação positiva entre as variáveis, então está mais que provado que sem marcar gols fica muito difícil ganhar o jogo!


Espero que você tenha se divertido com este artigo, no mundo do esporte profissional a cada dia a análise estatística e a ciência de dados estão fazendo a diferença não só no resultado dos jogos, mas principalmente na performance das equipes.



Publicado por

Leonardo Nogueira

Leonardo Nogueira

Executivo na área de Vendas, Desenvolvimento de Negócios, Segurança da Informação e Ciência de Dados, Engenheiro de Machine Learning


#ai hashtag

#datavisualization hashtag

#statistics hashtag

#futebol hashtag

#soccer


0
0

Comentários (2)

0
Thiago Guedes

Thiago Guedes

07/07/2021 11:46

Virei fã e seguidor! :)

0
L

Leonardo Macedo

07/07/2021 11:23

muito bacana seu artigo.

sera que voce consegue ir no meu e me dar uma ajuda ?

https://web.digitalinnovation.one/articles/probabilidade-do-brasil-vencer-a-argentina-ajuda?back=%2Farticles&page=1&order=oldest

https://www.linkedin.com/in/leonardonogueira/

Brasil