Portal de Eventos CoPICT - UFSCar, XXVII CIC e XII CIDTI

Tamanho da fonte: 
Descoberta de conhecimento em dados de scout de partidas de futebol
Luís Felipe Ortolan, Diego Furtado Silva

Última alteração: 2021-02-25

Resumo


Introdução
A análise de dados esportivos, prática conhecida como scouts, consiste em contar eventos como gols no futebol, ou cestas no basquete, e depois analisar os resultados obtidos. Ela tem ganhado atenção recentemente devido a resultados positivos em diversos esportes, inclusive o futebol. Entretanto, como é uma prática antiga \cite{alamar2013sports, sua prática ainda é realizada de forma muito manual. Este trabalho buscou aplicar técnicas de Aprendizado de Máquina(AM) sobre scouts do Campeonato Brasileiro para obter conhecimento desses dados.


Objetivo
O objetivo deste trabalho foi aplicar técnicas já estabelecidas de AM para obtenção de conhecimento através do futebol brasileiro. Trabalhos similares já foram usados para o futebol europeu, mas outro objetivo deste trabalho foi observar se as mesmas técnicas se aplicam ao esporte nacional.


Metodologia
Foram usadas quatro técnicas de AM para obtenção de conhecimento: Classificação, Regressão, Agrupamento e Regras de Associação. Para classificação, obteve-se os scouts de cada time, visitante e mandante, e o classificador tentou prever quem ganhou a partida. Para a regressão, usou-se os dados para tentar prever a nota, dada por especialista, de um jogador em uma partida. Os dados de scouts ainda passaram por um algoritmo de Regras de Associação para se descobrir ligações entre os dados e por último tentou-se agrupar partidas para encontrar semelhanças entre elas.


Resultados
Classificação
O modelo usado para a classificação foi o Random Forest(RF). Com ele, foi possível obter uma acurácia de 52.63% para os resultados de uma partida dados os scouts dos times. Além disso, o classificador proveu informações interessantes como passes errados e desarmes serem atributos importantes para a classificação do time vitorioso. Segundo essas estatísticas, times que trinema esses atributos tem maior chance de saírem vitorioso.

Regressão
Por entender que os atributos importantes na nota de um goleiro são diferentes das de um atacante, o regressor foi aplicado para cada posição individualmente. O atributo alvo foi a nota de especialistas do site Globoesporte.com. [NO PDF EM ANEXO, É POSSÍVEL VER TABELA COM RESULTADOS] Além disso, foi possível obter os atributos mais importantes para nota de cada posição.

Regras de Associação
Para as regras de associação, novamente os dados foram separados por posições. Além disso, para usar o algoritmo apriori os dados foram discretizados. [NO PDF EM ANEXO, É POSSÍVEL VER TABELA COM RESULTADOS]

Agrupamento
O agrupamento não foi realizado de forma satisfatória, já que não existia estrutura de grupos nos dados.


Conclusões
Os resultados obtidos neste trabalho mostraram que é um caminho promissor. Embora o conjunto de dados usado seja simples, assim como as técnicas usadas, foi possível observar bons resultados e extração de conhecimento interessante. Algoritmos mais complexos devem ser capaz de fazer ainda mais com essa linha de pesquisa.


Palavras-chave


Aprendizado de Máquina, Análise Esportiva