Saltar al contenido
Mundo Entrenamiento

Big data en el fútbol del 2021 ¿Información o sesgo?

7 marzo, 2021

El big data en el fútbol es una realidad en la última década. ¿Somos conscientes de la cantidad de datos que podemos manejar?

big data en el fútbol
Ayúdanos a difundirlo. El conocimiento tiene sentido sólo cuando se comparte.

La inclusión de las nuevas tecnologías y el big data en el fútbol ha supuesto una revolución en los últimos años.

La aparición y utilización de herramientas de registro automático de la carga externa como los GPS y de la carga interna han propiciado la necesidad de herramientas y profesionales formados en el tratamiento de la gran cantidad de datos que estos nos aportan.

El fútbol como deporte rey a nivel mundial (5), es el deporte sobre el que han puesto el foco las grandes empresas encargadas de la obtención de datos y su tratamiento como WyScout, Instat, OptaPro o Mediacoach, entre otras.

Por otro lado, el enorme desarrollo obtenido en los últimos años en la inteligencia artificial  ha permitido a diferentes a estas empresas u organizaciones la parametrización (hasta hace unos años fuera de nuestro alcance) de un gran número de variables técnicas y tácticas sobre los equipos de fútbol y los jugadores participantes en cada uno de los partidos analizados.

El nivel de especificación de estas herramientos se ha desarrollado hasta el punto de obtener una fiabilidad igual o superior a la del experto humano (6).

Podemos afirmar por lo tanto que nos encontramos ante un futuro condicionado por estas tecnologías, más si cabe en la élite deportiva. Nos encontramos en el momento del big data en el fútbol y en el deporte.

El mundo del deporte y del entrenamiento personal a experimentado un cambio notable de un tiempo a esta parte.

La progresiva incorporación de las tecnologías a la práctica deportiva ha permitido que se genere una gran cantidad de información, denominada Big Data (20), que nos permite obtener datos gracias a los cuales se puede profundizar en el conocimiento deportivo.

Gracias a esta información podemos mejorar nuestros conocimientos y la eficacia de los deportivas en el entrenamiento, en la salud, incluso se está comenzando a implementar su uso en el ámbito de la suplementación y de la alimentación (15) y en el de la dirección y gestión de clubs y entidades deportivas (16).

¿Qué es el Big Data en el fútbol?

Cuando hablamos de Big Data en el fútbol, también denominado Datos Masivos, se hace referencia a la acumulación de una gran cantidad de datos o de información, así como a los procedimientos empleados para encontrar patrones repetitivos en el proceso de análisis de dichos datos.

Este término de big data en el fútbol se engloba dentro del ámbito de las tecnologías de la información y de la comunicación (TICs) (6, 13, 17).

Big Data en el fútbol y otros ámbitos deportivos

Analizar el Big Data en el fútbol o en la práctica deportiva tiene una gran variedad de utilidades, por ejemplo se ha utilizado la información procedente de los GPS de los dispositivos móviles para generar mapas de calor de las rutas más populares de senderimo y otros deportes en la naturaleza (8, 10), para así mejorar su conservación y la seguridad y bienestar de los usuarios.

Saber interpretar correctamente la información que existe en el Big Data en el fútbol, nos puede dar ventaja a la hora de encarar un partido.

Por ejemplo, la investigación llevada a cabo por Xu et al. (14) analizó el estado emocional de los jugadores de la NBA antes de cada partido, lo que podía ayudar a predecir su nivel de rendimiento durante el juego.

Ese es solo un ejemplo de las diferentes estrategias deportivas que se pueden llevar a cabo mediante el análisis de la información que existe en el Big Data en el fútbol , pero sus posibilidades son infinitas (5).

En el ámbito de la salud, la investigación de Ebersbach et al. (3) señala la importa de analizar la información que nos proporciona el Big Data en el fútbol  para conocer en más detalle el proceso de mejora de los pacientes, en este caso nos referimos a un menor tiempo de reacción en pacientes con Párkinson gracias al ejercicio físico.

En el ámbito de la Educación Física, también se está utilizando el análisis de los datos que se encuentran en el Big Data para obtener información sobre la capacidad física, sobre todo relacionada con el ámbito de la salud de los jóvenes en el ámbito escolar.

Lo que por un lado permite llevar a cabo intervenciones de mayor calidad puede generar controversias en lo que respecta a cuestiones éticas o de privacidad, sin descartar el alto grado de vigilancia y de control al que pueden verse sometidos los jóvenes (6).

Por último el análisis del Big Data en el fútbol  también repercute en los espectadores de los grandes eventos deportivos, saber analizar la información de manera eficiente permitirá conocer mejor cuales serán las demandas de audiencia de los diferentes campeonatos deportivos, por lo que se podrá asegurar mejor los servidores web (por ejemplo mediante el Cloud Computing) lo que asegurará una mayor calidad en la retransmisión (1).

Mediante un análisis de los datos generados por Twitter se puede conocer cual es la opinión y los sentimientos de los aficcionados antes, durante y después de los partidos (15).

Además, el Big Data en el fútbol  supone un cambio en el modelo de comunicación deportiva que se venía manteniendo hasta la fecha (4, 17), ya que en un futuro es muy probable que una gran parte de las noticias deportivas se generen casi en exclusiva a partir del análisis del Big Data, si bien no sería lo recomendable (19).

Lo ideal sería concederles una orientación humanista  a dichas comunicaciones, otorgando una gran importancia a las redes sociales que mejoran la participación del público, por lo que sería ideal establecer sistemas para monitorizar su opinión (20).

Big Data en el fútbol: una reflexión inicial

Ante el creciente aumento del número de datos obtenidos en los partidos de fútbol debemos estar de acuerdo en que “corremos el riesgo de sustituir la tiranía de los expertos por la tiranía de los datos”. Esto se explica bajo la dificultad metodológica a la hora de realizar el tratamiento y análisis de estos metadatos.

En pocos años hemos avanzado de manera trepidante del fútbol subjetivo, en el que los profesionales del ámbito debían ser capaces de observar y analizar aquello que realmente consideraban importante de sus equipos, al fútbol del dato en el que en muchas ocasiones tal magnitud de información es tratada por científicos e ingenieros de datos de acuerdo a complejas fórmulas estadísticas que, con suerte, resuelven algunos de los problemas planteados por el entrenador.

El objetivo debe ser avanzar hacia un modelo de rendimiento en el que los datos sean capaces de ayudar en la toma de decisiones sin menospreciar la decisión del ojo experto entrenado durante tanto tiempo en el campo de la práctica. Por ello, se debe utilizar el big data como herramienta de ayuda y no como fin en sí mismo.

Herramientas y aplicaciones de big data en el fútbol

Entre las aplicaciones más comercializadas en el ámbito del fútbol podemos encontrar diferencias y similitudes pero, en todas las ocasiones se persigue un mismo propósito: recoger el mayor número de datos posibles por fracción temporal que puedan servir de ayuda a entrenadores y cuerpos técnicos.

Si bien no es el propósito de este artículo, a continuación se enumeran algunas de las más utilizadas en el fútbol profesional:

big data en el fútbol

Variables analizadas por el big data en el fútbol

Las variables comúnmente analizadas y recogidas por el big data en el fútbol versan sobre aspectos técnicos, tácticos y/o condicionales relativos al rendimiento de los jugadores y los equipos en competición.

A pesar de que todas ellas únicamente centran su atención en el análisis de la competición, no debemos olvidar que los grandes clubes de fútbol utilizan un sinfín de herramientas personalizadas con el objetivo de parametrizar y cuantificar el entrenamiento realizado durante la semana.

Con el objetivo de hacer ver al lector la magnitud del dato obtenido en cada uno de los partidos se enumeran a continuación parte de las variables analizadas por equipo y partido (y quedan algunas por enumerar) extraídas de la herramientas de análisis y scouting InStat (3):

  • Como indicadores de éxito: goles, oportunidades de gol, oportunidades de gol exitosas. tiros, tiros a puerta, eficacia en tiros a puerta, tiros fuera, tiros blocados, pases de gol y eficacia en pases de gol.
  • A nivel global: tiempo efectivo de juego, porcentaje de posesión y duración media de las posesiones.
  • A nivel ofensivo: pases, pases exitosos, tiros,  centros, eficacia en los centros, duelos, duelos ganados, duelos aéreos, regates, regates realizados con éxito, internadas en campo rival, pérdidas de balón, pérdidas de balón en campo propio, internadas en el último tercio, internadas en el área rival, ataques posicionales, ataques posicionales con tiro, contraataques, contraataques con tiro, acciones a balón parado, tiros libre directos, corners, cornes con tiro, eficacia en el corners, ataques por el carril izquierdo, ataques por el carril central y ataques por el carril derecho (estos tres últimos con sus respectivas estadísticas acordes a la frecuencia de estos que finalizaron con gol y su grado de eficacia)
  • A nivel defensivo: faltas realizadas, tarjetas amarillas, duelos defensivos, duelos defensivos ganados, entradas, entradas realizadas con éxito, interceptaciones de balón,  recuperaciones de balón y recuperaciones de balón en campo rival.

A todas las variables enumeradas anteriormente (y las que no se han enumerado hasta las 76 facilitadas por el este proveedor) debemos añadir todas lasque hacen referencia al rendimiento individual del jugador (suman 90 variables de rendimiento individual).

Por todo lo anterior se propone a continuación la realización de un sencillo cálculo:

Teniendo en cuenta que en un partido de fútbol participan 28 jugadores (titulares más suplentes sin tener en cuenta la posibilidad actual de realizar cinco cambios) y que por cada uno de ellos se recogen un total de 90 variables de rendimiento individual:

obtenemos una base de datos de rendimiento individual de 2.520 datos por partido que se grafica de una manera visual para el usuario de una manera similar a la que vemos en la siguiente figura.

Análisis técnico táctico individual en fútbol. Fuente: Instat

Si además le añadimos la estadística por equipo, que aproximadamente supone 150 datos a añadir, estaríamos hablando de 2700 datos por partido analizado.

Es decir, una única jornada disputada a lo largo del fin de semana proporciona a cualquier usuario de uno de estos proveedores una base de datos de 27.000 datos cada siete días (el lector puede seguir realizando cálculos por competiciones, ligas o incluso varias temporadas)

Análisis e interpretación de los datos en fútbol

Hasta este momento el proceso de obtención y registro de los datos a partir de diferentes proveedores ha evidenciado las enormes cantidades de información estadística que somos capaces de obtener.

Pero, aquí se encuentra una de las problemáticas actuales en cuanto al big data en el fútbol ¿Somos capaces de manejar tan ingente cantidad de información? o por el contrario ¿Nos vemos supeditados a ser engañados por esta cantidad de datos?

En su libro “Antifrágil”, Nicholas Nassim Taleb hace alusión al problema del tratamiendo de estos metadatos como sigue:

Si tenemos un conjunto de datos de 200 variables aleatorias, sin relación alguna entre sí, entonces resultará casi imposible no encontrar una correlación elevada entre ellas (ni siquiera algunas de las pruebas estadísticas post-hoc son capaces de eliminar este sesgo) […]

El efecto de “ser engañados por los datos” se está acelerando con el tiempo. Hoy sómos testigos de un desagradable fenómeno llamado big data […] en el que los investigadores han llevado la selección sesgada a niveles industriales. La modernidad proporcioa demasiadas variables, pero con un número excesivamente pequeño de datos por variable, y las relaciones espurias crecen desmesuradamente a un ritmo mucho más rápido que la información real.

Es decir, corremos el riesgo de obtener conclusiones erróneas propiciadas por ciertas asociaciones entre variables que, aunque estadísticamente cumplan los requisitos, carecen de cualquier tipo de coherencia práctica en el ámbito del deporte y, en este caso particular, el fútbol.

A modo de ejemplo: la FIFA (cita) emitió en 2015 el primer informe físico sobre la Copa Mundial Femenina de la FIFA Canadá 2015 -que supueso el primer intento por parte de este organismo de dotar al campeonato de un análisis estadístico desarrollado- en el que (por causas lógicamente desconocidas por los investigadores) se desmotró una alta correlación entre los metros recorridos a 16-18 km/h y el número de córners.

big data en el fútbol

Conclusión sobre el big data en el fútbol y el ámbito deportivo

El análisis del Big Data en el fútbol de una manera eficaz proporciona una gran cantidad de información que puede ser muy útil en el ámbito del deporte, desde la alta competición a la educación física, pasando por el ámbito de la salud entre otros.

Una de las mejores maneras de que la estrategia deportiva de un país mejore y se sitúe entre las mejores a nivel mundial es invertir en la mejora de la capacidad del proceso de datos y de servicios.

La introducción de talentos de análisis de datos, la creación de equipos de investigación científica, la protección de la privacidad individual y el desarrollo de la investigación en la innovación colaborativa de la industria de los deportes (22).

Si bien es necesario abordar todos los conflictos legales o éticos que puedan surgir del análisis del Big Data en el fútbol, para ellos algunos autores proponen abordar su uso desde el ámbito de la sociología del deporte (11).

El tratamiento de la información relativa el rendimiento técnico, táctico o condicional en fútbol debe ser gestionado por profesionales con amplio conocimiento y experiencia -siendo estrictamente necesario que siga el orden establecido- dos disciplinas:

  1. Las ciencias del deporte, en particular sobre fútbol en todos sus aspectos.
  2. Estadística e investigación

De lo contrario, podemos afirmar que en el momento en el que estas disciplinas no sean ampliamente dominadas por estos gestores de datos, o bien, el orden de ellas se altere, correremos el riesgo de vernos supeditados a obtener conclusiones sesgadas; es en ese momento cuando nos encontraremos en una tiranía del dato.

Referencias bibliográficas

  1. Kite, C.S. y Nevill, A. (2017). The predictors and Determinants of Inter-Seasonal Success in a Professional Soccer Team. Journal of Human Kinetics, 58, 157-167.
  2. Casal, C.A., Losada, J.L., Maneiro, R., y Ardá, T. (in press). Gender Differences in Technical-Tactical Behaviour of La Liga Spanish Football Teams. Journal of Human Sport and Exercise.
  3. Instat (2020). Instat Scout Features. Recuperado de: https://instatsport.com/content/31550577674_InStat_Scout_Features.pdf
  4. FIFA (2015). Análisis Físico de la Copa Mundial Femenina de la FIFA 2015. Recuperado de: https://img.fifa.com/image/upload/zbgh1drt57dhsqg72auv.pdf
  5. Baughman, A. K.; Bogdany, R. J.; McAvoy, C.; Locke, R.; O’Connell, B. & Upton, C. (2015). Predictive Cloud Computing with Big Data: Professional Golf and Tennis Forecasting [Application Notes]. IEEE Computational Intelligence Magazine. 10 (3), 62 – 76.
  6. Borgman, C. L. (2015). Big data, little data, no data: scholarship in the networked world. Cambridge, Massachusetts: The MIT Press.
  7. Ebersbach, G.; Ebersbach, A.; Gandor, F.; Wegner, B.; Wissel, J. & Kupsch, A. (2014). Impact of physical exercise on reaction time in patients with parkinson’s disease – Data from the berlin BIG study.  Archives of Physical Medicine and Rehabilitation. 95 (5), 996 – 999.
  8. Ding, X.; Gao, L. & Zhao, B. (2014). Sports Communication in Age of Big Data: Features, Body Positioning and Development Direction. Journal of Shenyang Institute of Physical Education. 33 (5), 39 – 45.
  9. Liu, Q. & He, X. (2015). The Development Strategies of Competitive Sports System in the Age of Big Data. Journal of Capital Institute of Physical Education. 27 (2), 156 – 159.
  10. Lupton, D. (2015). Data assemblages, sentient schools and digitised health and physical education (response to Gard). Sport, Education & Society. 20 (1), 122 – 132.
  11. Millington, B. & Millington, R. (2015). ‘The Datafication of Everything’: Toward a Sociology of Sport and Big Data. Sociology of Sport Journal. 32(2), 140 – 160.
  12. Oksanen, J.; Bergman, C.; Sainio, J. & Westerholm, J. (2015). Methods for deriving and calibrating privacy-preserving heat maps from mobile sports tracking application data. Journal of Transport Geography. 48, 135 – 144.
  13. Pérez-Masqués, M. (2015). Big Data: técnicas, herramientas y aplicaciones. San Fernando de Henares, Madrid: RC Libros.
  14. Sainio, J.; Westerholm, J. & Oksanen, J. (2015). Generating heat maps of popular routes online from massive mobile sports tracking application data in milliseconds while respecting privacy. ISPRS International Journal of Geo-Information. 4 (4), 1813 – 1826.
  15. Satija, A., & Hu, F. B. (2014). Big data and systematic reviews in nutritional epidemiology. Nutrition Reviews. 72 (12), 737 – 740.
  16. Wang, X. L.; Yoonjoung-Heo, C.; Schwartz, Z.; Legohérel, P. & Specklin, F. (2015). Revenue Management: Progress, Challenges, and Research Prospects. Journal of Travel & Tourism Marketing. 32 (7), 797 – 811.
  17. Wikipedia (2016). Big Data. Recuperado el 31/01/2016.
  18. Xu, C.; Yu, Y. & Hoi, C.-K. (2015). Hidden in-game intelligence in NBA players’ tweets. Communications of the ACM. 58 (11), 80 – 89.
  19. Yu, Y. & Wang, X. (2015). World Cup 2014 in the Twitter World: A big data analysis of sentiments in U.S. sports fans’ tweets. Computers in Human Behavior. 48, 392 – 400.
  20. Yue, H. & Allen, G. I. (2015). Local-Aggregate Modeling for Big Data via Distributed Optimization: Applications to Neuroimaging. Biometrics. 71(4), 905 – 917.
  21. Zhang, J. (2014). Sports Communication in Era of Big Data. Journal of Wuhan Institute of Physical Education. 48 (7), 16 – 20.
  22. 谢经良; 孙晋海 & 曹莉 (2015). Opportunitiesand Challenges for the Development of Chinese Sports Industryduring the Age of Big Data. Journal of Shanghai Physical Education Institute / Shanghai TiyuXueyuan Xuebao. 39 (4), 59 – 63.
  23. 王相飞 & 张巧玲 (2015). Research on New Media Communication of Large-scale Sports Events Under Background of Big Data. Journal of Wuhan Institute of Physical Education. 49 (11), 24 – 29.
  24. 付晓静; 罗珍 & 赵蕴 (2015). Sports Public Relation Communications in Big Data Era. Journal of Wuhan Institute of Physical Education. 49 (9), 26 – 30.


Ayúdanos a difundirlo. El conocimiento tiene sentido sólo cuando se comparte.