Estudio de caso: Análisis de críquet, ¡el cambio radical!

Copa y estadio de la Premier League de Críquet de India
IPLT20, el festival de críquet más grande en India#
(Créditos de imagen: IPLT20 (copa y logo) & Akash Yadav (estadio))

No juegas para el público, juegas para el país.

—M S Dhoni, Jugador Internacional de críquet, ex-capitán del equipo de India, juega para Chennai Super Kings en IPL

Acerca del críquet#

Sería una subestimación decir que a los indios les encanta el críquet. El juego se juega en casi todos los rincones de la India, rurales o urbanos, es popular entre los jóvenes y ancianos por igual, conectando miles de millones de personas en India como ningún otro deporte. El críquet disfruta de una gran atención mediática. Hay una cantidad importante de dinero y fama en juego. En los últimos años, la tecnología ha cambiado literalmente las reglas del juego. El público tiene muchas opciones para elegir entre streaming de medios, torneos, acceso asequible a la visualización de críquet en vivo desde dispositivos móviles y más.

La Indian Premier League (IPL) es una liga profesional de críquet Twenty20, fundada en 2008. Es uno de los eventos de críquet más concurridos en el mundo, valorado en $6.7 mil millones de dólares en 2019.

El críquet es un juego de números - las carreras anotadas por un bateador, los wickets tomados por un lanzador, los partidos ganados por un equipo de críquet, el número de veces que un bateador responde de cierta manera a un tipo de ataque de lanzamiento, etc. La capacidad de profundizar en los números del críquet tanto para mejorar el rendimiento como para estudiar las oportunidades de negocio, el mercado en general y la economía del cricket mediante potentes herramientas de análisis, impulsadas por software de computación numérica como NumPy, es algo muy importante. El análisis del críquet proporciona ideas interesantes sobre el juego e inteligencia predictiva respecto a los resultados del juego.

Hoy en día, hay abundantes y casi infinitos tesoros de registros y estadísticas de juegos de críquet disponibles, por ejemplo, en ESPN cricinfo y cricsheet. Estas y muchas otras bases de datos de cricket se han utilizado para el análisis de cricket utilizando los últimos algoritmos de aprendizaje automático y modelación predictiva. Las plataformas de medios y entretenimiento, junto con los organismos deportivos profesionales asociados con el juego, utilizan la tecnología y el análisis para determinar métricas clave que mejoren las posibilidades de ganar los partidos:

  • promedio móvil del rendimiento de bateo,
  • previsión del marcador,
  • obtener información sobre la condición física y el rendimiento de un jugador contra diferentes oponentes,
  • contribución del jugador a las victorias y derrotas para tomar decisiones estratégicas sobre la composición del equipo
Un campo de cricket con lanzador y bateadores
El campo de críquet, el punto focal en el terreno de juego#
(Image credit: Debarghya Das)

Objetivos Clave de Análisis de Datos#

  • El análisis de datos deportivos se utiliza no solo en el críquet, sino en muchos otros deportes para mejorar el rendimiento general del equipo y maximizar las posibilidades de ganar.
  • El análisis de datos en tiempo real puede ayudar a obtener información incluso durante el juego para cambiar tácticas por parte del equipo y de las empresas asociadas para beneficios económicos y crecimiento.
  • Además del análisis histórico, se aprovechan los modelos predictivos para determinar los posibles resultados de los partidos, lo cual requiere una cantidad significativa de procesamiento de datos y conocimientos de ciencia de datos, herramientas de visualización y la capacidad de incluir nuevas observaciones en el análisis.
estimador de postura
Estimador de postura en críquet#
(Crédito de imagen: connect.vin)

Los Desafíos#

  • Limpieza de datos y preprocesamiento

    La IPL ha expandido el críquet más allá del clásico formato de partido de prueba a una escala mucho más grande. El número de partidos jugados cada temporada a través de varios formatos ha incrementado y así también los datos, los algoritmos, las nuevas tecnologías de análisis de datos deportivos y modelos de simulación. El análisis de datos de críquet requiere mapeo del campo, seguimiento de jugadores, seguimiento de la pelota, análisis de tiros de los jugadores y varios otros aspectos relacionados con cómo se lanza la pelota, su ángulo, giro, velocidad y trayectoria. Todos estos factores juntos han incrementado la complejidad de la limpieza de datos y el preprocesamiento.

  • Modelación Dinámica

    En el cricket, al igual que en cualquier otro deporte, puede haber una gran cantidad de variables relacionadas con el seguimiento de varios jugadores en el campo, sus atributos, la pelota y varias posibilidades de acciones potenciales. La complejidad del análisis de datos y la modelación es directamente proporcional al tipo de preguntas predictivas que se plantean durante el análisis y depende en gran medida de la representación de los datos y del modelo. Las cosas se vuelven aún más desafiantes en términos de cálculo y comparación de datos cuando se buscan predicciones dinámicas del juego de críquet, tal como habría sucedido si el bateador hubiera golpeado la bola a un ángulo o velocidad diferente.

  • Complejidad de Análisis Predictivo

    Gran parte de la toma de decisiones en el críquet se basa en preguntas como “¿con qué frecuencia un bateador juega un cierto tipo de golpe si la entrega de la pelota es de un tipo particular?” o “¿cómo cambia un lanzador su línea y longitud si el bateador responde a su entrega de una cierta manera?”. Este tipo de consulta de análisis predictivo requiere una disponibilidad de un conjunto de datos altamente granular y la capacidad de sintetizar datos y crear modelos generativos que sean altamente precisos.

El Papel de NumPy en el Análisis del Críquet#

El análisis deportivo es un campo en desarrollo. Muchos investigadores y compañías utilizan NumPy y otros paquetes de PyData como Scikit-learn, SciPy, Matplotlib y Jupyter, además de utilizar las últimas técnicas de aprendizaje automático e inteligencia artificial. NumPy se ha utilizado para varios tipos de análisis deportivos relacionados con el críquet tales como:

  • Análisis Estadístico: Las capacidades numéricas de NumPy ayudan a estimar la significancia estadística de los datos observacionales o de eventos de partidos en el contexto de varias tácticas de jugadores y de juego, estimando el resultado del juego mediante la comparación con un modelo generativo o estático. El análisis causal y los enfoques de big data se utilizan para el análisis táctico.

  • Visualización de Datos: La creación de gráficos y la visualización de datos proporcionan información útil sobre la relación entre varios conjuntos de datos.

Resumen#

El análisis deportivo ha revolucionado la forma en que se juegan los partidos profesionales, especialmente en cuanto a la toma de decisiones estratégicas, que hasta hace poco se basaba principalmente en la “intuición” o en la adherencia a tradiciones pasadas. NumPy constituye una base sólida para un gran conjunto de paquetes de Python que brindan funciones de nivel superior relacionadas con análisis de datos, el aprendizaje automático y los algoritmos de IA. Estos paquetes están ampliamente desplegados para obtener información en tiempo real que ayudan en la toma de decisiones para resultados revolucionarios, tanto en el campo como para sacar conclusiones y hacer negocios alrededor del juego del críquet. Encontrar los parámetros ocultos, patrones y atributos que conducen al resultado de un partido de críquet ayuda a los interesados a tomar nota de la información del juego que de otra forma estarían ocultos en números y estadísticas.

Diagrama que muestra los beneficios de usar NumPy para análisis de críquet
Capacidades claves de NumPy utilizadas#

On this page