Sesión Estadística, Probabilidad y Ciencias de DatosCaracterización de circuitos de Fórmula 1 mediante PCA y clustering para apoyo en la toma de decisiones estratégicas
Ezequiel Francisco Chocobar
Facultad de Ciencias Exactas - Universidad Nacional de Salta , Argentina - Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.
En este trabajo se realiza un análisis cuantitativo y caracterización matemática de los circuitos que conforman el calendario de la temporada 2024 de Fórmula 1, aplicando técnicas de análisis de datos, aprendizaje automático y estadística multivariada. A partir de datos de telemetría obtenidos con la librería FastF1, se analizan variables como velocidad, aceleración y posiciones normalizadas para clasificar los tramos del circuito en rectas, curvas lentas, medias y rápidas. Estos datos permiten describir la proporción de cada tipo de tramo en los diferentes circuitos, generando un perfil característico de cada pista. Para detectar curvas se aplica un proceso de suavizado de la trayectoria, se calculan diferencias de posición, se determinan los ángulos de dirección y sus variaciones, identificando aquellas zonas que superan un umbral angular específico y clasificando así las curvas del trazado.
Posteriormente, se construye un conjunto de variables representativas para cada circuito, incluyendo los porcentajes de curvas por tipo detectadas anteriormente, longitud total del circuito, número de curvas, tiempos de vuelta rápida, velocidades máximas y mínimas, y porcentaje de acelerador a fondo. Estos datos se normalizan y se someten a un proceso de reducción dimensional mediante Análisis de Componentes Principales (PCA), lo que permite facilitar la visualización y comparación entre pistas en un espacio reducido de dimensiones con mínima pérdida de información. Sobre este espacio reducido, se aplica un método de clustering (K-Means), con el objetivo de agrupar los circuitos según sus características geométricas y dinámicas. Para determinar la cantidad óptima de clústeres, se emplean criterios como el método del codo (Elbow Method) y el coeficiente de silueta (Silhouette Score), lo que permite identificar configuraciones de agrupamiento estables y coherentes. Además, se complementa el análisis con un enfoque jerárquico utilizando dendrogramas, lo que brinda una visión más detallada de las relaciones de similitud entre los distintos trazados.
Este enfoque integral permite no solo una mejor comprensión de la diversidad y características estructurales de los circuitos de Fórmula 1, sino también sugiere posibles impactos estratégicos en la dinámica de carrera. La información derivada puede emplearse para decisiones relacionadas con la configuración del monoplaza, como la carga aerodinámica, la gestión del rendimiento del motor y el desgaste de neumáticos. A su vez, esta caracterización ofrece una herramienta valiosa tanto para ingenieros y estrategas como para analistas y aficionados, proporcionando una forma accesible de interpretar por qué ciertas elecciones técnicas y estratégicas se toman en función del tipo de circuito.
Referencias
[1] Raschka, S., & Mirjalili, V. (2017). Python machine learning: Machine learning and deep learning with Python, scikit-learn, and TensorFlow (2nd ed.). Packt Publishing.
[2] Chatfield, C. (2003). The analysis of time series: An introduction (6th ed.). CRC Press.
[3] Morán Montero, D. (2022, julio). Análisis de datos de telemetría de Fórmula 1 con técnicas de Deep Learning. Universidad de Extremadura.
[4] Strang, G. (2019). Linear algebra and learning from data. Massachusetts Institute of Technology
[5] J. L. Devore, Probabilidad y Estadísticas para Ingeniería y Ciencias, Cengage Learning, 2008.
[6] https://docs.fastf1.dev/, Biblioteca con datos de F1

