Sesión Estadística, Probabilidad y Ciencias de DatosPredicción invariante al entorno vía independencia condicional y transporte óptimo
Ian Bounos
Universidad de Buenos Aires - Instituto de Investigaciones Matemáticas Luis A. Santaló, Argentina - Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.
Estudiamos la predicción de resultados $Y$ a partir de predictores $X$ en presencia de efectos de confusión inducidos por una variable ambiental $E$, de modo que la relación entre $Y$ y el entorno $E$ puede diferir entre los conjuntos de entrenamiento y prueba.
Proponemos aprender una representación $W = f(X)$ que sea lo más predictiva posible de $Y$, mientras satisface la independencia condicional $W \perp\!\!\!\perp E \mid Y$. En un entorno lineal y gaussiano, este criterio es equivalente a la ortogonalidad entre los residuos de la regresión de $E$ respecto de $Y$, que llamaremos $T(E,Y)$ y $W$, lo que produce un problema espectral tratable con solución en forma cerrada.
Para el caso no lineal, generalizamos $T$ al baricentro de Wasserstein para definir una función de pérdida que garantice la invariancia frente a cambios de entorno.
Proporcionamos resultados de identificación en el caso gaussiano, aclaramos cuándo la independencia de residuos caracteriza $W \perp\!\!\!\perp E \mid Y$, y conectamos el objetivo con identidades de covarianza. Experimentos sintéticos con desplazamientos controlables en el acoplamiento $Y$--$E$ muestran que el estimador propuesto mantiene un error estable fuera del entorno de entrenamiento y supera a mínimos cuadrados ordinarios en este contexto.
En conjunto, el marco ofrece una vía fundamentada para la extracción de características estables al entorno al relacionar independencia condicional con transporte óptimo.
Trabajo en conjunto con: Pablo Groisman (Universidad de Buenos Aires, Argentina), Mariela Sued (Universidad de San Andrés, Argentina) y Esteban Tabak (Universidad de Nueva York, Estados Unidos).

