Comunicaciones

Resumen

Sesión Estadística, Probabilidad y Ciencias de Datos

Una Aplicación del Modelo Bivariado de Regresión Simbólica para Datos de Intervalo

Jorgelina Carrizo

Facultad de Filosofía, Humanidades y Artes.Universidad Nacional de San Juan, Argentina   -   Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

\begin{center}

{\sc Una Aplicaci\'on del Modelo Bivariado de Regresi\'on Simb\'olica para Datos de Intervalo } \end{center}

\noindent Expositor: { Jorgelina Carrizo (Universidad Nacional de San Juan, jorgelinav\Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.) }

\noindent Autor: { Jorgelina Carrizo (Universidad Nacional de San Juan, jorgelinav\Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.)}

\vspace{10pt}

{ El An\'alisis de Datos Simb\'olicos (ADS) es un campo relativamente nuevo de la estad\'{\i}stica que ampl\'{\i}a el an\'alisis estad\'{\i}stico convencional de datos, al considerar la variabilidad y la estructura intr\'{\i}nsecas de los datos. A diferencia del an\'alisis cl\'asico de datos, en ADS, las variables que caracterizan los datos pueden ser multivaluadas, como intervalos o histogramas. El objetivo del presente trabajo es mostrar las variables con valores de intervalo como vectores aleatorios bivariados e introducir el modelo bivariado de regresi\'on simb\'olica, basado en la teor\'{\i}a de modelos lineales generalizados. El mismo proporciona aspectos inferenciales al introducir herramientas de diagn\'ostico como deviance, residuos simb\'olicos y medidas de influencia, adaptadas a datos de intervalo. El m\'etodo propuesto se aplica a un conjunto de datos reales en el marco de la econom\'{\i}a, obteniendo las estimaciones de los par\'ametros del modelo, como coeficientes de regresi\'on, el par\'ametro de dispersi\'on,que mide la variabilidad residual del modelo, y el coeficiente de correlaci\'on utilizando un enfoque iterativo de estimaci\'on por m\'axima verosimilitud. Su desempe\~no se compara con el del m\'etodo del Centro, introducido por Billard y Diday (2000), y del m\'etodo de Centro y Rango propuesto por Lima Neto y Carvalho (2008). Para esta evaluaci\'on se utiliza el error cuadr\'atico medio. Se concluye que, para el ejemplo utilizado, el m\'etodo bivariado de regresi\'on simb\'olica muestra una mejor performance respecto de los m\'etodos citados, con la ventaja de ser un m\'etodo inferencial.

Palabras Claves: An\'alisis de datos simb\'olicos, variables simb\'olicas de intervalo, m\'etodo bivariado de regresi\'on lineal simb\'olica, modelo lineal generalizado, an\'alisis de residuos.

}

Referencias

[1] Billard and Diday (2000). Regression analysis for interval-valued data. In: Proc. of IFCS00, Belgium, pp. 369-374,Springer.

[2] Lima Neto, E. and F. De Carvalho (2008). Centre and Range method for fitting a linear regression model to symbolic interval data.Computational Statistics and Data Analysis 52(3), 15001515.

[3] Lima Neto, Cordeiro, De Carvalho, 2011. Bivariate symbolic regression models for interval-valued variables. Journal of Statistical Computation and Simulation 81 (11), 1727-1744.

Ver resumen en PDF