Negocios
Cómo calcular el estadístico Durbin-Watson
El test Durbin-Watson es una herramienta estadística que permite detectar si los residuales de una regresión están autocorrelacionados.
La autocorrelación es un problema estadístico donde los residuales de una regresión de un período de tiempo no son al azar, sino que tienen algún tipo de patrón. Esto no afecta los coeficientes del estimado, pero tiene un efecto en errores estándar.
Esto quiere decir que, si el resultado de tu cálculo tiene problemas de autocorrelación, las cifras van a parecer estadísticamente significativas, cuando en realidad no es así.
Por otro lado, para calcular el estadístico Durbin-Watson, te puedes ayudar de software especializado, como Stata.
Te puede interesar: ¿Qué es un conjunto de datos discretos?
¿Por qué es importante el test Durbin-Watson?
La autocorrelación, también conocida como correlation serial, puede ser un problema significativo al analizar los datos históricos, sobre todo si no se es experto en ello.
Un ejemplo de esto son los precios de las acciones. Al no presentar cambios significativos de un día a otro, los datos resultantes tienden a estar altamente correlacionados. Para evitar esto, las series de datos históricos son convertidos en porcentajes que reflejan los cambios diarios en los precios.
La autocorrelación es útil en el análisis técnico, el cual apunta a estudiar las tendencias y relaciones de los precios de los valores utilizando técnicas de gráficos en lugar de los datos de la gestión financiera de la empresa. En este sentido, los analistas utilizan la autocorrelación para comprender el impacto que puede tener el precio pasado de un valor en su precio futuro.
La autocorrelación puede mostrar si existe un factor de impulso asociado a un valor determinado. Por ejemplo, si ves que un valor ha tenido durante su desempeño histórico una alta tasa positiva de autocorrelación y has observado que el mismo ha tenido ganancias durante los días anteriores, es razonable que esperes que en los próximos días los valores se muevan para coincidir con aquellos de la serie temporal rezagada para luego moverse hacia arriba.
Contenido relacionado: ¿Qué tipo de datos se muestran en un gráfico circular?
¿Cómo calcular el estadístico Durbin-Watson usando Stata?
- Abre la base de datos en Stata y dale un formato de período de tiempo donde cada línea de datos represente un período determinado.
- Crea una variable falseada para cada período de tiempo. Si tus datos sólo tienen un período, puedes usar el código: gen año=_n. Si tus datos están constituidos por diferentes lugares observados a lo largo del tiempo, puedes usar: bysort lugar: gen año=_n, donde "lugar" es la ubicación que has observado.
- Utiliza el comando tsset para especificar el período de tiempo de tus datos y permitir que se calcule el estadístico Durbin-Watson. Por ejemplo, si los datos están construidos de manera que el año es la variable del período de tiempo, tienes que introducir: tsset año.
- Utiliza el comando estat para generar el estadístico Durbin-Watson. Hazlo usando el código estat dwatson si tus datos son estrictamente endógenos y estat durbinalt si no lo son.
- Interpreta los resultados observando el p-value y las estadísticas chi-squared. El p-value prueba la correlación serial. Si el p-value es mayor que 0,05, entonces no hay correlación serial y tus datos están bien. Si el p-value es menor a 0,05 entonces hay problemas de correlación serial que necesitan ser revisados.
Para saber más: Cuatro tipos de análisis de datos
Para tomar en cuenta
- El resultado del test Durbin-Watson siempre será entre 0 y 4. Un resultado de 2.0 significa que no hay autocorrelación en la muestra.
- Un resultado entre 0 y 2 significa que existe una autocorrelación positiva, mientras que entre 2 y 4 una negativa.
- Es normal que el resultado varíe entre 1.5 y 2.5. En el caso contrario, es posible que exista un problema en la operación.
- El estadístico Durbin-Watson no debería utilizarse para ciertas situaciones. Por ejemplo, cuando las variables dependientes rezagadas se incluyen en las variables explicativas.