Cómo arreglar Normalidad en la regresión múltiple con datos de serie temporal

En muchas técnicas estadísticas , la asunción de la normalidad de los errores es una de las bases de la realización de pruebas de hipótesis estadísticas. Por lo tanto , es importante para un investigador para comprobar sus datos de normalidad; si el supuesto de normalidad falla, esto implica que algunos de los métodos estadísticos serán de fundamento si se utiliza en el conjunto de datos del investigador. Este hecho es cierto para la regresión múltiple de datos de series de tiempo. Datos de series de tiempo - los datos de medición de un fenómeno particular y tomará en momentos específicos - puede ser sensible a la hipótesis de la normalidad , ya que los errores en la medición podrían cambiar con el tiempo. Ejecución de regresión múltiple en dichos datos complica aún más las cosas , debido al alto nivel de dimensionalidad que implica. Sin embargo , un buen estadista aún debe hacer un intento de corregir cualquier desviación de la hipótesis de la normalidad en los datos. Instrucciones Matemáticas 1

Eliminar valores atípicos. A menudo, los datos en sí hace ajustarse a la normalidad , pero parcelas y pruebas que sonda para la normalidad simplemente fallan debido a la existencia de los valores atípicos en los datos . Trazar los datos de series de tiempo , en busca de valores atípicos ( los puntos que se desvían enormemente de los principales patrones presentes en los datos ) . Tome estos valores atípicos de los datos y volver a ejecutar la regresión múltiple. Si la hipótesis de normalidad se mantiene, entonces el problema es fijo y sólo tiene que indicar en su análisis de los datos que había eliminado los valores extremos antes del análisis de datos. Si la hipótesis de la normalidad aún no se sostiene después de la eliminación de valores atípicos , pasar a otras técnicas.
2

transformaciones de datos de prueba . En muchos casos , la transformación de la variable dependiente en los datos conduce a una distribución con normalidad . Tres funciones comunes que pueden transformar sus datos de una manera que deja los datos todavía son fáciles de interpretar la función de registro , la función de raíz cuadrada y la función inversa . Trate de aplicar estas funciones a su variable dependiente , uno a la vez , y la comprobación de la normalidad . Es muy posible que esta transformación le dejará con un conjunto de datos normal, que puede utilizar en su análisis de los datos directamente , el hecho de afirmar que ha realizado una transformación antes del análisis.
3

Aumentar el tamaño de la muestra. Se sabe que la suposición de normalidad es especialmente importante y fácilmente violado en conjuntos de datos que contienen pocos puntos de datos . Evite este problema mediante el muestreo de más puntos. Para los datos de series de tiempo , esto significa ajustar los espacios entre las mediciones. Si los datos llegaron de un registro de un fenómeno , es fácil volver a muestrear sus datos , produciendo un nuevo conjunto de datos que puede ser normal. Aunque los datos todavía se rompe el supuesto de normalidad , el hecho de que tiene una gran base de datos hace que esta suposición es menos importante , debido a las implicaciones del teorema del límite central.