¿Qué es una Línea de Regresión

? Regresión lineal se conoce como una línea de mejor ajuste . Tratando de encontrar una línea recta que mejor representa los puntos trazados de datos observables en un gráfico ayuda a entender la correlación entre los datos , si hay alguna . Una vez que se deriva una ecuación para una línea de regresión , que se puede utilizar para predecir valores futuros posibles que aún no se han observado . Regresión lineal

Hay varios aspectos a los modelos de regresión lineal , o encontrar un mejor línea de ajuste . El primer paso es recopilar los datos relativos a dos rasgos presumiblemente relacionados , tales como la altura y el peso de varias personas al azar . En los problemas más avanzados de regresión , una correlación entre dos variables no es tan obvio, pero en aras de la comprensión vamos a seguir este sencillo . Altura y peso se recogen y se colocan en una tabla - estos números son los datos, y son las variables en la ecuación de regresión , los cuales representarán a la línea de mejor ajuste . Se trazan los datos en un gráfico , con una variable para cada eje . Usted en cuenta que los puntos de la gráfica parecen estar correlacionados , ya que se están moviendo en la misma dirección . El más alto es una persona, cuanto más pesa . Usted puede ver la correlación .
Mínimos cuadrados de regresión

Mientras que un ejemplo sencillo se puede resolver de forma manual, y debe ser para principiantes , el proceso de regresión lineal es hecho automáticamente por las calculadoras gráficas . Mínimos cuadrados de regresión es el proceso por el cual una línea de mejor ajuste se deriva y su ecuación, en la forma y = mx + b , se descubre . Se utiliza un proceso de cálculo de los datos; estos cálculos son una combinación de la suma de x observables y los valores de y , cuadratura ellos, restando ellos y dividiéndolas . Una vez que sepas lo que cada valor en la fórmula representa , es una simple cuestión de leer los números en una calculadora y registrar el valor de sus operaciones. El resultado es una ecuación para la línea de mejor ajuste o regresión; es una línea recta que se puede extraer a través de sus puntos de datos que mejor representa su correlación matemáticamente.
Residuales

Residuales son la distancia entre los puntos de datos y la línea de mejor ajuste . Teniendo en cuenta los residuos permite que el observador para conocer la validez de su suposición de que existe una correlación entre estos datos . En la mayoría de los problemas de regresión , parte de la solución es descubrir si existe una correlación en absoluto , al contrario que con la altura y el peso . En una calculadora gráfica , un nuevo gráfico puede hacerse únicamente de los residuos , y la variable independiente, que puede regalar la presencia de variables que están al acecho .
Variables acecho

una variable que está al acecho puede existir cuando los puntos de datos presentan una pobre línea de regresión , o valores atípicos. Una variable que está al acecho es simplemente un factor en el problema que afecta a los datos, pero no puede haber sido tenido en cuenta inicialmente . Altura y peso están correlacionados, pero para explicar un gráfico en el que no existe una correlación entre ellos , podríamos imaginar que la ingesta de alimentos y /o el ejercicio es una variable que está al acecho que hace una persona de baja estatura pesado, o una persona alta delgada. Un punto que representa cualquiera de esos escenarios mentiría lejos de la línea de regresión y tienen un alto residual.
Outliers

El punto de datos que es el más alejado de la línea de regresión en el gráfico tiene el valor residual más grande . Un término para los puntos que están muy lejos de la línea de regresión es atípicos . Los valores atípicos son importantes , ya que pueden representar los datos erróneos o una línea de mala forma, y ​​que pueden cambiar la pendiente de la línea de manera significativa.