Cómo obtener una estimación de densidades multivariante

Imagine la situación en la que usted tiene un conjunto de datos que es multivariado todavía parcelas como una distribución rígida grueso . Este resultado no es ideal, ya que es difícil de describir una distribución tan matemáticamente. La solución a este problema es la estimación de la densidad multivariante . Este método permite que usted utilice su distribución multivariante bloques para estimar una versión suave que probablemente corresponde a la verdadera distribución detrás de los datos incluidos en la muestra . En este método, se aplica un tipo específico de la función , llamada núcleo, a sus datos originales , produciendo de este modo una nueva distribución, más suave que puede describir sus data.Things que necesitará de software Usted Estadística
Mostrar Más instrucciones Matemáticas 1

Ponga sus datos en el software estadístico de elección. Al hacer esto , se debe etiquetar claramente cada variable aleatoria en los datos, como la estimación de datos multivariable requiere marginar a los datos (es decir , que tendrá que romper sus datos en múltiples conjuntos de datos univariantes ) . Siempre y cuando usted introduce sus datos en la forma de una matriz , no habrá problemas. Por ejemplo , en el software estadístico R, es posible que primero poner los datos en un archivo csv de Excel y, a continuación, leer en los datos con los "datos <- read.csv comando . . ( " Data.csv ")
Página 2

Decida qué kernel que se aplicará a los datos. El kernel de Gauss sirve la mayoría de los propósitos prácticos. Sin embargo , la mayoría de los paquetes de software estadísticos ofrecen una variedad de granos para los usuarios con fines particulares . Por ejemplo , R ofrece casi una docena de granos , incluyendo triangular, rectangular y coseno. También es posible programar su propio núcleo , siempre y cuando esté familiarizado con la forma de programar en su paquete de software de su elección . En caso de duda en cuanto a que el kernel de usar , elija el kernel de Gauss.
3

Decidir sobre el ancho de banda para la estimación de la densidad . El ancho de banda , en definitiva, es el equivalente a la desviación estándar para el proceso de suavizado . No existe un método estándar de la elección de un ancho de banda para la estimación de la densidad multivariante . Tenga en cuenta que los anchos de banda más pequeños son menos sesgada , pero llevar a mayores niveles de variación , mientras que los anchos de banda más grandes tienen menos variaciones , pero son más sesgada. Es posible que desee volver a este paso varias veces , experimentando con diferentes anchos de banda para su estimación de la densidad .
4

Realizar la estimación de la densidad multivariante. Utilice los datos , ancho de banda y el kernel que seleccionó anteriormente . La mayoría de los paquetes de software estadísticos utilizan una llamada de una línea para esta tarea, pidiendo sólo los parámetros necesarios (datos, ancho de banda y kernel). En R , se llama a esta función con "densidad (datos, ancho de banda, kernel). " El resultado (output) será la estimación de la densidad multivariante.