Comprensión de las propiedades estadísticas de la distribución normal

  1. Educación
  2. Matemáticas
  3. Estadísticas
  4. Comprensión de las propiedades estadísticas de la distribución normal

Libro Relacionado

Por Deborah J. Rumsey

Cuando entienda las propiedades de la distribución normal, le resultará más fácil interpretar los datos estadísticos. Una variable aleatoria continua X tiene una distribución normal si sus valores caen en una curva suave (continua) con un patrón en forma de campana. Cada distribución normal tiene su propia media, denotada por la letra griega

(diga “mu”); y su propia desviación estándar, denotada por la letra griega

(diga “sigma”). Pero no importa cuáles sean sus medias y desviaciones estándar, todas las distribuciones normales tienen la misma forma básica de campana. La siguiente figura muestra algunos ejemplos de distribuciones normales.

Tres distribuciones normales, con medias y desviaciones estándar de a) 90 y 30; b) 120 y 30; y c) 90 y 10, respectivamente.

Cada distribución normal tiene ciertas propiedades. Estas propiedades se utilizan para determinar la posición relativa de cualquier resultado particular en la distribución y para encontrar probabilidades. Las propiedades de cualquier distribución normal son las siguientes:

  • Su forma es simétrica (es decir, cuando se corta por la mitad, las dos piezas son imágenes de espejo entre sí).
  • Su distribución tiene un bulto en el centro, con colas que bajan y salen a la izquierda y a la derecha.
  • La media y la mediana son las mismas y se encuentran directamente en el centro de la distribución (debido a la simetría).
  • Su desviación estándar mide la distancia en la distribución desde la media hasta el punto de inflexión (el lugar donde la curva cambia de una forma de “cubeta invertida” a otra de “cubeta invertida”).
  • Debido a su forma de campana única, las probabilidades para la distribución normal siguen la Regla Empírica, que dice lo siguiente: Cerca del 68 por ciento de sus valores se encuentran dentro de una desviación estándar de la media. Para encontrar este rango, tome el valor de la desviación estándar, luego encuentre la media más esta cantidad, y la media menos esta cantidad.Alrededor del 95 por ciento de sus valores se encuentran dentro de dos desviaciones estándar de la media. (Aquí se toma 2 veces la desviación estándar, luego se suma y se resta de la media.) Casi todos sus valores (alrededor del 99.7 por ciento de ellos) se encuentran dentro de tres desviaciones estándar de la media. (Tome 3 veces la desviación estándar y sume y reste de la media.)

Eche un vistazo de nuevo a la figura de arriba. Para comparar y contrastar las distribuciones mostradas en la figura, primero verá que todas son simétricas con la forma de la campana de la firma. Los ejemplos (a) y (b) tienen la misma desviación estándar, pero sus medias son diferentes; la media en el Ejemplo (b) se encuentra a 30 unidades a la derecha de la media en el Ejemplo (a) porque su media es de 120 comparado con 90. Los ejemplos (a) y (c) tienen la misma media (90), pero el Ejemplo (a) tiene más variabilidad que el Ejemplo (c) debido a su mayor desviación estándar (30 comparado con 10). Debido a la mayor variabilidad, la mayoría de los valores del Ejemplo (a) se encuentran entre 0 y 180 (aproximadamente), mientras que la mayoría de los valores del Ejemplo (c) se encuentran sólo entre 60 y 120.

Por último, los ejemplos b) y c) tienen medias diferentes y desviaciones estándar totalmente diferentes; el ejemplo b) tiene una media más alta que desplaza el gráfico hacia la derecha, y el ejemplo c) tiene una desviación estándar más pequeña; sus valores de datos son los más concentrados en torno a la media.

Nótese que la media y la desviación estándar son importantes para interpretar correctamente los números situados en una distribución normal particular. Por ejemplo, se puede comparar dónde cae el valor 120 en cada una de las distribuciones normales de la figura anterior. En el ejemplo (a), el valor 120 es una desviación estándar por encima de la media (debido a que la desviación estándar es 30, se obtiene 90 + 1[30] = 120). Así que en esta primera distribución, el valor 120 es el valor superior para el rango donde se encuentra el 68% medio de los datos, de acuerdo con la Regla Empírica.

En el ejemplo (b), el valor 120 se encuentra directamente en la media, donde los valores están más concentrados. En el Ejemplo (c), el valor 120 está muy por encima de la franja derecha, 3 desviaciones estándar por encima de la media (debido a que la desviación estándar esta vez es 10, se obtiene 90 + 3[10] = 120). En el Ejemplo (c), es muy improbable que ocurran valores superiores a 120 porque están fuera del rango en el que debería estar el 99,7% medio de los valores, de acuerdo con la Regla Empírica.