La simetría y la forma de las distribuciones de datos que se ven a menudo en la bioestadística

  1. Educación
  2. Ciencia
  3. Biología
  4. La simetría y la forma de las distribuciones de datos que se ven a menudo en la bioestadística

Libro Relacionado

Bioestadística para tontos

Por John Pezzullo

La bioestadística puede ser sorprendente a veces: Los datos obtenidos en los estudios biológicos a menudo pueden ser distribuidos de forma extraña, como se puede ver en las siguientes distribuciones de frecuencia:

Dos medidas estadísticas de resumen, asimetría y kurtosis, se usan típicamente para describir ciertos aspectos de la simetría y forma de la distribución de los números en sus datos estadísticos.

Asimetría

La asimetría se refiere a si la distribución tiene simetría izquierda-derecha o si tiene una cola más larga en un lado u otro. A lo largo de los años se han propuesto muchos coeficientes de asimetría diferentes. La más común, representada a menudo por la letra griega gamma minúscula (γ), se calcula promediando los cubos (terceras potencias) de las desviaciones de cada punto de la media, y luego dividiendo por el cubo de la desviación estándar. Esto da un coeficiente sin dimensión (independiente de las unidades de los valores observados), que puede ser positivo, negativo o cero.

Un coeficiente de asimetría negativo (gamma en minúsculas) indica datos sesgados a la izquierda (larga cola izquierda); un gamma cero indica datos no sesgados; y un gamma positivo indica datos sesgados a la derecha (larga cola derecha).

Por supuesto, el coeficiente de asimetría para cualquier conjunto de datos reales casi nunca llega a cero exactamente debido a las fluctuaciones del muestreo aleatorio. Entonces, ¿cuán grande tiene que ser el tamaño de los rayos gamma antes de sospechar una asimetría real en sus datos? Una regla empírica muy aproximada para las muestras grandes es que si la gama es mayor que

tus datos probablemente estén sesgados.

Kurtosis

Las tres distribuciones que se muestran a continuación tienen la misma media y la misma desviación estándar, y las tres tienen una simetría perfecta de izquierda a derecha (es decir, no están torcidas). Pero sus formas siguen siendo muy diferentes. La curtosis es una forma de cuantificar estas diferencias de forma.

Si se piensa que una curva de función de distribución típica tiene una “cabeza” (cerca del centro), “hombros” (a cada lado de la cabeza) y “colas” (hacia afuera en los extremos), el término kurtosis se refiere a si la curva de distribución tiende a tener

  • Una cabeza puntiaguda, colas gordas y sin hombros (leptocúrtico)
  • Aspecto normal
  • Hombros anchos, colas pequeñas y poca cabeza (platykurtic)

El índice de kurtosis de Pearson, a menudo representado por la letra griega kappa, se calcula promediando las cuatro potencias de las desviaciones de cada punto de la media y dividiéndolas por la cuarta potencia de la desviación estándar. Es un coeficiente sin dimensión (es independiente de las unidades en las que se expresaron los datos originales). Su valor puede variar de 1 a infinito y es igual a 3.0 para una distribución normal.

El exceso de kurtosis es la cantidad en la que el kappa excede (o se queda corto) 3. Una regla general muy aproximada para muestras grandes es que si kappa difiere de 3 por más de

sus datos probablemente tienen kurtosis anormal.

  • Add Your Comment