Cuándo utilizar la distribución F

La distribución F es una distribución de probabilidad continua, lo que significa que está definida para un número infinito de valores diferentes. La distribución F se puede utilizar para varios tipos de aplicaciones, incluyendo la comprobación de hipótesis sobre la igualdad de dos varianzas de población y la comprobación de la validez de una ecuación de regresión múltiple.

La distribución F comparte una propiedad importante con la distribución t del Estudiante: Las probabilidades están determinadas por un concepto conocido como grados de libertad. A diferencia de la distribución t del Estudiante, la distribución F se caracteriza por dos tipos diferentes de grados de libertad – grados de libertad numerador y denominador.

La distribución F tiene dos propiedades importantes

  • Se define sólo para valores positivos.
  • No es simétrica en cuanto a su media; en cambio, está positivamente sesgada.

Una distribución está sesgada positivamente si la media es mayor que la mediana. (La media es el valor promedio de una distribución y la mediana es el punto medio; la mitad de los valores de la distribución están por debajo de la mediana y la otra mitad por encima.)

Un buen ejemplo de una distribución sesgada es el de los ingresos de los hogares. Supongamos que la mitad de los hogares de un país tienen ingresos inferiores a 50.000 dólares y que la otra mitad tiene ingresos superiores a 50.000 dólares; esto indica que el ingreso medio del hogar es de 50.000 dólares. Entre los hogares con ingresos inferiores a $50,000, el valor más bajo posible es $0. Entre los hogares con ingresos superiores a $50,000, puede haber ingresos de varios millones de dólares al año. Este desequilibrio entre los ingresos por debajo de la mediana y por encima de la mediana hace que la media sea sustancialmente superior a la mediana. Supongamos, por ejemplo, que el ingreso medio en este caso es de 120.000 dólares. Esto demuestra que la distribución de los ingresos de los hogares está sesgada de manera positiva.

La forma de la distribución F varía según su grado de libertad (df)

Esta figura muestra un gráfico de la distribución F para diferentes combinaciones de grados de libertad de numerador y denominador. En cada caso, los grados de libertad del numerador se enumeran en primer lugar, y los grados de libertad del denominador se enumeran en segundo lugar. El nivel de significación en cada caso es de 0,05.

Un nivel de significación se utiliza para probar una hipótesis. Una prueba de hipótesis comienza con una hipótesis nula; esta es una afirmación que se asume que es verdadera a menos que haya evidencia fuerte en contrario. También hay una hipótesis alternativa; esta es una afirmación que se acepta en lugar de la hipótesis nula si hay suficiente evidencia para rechazar la hipótesis nula.

El nivel de significación, designado

se refiere a la probabilidad de rechazar incorrectamente la hipótesis nula cuando en realidad es cierta. Esto se conoce como un error de tipo I. Por el contrario, un error de tipo II ocurre cuando no se rechaza la hipótesis nula cuando en realidad es falsa. Por lo tanto, con un nivel de significación de 0,05, hay un 5 por ciento de posibilidades de cometer un error de tipo I.

La figura muestra que la distribución no está definida para valores negativos (como puede ver, no aparecen valores negativos a lo largo del eje horizontal). Además, a medida que aumenta el número de grados de libertad, la forma de la distribución se desplaza hacia la derecha. La distribución tiene una larga cola derecha (más formalmente, está sesgada a la derecha, o positivamente sesgada).

  • Add Your Comment