prueba: Clase 7.Estadistica :Prueba de hipotesis

Introducción: ¿qué es una prueba de hipótesis estadística?

Supongamos que un amigo nuestro afirma que en cada partido de fútbol que juega, mete tres o cuatro goles. Impresionados con su excelente performance, vamos a verlo jugar cinco partidos seguidos. Pero ocurre que en esos cinco partidos no mete ningún gol. ¿No sospecharíamos que tal vez nos mintió? ¿No es muy incompatible «lo observado» con su afirmación inicial de que mete tres o cuatro goles por partido? Este mini-ejemplo muestra la lógica que hay detrás de una prueba de hipótesis estadística.

Una prueba de hipótesis es un procedimiento, con el que se busca tomar una decisión sobre el valor de verdad de una hipótesis estadística. Al realizar una prueba de hipótesis decidimos si rechazar o no rechazar esa hipótesis estadística. Basamos la decisión en la evidencia muestral.

Un esquema muy simplificado que resume el proceso sería el siguiente:

Por eso muchas veces se compara un proceso de prueba de hipótesis con un juicio: hay que recoger evidencias para analizar si la hipótesis de base (la inocencia del acusado en el caso del juicio) se sostiene o se rechaza.

Ejemplo intuitivo (sin detalles «técnicos»)

Entender muy bien que es una prueba de hipótesis implica comprender muchos conceptos (variable, parámetro, hipótesis estadística, estadístico de prueba, etc). Y también las relaciones entre ellos. Pero la idea general de que es una prueba de hipótesis no es difícil de entender. De hecho, es muy intuitiva. Vamos a ver un ejemplo que en forma natural expresa el razonamiento y procedimiento detrás de una prueba de hipótesis.

Situación

Un fabricante de galletitas produce paquetes en los cuales el peso nominal impreso es de

500

gramos. Pero el contenido real en gramos es una variable aleatoria. No tienen exactamente

500

gramos todos los paquetes. El fabricante, basándose en información histórica, afirma que la media de esa variable

X

μ = 500

gramos con un desvío estándar de

5

gramos. Se desconfía de la afirmación del fabricante acerca de que

μ = 500

gramos. Se quiere analizar si en realidad el peso promedio de los paquetes es inferior a

500

gramos.

La variable

La variable que nos interesa observar es

X

: peso en gramos de un paquete de galletitas de la fábrica.

Las hipótesis en juego

Las dos afirmaciones que se contraponen en esta situación son:

Afirmación del fabricante, que llamaremos hipótesis nula: la media de $X$ es 500: $μ = 500$
Afirmación alternativa: Hipótesis alternativa: la media de $X$ es menor que 500: $μ < 500$

No podemos conocer el verdadero valor del parámetro, pero podemos estimarlo

Cómo se trata de una discusión acerca del valor de un parámetro, no es fácil decidir cuál afirmación es correcta. Habría que medir todos los paquetes de la producción para conocer la verdadera esperanza de

X

. En general esto es inviable. Para no tener que medir el peso en todos los paquetes de la producción se puede tomar una muestra aleatoria de

n

paquetes, y analizar si los valores observados de

X

son o no coherentes con la afirmación del fabricante.

Para lo que sigue a continuación es requisito saber sobre la distribución de la variable media muestral.

Supongamos que se toma una muestra aleatoria de 100 paquetes, y se mide el peso (utilizando una balanza muy precisa) en cada uno de los

100

paquetes. Obtenemos entonces una muestra aleatoria de la variable

X

X_{1}, X_{2}, X_{3} \dots, X_{100}

Sabemos que la medía muestral

\bar{X}

es un buen estimador de la media poblacional

μ

. Entonces vamos a calcular la media muestral del peso de los 100 paquetes, para contrastarla con la hipótesis nula.

Si obtenemos un valor de $\bar{X}$ «muy inferior a 500», es decir una diferencia $\bar{x} - μ$ «muy grande», rechazaremos la hipótesis nula.
Si obtenemos un valor de $\bar{X}$ «muy cercano a 500», es decir una diferencia $\bar{x} - μ$ «pequeña», diremos que no existe evidencia suficiente para rechazar la hipótesis nula.

Veamos que conclusión sacaríamos en los siguientes casos.

Caso A de evidencia muestral: se obtiene una media muestral muy contraría a la afirmación inicial

Si se obtiene que el promedio de los pesos es de

\bar{x} = 421, 3

gramos, podríamos concluir que la evidencia muestral no es compatible con la afirmación del fabricante. Se obtuvo un valor muy por debajo de 500 gramos. Podríamos rechazar la afirmación del fabricante. No puede ser cierto que

E (X) = 500

, pero que se observe

\bar{x} = 421, 3

. Cómo

\bar{x} = 421, 3

de hecho se observó, entonces rechazamos la hipótesis nula.

Caso B de evidencia muestral: se obtiene una media muestral «cercana» a la afirmación inicial

Si se obtiene que el promedio de los pesos es de

\bar{x} = 499, 8

gramos, podríamos pensar que el valor de

\bar{X}

obtenido es muy cercano al valor de

μ

propuesto por la hipótesis inicial… y entonces concluir que no hay evidencia contraria a esa hipótesis.

Caso C de evidencia muestral: se obtiene una media muestral que no es concluyente «a simple vista» respecto de la afirmación inicial

Si se obtiene que el promedio de los pesos de 100 paquetes es de

\bar{x} = 497, 3

gramos… ¿Qué concluimos? ¿Es coherente con una media poblacional de 500 o no? Este caso resulta más dilemático y no permite decidir tan fácilmente. Se presenta el problema de decidir que es «cerca» y que es «lejos» de 500. Más adelante vamos a ver cómo se decide un punto de corte o punto crítico que permite definir una zona «cercana» (zona de no rechazo) y una zona «lejana» (zona de rechazo).

¿Qué es una variable?

Una variable es una característica de interés, que tienen los individuos de una población.

Ejemplo 1: el peso de un paquete de galletitas
Ejemplo 2: la cantidad de alumnos de una escuela de CABA
Ejemplo 3: la localidad en la que está ubicada un comercio de una cierta cadena

¿Qué es un parámetro?

En estadística, un parámetro es una constante asociada a la distribución de probabilidades de una variable aleatoria.

Ejemplo 1: Si una variable tiene distribución binomial, sus parámetros son $n$ y $p$ .
Ejemplo 2: Si una variable tiene distribución normal, sus parámetros son $μ$ y $σ$ .
Ejemplo 3: Si una variable tiene distribución Bernoulli, su único parámetro es la probabilidad de éxito $p$ .

¿Qué es un estimador de un parámetro?

El estimador de un parámetro es un estadístico (estadístico: variable aleatoria función de las observaciones muestrales) que toma «valores cercanos» al verdadero valore del parámetro.

Fundamentalmente nos interesan los siguientes estimadores:

La media muestral $\bar{x}$ es un estimador de la media poblacional $μ$ .
El desvío estándar muestral $s$ es un estimador del desvío estándar poblacional $σ$
La proporción muestral $\hat{p}$ , es un estimador de la proporción poblacional $p$ .

parametros-y-estimadores-de-parametros-prueba-de-hipotesis — Parámetros poblacionales y estimadores de esos parámetros

¿Qué es un estadístico de prueba?

Esta es la definición más difícil de esta serie. Por eso vamos a dar muchos ejemplos.

Un estadístico de prueba es:

Una variable aleatoria
De distribución conocida
Que vincula a un parámetro de interés, con un estimador de ese parámetro.

Vamos a ver algunos ejemplos de estadísticos de prueba que nos van a interesar más adelante.

EJEMPLO 1

X \sim N (μ, σ)

, y

X_{1}, X_{2}, \dots, X_{n}

, es una muestra aleatoria de

X

, y conocemos

σ

entonces:

\frac{\bar{X} - μ}{\frac{σ}{\sqrt{n}}} \sim N (0, 1)

Es un estadístico de prueba. Porque es una variable aleatoria, con distribución conocida (normal estándar), y que relaciona al parámetro

μ

con su estimador

\bar{x}

Observación: no demostramos recién por qué es esa la distribución de

\frac{\bar{X} - μ}{\frac{σ}{\sqrt{n}}}

. No nos interesa hacerlo acá para no distraer la atención. Pero la fundamentación tiene que ver con:

Si $X$ es normal, una combinaicón lineal de $X_{i}$ va a ser normal también.
La esperanza de $\bar{X}$ es $μ$ .
La varianza de $\bar{X}$ es $σ^{2} / n$
La estandarización de variables aleatorias normales.

EJEMPLO 2

X \sim N (μ, σ)

, y

X_{1}, X_{2}, \dots, X_{n}

, es una muestra aleatoria de

X

, y no conocemos

σ

pero lo estimamos con

S

entonces:

\frac{\bar{X} - μ}{\frac{S}{\sqrt{n}}} \sim t_{n - 1}

Es un estadístico de prueba. Porque es una variable aleatoria, con distribución conocida (

t

de student

n - 1

grados de libertad), y que relaciona al parámetro

μ

con su estimador

\bar{X}

Observación: no demostramos por qué es esa la distribución. Hay que aceptarlo así :).

EJEMPLO 3

X

tiene una distribución desconocida, y

X_{1}, X_{2}, \dots, X_{n}

, es una muestra aleatoria de

X

(con

n > 30

), y no conocemos

σ

pero lo estimamos con

S

entonces:

\frac{\bar{X} - μ}{\frac{S}{\sqrt{n}}} \approx N (0, 1)

Es un estadístico de prueba. Porque es una variable aleatoria, con distribución conocida (en realidad aproximadamente conocida, porque se aproxima a la distribución normal estándar), y que relaciona al parámetro