Estadística II (Primavera 2010)

Tutorial: Prueba de Bondad de Ajuste

 

Una extensión de la prueba sobre la proporción binomial ocurre cuando una realización puede clasificarse en k posibles categorías en vez de dos (éxito y fracaso). Esto puede ocurrir en la elección de un individuo de un partido político (tricolor, amarillo, azul, otro), en el tipo de delito por el cual un individuo es recluido (un delito de violencia, un delito de cuello blanco, otro), por mencionar algunos ejemplos.

Supóngase que en una muestra en particular se observa que ocurre un conjunto de eventos posibles E1, E2, E3, …, Ek (véase la tabla), con frecuencias o1, o2, o3, …, ok, denominadas frecuencias observadas, y que de acuerdo con las reglas de probabilidad, se espera que ocurran con frecuencias e1, e2, e3, …, ek, llamdas frecuencias esperadas. En un escenario como el descrito arriba se desea saber si las frecuencias observadas difieren significativamente de las frecuencias esperadas.

Evento
E1
E2
E3
Ek
Frecuencia observada
o1
o2
o3
ok
Frecuencias esperadas
e1
e2
e3
ek

El estadístico   (léase chi cuadrada) proporciona una medida de la discrepancia existente entre la frecuencia observada y la frecuencia esperada, que está dada por

                          (1)

Donde, se la frecuencia total es n,

.                                                       (2)

La hipótesis nula que se desea probar es
H0: p1 = p10,…pk = pk0
contra
H1: al menos una pj ≠ pj0 para j = 1,…,k,
donde pj0 es la proporción correspondiente a la j-ésima categoría.

Nótese que bajo H0 ej = n pj0.

Bajo la hipótesis nula, el estadístico  (ji-cuadrado) se distribuye aproximadamente   (k-1) y entonces se rechaza H0 al nivel de significancia α si  excede el valor critico .

 
   
 

Un fabricante de refrigeradores ofrece tres líneas básicas de productos, que pueden describirse como baja, intermedia y alta en términos de precios comparativos. Antes de que se lanzara una promoción de ventas destinada a resaltar las virtudes de los refrigeradores de alto precio, el porcentaje de ventas de las tres categorías era de 45, 30 y 25, respectivamente. De una muestra aleatoria de 50 refrigeradores vendidos después de la promoción, el número vendido en las categorías de bajo precio, precio intermedio y alto precio es de 15, 15 y 20, respectivamente. Pruebe la hipótesis nula de que el patrón actual de ventas no difiere del patrón histórico, con un nivel de significancia de 5%.

Este ejemplo demuestra como usar la prueba ji-cuadrada para las proporciones de cada nivel de una variable categórica.

Los datos se escriben directamente como se muestra a continuación:

Categoría
Ventas
Bajo
15
Intermedio
15
Alto
20

Recuerda que la asignación de nombres de las columnas se puede hacer al oprimir el botón derecho del ratón y al escoger Variable Info y después Variable Name.

Aquí hemos usado dos variables: una que contiene los nombres de los niveles de la variable categórica en la que estamos interesados (Categoría), y una que contiene las frecuencias observadas (Ventas).

Para generar el reporte de la prueba, sigue los siguientes pasos:

  1. Escribe los datos en la hoja de cálculo de NCSS como en la tabla arriba.
  2. Abre la ventana de Frequency Tables.
    • En el menú, selecciona Analysis, luego Descriptive Statistics, luego Frequency Tables. El procedimiento de Frequency Table aparecerá.
    • En el menú, selecciona File, luego New Template. Este va a poner el formato de default.
  3. Especifica las variables.
    • En la ventana de Frequency Table, selecciona la ceja Variables.
    • Haz doble clic en la caja de texto de Discrete Variables. Esto va a lanzar la ventana de selección de variable.
    • Selecciona Categoría y haz clic en Ok.
    • Haz doble clic en la caja de texto de Frequency Variable. Esto va a lanzar la ventana de selección de variable.
    • Selecciona Ventas y haz clic en Ok.
  4. Especifica el formato del reporte.
    • Haz clic en la ceja Format.
    • En Variable Names, selecciona Labels.
    • En Value Labels, selecciona Value Names.
  5. Especifica la prueba Multinomial.
    • Haz clic en la ceja Multinomial.
    • Pon palomita en Multinomial Test.
    • En el espacio de Expected Values for Multinomial Test, escribe 25, 30, 45 (los porcentajes bajo la hipótesis nula).
  6. Corre el procedimiento.
    • En el menu de Run, selecciona Run Procedure. Aquí obtendrás el siguiente resultado:
    • Frequency Table Report
Como te puedes dar cuenta, Chi-Square es el estadístico de prueba que encontramos en clase, Degrees of Freedom son los grados de libertad, y Probability Level es el equvalente al valor p.

 
o baja Tutorial: Prueba de Bondad de Ajuste (76 KB)

atrás