13.1 INTRODUCCION AL DISEÑO DE EXPERIMENTOS Y AL ANÁLISIS DE VARIANZA
- Recolección de datos
- Supuestos para el análisis de varianza
- Análisis de varianza: una perspectiva conceptual
13.2 ANÁLISIS DE VARIANZA Y EL DISEÑO COMPLETAMENTE ALEATORIZADO
- Estimación de la varianza poblacional entre tratamientos
- Estimación de la varianza poblacional dentro de los tratamientos
- Comparación de las estimaciones de las varianzas: la prueba F
- Tabla de ANOVA
- Resultados de computadora para el análisis de varianza
- Prueba para la igualdad de k medias poblacionales: un estudio observacional
13.3 PROCEDIMIENTOS DE COMPARACIÓN MÚLTIPLE
- Margen de error y estimación por intervalo
- Consejo práctico
13.4 DISEÑO DE BLOQUES ALEATORIZADO
- Prueba de estrés para controladores de tráfico aéreo
- Procedimiento ANOVA
- Cálculos y conclusiones
13.5 EXPERIMENTO FACTORIAL
- Procedimiento ANOVA
- Cálculos y conclusiones
13.1 INTRODUCCION AL DISEÑO DE EXPERIMENTOS Y AL ANÁLISIS DE VARIANZA¶
Recolección de datos¶
Una vez realizado el diseño del experimento, se procede a recolectar y analizar los datos. En el caso de Chemitech, se le explica a los trabajadores cómo emplear el método de ensamble que les ha sido asignado y empezarán a armar los sistemas de fi ltración con ese método. En la tabla 13.1 se presenta el número de unidades ensambladas por cada empleado en una semana. También se proporciona la media muestral, la varianza muestral y la desviación estándar muestral obtenidas con cada proceso de ensamble. Así, la media muestral del número de unidades producidas con el método A es 62; con el método B es 66, y usando el método C es 52. Con base en estos datos, parece que B proporciona las tasas más altas de producción que cualquiera de los otros métodos.
El punto a considerar es si cualquiera de las tres medias muestrales observadas difiere lo suficiente como para concluir que las medias poblacionales correspondientes a estos tres métodos de ensamble son diferentes. Para escribir esto en términos estadísticos, se introduce la notación siguiente.
$\mu_1$: Número medio de unidades producidas por semana con el método A.
$\mu_2$: Número medio de unidades producidas por semana con el método B.
$\mu_3$: Número medio de unidades producidas por semana con el método C.
Tabla 13.1 Número de unidades producidas por 15 trabajadores
Aunque nunca se podrá saber cuáles son los verdaderos valores de $μ1, μ2$ y $μ3$, se utilizan las medias muestrales para probar las hipótesis siguientes.
H₀: $\mu_1 = \mu_2 = \mu_3$
Hₐ: No todas las medias poblacionales son iguales.
Como se demostrará más adelante, el análisis de varianza (ANOVA) es el procedimiento estadístico que se emplea para determinar si las diferencias observadas entre las tres medias muestrales son lo sufi cientemente grandes para rechazar $H_0$.
Supuestos para el análisis de varianza¶
Los supuestos requeridos para usar el análisis de varianza son tres.
- En cada población, la variable de respuesta está normalmente distribuida. Implicación. En el experimento de Chemitech, el número de unidades producidas por semana (variable de respuesta) debe estar normalmente distribuido para cada método de ensamble.
- La varianza de la variable de respuesta, denotada como $\sigma^2$ , es la misma en todas las poblaciones. Implicación. En el experimento de Chemitech, la varianza en el número de unidades producido por semana debe ser el mismo para cada método de ensamble.
- Las observaciones deben ser independientes. Implicación. En el experimento de Chemitech la cantidad de unidades producida por semana por un empleado debe ser independiente del número de unidades producidas por semana por cualquier otro empleado.
Análisis de varianza: una perspectiva conceptual¶
Si las medias de las tres poblaciones son iguales, se esperaría que las tres medias muestrales fueran muy parecidas. De hecho, entre más parecidas sean éstas, mayor será la evidencia para concluir que las medias poblacionales son iguales. De otra forma, entre mayor sea la diferencia entre las medias muestrales, mayor será la evidencia para concluir que las medias poblacionales no son iguales. Esto es, si la variabilidad entre las medias muestrales es “pequeña”, esto favorece $H_0$; si la variabilidad entre las medias muestrales es “grande”, esto favorece $H_a$.
Si la hipótesis nula, $H_0$: $μ1 = μ2 = μ3$, es verdadera, se usa la variabilidad entre las medias muestrales para estimar $\sigma^2$. Primero, observe que si se satisfacen los supuestos para el
Figura 13.2 Distribución muestral de $x$ si $H_0$ es verdadera
import numpy as np
import matplotlib.pyplot as plt
# Definimos los parámetros de la distribución normal
media = 0
desviacion_estandar = 1
# Generamos una muestra de datos de la distribución normal
datos = np.random.normal(media, desviacion_estandar, 1000)
# Creamos la figura de matplotlib
plt.figure()
# Graficamos los datos
plt.hist(datos, bins=100)
# Establecemos los límites del eje x
plt.xlim([-5, 5])
# Establecemos el título de la figura
plt.title("Distribución normal")
# Mostramos la figura
plt.show()
En el análisis de varianza, cada muestra provendrá de la misma distribución normal con media μ y varianza σ². Recuerde que en el capítulo 7 se vio que la distribución muestral de la media muestral $\bar{x}$ de una muestra aleatoria simple de tamaño n tomada de una población normal tendrá una distribución normal con media μ y varianza $\frac{\sigma^2}{n}$. En la figura 13.2 se ilustra una distribución muestral de este tipo.
Por consiguiente, si la hipótesis nula es verdadera, se considera cada una de las tres medias muestrales, $\bar{x}_1$, $\bar{x}_2$ y $\bar{x}_3 $ de la tabla 13.1, como valores obtenidos aleatoriamente de la distribución muestral que aparece en la figura 13.2. En este caso, la media y la varianza de los tres valores $\bar{x}$ se pueden usar para estimar la media y la varianza de la distribución muestral.Cuando los tamaños de las muestras son iguales, como en el caso de Chemitech, la mejor estimación de la media de la distribución muestral de $\bar{x}$ es la media o el promedio de las medias muestrales. Por tanto, en el experimento de Chemitech, una estimación de la media de la distribución muestral de $\bar{x}$ es $ \frac{62 + 66 + 52}{3} = 60 $, a la cual se le conoce como media muestral general. A su vez, una estimación de la varianza de la distribución muestral de $\bar{x}$, $\sigma_{\bar{x}}^2$ se obtiene de la varianza de las tres medias muestrales.
$s_{\bar{x}}^2= \frac {(62 - 60)^2 + (66 - 60)^2 + (52 - 60)^2}{3 - 1}=\frac{104}{2}=52$
Como $\sigma_{\bar{x}}^2=\frac{σ^2}{n}$, al resolver para $σ^2$ obtenemos
$\sigma^2= n\sigma_{\bar{x}}^2$
Estimación de $\sigma_{\bar{x}}^2=n$ (estimación de $\sigma_{\bar{x}}^2$) $=ns_{\bar{x}}^2=$ 5(52)=260
Al resultado, $ns_{\bar{x}}^2 = 260$, se le conoce como estimación de $\sigma^2$ entre tratamientos. La estimación $\sigma^2$ entre tratamientos se basa en el supuesto de que la hipótesis nula es verdadera. En este caso cada una de las muestras proviene de la misma población y sólo hay una
import numpy as np
import matplotlib.pyplot as plt
# Definimos los parámetros de la distribución normal
media = 0
desviacion_estandar = 1
# Generamos una muestra de datos de la distribución normal
datos = np.random.normal(media, desviacion_estandar, 1000)
# Creamos la figura de matplotlib
plt.figure()
# Graficamos los datos
plt.hist(datos, bins=100)
# Establecemos los límites del eje x
plt.xlim([-5, 5])
# Establecemos el título de la figura
plt.title("Distribución normal")
# Añadimos una línea de media
plt.axvline(media, color="red")
# Añadimos una línea de desviación estándar
plt.axvline(media + desviacion_estandar, color="blue")
plt.axvline(media - desviacion_estandar, color="blue")
# Añadimos una línea de dos desviaciones estándar
plt.axvline(media + 2 * desviacion_estandar, color="green")
plt.axvline(media - 2 * desviacion_estandar, color="green")
# Añadimos una línea de tres desviaciones estándar
plt.axvline(media + 3 * desviacion_estandar, color="black")
plt.axvline(media - 3 * desviacion_estandar, color="black")
# Mostramos la figura
plt.show()
distribución muestral de $\bar{x}$. Para ilustrar qué ocurre cuando $H_0$ es falsa, suponga que las medias poblacionales son todas diferentes. Observe que como las tres muestras provienen de poblaciones normales con medias diferentes, darán tres distribuciones muestrales distintas. En la figura 13.3 se advierte que en este caso las medias muestrales no están tan cerca unas de otras como cuando $H_0$ es verdadera. Entonces $s \frac{2}{x}$ será mayor, haciendo que la estimación entre tratamientos de $\sigma^2$ también lo sea. En general, cuando las medias poblacionales no son iguales, la estimación entre tratamientos sobreestimará la varianza poblacional $\sigma^2$. La variación dentro de cada una de las muestras también tiene efecto sobre la conclusión a la que se arriba con el análisis de varianza. Cuando se selecciona una muestra aleatoria simple de cada población, cada una de las varianzas muestrales proporciona una estimación insesgada de $\sigma^2$. Por tanto, se combinan o juntan las estimaciones individuales de $\sigma^2$ en una general. A la estimación de $\sigma^2$ obtenida de esta manera se le conoce como estimación conjunta o dentro de los tratamientos de $\sigma^2$. Debido a que cada varianza muestral proporciona una estimación de $\sigma^2$ que se basa sólo en la variación dentro de cada muestra, a la estimación de σ2 dentro de los tratamientos no le afecta que las medias poblacionales sean iguales. Cuando los tamaños de las muestras son iguales, la estimación dentro de los tratamientos de $\sigma^2$ se obtiene al calcular el promedio de las varianzas muestrales. En el experimento de Chemitech obtenemos
En el experimento de Chemitech, la estimación de $\sigma^2$ entre los tratamientos (260) es mucho mayor que dentro de los tratamientos (28.33). De hecho, el cociente entre estas dos estimaciones es $\frac{260}{28.33}=9.18$. Pero debe recordarse que el método entre tratamientos sólo proporciona una buena estimación de $\sigma^2$ si la hipótesis nula es verdadera; si es falsa, este método sobreestima $\sigma^2$. El método dentro de los tratamientos proporciona una buena estimación de $\sigma^2$ en cualquiera de los casos. Por tanto, si la hipótesis nula es verdadera, las dos estimaciones serán semejantes y su cociente será cercano a 1. Si la hipótesis es falsa, la estimación entre tratamientos será mayor que la estimación dentro de los tratamientos y su cociente será grande. En la sección siguiente se muestra qué tan grande debe ser este cociente para que $H_0$ sea rechazada.
En resumen, la lógica detrás del ANOVA se basa en obtener dos estimaciones independientes de la varianza poblacional común de $\sigma^2$. Una estimación de $\sigma^2$ se funda en la variabilidad entre las medias muestrales mismas y la otra en la variabilidad entre los datos dentro de cada muestra. Al comparar estas dos estimaciones de $\sigma^2$, podrá determinarse si las medias poblacionales son iguales.
NOTAS Y COMENTARIOS¶
- En el diseño de experimentos, la aleatorización es análoga al muestreo probabilístico en un estudio observacional.
- En muchos estudios médicos los sesgos potenciales se eliminan con el uso de un diseño de experimento doble ciego en el cual ni el médico que aplica el tratamiento ni el paciente saben qué tratamiento se está administrando. Este tipo de diseño también es útil en muchos otros tipos de experimentos.
- En esta sección se presentó una perspectiva conceptual de cómo puede utilizarse el análisis de varianza para probar la igualdad de k medias poblacionales en un diseño experimental completamente aleatorizado. Veremos que este mismo procedimiento también se usa para probar la igualdad de k medias poblacionales en un estudio observacional o no experimental.
- En las secciones 10.1 y 10.2 se presentaron métodos estadísticos para probar las hipótesis de que las medias de dos poblaciones son iguales. El ANOVA también puede utilizarse para probar estas mismas hipótesis. Sin embargo, en la práctica el análisis de varianza no es usualmente utilizado, excepto cuando se tienen tres o más medias poblacionales.
13.2 Analisis de varianza y el diseño completamente aleaterizado
En esta sección se muestra el uso del análisis de varianza para probar la igualdad de k medias poblacionales en un diseño completamente aleatorizado. La forma general de esta prueba de11 hipótesis es $$ H_0: \mu_1 = \mu_2 = \ldots = \mu_k $$ $$ H_a: \text{no todas las medias poblacionales son iguales} $$ Se asume que de cada una de las k poblaciones o tratamientos se toma una muestra aleatoria simple de tamaño nj . Para los datos muestrales resultantes, sean
- $ x_{ij} $: valor de la observación i de tratamiento j
- $ \bar{x}_j $: media del tratamiento j
- $ n_j $: número de observaciones en el tratamiento j
- $ s_{j}^2 $: varianza muestral del tratamiento j
- $ s_{j} $: desviación estándar muestral del tratamiento j
Las fórmulas para la media muestral y la varianza muestral del tratamiento j son las siguientes: $$ \bar{x_j} = \frac{\sum_{i=1}^{n_j} x_{ij}}{n_j}\tag{13.1} $$
$$ s^2_j = \frac{\sum_{i=1}^{n_j} (x_{ij} - \bar{x_j})^2}{n_j-1} \tag{13.2} $$
La media muestral general, que se denota $$\bar{\bar{X}}$$, es la suma de todas las observaciones divididas entre la cantidad total de las observaciones. Es decir $$ \bar{\bar{X}} = \frac{\sum_{i=1}^{k} \sum_{j=1}^{n_i} X_{ij}}{n_T}\tag{13.3} $$
donde $$ n_T = n_1 + n_2 + \ldots + n_k\tag{13.4} $$ Si el tamaño de cada muestra es de n, nT kn, en este caso la ecuación (13.3) se reduce a
$$ \bar{\bar{X}} = \frac{\sum_{i=1}^{k} \sum_{j=1}^{n_i} X_{ij}}{kn}= \frac{\sum_{i=1}^{k} \sum_{j=1}^{n_i} {X_{ij}/n}}{k}=\frac{\sum_{j=1}^{k} \bar{X_j}}{k}\tag{13.5} $$
En otras palabras, si todas las muestras son del mismo tamaño, la media muestral general es el promedio de las k medias muestrales.
En el experimento de Chemitech, como todas las muestras constaban de n = 5 observaciones, la media muestral general se calcula utilizando la fórmula (13.5). Con base en los datos de la tabla 13.1 obtenemos el siguiente resultado.
$$ \bar{\bar{X}} = \frac{62 + 66 + 52}{3} = 60 $$
Si la hipótesis nula es verdadera (μ1 = μ2 = μ3 = μ), la media muestral general de 60 es la mejor estimación de la media poblacional μ.
Estimación de la varianza poblacional entre tratamientos
Se presentó el concepto de estimación de $σ^2$ entre tratamientos y se mostró cómo calcularla cuando todas las muestras son del mismo tamaño. A esta estimación de $σ^2$ se le llama cuadrado medio debido a los tratamientos y se denota como CMTR. La fórmula general para calcularlo es
$$ CMTR = \frac{\sum_{j=1}^{k} n_j (\bar{X}_j - \bar{\bar{X}})^2}{k-1}\tag{13.6} $$
Al numerador de la ecuación (13.6) se le llama suma de cuadrados debido a los tratamientos y se denota SCTR. El denominador, k-1, representa los grados de libertad asociados con la SCTR. Por tanto, el cuadrado medio debido a los tratamientos se calcula con la fórmula siguiente.
Cuadrado Medio Debido a los Tratamientos $$ CMTR = \frac{SCTR}{k-1} \tag{13.7} $$
donde
$$ SCTR = \sum_{i=1}^{k} n_j (\bar{X}_j - \bar{\bar{X}})^2 \tag{13.8}$$
Si $H_0$ es verdadera, el CMTR proporciona una estimación insesgada de $σ^2$. No obstante, si las medias de las k poblaciones no son iguales, el CMTR no es un estimador insesgado de $σ^2$; en este caso, de hecho, sobreestima $σ^2$. Para los datos de Chemitech de la tabla 13.1 obtenemos los siguientes resultados.
$$ SCTR = \sum_{i=1}^{k} n_j (\bar{X}_j - \bar{\bar{X}})^2 = 5(62-60)^2 + 5(66-60)^2 + 5(52-60)^2=520 $$
$$ CMTR = \frac{SCTR}{k-1} = \frac{520}{2}=260 $$
Estimación de la varianza poblacional dentro de los tratamientos
Ya se presentó el concepto de estimación de $σ^2$ dentro de los tratamientos y cómo calcularla cuando todas las muestras son del mismo tamaño. A esta estimación de $σ^2$ se le llama cuadrado medio debido al error y se denota como CME. La fórmula general para calcularlo es
$$ CMTR = \frac{\sum_{j=1}^{k}(n_j - 1)s^2_j}{n_T-k} \tag{13.9} $$
Al numerador de la ecuación (13.9) se le llama suma de cuadrados debido al error, y se denota como SCE. El denominador del CME son los grados de libertad correspondientes a la SCE. Por tanto, la fórmula para el CME también se expresa como sigue.
Cuadrado medio debido al error $$ CME = \frac{SCE}{n_T-k} \tag{13.10} $$ donde
$$ SCE = \sum_{j=1}^{k} (n_j - 1) s^2_j \tag{13.11} $$
Observe que el CME está basado en la variación dentro de cada tratamiento; el que la hipótesis nula sea o no verdadera no tiene ninguna infl uencia. Por tanto, el CME proporciona siempre una estimación insesgada de $σ^2$.
Con base en los datos de la tabla 13.1 para el caso de Chemitech, obtenemos los resultados siguientes. $$ SCE = \sum_{j=1}^{k} (n_j - 1)s^2_j= (5-1)27.5+(5-1)26.5+(5-1)31=340 $$ $$ CME= \frac{SCE}{n_T-k} = \frac{340}{15-3}=\frac{340}{12}=28.33 $$
Comparación de las estimaciones de las varianzas: la prueba F
Si la hipótesis nula es verdadera, el CMTR y el CME proporcionan dos estimaciones insesgadas e independientes de $σ^2$. Con base en lo estudiado en el capítulo 11 sabemos que cuando se tienen poblaciones normales la distribución muestral del cociente de dos estimaciones independientes de σ2 sigue una distribución F. Por tanto, si la hipótesis nula es verdadera y se satisfacen los supuestos del ANOVA, la distribución muestral del CMTR/CME es una distribución F con k - 1 grados de libertad en el numerador y nT - k grados de libertad en el denominador. En otras palabras, si la hipótesis nula es verdadera, el valor del CMTR/CME parecerá que es un valor tomado de esta distribución F.
No obstante, si la hipótesis nula es falsa, el valor del CMTR/CME será muy grande debido a que el CMTR sobreestima σ2. Por tanto, si el valor de CMTR/CME resulta ser demasiado grande para haber sido tomado de la distribución F con k - 1 grados de libertad en el numerador y nT - k grados de libertad en el denominador, $H_0$ será rechazada. Como la decisión de descartar $H_0$ está basada en el valor del CMTR/CME, el estadístico de prueba que se usa para probar la igualdad de k poblaciones es el siguiente.
ESTADISTICO DE PRUEBA PARA LA IGUALDAD DE K MEDIAS POBLACIONALES $$ F = \frac{CMTR}{CME}\tag{13.12} $$ donde Este estadístico de prueba sigue una distribución F con k - 1 grados de libertad en el numerador y nT -k grados de libertad en el denominador
Ahora bien, en el experimento de Chemitech se usará $α=0.05$ como nivel de significancia para realizar la prueba de hipótesis. El valor del estadístico de prueba es $$ F = \frac{CMTR}{CME}= \frac{260}{28.33}=9.18 $$
Los grados de libertad en el numerador son $k - 1 = 3 - 1= 2$, y los grados de libertad para el denominador son $n_T - k = 15 - 3 = 12$. Como la hipótesis nula sólo será rechazada si obtenemos un valor grande para el estadístico de prueba, el valor-p será el área en la cola superior de la distribución F a la derecha del estadístico de prueba $F = 9.18$. En la figura 13.4 se presenta la distribución muestral de $F = CMTR/CME$, el valor del estadístico de prueba y el área en la cola superior que es el valor-p de esta prueba de hipótesis.
En la tabla 4 del apéndice B se encuentran las áreas siguientes en la cola superior de la distribución F con 2 grados de libertad en el numerador y 12 grados de libertad en el denominador.
Area en la cola superior | 0.10 | 0.05 | 0.025 | 0.01 |
---|---|---|---|---|
Valor F( $$ gl_1 = 2 ; gl_2 = 12 $$ ) | 2.81 | 3.89 | 5.10 | 6.93 |
import matplotlib.pyplot as plt
import numpy as np
from scipy.interpolate import make_interp_spline
# Definir los datos
x = np.array([0, 2.81, 3.89, 5.10, 6.93])
y = np.array([0, 0.10, 0.05, 0.025, 0.01])
# Crear la figura y los ejes
fig, ax = plt.subplots()
# Graficar los datos suavizados
x_smooth = np.linspace(x.min(), x.max(), 200)
y_smooth = make_interp_spline(x, y)(x_smooth)
ax.plot(x_smooth, y_smooth, color="#009929", label="Datos suavizados")
# Graficar los datos originales
ax.scatter(x, y, color="#98F84A", label="Datos originales")
# Cambiar el color del fondo
ax.set_facecolor("#D4F8B7")
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
# Agregar el sombreado
ax.fill_between(x, y, where=(x >= 4.18), color="#98F84A", alpha=0.2)
# Agregar el texto
ax.text(5.81, -0.02, "F = 9.18", ha="center")
ax.text(7.81, -0.03, "CMTR/CME", ha="center")
ax.text(4.81, 0.1, "Distribucion de muestreo\n de CMTR/CME",va='center', ha="center")
ax.text(6.81, 0.025, "valor - p",va='center', ha="center")
# Agregar leyenda
ax.legend()
# Mostrar el gráfico
plt.show()
Como F = 9.18 es mayor que 6.93, el área en la cola superior correspondiente a F = 9.18 es menor que 0.01. Por tanto, el valor-p es menor que 0.01. Para obtener el valor-p exacto, que es 0.004, se puede usar Minitab o Excel. Como el valor-p <= α = 0.05, $H_0$ es rechazada. La prueba proporciona evidencias suficientes para concluir que las medias de las tres poblaciones no son iguales. En otras palabras, el análisis de varianza favorece la conclusión de que las medias poblacionales del número de unidades producidas por semana con cada uno de los tres métodos de ensamble no son iguales. Como en otros procedimientos de pruebas de hipótesis, aquí también puede emplearse el método del valor crítico. Como α 0.05, el valor crítico de F es aquel que deja un área de 0.05 en la cola superior de la distribución F con 2 y 12 grados de libertad. En las tablas de la distribución F se encuentra F0.05 3.89. Por tanto, la regla de rechazo en el caso del experimento de Chemitech es
$$Rechazar \space{} H_0 \space{} si \space{} F \geq 3.89 $$
Con F = 9.18, $H_0$ es rechazada, y concluimos que las medias de las tres poblaciones no son iguales. A continuación se presenta un resumen del procedimiento general para probar la igualdad de k medias poblacionales
PRUEBA DE IGUALDAD DE K MEDIAS POBLACIONALES
$ H_0: \mu_1 = \mu_2 = \ldots = \mu_k $
$ H_a: \text{no todas las medias poblacionales son iguales} $
ESTADISTICO DE PRUEBA $$F = \frac{CMTR}{CME}$$ REGLA DE RECHAZO
Metodo del valor-p: Rechazar $ H_0 $ si el valor-p ≤ a
Metodo del valor critico: Rechazar $ H_0 $ si F ≤ $ F_a $
donde el valor de $ F_a $ esta basado en una distribucion F con k - 1 grados de libertad en el numerador y $ n_t - k $ grados de libertad en el denominador.
Tabla de ANOVA
Los cálculos anteriores se pueden presentar de manera adecuada en un instrumento conocido como tabla de análisis de varianza o tabla de ANOVA. En la tabla 13.2 se observa la forma general de una tabla ANOVA para un diseño completamente aleatorizado; la tabla 13.3 corresponde a la tabla ANOVA del experimento de Chemitech. La suma de los cuadrados asociados con la fuente de variación que se indica como “Total” se conoce como suma total de cuadrados (STC). Observe que los resultados del experimento de Chemitech indican que STC SCTR SCE, y que los grados de libertad que corresponden a este resultado es la suma de los grados de libertad correspondiente a la suma de cuadrados debido a los tratamientos más la suma de cuadrados debido al error. Cabe hacer notar que la STC dividida entre los grados de libertad nT - 1 no es otra cosa que la varianza muestral general que se obtendría si se considerara la muestra de las 15 observaciones como un solo conjunto de datos. Si se toma todo el conjunto de datos como una sola muestra, la fórmula para calcular la suma total de cuadrados, STC, es $$STC = \sum_{j=1}^{k}\sum_{i=1}^{n_j} (X_{ij} - \bar{\bar{X}})^2 \tag{13.13}$$
Se puede demostrar que estos resultados observados para el análisis de la tabla de varianza en el caso del experimento de Chemitech también son aplicables a otros problemas. Es decir, $$STC = SCTR + SCE \tag{13.14}$$
En otras palabras, la STC se particiona en dos sumas de cuadrados: la suma de cuadrados debido a los tratamientos y la suma de cuadrados debido al error. Observe, además, que los grados de libertad que corresponden a la STC, $n_T - 1$, se pueden partir en grados de libertad correspondientes a SCTR, $k - 1$, y en grados de libertad correspondientes a SCE, $n_T - k$. El análisis de varianza se puede ver como el proceso de partición de la suma total de cuadrados y los grados de libertad en sus fuentes correspondientes: tratamientos y error. Al dividir las sumas de cuadrados entre los correspondientes grados de libertad, se obtienen las estimaciones de la varianza, el valor de F y el valor-p empleados en la prueba de hipótesis de igualdad entre las medias poblacionales.
Tabla 13.2 Tabla ANOVA para un diseño completamente aleatorizado
Fuente de variacion | Suma de cuadrados | Grados de libertad | Cuadrado medio | F | valor-p |
---|---|---|---|---|---|
Tratamientos | SCTR | k - 1 | $$CMTR=\frac{SCRT}{k-1}$$ | $$\frac{CMTR}{CME}$$ | |
Error | SCE | $$n_t - k$$ | $$CME=\frac{SCE}{n_t-k}$$ | ||
Total | STC | $$n_t - 1$$ |
Tabla 13.3 Tabla de analisis de varianza para el experimento de Chemitech
Fuente de variacion | Suma de cuadrados | Grados de libertad | Cuadrado medio | F | valor-p |
---|---|---|---|---|---|
Tratamientos | 520 | 2 | 260.00 | 9.18 | 0.004 |
Error | 340 | 12 | 28.33 | ||
Total | 860 | 14 |
Tabla 13.3 Tabla de analisis de varianza para el experimento de Chemitech
Source | DF | SS | MS | F | P |
---|---|---|---|---|---|
Factor | 2 | 520.0 | 260.0 | 9.8 | 0.004 |
Error | 14 | 360.0 | 28.3 | ||
Total | 16 | 840.0 |
Level | N | Mean | StDev |
---|---|---|---|
1 | 5 | 10.2 | 3.4 |
2 | 5 | 15.1 | 2.7 |
3 | 5 | 20.3 | 2.9 |
Resultados de computadora para el análisis de varianza
Cuando se tienen muestras grandes o una cantidad grande de poblaciones, los cálculos del análisis de varianza se realizan con más facilidad mediante software para estadística. En los apéndices 13.1 a 13.3 se indican los pasos necesarios para realizar los cálculos del análisis de varianza con Minitab, Excel y StarTools. En la fi gura 13.5, aplicado al experimento de Chemitech, se presenta la pantalla de resultados de Minitab. En la primera parte de la pantalla se observa el formato ya conocido de la tabla ANOVA. Si se compara la fi gura 13.5 con la tabla 13.3, vemos que la información disponible es la misma, aunque algunos encabezados son ligeramente diferentes. El encabezado Source se usa en la columna correspondiente a la fuente de variación; Factor corresponde a la fi la de tratamientos, y las columnas de las sumas de cuadrados y los grados de libertad están intercambiados.
Observe que, enseguida de la tabla ANOVA, la pantalla de la computadora proporciona los respectivos tamaños de las muestras, las medias muestrales y las desviaciones estándar. Además, Minitab presenta una fi gura con la estimación por intervalos de 95% de confi anza para cada una de las medias poblacionales. Para obtener la estimación de estos intervalos, Minitab emplea el CME como estimación de σ2 . Por tanto, la raíz cuadrada del CME proporciona la mejor estimación de la desviación estándar poblacional σ. En la salida de la computadora esta estimación de σ es Pooled StDev, y su valor es 5.323. Para ilustrar cómo se calcula la estimación por intervalos se hará aquí la estimación por intervalo de 95% de confianza para la media poblacional del método A. Con base en lo aprendido en el estudio de intervalos de confianza en el capítulo 8, sabemos que la forma general de una estimación por intervalo para una media poblacional es
$$\bar{x}=t_{a/2}\frac{s}{\sqrt{n}}$$
donde s es la estimación de la desviación estándar poblacional σ. Como la mejor estimación de σ es la proporcionada por la Pooled StDev, se usa 5.323 en la expresión (13.15) como valor de s. Los grados de libertad para el valor de t son 12, los grados de libertad asociados con la suma de los cuadrados del error. Por tanto, como t0.025 2.179, obtenemos
$$62±2.179\frac{5.323}{\sqrt{5}}=62±5.19$$
Así, el intervalo de 95% de confi anza para el método A va de 62 5.19 56.81 a 62 5.19 67.19. Como en el experimento de Chemitech los tamaños muestrales son iguales, también los intervalos de confi anza para los métodos B y C se obtienen al sumar y restar 5.19 de la respectiva media muestral. En la salida de Minitab se aprecia que los anchos de los intervalos de confi anza son los mismos.
Prueba para la igualdad de k medias poblacionales: un estudio observacional
Se ha revisado el uso del análisis de varianza para probar la igualdad de k medias poblacionales cuando se emplea un diseño experimental completamente aleatorizado. Es importante notar que el ANOVA también se puede utilizar para probar la igualdad de tres o más medias poblacionales usando datos de un estudio observacional. Para dar un ejemplo, se considerará el caso de National Computer Products, Inc. (NCP). NCP fabrica impresoras y aparatos de fax en sus tres plantas situadas en Atlanta, Dallas y Seattle. Con el fi n de medir los conocimientos de los empleados de estas tres plantas acerca de la administración de la calidad, se toma una muestra aleatoria de seis empleados de cada planta y se les aplica un examen acerca de su conocimiento sobre la calidad. En la tabla 13.4 se presentan las puntuaciones obtenidas en los exámenes por los 18 sujetos. En esta tabla se indican también la media, la varianza y la desviación estándar muestrales de cada grupo. Los gerentes de la empresa quieren usar estos datos para probar la hipótesis de que la media de las puntuaciones de los exámenes es la misma en las tres plantas. Como población 1 se defi ne a los empleados de la planta en Atlanta, como población 2 a los de la planta en Dallas y como población 3 a los de Seattle. Sean
$ \mu_1 $ = media de las puntuaciones en los examenes de la poblacion 1
$ \mu_2 $ = media de las puntuaciones en los examenes de la poblacion 2
$ \mu_3 $ = media de las puntuaciones en los examenes de la poblacion 3
Aunque los verdaderos valores de $\mu_1, \mu_2$ y $\mu_3$ nunca puedan conocerse, se usarán los resultados muestrales para probar las hipótesis siguientes.
$ H_0:\mu_1 = \mu_2= \mu_3$
$ H_a: $ no todas las medias poblaciones son iguales.
Observe que la prueba de hipótesis para el estudio observacional de NCP es exactamente igual a la que se manejó para el experimento de Chemitech. También para analizar los datos del estudio
Tabla 13.2 Tabla ANOVA para un diseño completamente aleatorizado
Planta 1 Atlanta | Planta 2 Dallas | Planta 3 Seattle |
---|---|---|
85 | 71 | 59 |
75 | 75 | 64 |
76 | 74 | 69 |
71 | 69 | 75 |
85 | 82 | 67 |
Media Muestral | 79 | 74 | 66 |
Varianza muestral | 34 | 20 | 32 |
Desviacion estandar muestral | 5.83 | 4.47 | 5.66 |
observacional de NCP se emplea la misma metodología de análisis de varianza usada para el experimento de Chemitech.
Aun cuando en ambos casos se utiliza la misma metodología del ANOVA, vale la pena observar la diferencia entre el estudio estadístico observacional de NCP y la investigación estadística experimental de Chemitech. Las personas que realizaron el estudio de NCP no tuvieron control sobre la asignación de las plantas a cada uno de los empleados. Las plantas ya funcionaban y cada uno de los sujetos trabajaba en una de las tres. Lo único que se pudo hacer en este caso fue tomar una muestra aleatoria de seis empleados de cada una de las plantas y aplicarles el examen de conocimiento sobre la calidad. Para clasifi carlo como un trabajo experimental, NPC tendría que haber tomado al azar 18 empleados y después, de manera aleatoria, asignar las plantas a cada uno.
NOTAS Y COMENTARIOS
- La media muestral general también se calcula como media ponderada de las k medias muestrales.
$$\bar{\bar{x}}=\frac{n_1\bar{x}_1 + n_2\bar{x}_2 + \ldots + n_k\bar{x}_k }{n_T}$$
En los problemas en que se proporcionan las medias muestrales, para calcular la media general es más sencillo utilizar esta fórmula que la expresión (13.3)
- Si todas las muestras constan de n observaciones, la ecuación (13.6) puede escribe como
$$ CMTR = \frac{n∑_{j=1}^{k} (\bar{x}_j-\bar{\bar{x}})^2}{k - 1} = n [\frac{n∑_{j=1}^{k} (\bar{x}_j-\bar{\bar{x}})^2}{k - 1}] = ns^2_{\bar{x}} $$
Observe que este resultado es el mismo que el presentado en la sección 13.1 cuando se estudió el concepto de estimación de σ2 entre tratamientos. La ecuación (13.6) es sólo una generalización de este resultado para el caso de tamaños muestrales distintos.
- Si cada muestra tiene n observaciones, $n_T = kn$; por tanto, $ n_T - k $ = k(n - 1), y la ecuación (13.9) se puede reescribir como
$$ CMTR = \frac{n∑_{j=1}^{k} (\bar{x}_j-\bar{\bar{x}})^2}{k - 1} = n [\frac{n∑_{j=1}^{k} (\bar{x}_j-\bar{\bar{x}})^2}{k - 1}] = ns^2_{\bar{x}} $$
En otras palabras, si los tamaños muestrales son iguales, el CME es simplemente el promedio de las k varianzas muestrales. Observe que éste es el mismo resultado que se usó en la sección 13.1 cuando se presentó el concepto de estimación de σ2 dentro de los tratamientos.
13.3 Procedimientos de comparacion multiple
Cuando se emplea el análisis de varianza para probar si las medias de k poblaciones son iguales, rechazar la hipótesis nula sólo permite concluir que las medias poblacionales no son iguales. En algunos casos se necesita dar un paso más y determinar dónde están las diferencias. El propósito de esta sección es mostrar el uso de procedimientos de comparación múltiple para establecer comparaciones entre pares de medias poblacionales.
LSD de Fisher
¶Suponga que en un análisis de varianza se encuentran evidencias estadísticas para rechazar la hipótesis nula que plantea la igualdad de las medias poblacionales. En tal caso, para determinar dónde están las diferencias se puede emplear el procedimiento de la diferencia mínima signifi cativa (LSD, por sus siglas en inglés) de Fisher. Con el fin de ilustrar el uso del procedimiento de la LSD de Fisher para comparar pares de medias poblacionales, remítase al experimento de Chemitech presentado en la sección 13.1. A partir del análisis de varianza se concluyó que el número medio de unidades producidas por semana no era el mismo con los tres métodos de ensamble. En tal caso la siguiente pregunta es: se cree que hay diferencia entre los métodos pero, ¿dónde ocurren las diferencias? Es decir, las medias que difi eren, ¿son las de las poblaciones 1 y 2? ¿O las de las poblaciones 1 y 3? ¿O las de las poblaciones 2 y 3?
En el capítulo 10 se presentó un procedimiento estadístico para probar la hipótesis de la igualdad de dos medias poblacionales. Con una ligera modifi cación en la manera de evaluar la varianza poblacional, el procedimiento de la LSD de Fisher se basa en el estadístico de prueba *t* presentado para el caso de dos poblaciones. En la tabla siguiente se resume el procedimiento de la LSD de Fisher.
PROCEDIMIENTO DE LA LSD DE FISHER $$H_0: \mu_i=\mu_j$$ $$H_a: \mu_i \neq \mu_j$$ ESTADÍSTICO DE PRUEBA
$$\overbrace{t}^{\text{Distribución } t} = \frac{\overbrace{\bar{x}_i + \bar{x}_j}^{\text{Diferencias de medias poblacionales}}}{\sqrt{CME\left(\frac{1}{n_i} + \frac{1}{n_j}\right)}}$$
(13.16)
REGLA DE RECHAZO
Metodo del valor critico: Rechazar $H_0$ si $t \le -t_{\alpha/2}$ o $t \ge t_{\alpha/2}$
A continuación, se usará este procedimiento para determinar si existe alguna diferencia significativa entre la media de la población 1 (método A) y la media de la población 2 (método B) con α = 0.05 como nivel de significancia. Según la tabla 13.1, las medias obtenidas con el método A son 62 y con el método B son 66. En la tabla 13.3 se observa que el valor del CME es 28.33; esta es la estimación de $σ^2$ con 12 grados de libertad. Con los datos de Chemitech, el valor que se obtiene para el estadístico de prueba es $$ t=\frac{62-66}{\sqrt{28.33(\frac{1}{5}+\frac{1}{5})}}=-1.19 $$ Como se trata de una prueba de dos colas, el valor-p es el doble del área bajo la curva de la distribución t a la izquierda de $t= -1.19$.
La tabla de la distribución t sólo contiene valores positivos de t. Sin embargo, como la distribución t es simétrica, podemos determinar el área bajo la curva a la derecha de $t= 1.19$ y duplicarla para determinar el valor-p que corresponde a $t=-1.19$. En esta tabla vemos que $t=1.19$ se encuentra entre 0.20 y 0.10. Al duplicar estas cantidades, tenemos que el valor-p debe estar entre 0.40 y 0.20. Se puede usar Excel o Minitab para ver que el valor-p exacto es 0.2571. Como este valor es mayor que α = 0.05, la hipótesis nula no puede ser rechazada. Por tanto, no podemos concluir que la media poblacional del número de unidades producidas por semana con el método A sea diferente que la media poblacional del método B.
Muchas personas encuentran más fácil determinar qué tan grande tiene que ser la diferencia entre las medias muestrales para que H0 sea rechazada. En este caso el estadístico de prueba
es $\bar{x_i}+\bar{x_j}$, y la prueba se realiza siguiendo el procedimiento que se presenta a continuación.
PROCEDIMIENTO DE LA LSD FISHER BASADO EN EL ESTADISTICO DE PRUEBA EN EL ESTADISTICO DE PRUEBA $\bar{x}_i-\bar{x}_j$
$$H_0 :\mu_i = \mu_j$$ $$H_a :\mu_i\neq\mu_j$$
ESTADISTICO DE PRUEBA
$\bar{x}_i-\bar{x}_j$
REGLA DE RECHAZO PARA EL NIVEL DE SIGNIFICANCIA $\alpha$
Rechazar $H_0$ si $\left| \bar{x}_i-\bar{x}_j \right| \ge $ LSD
donde
LSD = $t_{\alpha/2}\sqrt{CME(\frac{1}{n_i}+\frac{1}{n_j})}$
(13.17)
La LSD de Fisher también se usa para obtener una estimación mediante un intervalo de confianza de la diferencia entre las medias de dos poblaciones. El procedimiento general que se emplea es el siguiente.
ESTIMACION POR INETRVALO DE CONFIANZA DE LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES USANDO EL PROCEDIMIENTO DE LA LSD DE FISHER
$\bar{x}_i-\bar{x}_j\pm\text{LSD}$
(13.18)
donde
$\text{LSD}=t_{\alpha/2}\sqrt{\text{CME}(\frac{1}{n_i}+\frac{1}{n_j})}$
(13.19)
y $t_{\alpha/2}$ pertenece a la distribucion t con $n_t-k$ grados de libertad
Si el intervalo de confi anza hallado con la expresión (13.18) incluye el valor cero, no se puede rechazar la hipótesis nula de que las dos medias poblacionales sean iguales. Pero si dicho intervalo no incluye al valor cero, podemos concluir que sí hay diferencia entre las medias poblacionales. En el caso del experimento de Chemitech, recuerde que la LSD = 7.34 (que corresponde a $t_{0.025} = 2.179$). Por tanto, una estimación de la diferencia entre las medias poblacionales 1 y 2 empleando un intervalo de 95% de confi anza es $62 - 66 \pm 7.34 = -4 \pm 7.34 =$ $-11.34$ a $3.34$; como este intervalo incluye el cero, no se puede rechazar la hipótesis de que las dos medias sean iguales.
Tasas de error tipo I
El estudio del procedimiento de la LSD de Fisher se inició con la premisa de que el análisis de varianza proporcionaba evidencias estadísticas para rechazar la hipótesis nula de la igualdad entre medias poblacionales. Se mostró que en tales casos se puede emplear el procedimiento de la LSD de Fisher para determinar dónde están las diferencias. Técnicamente, a este procedimiento se le conoce como prueba restringida o protegida de la LSD debido a que sólo se usa si primero se ha encontrado un valor F signifi cativo al aplicar el análisis de varianza. Para ver por qué es importante esta distinción en las pruebas de comparación múltiple es necesario explicar la diferencia entre tasa de error tipo I por comparación y tasa de error tipo I por experimentación.
En el experimento de Chemitech se usa el procedimiento de la LSD de Fisher para efectuar tres pares de comparaciones.
Prueba 1
$$H_0: \mu_1 = \mu_2 $$ $$H_a: \mu_1 \neq \mu_2 $$ |
Prueba 2
$$H_0: \mu_1 = \mu_3 $$ $$H_a: \mu_1 \neq \mu_3 $$ |
Prueba 3
$$H_0: \mu_2 = \mu_3 $$ $$H_a: \mu_2 \neq \mu_3 $$ |
En cada caso, el nivel de signifi cancia empleado es α = 0.05. Por tanto, en cada prueba, si la hipótesis nula es verdadera, la probabilidad de que se cometa un error tipo I es α = 0.05; entonces, la probabilidad de no cometer un error tipo I es 1 - 0.05 = 0.95. En el estudio de los procedimientos de comparación múltiple, a esta probabilidad de cometer un error tipo I (α = 0.05) se le conoce como tasa de error tipo I por comparación, la cual indica el nivel de signifi cancia que corresponde a una sola comparación por pares.
Considere ahora una cuestión ligeramente diferente. ¿Cuál es la probabilidad de que al hacer tres comparaciones por pares se cometa un error tipo I en por lo menos una de las tres pruebas? Para responder esta pregunta, observe que la probabilidad de que no se cometa un error tipo I en ninguna de las tres pruebas es (0.95) (0.95) (0.95) = 0.8574. Por tanto, la probabilidad de cometer por lo menos un error tipo I es 1 - 0.8574 = 0.1426. Entonces, cuando se usa el procedimiento de la LSD de Fisher para hacer los tres pares de comparaciones, la tasa de error tipo I correspondiente a este método no es 0.05, sino 0.1426, y se le conoce como tasa de error tipo I por comparación por experimentación o general. Para evitar confusiones, la tasa de error tipo I por experimentación se denota $α_{EW}$.
La tasa de error tipo I por experimentación es mayor en estudios con más poblaciones. Por ejemplo, en un problema con cinco poblaciones hay 10 pares de comparaciones. Si se prueban todas las comparaciones posibles por pares usando el procedimiento de la LSD de Fisher con una tasa de error por comparación de α = 0.05, la tasa de error tipo I por experimentación será $1 - (1 - 0.05)^{10} = 0.40$. En tales casos se prefi ere buscar otras alternativas que proporcionen un mejor control sobre la tasa de error por experimentación.
Una alternativa para controlar la tasa de error general por experimentación, conocida como ajuste de Bonferroni, consiste en usar en cada prueba tasas de error por comparación más pequeñas. Por ejemplo, si se quieren probar C comparaciones por pares y se desea que la probabilidad máxima de cometer un error tipo I en todo el experimento sea αEW, simplemente se usa una tasa de error por comparación igual a αEW/C. En el experimento de Chemitech, si se desea emplear el procedimiento de la LSD de Fisher para probar los tres pares de comparaciones con una tasa de error máximo por experimentación de $α_{EW} = 0.05$, se establece como tasa de error por comparación $α = 0.05/3 = 0.017$. En un problema con cinco poblaciones y 10 comparaciones por pares, el ajuste de Bonferroni sugeriría una tasa de error por comparación de $0.05/10 = 0.005$. Recuerde que cuando se estudiaron las pruebas de hipótesis en el capítulo 9 se vio que para un tamaño de muestra dado, toda disminución en la probabilidad de cometer un error tipo I aumenta la probabilidad de cometer un error tipo II, el cual corresponde a aceptar la hipótesis de que las dos medias poblacionales son iguales cuando en realidad no lo son. Por tanto, suele haber renuencia a realizar pruebas individuales con una baja tasa de error tipo I por comparación debido a que aumenta el riesgo de cometer un error tipo II.
Como solución para tales situaciones se han elaborado otras alternativas, como el procedimiento de Turkey y la prueba de rango múltiple de Duncan. Sin embargo, en la comunidad estadística existe una gran controversia respecto de cuál es el “mejor” procedimiento. La verdad es que no hay uno que sea el mejor para todo tipo de problemas.
13.4 Diseño de bloques aleatorizado
Hasta ahora sólo se ha considerado el diseño de experimentos completamente aleatorizado. Como recordará, para probar la diferencia entre las medias de los tratamientos se calcula el valor de F mediante el cociente
$$ F= \frac{CMTR}{CME}\tag{13.20} $$
Sin embargo, puede surgir un problema por diferencias debido a factores ajenos (no considerados en el experimento) que ocasionen que el término CME en este cociente se vuelva más grande. En estos casos, el valor de F en la ecuación (13.20) será más pequeño, haciendo que se concluya que no hay diferencia entre las medias de los tratamientos cuando en realidad sí la hay.
En esta sección se presenta un diseño de experimentos conocido como diseño de bloques aleatorizado, cuyo propósito es controlar algunas fuentes ajenas de variación eliminándolas del término CME. Este diseño tiende a proporcionar una mejor estimación de la varianza del error y conduce a pruebas de hipótesis más sólidas en términos de su capaciadad para detectar diferencias entre medias de tratamientos. Para ilustrar esto se retoma un estudio sobre el estrés que experimentan los controladores del tráfico aéreo.
Prueba de estres para controladores de trafico aéreo
Como resultado de un estudio para medir la fatiga y el estrés de los controladores de tráfi co
aéreo, se propusieron modifi caciones y rediseños a su estación de trabajo. Después de evaluar
diversos diseños, se seleccionaron tres alternativas consideradas con el mayor potencial para
reducir el estrés en los controladores. La pregunta clave es: ¿en qué medida difi eren estas tres
alternativas en su efecto sobre el estrés de los sujetos de estudio? Para responder esta pregunta
es necesario diseñar un experimento que proporcione mediciones del estrés de los controladores del tráfi co aéreo bajo cada alternativa.
Si se empleara un diseño completamente aleatorizado, una muestra al azar de controladores
sería asignada a cada una de las alternativas de estaciones de trabajo. Sin embargo, se cree que
los sujetos difi eren de forma signifi cativa en su habilidad para manejar situaciones estresantes. Lo que para un controlador implica una gran tensión, para otro puede ser sólo un estrés
moderado e incluso pequeño. Por tanto, al considerar la fuente de variación dentro del grupo
(CME), hay que reconocer que esta variación comprende tanto el error aleatorio como el error
debido a las diferencias individuales de los sujetos. De hecho, los gerentes consideran que la
variabilidad entre los controladores será la contribución principal al término CME.
Una manera de hacer a un lado el efecto de las diferencias individuales es usar el diseño
de bloques aleatorizado, en el cual se identifi ca la variabilidad debido a las diferencias individuales de los controladores y se elimina del término CME. En el diseño de bloques aleatorizado
se emplea una sola muestra de controladores. Cada uno de ellos se prueba con cada una de las
tres alternativas de puestos de trabajo. En la terminología del diseño de experimentos, el puesto de trabajo es el factor de interés y los controladores son los bloques. Los tres tratamientos
o poblaciones asociados con el factor puesto de trabajo son las tres alternativas de puesto de
trabajo. Para simplifi car, a estas tres alternativas se les designará como sistema A, sistema B y
sistema C.
El aspecto aleatorizado del diseño de bloques aleatorizado es el orden al azar en el que les
son asignados los tratamientos (sistemas) a los controladores. Si cada sujeto probara los tres sistemas en el mismo orden, cualquier diferencia encontrada podría deberse al orden de la prueba
más que a las verdaderas diferencias entre los sistemas.
Para obtener los datos necesarios, en el Centro de Control Cleveland en Oberlin, Ohio,
se instalaron las tres alternativas de estación de trabajo. Se seleccionó a seis controladores en
forma aleatoria y se le asignó a cada sujeto uno de los sistemas para que lo operara. Después
de practicar una entrevista y un examen médico a cada uno de los participantes en el estudio,
se obtuvieron las mediciones del estrés de cada controlador en cada uno de los sistemas. En la
tabla 13.5 se presentan estos datos con las etiquetas Blocks (bloques), Controller (controlador),
System (sistema) y Treatments (tratamientos).
En la tabla 13.6 aparece un resumen de los datos recabados sobre el estrés. En ella se presentan los totales de las columnas (tratamientos) y los totales de las fi las (bloques), así como
Tabla 13.5 Diseño de bloques aleatorizado para la prueba de estrés en los controladores de tráfico aéreo
Treatments | ||||
---|---|---|---|---|
System A | System B | System C | ||
Controller 1 | 15 | 15 | 18 | |
Controller 2 | 14 | 14 | 14 | |
Controller 3 | 10 | 11 | 15 | |
Blocks | Controller 4 | 13 | 12 | 17 |
Controller 5 | 16 | 13 | 16 | |
Controller 6 | 13 | 13 | 13 |
TABLA 13.6 Resumen de los datos recolectados para la prueba de estrés en los controladores de tráfico aéreo. de tráfico aéreo
Tratamientos | ||||||
---|---|---|---|---|---|---|
System A | System B | System C | Totales de fila o de bloque | Medias por bloque | ||
Controlador 1 | 15 | 15 | 18 | 48 | $$ \bar{x}_1 = 48/3 = 16.0 $$ | |
Controlador 2 | 14 | 14 | 14 | 42 | $$ \bar{x}_2 = 42/3 = 14.0 $$ | |
Controlador 3 | 10 | 11 | 15 | 36 | $$ \bar{x}_3 = 36/3 = 12.0 $$ | |
Bloques | Controlador 4 | 13 | 12 | 17 | 42 | $$ \bar{x}_4 = 42/3 = 14.0 $$ |
Controlador 5 | 16 | 13 | 16 | 45 | $$ \bar{x}_5 = 45/3 = 15.0 $$ | |
Controlador 6 | 13 | 13 | 13 | 39 | $$ \bar{x}_6 = 39/3 = 13.0 $$ | |
Totales de columna o de tratamiento | 81 | 78 | 93 | 252 | $$ \bar{\bar{x}} = \frac{252}{18} = 14.0$$ | |
Medias por tratamiento | $$ \bar{x}_1 = \frac{81}{6} = 13.5 $$ | $$ \bar{x}_2 = \frac{78}{6} = 13.0 $$ | $$ \bar{x}_3 = \frac{93}{6} = 15.5 $$ |
algunas medias muestrales necesarias que serán útiles para efectuar los cálculos de la suma de cuadrados del ANOVA. Dado que los valores bajos de estrés se consideran mejores, los datos muestrales parecen favorecer el sistema B, en el que la media de las mediciones del estrés es 13. Sin embargo, la pregunta persiste: ¿los resultados muestrales justifi can la conclusión de que las medias poblacionales de los niveles de estrés con estos tres sistemas difi eren? Es decir, ¿las diferencias son estadísticamente signifi cativas? Para responder esta pregunta se emplea un análisis del cálculo de la varianza, similar al empleado en el diseño completamente aleatorizado.
Procedimiento ANOVA
El procedimiento ANOVA para el diseño de bloques aleatorizado requiere la partición de la suma total de los cuadrados (STC) en tres grupos: la suma de los cuadrados debido a los tratamientos (SCTR), la suma de los cuadrados debido a los bloques (SCBL) y la suma de los cuadrados debida al error (SCE). A continuación se proporciona la fórmula para este particionamiento.
$$ STC = SCTR + SCBL + SCE \tag{13.21} $$
Esta suma de la partición de cuadrados se presenta en la tabla ANOVA para el diseño de bloques aleatorizado como se muestra en la tabla 13.7. La notación empleada es $$ k = numero de tratamientos $$ $$ b = numero de bloques $$ $$ n_t = tamaño muestral total (n_t = kb) $$
Observe que en la tabla ANOVA también se indica la partición de los nT 1 grados de libertad totales de manera que k 1 grados de libertad correspondan a los tratamientos, b 1 a los bloques y (k 1)(b 1) al término del error. En la columna cuadrado medio se proporcionan las sumas de los cuadrados divididas entre los grados de libertad, y F CMTR/CME es el cociente F que se usa para probar si hay diferencias signifi cativas entre las medias de los tratamientos. La contribución más importante del diseño de bloques aleatorizado radica en que, al emplear bloques, se eliminan del término CME las diferencias individuales de los controladores y se obtiene una prueba más sólida para las diferencias de estrés entre las tres alternativas de estaciones de trabajo.
Tabla 13.7 Tabla ANOVA para el diseño de bloques aleatorizado con k tratamientos y b bloques
Fuente de variacion | Suma de cuadrados | Grados de libertad | Cuadrado medio | F | valor-p |
---|---|---|---|---|---|
Tratamientos | SCTR | k - 1 | $$ CMTR=\frac{SCRT}{k-1} $$ | $$ \frac{CMTR}{CME} $$ | |
Bloques | SCBL | b - 1 | $$ CMBL=\frac{SCBL}{b-1} $$ | $$ \frac{CMTR}{CME} $$ | |
Error | SCE | $$ (k - 1)(b - 1) $$ | $$ CME=\frac{SCE}{(k - 1)(b - 1)} $$ | ||
Total | STC | $$ n_t - 1 $$ |
Calculos y conlusiones
Para calcular el estadístico F requerido para probar si existe diferencia entre las medias de los tratamientos en un diseño de bloques aleatorizado, se necesita calcular el CMTR y el CME. Para determinar estos dos cuadrados medios es preciso calcular primero la SCTR y la SCE; para esto también se calcula la SCBL y la STC. En forma más sencilla, estos procedimientos se realizan en cuatro pasos. Además de la notación k, b y $n_T$ ya definida, se usará:
$ x_{ij} $ = valor de la observación correspondiente al tratamiento j en el bloque i
$ \bar{x}_j $ = media muestral del tratamiento j-ésimo
$ \bar{x}_i $ = media muestral para el bloque i-ésimo
$ \bar{\bar{x}} $ = media muestral general
Paso 1. Calcular la suma total de cuadrados (STC)
$$ STC = \sum_{i=1}^{b} \sum_{j=1}^{k} (x_{ij} - \bar{\bar{x}})^2 \tag{13.22}$$
Paso 2. Estimar la suma de cuadrados debido a los tratamientos (SCTR).
$$ STC = b\sum_{j=1}^{k} (x_j - \bar{\bar{x}})^2 \tag{13.23}$$
Paso 3. Calcular la suma de cuadrados debido a los bloques (SCBL).
$$ STC = k\sum_{i=1}^{k} (x_i - \bar{\bar{x}})^2 \tag{13.24}$$
Paso 4. Determinar la suma de cuadrados debido al error (SCE).
$$ SCE = STC – SCTR – SCBL \tag{13.25} $$
En el caso de los datos de la tabla 13.6 sobre los controladores del tráfi co aéreo, con estos cálculos se obtienen las sumas de los cuadrados siguientes.
Paso 1. STC = (15 - 14)^2 + (15 - 14)^2 + (18 - 14)^2 + . . . + (13 - 14)^2 = 70
Paso 2. SCTR = 6[(13.5 - 14)^2 + (13.0 - 14)^2 + (15.5 - 14)^2] = 21
Paso 3. SCBL = 3[(16 - 14)^2 + (14 - 14)^2 + (12 _ 14)^2 + (14 - 14)^2 + (15 - 14)^2 + (13 - 14)^2] = 30
Paso 4. SCE = 70 - 21 - 30 = 19
Tabla 13.8 Tabla ANOVA para la prueba de estrés de los controladores de tráfico aéreo
Fuente de variacion | Suma de cuadrados | Grados de libertad | Cuadrado medio | F | valor-p |
---|---|---|---|---|---|
Tratamientos | 21 | 2 | 10.5 | 10.5/1.9 = 5.53 | 0.024 |
Bloques | 30 | 5 | 6.0 | ||
Total | 70 | 17 |
Las sumas de cuadrados divididas entre sus grados de libertad proporcionan los correspondientes cuadrados medios que se presentan en la tabla 13.8. Ahora, para realizar la prueba de hipótesis se usará α 0.05 como nivel de signifi cancia. El valor del estadístico de prueba es
$$ F = \frac{CMTR}{CME} = \frac{10.5}{1.9} = 5.53 $$
Los grados de libertad en el numerador son $k - 1 = 3 - 1 = 2$, y en el denominador son
$(k - 1)(b - 1) = (3 - 1)(6 - 1) = 10$. Como la prueba de hipótesis nula es rechazada sólo
cuando los valores del estadístico de prueba son grandes, el valor-p es el área bajo la distribución F a la derecha de $F= 5.53$. En la tabla 4 del apéndice B se puede ver que para 2 y
10 grados de libertad, $F = 5.53$ se encuentra entre $F_{0.025} = 5.46$ y $F_{0.01}=7.56$. Por tanto, el área en la cola superior, o valor-p, se ubica entre $0.01$ y $0.025$. Se puede usar también Excel o Minitab y encontrar que el valor-p exacto para $F = 5.53$ es $0.024$. Como el valor-p $\le \alpha =0.05$, se rechaza la hipótesis nula $H_0: \mu_1$ , $\mu_2$, $\mu_3$, y se concluye que las medias poblacionales de los niveles de estrés en las tres alternativas de estación de trabajo no son iguales.
Acerca de este diseño de bloques aleatorizado se pueden exponer algunos comentarios generales. El diseño de experimentos descrito en esta sección es un diseño de bloques completo;
la palabra “completo” indica que cada bloque se somete a todos los k tratamientos. Es decir,
todos los controladores (bloques) fueron probados con los tres sistemas (tratamientos). A los
diseños de experimentos en los que a cada bloque se le aplican algunos, pero no todos los tratamientos, se les llama diseños de bloques incompleto. Su estudio queda fuera del alcance de
este libro.
Como en la prueba sobre el estrés de los controladores de tráfi co aéreo cada sujeto usó
todos los sistemas, este método garantiza un diseño de bloques completo. En algunos casos
la formación de los bloques se realiza con unidades experimentales “similares” en cada bloque. Por ejemplo, suponga que en una prueba preliminar realizada a los controladores se divide
la población en grupos que van desde personas con mucho estrés hasta individuos con estrés
sumamente bajo. Aquí también se puede tener la formación de bloques haciendo que en el estudio participen tres controladores de cada nivel de estrés. En este caso, cada bloque consistirá en
tres sujetos de un mismo nivel de estrés. El aspecto aleatorizado del diseño de bloques será la
designación aleatoria de los tres controladores de cada bloque a los tres sistemas.
Por último, observe que en la tabla ANOVA que se presenta en la tabla 13.7, se proporciona
un valor F para probar los efectos de los tratamientos pero no de los bloques. La razón estriba
en que el experimento se diseñó para probar un solo factor: el diseño de la estación de trabajo. La formación de bloques basada en las diferencias del estrés individuales se realizó para
eliminar tal variación del término CME. El estudio no se diseñó para detectar las diferencias
individuales de estrés.
Algunos analistas calculan $F=CMBL/CME$ y usan este estadístico para probar la signifi -
cancia de los bloques. Después utilizan los resultados como guía para determinar si el mismo
tipo de bloques puede ser útil en experimentos futuros. Sin embargo, si la diferencia en el estrés
de las personas ha de ser un factor en el estudio, deberá emplearse un diseño de experimentos
diferente. Una prueba de signifi cancia sobre los bloques no debe hacerse como base para una
conclusión acerca de un segundo factor.
NOTAS Y COMENTARIOS
En un diseño de bloques aleatorizado, los grados de libertad del error son menos que en un diseño completamente aleatorizado, debido a que en los b bloques se pierden b 1 grados de libertad. Si n es pequeño, los efectos potenciales debido a los bloques pueden quedar ocultos por la pérdida de grados de libertad del error; con n grande, los efectos se minimizan.
13.5 Experimento factorial¶
Los diseños de experimentos estudiados hasta ahora permiten formular conclusiones estadísticas acerca de un solo factor. Sin embargo, en algunos experimentos tal vez se quieran formular conclusiones acerca de más de una variable o factor. Un experimento factorial es un diseño que permite obtener conclusiones simultáneas acerca de dos o más factores. El término factorial se utiliza porque las condiciones experimentales incluyen todas las posibles combinaciones de los factores. Por ejemplo, para a niveles de un factor A y b niveles de un factor B, el experimento incluirá una colección de datos en el tratamiento de las combinaciones ab. En esta sección mostraremos el análisis para un experimento factorial de dos factores. El enfoque básico puede ampliarse a más de dos factores. Como ilustración de un experimento factorial de dos factores, veremos un estudio acerca del Examen de admisión de graduados en administración (GMAT, por sus siglas en inglés), una prueba estandarizada que utilizan las escuelas de negocios para evaluar una habilidad de los aspirantes a cubrir un programa de grado en ese campo. Las puntuaciones del GMAT están en el rango de 200 a 800; las de nivel más elevado signifi can una aptitud más alta. Con la intención de mejorar el desempeño de los estudiantes en el GMAT, una de las principales universidades de Texas considera ofrecer los siguientes tres programas de preparación para ese examen.
- Una sesión de repaso de tres horas, en la que se revisa el tipo de preguntas que suele encontrarse en el GMAT.
- Un programa de un día en el que se ve el material más relevante del examen, junto con un examen muestra que se califi ca.
- Un curso intensivo de 10 semanas en el que se identifi can las debilidades de cada estudiante y se establecen programas individualizados de mejora.
Por tanto, un factor en este estudio es el programa de preparación, el cual tiene tres tratamientos: un repaso de tres horas, un programa de un día y un curso de 10 semanas. Antes de seleccionar la opción a adoptar, más estudios llevarán a determinar el efecto de cada uno de los programas sobre las puntuaciones obtenidas en este examen de admisión.
Por lo general, los aplicantes del GMAT son estudiantes de tres licenciaturas: negocios, ingeniería y artes y ciencias. En consecuencia, el segundo factor de interés en el experimento es si la licenciatura infl uye en la califi cación del GMAT. Para este segundo factor hay también tres tratamientos: negocios, ingeniería y artes y ciencias. El diseño factorial de este experimento con tres tratamientos para el factor A, programa de preparación, y tres tratamientos para el
Tabla 13.9 Las nueve combinaciones de tratamiento en el experimento con dos factores del GMAT
Factor B: licenciatura | ||||
---|---|---|---|---|
Negocios | Ingenieria | Artes y ciencia | ||
Factor A | Repaso de tres horas | 1 | 2 | 3 | >
programa | programa de un día | 4 | 5 | 6 |
de preparación | Curso de 10 semanas | 7 | 8 | 9 |
factor B, tipo de licenciatura, habrá un total de $3 \cdot3=9$ combinaciones. En la tabla 13.9 se resumen estas combinaciones de tratamientos o condiciones experimentales.
Suponga que se toma una muestra de dos sujetos para cada una de las combinaciones de tratamientos de la tabla 13.9: dos estudiantes de negocios participarán en el repaso de tres horas, dos participarán en el programa de un día y otros dos en el curso de 10 semanas. Además, dos estudiantes de ingeniería y dos de artes y ciencias participarán en cada uno de los tres programas. En la terminología del diseño de experimentos, el tamaño muestral de dos para cada combinación de tratamientos indica que se tienen dos replicaciones. Se pueden usar también más replicaciones y tamaños muestrales mayores, pero elegimos minimizar los cálculos para este ejemplo.
En este diseño de experimentos se requiere que de cada una de las licenciaturas (negocios,ingeniería y artes y ciencias) se tomen aleatoriamente seis estudiantes que pretendan realizar este examen de admisión. Después, dos de cada licenciatura deben ser asignados de manera aleatoria a cada uno de los programas de preparación para el examen, con lo que en total participan 18 sujetos en el estudio.
Asumamos que los estudiantes seleccionados de manera aleatoria participaron en los programas de preparación y luego tomaron el GMAT. En la tabla 13.10 se presentan las califi caciones obtenidas en el programa de preparación (Preparation Program), que incluyó repaso de tres horas (Three-hour review), programa de un día (One-day program) y curso de 10 semanas (10-week course) para las licenciaturas (College) de negocios (Business), ingeniería (Engineering) y artes y ciencias (Arts and Sciences). Los cálculos para el análisis de varianza con los datos de la tabla 13.10 darán respuesta a las siguientes preguntas.
• Efecto principal (factor A). ¿Los programas de preparación tienen efectos diferentes sobre la puntuación obtenida en el GMAT?
• Efecto principal (factor B). ¿Las licenciaturas tienen efectos diferentes sobre la puntuación obtenida en el GMAT?
• Efecto de interacción (factores A y B). ¿Es uno de los programas de preparación mejor para los estudiantes que provienen de una de las tres licenciaturas, mientras que para los de otras licenciaturas es mejor otro de los programas?
Tabla 13.10 Puntuaciones en el GMAT para el experimento de dos factores
Factor B: College | ||||
---|---|---|---|---|
Business | Engineering | Arts and Sciences | ||
Three-hour review | 500 | 540 | 480 | >|
Factor A | 580 | 460 | 400 | |
Preparation | One-day program | 460 | 560 | 420 |
Program | 540 | 620 | 480 | >|
10-week course | 560 | 600 | 480 | |
600 | 580 | 410 |
Tabla 13.11 Tabla ANOVA para el experimento factorial de dos factores con $r$ replicaciones
Fuente de variación | Suma de cuadrados | Grados de libertad | Cuadrado medio | F | valor-p |
---|---|---|---|---|---|
Factor A | SCA | $a-1$ | $CMA=\frac{SCA}{-1} $ | $\frac{CMA}{CME}$ | |
Factor B | SCB | $b-1$ | $CMB=\frac{SCB}{b-1}$ | $\frac{CMB}{CME}$ | |
Interacción | SCAB | $(a-1)(b-1)$ | $CMAB=\frac{SCAB}{(a-1)(b-1)}$ | $\frac{CMA}{CME}$ | |
Error | SCE | $ab(r-1)$ | $CME=\frac{SCE}{ab(r-1)} $ | ||
Total | STC | $n_r-1$ |
sobre las puntuaciones del GMAT, se podrá concluir que el efecto del tipo de programa de preparación depende de la licenciatura
Procedimiento ANOVA¶
El procedimiento ANOVA para el experimento factorial de dos factores requiere la partición de la suma total de cuadrados (STC) en cuatro grupos: suma de cuadrados del factor A (SCA), suma de cuadrados del factor B (SCB), suma de cuadrados de la interacción (SCAB) y suma de cuadrados debido al error (SCE). La fórmula para esta partición se da a continuación. \begin{equation} STC = SCA + SCB + SCAB + SCE \end{equation}
En la tabla 13.11 se resumen las particiones de las sumas de cuadrados y de los grados de libertad. Se emplea la notación siguiente:
$a$ número de niveles del factor A
$b$ número de niveles del factor B
$r$ número de replicaciones
$n_T$ número total de observaciones realizadas en el experimento;$n_T=abr$
Cálculos y conclusiones¶
Para determinar los estadísticos F que se requieren en las pruebas de signifi cancia del factor A, del factor B y de la interacción, es necesario calcular CMA, CMB, CMAB y CME. Para obtener estos cuatro cuadrados medios se debe calcular primero SCA, SCB, SCAB y SCE; con esto se calcula también STC. Para simplificar la presentación, los procedimientos se dividen en cinco pasos. Además de $a, b, r$ y $n_T$ definidos previamente, se emplea la siguiente notación.
$x_{ijk} =$ observación correspondiente a la k-ésima réplica tomada del tratamiento i del factor A y del tratamiento j del factor B
$\bar{x}_i.$ media muestral de las observaciones en el tratamiento i (factor A)
$\bar{x}_{.j}=$ media muestral de las observaciones en el tratamiento j (factor B)
$\bar{x}_{ij} =$ media muestral de las observaciones correspondientes a la combinación del tratamiento i (factor A) y el tratamiento j (factor B)
$\overline{\overline{x}}=$ media muestral general de todas las $n_T$ observaciones
Paso 1. Calcular la suma total de cuadrados (STC) \begin{equation} STC = \sum_{i=1}^{a}\sum_{j=1}^{b} \sum_{k=1}^{r} (x_{ijk}-\overline{\overline{x}})^2 \end{equation}
Paso 2. Estimar la suma de cuadrados debido a los tratamientos (SCTR).
$SCA = br \sum_{i=1}^{a} (\bar{x}_i. - \overline{\overline{x}})^2$
Paso 3. Calcular la suma de cuadrados debido a los bloques (SCBL).
$SCA = ar \sum_{i=1}^{a} \sum_{j=1}^{b} (\bar{x}_{.j} - \overline{\overline{x}})^2$
Paso 4. Determinar la suma de cuadrados debido al error (SCE)
$SCAB = r \sum_{i=1}^{a} \sum_{j=1}^{b} (\bar{x}_{ij} -\bar{x}_{i.}-\bar{x}_{.j}- \overline{\overline{x}})^2$
Paso 5. Calcular la suma de cuadrados debido al error.
$SCE = STC - SCA - SCB - SCAB$
Paso 1. $STC = (500-515)^2 + (580-515)^2 + (540-515)^2 + \ldots + (410-515)^2 = 82450$
Paso 2. $SCA = (3)(2)[(493.33 - 515)^2+ (513.33-515)^2+(538.33-515)^2] = 6100$
Paso 3. $SCB = (3)(2)[(540 - 515)^2 +(560-515)^2 + (445 - 515)^2 ] = 45 300$
Paso 4. $SCAB = 2[(540 - 493.33 - 540 + 515)^2 + (500 - 493.33 - 560 + 515)^2\ldots(445 - 538.33 - 445 + 515)^2 ] = 11200$
Paso 5. $SCE = 82450 - 6100- 45300 - 11200 = 19850$
Estas sumas divididas entre sus correspondientes grados de libertad proporcionan los valores de los cuadrados medios apropiados para estimar los dos efectos principales (programas de preparación y licenciatura) y el efecto de su interacción. Debido a la gran cantidad de cálculos involucrada en cualquier experimento factorial desde uno modesto hasta uno de gran dimensión, usualmente la computadora juega un papel importante en la realización de los cálculos necesarios en el análisis de varianza mostrado antes y en la obtención de los valores-p que se emplean para tomar las decisiones en la prueba de hipótesis. En la fi gura 13.6 se presenta la pantalla de resultados de Minitab para el análisis de varianza del experimento factorial de dos factores del GMAT. Para realizar la prueba de hipótesis de dos factores en este estudio usaremos el resultado de Minitab y un nivel de significancia $α = 0.05$. El valor-p utilizado para probar si hay diferencias significativas entre los tres programas de preparación (factor A) es 0.299. Como este valor-p = 0.299 es mayor que $α = 0.05$, no existe diferencia signifi cativa entre las medias de las puntuaciones obtenidas en el GMAT para los tres programas de preparación. Sin embargo, en relación con el efecto de la licenciatura, el valor-p = 0.005 es menor que $α = 0.05$; por tanto, sí hay una diferencia signifi cativa en las medias de las puntuaciones en el GMAT entre las tres licenciaturas. Por ultimo, debido a que el
tresTabla 13.12 Resumen de los datos del examen para el experimento de dos factores | ||||||
Totales de combinacion de tratamiento |
Factor B: Licenciatura Negocios Ingeniería Artes y Ciencias |
Totales de Fila | Medidas del Factor A | |||
---|---|---|---|---|---|---|
Factor A: programa de preparacion | Repaso de tres horas |
500 580 1080
$$\bar{x}_{11}=\frac{1080}{2}=500$$ |
540 460 1000
$$\bar{x}_{12}=\frac{1000}{2}=540$$ |
480 400 880
$$\bar{x}_{13}=\frac{880}{2}=440$$ |
2960 |
$$\bar{x}_{1}.=\frac{2960}{6}=493.33$$ |
Programa de un dia |
460 540 1000
$$\bar{x}_{21}=\frac{1000}{2}=500$$ |
560 620 1180
$$\bar{x}_{22}=\frac{1180}{2}=590$$ |
420 480 900
$$\bar{x}_{23}=\frac{900}{2}=450$$ |
3080 |
$$\bar{x}_{2}.=\frac{2960}{6}=493.33$$ |
|
Curso de 10 semanas |
560 600 1160
$$\bar{x}_{31}=\frac{1160}{2}=580$$ |
600 580 1180
$$\bar{x}_{32}=\frac{1180}{2}=590$$ |
480 410 890
$$\bar{x}_{33}=\frac{890}{2}=445$$ |
3230 |
$$\bar{x}_{3}.=\frac{2960}{6}=493.33$$ |
|
Total de Columna | 3240 | 3360 | 2670 |
$$9270\longleftarrow$$ Total General |
||
Medidas del factor B |
$$\bar{x}_{1}.=\frac{3240}{6}=540$$ |
$$\bar{x}_{2}.=\frac{3360}{6}=560$$ |
$$\bar{x}_{3}.=\frac{2670}{6}=445$$ |
$$\bar{\bar{x}}=\frac{9070}{18}=515$$ |
SOURCE | DF | SS | MS | F | P |
---|---|---|---|---|---|
Factor A | 2 | 6100 | 3050 | 1.38 | 0.299 |
Factor B | 2 | 45300 | 22650 | 10.27 | 0.005 |
Interaction | 4 | 11200 | 2800 | 1.27 | 0.350 |
Error | 9 | 19850 | 2206 | ||
Total | 17 | 82450 |
$valor-p$ de 0.350 correspondiente al efecto de la interacción es mayor que $α = 0.05$, no hay un efecto signifi cativo de interacción. Por tanto, en este estudio no se encuentran razones para pensar que los tres programas de preparación difi eren en su capacidad para capacitar a estudiantes de las distintas licenciaturas para el GMAT.
Se encontró que la licenciatura sí es un factor significativo. Al revisar los cálculos de la tabla 13.12, vemos que las medias muestrales son: estudiantes de negocios $x_1 = 540$, estudiantes de ingeniería $x_2 = 560$ y estudiantes de artes y ciencias $x_3 = 445$. Se pueden realizar pruebas para los distintos tratamientos; sin embargo, después de observar las tres medias muestrales es posible anticipar que no hay diferencia entre los alumnos con las licenciaturas de ingeniería y negocios. Pero los de artes y ciencias parecen estar menos preparados para este examen que los de las otras dos licenciaturas. Quizás esta observación haga que la universidad busque otras opciones para ayudar a este grupo a prepararse para el GMAT.