Portada
from IPython.display import display, HTML
htmlCod = """
<!DOCTYPE html>
<html lang="es">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<style>
body1 {
font-family: 'Cambria', sans-serif;
background-color: #FFF; /* Fondo blanco */
color: #000; /* Texto negro */
margin: 0;
padding: 0;
}
.chapter-box {
background-color: #009929;
color: #FFF;
padding: 20px 0; /* Ajusta este valor para centrar verticalmente como desees */
width: 100%; /* Ancho al 100% para ocupar la parte superior de la pantalla */
box-sizing: border-box; /* Asegura que el padding no añada más ancho */
text-align: center; /* Centra el texto horizontalmente */
}
.chapter-box h1 {
margin: 0;
font-size: 6em; /* Tamaño CAPÍTULO 1 */
}
.content {
padding: 20px;
column-count: 2;
column-gap: 40px;
}
.content h2 {
color: #009929;
font-size: 1.5em;
margin-top: 0;
font-weight: normal;
text-transform: uppercase;
text-align: left;
border-bottom: 1px solid #009929; /* Línea debajo del texto */
padding-bottom: 5px; /* Espacio entre texto y línea */
display: inline-block; /* Permite que la línea ocupe el ancho del contenedor */
width: 100%; /* Asegura que el subrayado se extienda a lo largo de la página */
}
.content ul {
list-style-type: none; /* No queremos viñetas */
padding: 0;
margin-top: 0; /* Evitar espacios adicionales antes de la lista */
}
.content ul li {
margin-bottom: 10px; /* Espaciado entre líneas */
font-size: 1em;
}
.content ul li strong {
font-weight: bold;
display: block; /* Asegura que cada título de sección comience en una nueva línea */
break-inside: avoid-column; /* Evita que los títulos de sección se dividan entre columnas */
-webkit-column-break-inside: avoid; /* Para navegadores basados en WebKit como Safari */
page-break-inside: avoid; /* Para la paginación al imprimir */
}
</style>
</head>
</html>
"""
display(HTML(htmlCod))
otros estilos
from IPython.display import display, HTML
htmlCod = """
<style>
body {
font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif;
background: #fafafa;
margin: 0;
padding: 20px;
}
.encuesta {
max-width: 700px;
margin: auto;
padding: 20px;
background: #ffffff;
box-shadow: 0 2px 5px rgba(0,0,0,0.1);
}
.encuesta h2 {
text-align: center;
color: #333333;
}
.campo {
margin: 15px 0;
}
.campo label {
margin: 0 10px 0 0;
font-weight: bold;
}
.campo input[type="text"],
.campo textarea {
width: calc(100% - 22px);
padding: 10px;
margin-top: 5px;
border: 1px solid #dddddd;
border-radius: 4px;
}
.pregunta {
margin: 15px 0;
}
.pregunta span {
font-weight: bold;
}
.opciones label {
margin-right: 5px;
}
.opciones input[type="checkbox"] {
margin-right: 10px;
}
.comentario {
margin: 15px 0;
}
.boton-envio {
width: 100%;
padding: 10px;
background-color: #555555;
color: white;
border: none;
border-radius: 4px;
cursor: pointer;
}
.tabulado {
margin-left: 20px; /* Esto añade espacio antes del elemento, como un tabulador. */
.tab {
margin-left: 20px; /* Esto añade espacio antes del elemento, como un tabulador. */
}
</style>
"""
display(HTML(htmlCod))
from IPython.display import display, HTML
htmlCod = """
<style>
body {
font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif;
background: #fafafa;
margin: 0;
padding: 20px;
}
.encuesta {
max-width: 700px;
margin: auto;
padding: 20px;
background: #ffffff;
box-shadow: 0 2px 5px rgba(0,0,0,0.1);
}
.encuesta h2 {
text-align: center;
color: #333333;
}
.campo {
margin: 15px 0;
}
.campo label {
margin: 0 10px 0 0;
font-weight: bold;
}
.campo input[type="text"],
.campo textarea {
width: calc(100% - 22px);
padding: 10px;
margin-top: 5px;
border: 1px solid #dddddd;
border-radius: 4px;
}
.pregunta {
margin: 15px 0;
}
.pregunta span {
font-weight: bold;
}
.opciones label {
margin-right: 5px;
}
.opciones input[type="checkbox"] {
margin-right: 10px;
}
.comentario {
margin: 15px 0;
}
.boton-envio {
width: 100%;
padding: 10px;
background-color: #555555;
color: white;
border: none;
border-radius: 4px;
cursor: pointer;
}
.tabulado {
margin-left: 20px; /* Esto añade espacio antes del elemento, como un tabulador. */
.tab {
margin-left: 20px; /* Esto añade espacio antes del elemento, como un tabulador. */
}
</style>
"""
display(HTML(htmlCod))
CAPITULO 9
Pruebas de hipotesis
CONTENIDO
- 9.1 FORMULACION DE LAS HIPOTESIS NULA Y ALTERNATIVA
- Lahipotesis alternativa como hipotesis de investigacion
- la hipotesis nula como un supuesto para ser rebatido
- Formas para la hipotesis nula y alternativa
- 9.2 ERRORES TIPO I Y TIPO II
- 9.3 MEDIA POBLACIONAL $\sigma$ CONOCIDA
- Prueba de una cola
- Prueba de dos colas
- Resumen y consejo practico
- Relacion entre estimacion por intervalo y prueba de hipotesis
- 9.4 MEDIA POBLACIONAL $\sigma$ DESCONOCIDA
- Prueba de una cola
- Prueba de dos colas
- Resumen y consejo practico
- 9.5 PROPORCION POBLACIONAL
- Resumen
- 9.6 PRUEBA DE HIPOTESIS Y TOMA DE DECISIONES
- 9.7 CALCULO DE LA PROBABILIDAD DE LOS ERRORES TIPO II
- 9.8 DETERMINACION DEL TAMAÑO DE LA MUESTRA EN UNA PRUEBA DE HIPOTESIS PARA LA MEDIA POBLACIONAL
Ejemplo
Afirmación:
La mayor parte de los estudiantes de la carrera de informática de la UMSA tienen preferencia por laptops en lugar de computadoras de escritorio.Negación:
No todos los estudiantes de la carrera de informática de la UMSA comparte preferencia por laptops en lugar de computadoras de escritorio.9.1 Formulación de la hipótesis nula y alternativa¶
La hipótesis alternativa como hipótesis de investigación
Ejemplo
Estamos formulando una pregunta de investigación específica sobre la relación entre el tiempo de estudio y el rendimiento académico, considerando abiertamente la posibilidad de que más tiempo de estudio esté asociado con notas superiores a 75.
Si rechazamos $H_0$, no podemos concluir que la Hipótesis Nula $H_0$ —la cantidad promedio de tiempo de estudio no tiene un impacto significativo en las notas promedio de los estudiantes de estadística, y la media de las notas es igual o menor a 75 sea válida.
Este ejemplo puede aplicarse en diversas situaciones, como el rendimiento en exámenes, el tiempo de estudio y la mejora en las calificaciones.
formulando una pregunta de investigación específica sobre la relación entre el tiempo de estudio y el rendimiento académico, considerando abiertamente la posibilidad de que más tiempo de estudio esté asociado con notas superiores a 75.
Si rechazamos $H_0$, no podemos concluir que la Hipótesis Nula $H_0$ —la cantidad promedio de tiempo de estudio no tiene un impacto significativo en las notas promedio de los estudiantes de estadística, y la media de las notas es igual o menor a 75 sea válida.
Este ejemplo puede aplicarse en diversas situaciones, como el rendimiento en exámenes, el tiempo de estudio y la mejora en las calificaciones.
La hipótesis nula como un supesto para ser rebatido
Ejemplo
Si se rechaza la hipótesis nula, se infiere que la afirmación del fabricante es incorrecta, respaldando así la hipótesis alternativa. En este caso, la agencia gubernamental puede tomar medidas para garantizar el cumplimiento de los estándares de etiquetado. Sin embargo, si no se puede rechazar la hipótesis nula, no hay evidencia suficiente para cuestionar la afirmación del fabricante, y no se toma ninguna acción basada en la prueba de hipótesis. Este proceso destaca la importancia de la hipótesis nula como punto de partida para la evaluación de afirmaciones y la toma de decisiones basada en evidencia estadística.
Formas para la hipotesis nula y alternativa
$H_0: \mu \leq \mu_0$ | $H_0: \mu \geq \mu_0$ | $H_0: \mu = \mu_0$ |
---|---|---|
$H_a: \mu > \mu_0$ | $H_a: \mu < \mu_0$ | $H_a: \mu \neq \mu_0$ |
Estas formas reflejan la dirección en la que se está interesado en encontrar evidencia significativa. Si se espera que la media poblacional sea mayor que $\mu_0$, se elige la primera forma; si se espera que sea menor, se elige la segunda forma. La tercera forma se selecciona cuando el interés es determinar si hay alguna diferencia significativa, ya sea mayor o menor.
Es importante destacar que la igualdad siempre aparece en la hipótesis nula $H_0$, ya sea con el símbolo de igualdad $=$.
La elección entre estas formas depende de la pregunta que se busca responder y de la dirección de la evidencia que se espera encontrar. Si se busca respaldar la idea de que la media es mayor, menor o simplemente diferente de $\mu_0$, entonces se elige la forma correspondiente para $H_a$.
Este enfoque permite estructurar adecuadamente las pruebas de hipótesis para la media poblacional y proporciona un marco claro para interpretar los resultados. La comprensión de estas formas es esencial para evitar errores tipo I y tipo II y garantizar que las pruebas sean efectivas en la evaluación de las afirmaciones sobre la media poblacional.
Ejercicios
Métodos
Ejercicio 1
a) ¿Qué forma de hipótesis deberá usar para probar la afirmación del gerente? Explique
b) ¿Cuál es la conclusión apropiada cuando no se puede rechazar la hipótesis nula $H_0$
c) ¿Qué conclusión es adecuada cuando se puede rechazar la hipótesis nula $H_0$?
Solución
$H_a: \mu > 4,148$
Esto indica que la afirmación nula $H_0$ es que la cantidad media que gastan los huéspedes en un fin de semana es igual o menor que 4,148 bs. La hipótesis alternativa $H_a$ sería que la cantidad media es mayor de 4,148 bs.
b) Cuando no se puede rechazar la hipótesis nula $H_0$la conclusión apropiada es que no hay evidencia suficiente para afirmar que la cantidad media que gastan los huéspedes en un fin de semana es mayor que 4,148𝑏𝑠. En otras palabras, se acepta la afirmación del gerente..
c) Cuando se puede rechazar la hipótesis nula $H_0$la conclusión adecuada es que hay evidencia suficiente para afirmar que la cantidad media que gastan los huéspedes en un fin de semana es mayor que 4,148𝑏𝑠.
Ejercicio 2
El gerente de un negocio de venta de automóviles piensa en un nuevo plan de bono diseñado para incrementar el volumen de ventas. En el momento actual, el volumen medio de ventas es 14 automóviles por mes. El gerente desea realizar un estudio para ver si el plan de bono incrementa el volumen de ventas. Para recolectar los datos, se le permitirá a una muestra de vendedores vender bajo el nuevo plan de bono durante un mes.
a) Desarrolle las hipótesis nula y alternativa más adecuadas para esta situación.
b) Comente la conclusión en caso de que no pueda rechazarse $H_0$.
c) Comente la conclusión en caso de que pueda rechazarse $H_0$
Solución
$H_a: \mu > 14$
Esto indica que la afirmación nula $H_0$ es que la cantidad media que gastan los huéspedes en un fin de semana es igual o mayor que 600. La hipótesis alternativa $H_a$ sería que la cantidad media es menor de 600, que es la afirmación del gerente.
b) No hay evidencia de que el nuevo plan incremente las ventas
c) La hipótesis de investigación $μ 14$ es apoyada, el nuevo plan incrementa las ventas
Ejercicio 3
Una operación de la línea de producción está diseñada para llenar cajas con un peso medio de 32 onzas de detergente para lavar. Con periodicidad se selecciona una muestra de los empaques y se pesan para determinar si se están llenando de manera insuficiente o en demasía. Si los datos muestrales llevan a la conclusión de que hay llenado insuficiente o excesivo, la producción se suspende y se ajusta al llenado correcto.
a) Formule las hipótesis nula y alternativa que ayudarán a determinar si se debe detener la producción y ajustar el peso.
b) Comente sobre la conclusión y la decisión en caso de que $H_0$ no se pueda rechazar.
c) Comente acerca de la conclusión y la decisión en caso de que $H_0$ se pueda rechazar.$
Solución
a) Formulación de hipótesis:
Hipótesis nula ($H_0$): El peso medio de las cajas de detergente es igual a 32 onzas.
Hipótesis alternativa $H_a$ El peso medio de las cajas de detergente no es igual a 32 onzas (puede ser menor o mayor).
$H_a: \mu \neq 32 $
b) Conclusión y decisión si $H_0$ no se puede rechazar:
c) Conclusión y decisión si $H_0$ se puede rechazar:
Ejercicio 4
a) Formule las hipótesis nula y alternativa más adecuadas para este estudio.
b) Comente acerca de la conclusión cuando $H_0$ no pueda rechazarse.
c) Comente acerca de la conclusión cuando $H_0$ pueda rechazarse.$
Solución
Hipótesis alternativa $H_a$ El costo medio del nuevo método de producción es diferente al costo medio del método actual.
$H_a: \mu \neq 220$
b) Si no se puede rechazar $H_0$, se concluye que no hay suficiente evidencia para afirmar que el costo medio del nuevo método es diferente al del método actual. En este caso, no se tendría base estadística para convencer a la dirección de que el nuevo método reducirá los costos..
c) Si se puede rechazar $H_0$, se concluye que hay evidencia estadística para afirmar que el costo medio del nuevo método es diferente al del método actual. En este caso, el director de fabricación podría utilizar estos resultados como base para convencer a la dirección de que el nuevo método reducirá los costos.
9.2 Errores tipo I y tipo II¶
Las hipótesis nula y alternativa son afirmaciones opuestas acerca de la población. Una de las dos, ya sea la hipótesis nula $H_0$ o la alternativa $H_a$, es verdadera, pero no ambas. Lo ideal es que la prueba de hipótesis lleve a la aceptación de $H_0$ cuando sea verdadera y a su rechazo en $H_a$ sea verdadera,sin enbargo debe considerarse que existe la posibilidad de un error.
Condicion poblacional
Tabla 1
Errores y conclusiones correctas en las pruebas de hipotesis
$H_0$ es aceptada | $H_a$ verdadera | |
---|---|---|
$H_0$ es rechazada | Conclusion correcta | Error tipo II |
$H_0 es rechazada | Error tipo I | Conclusion correcta |
En la figura, se representa gráficamente qué sucede cuando se acepta o se rechaza $H_0$. Si $H_0$es aceptada y es verdadera, la conclusión es correcta. Pero si $H_a$ es verdadera, se comete un Error Tipo II al aceptar incorrectamente $H_0$. Si $H_0$ es rechazada y es verdadera, se comete un Error Tipo I, pero si Ha es verdadera, es correcto rechazar $H_0$.
NIVEL DE SIGNIFICANCIA
Consiste en comter un Error de tipo I cuando $H_0$ es verdadera como igualdad
La probabilidad de cometer el Error Tipo I se controla con el nivel de significancia (α), que es la probabilidad de rechazar $H_0$ cuando es verdadera. Elegir un α más pequeño reduce la probabilidad de este error, pero aumenta la probabilidad de cometer el Error Tipo II.
Video: Error de tipo I y tipo II
# importar la clase que permite ver videos
from IPython.display import YouTubeVideo
# crear una instancia del objeto YouTubeVideo
youtube_video=YouTubeVideo('dtXMIQp2n5U')
#mostrar el video de youtube
display(youtube_video)
Ejercicios
Ejercicio 5
Nielsen informó que los hombres jóvenes estadounidenses ven diariamente 56.2 minutos de televisión en las horas de mayor audiencia (The Wall Street Journal Europe, 18 de noviembre de 2003). Un investigador cree que en Alemania los jóvenes ven más tiempo la televisión en las horas de mayor audiencia. Este investigador toma una muestra de hombres jóvenes alemanes y registra el tiempo que ven televisión en un día. Los resultados muestrales se usan para probar las siguientes hipótesis nula y alternativa.
$H_a: \mu > 56.2$
a) ¿Cuál es el error tipo I en esta situación? ¿Qué consecuencia tiene cometerlo?
b) ¿Cuál es el error tipo II en esta situación? ¿Qué consecuencia tiene cometerlo?
Solución
Definición:Rechazar incorrectamente la hipótesis nula $H_0$cuando es verdadera.
Consecuencia: Concluir que los jóvenes alemanes ven más tiempo la televisión en las horas de mayor audiencia cuando, de hecho, no hay evidencia suficiente para respaldar esta afirmación. Puede llevar a tomar decisiones o implementar cambios basados en información incorrecta.
b) Definición: No rechazar la hipótesis nula $H_0$cuando es falsa.
Consecuencia: No reconocer que los jóvenes alemanes ven más tiempo la televisión en las horas de mayor audiencia cuando, de hecho, hay evidencia para respaldar esta afirmación. Puede llevar a perder la oportunidad de tomar decisiones informadas o implementar cambios necesarios.
Ejercicio 6
En la etiqueta de una botella de jugo de naranja de 3 cuartos de galón se afirma que el jugo contiene en promedio 1 gramo o menos de grasa. Responda las preguntas siguientes relacionadas con una prueba de hipótesis para probar lo que se asegura en la etiqueta.
a) Desarrolle las hipótesis nula y alternativa adecuadas.
b) ¿Cuál es el error tipo I en esta situación? ¿Qué consecuencias tiene cometerlo?
c) ¿Cuál es el error tipo II en esta situación? ¿Qué consecuencias tiene cometerlo?
Solución
$H_a: \mu > 1$
$H_0$: La afirmación en la etiqueta es verdadera; el jugo de naranja tiene 1 gramo o menos de grasa en promedio.
$H_a$: La afirmación en la etiqueta es falsa; el jugo de naranja tiene más de 1 gramo de grasa en promedio.
b) Error Tipo I: Definición: Rechazar incorrectamente la hipótesis nula$H_0$ cuando es verdadera.
Consecuencia: Concluir que el jugo de naranja tiene más de 1 gramo de grasa en promedio cuando, de hecho, la afirmación en la etiqueta es correcta. Esto podría llevar a decisiones incorrectas sobre la producción, marketing u otras áreas basadas en información incorrecta.
c) Error Tipo II: Definición: No rechazar la hipótesis nula $H_0$cuando es falsa.
Consecuencia: No reconocer que el jugo de naranja tiene más de 1 gramo de grasa en promedio cuando, de hecho, la afirmación en la etiqueta es falsa. Esto podría llevar a que el producto se comercialice como bajo en grasa cuando no lo es, lo que podría afectar la confianza del consumidor y la reputación del producto.
Ejercicio 7
El personal de ventas de Carpetland tiene un promedio de $8 000 semanales en ventas. Steve Contois, vicepresidente de la empresa, propone un plan de compensación con nuevos incentivos. Steve espera que los resultados de un periodo de prueba permitirán concluir que el plan de compensación aumenta el promedio de ventas de los vendedores.
a) Establezca las hipótesis nula y alternativa adecuadas.
b) ¿Cuál es el error tipo I en esta situación? ¿Qué consecuencias tiene cometerlo?.
c) ¿Cuál es el error tipo II en esta situación? ¿Qué consecuencias tiene cometerlo?
Solución
$H_a: \mu > 8,000$
$H_0$: El plan no aumenta el promedio de ventas.
$H_a$: El plan aumenta el promedio de ventas.
b) Rechazar incorrectamente $H_0$cuando es cierta. Consecuencia: Implementar un plan que no mejora las ventas, con costos innecesarios.
c)No rechazar$H_0$ cuando $H_a$ es cierta. Consecuencia: Perder la oportunidad de implementar un plan beneficioso que aumenta las ventas.
9.3 Medida Poblacional: σ conocida¶
En esta sección se muestra cómo realizar una prueba de hipótesis para la media poblacional en el caso en que σ es conocida.
Los métodos que se presentan dan resultados exactos si la población de la que se selecciona la muestra tiene distribución normal. En los casos en los que no sea razonable suponer que la población tiene esta distribución, se pueden aplicar estos métodos siempre y cuando el tamaño de la muestra sea suficientemente grande.
Prueba de una cola
Prueba de cola inferior (o izquierda) | Prueba de cola superior (o derecha) |
---|---|
$$H_0: μ ≥ μ_0$$ | $$H_0: μ ≤ μ_0$$ |
$$H_a: μ < μ_0$$ | $$H_a: μ > μ_0$$ |
A continuación se presenta un ejemplo de una prueba para la cola inferior:
El Instituto Boliviano de Regulación Comercial (IBRC) realiza estudios para verificar afirmaciones de fabricantes sobre productos, como el peso de café en latas de "Café Sierra".
La hipótesis nula ($H_0$) establece que la media poblacional del peso de llenado es al menos 3 libras por lata: $H_0: μ ≥ 3$
La hipótesis alternativa ($H_a$) sugiere que la media es menor de 3 libras: $H_0: μ < 3$
Se utiliza un nivel de significancia ($α = 0.01$). En el caso de "Café Sierra", si los datos no rechazan $H_0$, no se toman medidas; de lo contrario, se concluye que $H_a$ es verdadera, lo que justificaría un cargo por violación en la etiqueta. El director de pruebas de la IBRC está dispuesto a asumir un riesgo del 1% de cometer un error tipo I.
Se selecciona una muestra de 36 latas y se calcula la media muestral $x$ como una estimación de la media poblacional $μ$. Si $x$ es menor de 3 libras, se cuestiona la hipótesis nula. El factor clave es el valor de $α$, la probabilidad de cometer un error tipo I. Con los pasos iniciales completados, el siguiente paso es recopilar datos muestrales y calcular el estadístico de prueba para tomar una decisión basada en la evidencia estadística.
Estadístico de prueba
En el estudio de "Café Sierra", se realizan pruebas de hipótesis para la media poblacional ($μ$) en el caso de que la desviación estándar poblacional ($σ$) sea conocida. Los resultados previos de la IBRC indican que $σ$ tiene un valor de 0.18 y que la distribución de los pesos de llenado en la población sigue una distribución normal.
Con un tamaño de muestra $n = 36$ y asumiendo la hipótesis nula $H_0$ como verdadera $μ = μ_0 = 3$, se puede ilustrar la distribución de muestreo de la media muestral $\bar{x}$ en una distribución normal. El error estándar de $\bar{x}(σ_\bar{x})$ se calcula como $\frac{\sigma}{\sqrt{n}} = \frac{0.18}{\sqrt{36}} = 0.03 $
La variable aleatoria normal estándar:
$z =\frac{\bar{x} - \mu_0}{\sigma_{\bar{x}}} = \frac{\bar{x} - 3}{0.03}$
La probabilidad asociada a un valor específico de $z$ en la cola inferior se determina utilizando la tabla de probabilidad normal estándar.
Por ejemplo, si $z=-3.00$, el área en la cola inferior es $0.0013$, lo que significa que la probabilidad de obtener un valor de $\bar{x}$ que sea tres o más errores estándar menor que la media hipotética ($\mu_0=3$) es $0.0013$. En una prueba de hipótesis, un resultado tan extremo sugiere que la hipótesis nula es poco probable, lo que podría llevar al rechazo de la hipótesis nula en favor de la hipótesis alternativa. El estadístico de prueba utilizado es $z$, y se compara con un umbral crítico basado en el nivel de significancia predefinido ($α$).
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Parámetros de la distribución muestral
media_poblacional = 3
error_estandar = 0.03
# Generar datos de la distribución muestral
x = np.linspace(media_poblacional - 4 * error_estandar, media_poblacional + 4 * error_estandar, 1000)
y = norm.pdf(x, media_poblacional, error_estandar)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
ax.set_xlabel(f'μ = {media_poblacional}', fontsize=12)
ax.set_ylabel(r'Distribución de muestreo de $\bar{x}$', fontsize=12)
# Agregar información sobre el error estándar
info_error_estandar = r'$σ_\bar{x}$ = $\frac{\sigma}{\sqrt{n}} = \frac{0.18}{\sqrt{36}} = 0.03 $'
ax.text(0.6, 0.85, info_error_estandar, transform=ax.transAxes, fontsize=12, color='#000')
ax.grid(False)
plt.show()
La cuestión clave en una prueba de cola inferior es: ¿qué tan pequeño debe ser el estadístico de prueba z para que se decida rechazar la hipótesis nula? Para responder esta pregunta se usandos métodos: el método del valor-p y el método del valor crítico.
Método del valor-p
En este enfoque se usa el valor del estadístico de prueba $z$ paracalcular una probabilidad llamada valor-p.
VALOR-p: Es una probabilidad que aporta una medida de la evidenciasuministrada por la muestra contra la hipótesis nula. Valores-p pequeños indican una evidencia mayor contra $H_0$.
El cálculo del valor-p depende del tipo de prueba (cola inferior, cola superior o dos colas). Para una prueba de cola inferior con $σ$ conocida, se determina el área bajo la curva normal estándar para valores de $z ≤$ al valor del estadístico de prueba.
Ahora calculamos el valor-p para la prueba de cola inferior del estudio de "Café Sierra".Suponga que en la muestra de las 36 latas de café, la media muestral obtenida es $\bar{x} = 2.92$ libras. ¿Es $\bar{x} = 2.92$ lo suficientemente pequeña para que se rechace $H_0$? Como es una prueba de cola inferior, el valor-p es el área bajo la curva normal estándar para valores de $z$ que el valor del estadístico de prueba. Al usar $\bar{x} = 2.92$, $σ = 0.18$ y $n = 36$, se determina el valor del estadístico de prueba z.
$$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}} = \frac{{2.92 - 3}}{{\frac{0.18}{\sqrt{36}}}} = -2.67$$
Por consiguiente, el valor-p es la probabilidad de que el estadístico de prueba $z$ sea menor o igual que $-2.67$(el área bajo la curva normal estándar a la izquierda del estadístico de prueba).
Como se indicó antes, el director del programa de pruebas de la IBRC eligió como nivel de significancia un valor de 0.01. Seleccionar $α = 0.01$ significa que él está dispuesto a tolerar una probabilidad de 0.01 para rechazar la hipótesis nula cuando sea verdadera como igualdad ($μ_0 = 3$). La muestra de 36 latas de "Café Sierra" dio como resultado un $valor-p = 0.0038$, lo cual significa que la probabilidad de obtener $\bar{x} = 2.92$ o menor, si la hipótesis nula considerada como igualdad es verdadera, es 0.0038. Como 0.0038 es menor o igual que $α = 0.01$, $H_0$ es rechazada. De manera que para el nivel de significancia 0.01 se encontró evidencia estadística suficiente para rechazar la hipótesis nula.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
from scipy.stats import t
#GRAFICO1
# Generar datos de la distribución muestral
x = np.linspace(0 - 4 * 1, 0 + 4 * 1, 1000)
y = norm.pdf(x*3, 0, 4)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
ax.set_xlabel(f'$μ_0$ = 3', fontsize=12)
# Agregar información sobre el error estándar
info_error_estandar = r'$σ_\bar{x}$ = $\frac{\sigma}{\sqrt{n}} = 0.03 $'
ax.text(0.6, 0.88, info_error_estandar, transform=ax.transAxes, fontsize=13, color='#000')
ax.text(-0.03, -0.15, r'$\bar{x} = 2.92$',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.02, 0.85, r'Distribución de muestreo',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.17, 0.77, r'de $\bar{x}$',transform=ax.transAxes, fontsize=12, color='#000')
# Línea vertical
ax.axvline(t.ppf(0.005, 47), color='#009929', linestyle='--', label=r'$t_{\alpha/2}$')
# Sombrear la parte de -2.67 hacia la izquierda
ax.fill_between(x, y, where=(x <= -2.67), color='#009929', alpha=0.5)
ax.grid(False)
plt.show()
#GRAFICO2
# Generar datos de la distribución muestral
x = np.linspace(0 - 4 * 1, 0 + 4 * 1, 1000)
y = norm.pdf(x*3, 0, 4)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
# Agregar información sobre el error estándar
ax.text(0.58, 0.85, r'Distribución de muestreo de',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.69, 0.72, r'$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}}$',transform=ax.transAxes, fontsize=14, color='#000')
ax.text(0.23, 0.07, r'valor-p = 0.0038',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.08, -0.15, r'z = -2.67',transform=ax.transAxes, fontsize=12, color='#000')
# Línea vertical
ax.axvline(t.ppf(0.005, 47), color='#009929', linestyle='--', label=r'$t_{\alpha/2}$')
# Sombrear la parte de -2.67 hacia la izquierda
ax.fill_between(x, y, where=(x <= -2.67), color='#009929', alpha=0.5)
ax.grid(False)
plt.show()
Ahora se puede establecer ya la regla general para determinar cuándo rechazar la hipótesis nula al usar el método del valor-p. Dado un nivel de significancia $α$, la regla para el rechazo utilizando el método del valor-p es la siguiente.
En la prueba para "Café Sierra", el valor-p de 0.0038 condujo al rechazo de la hipótesis nula. Aunque la decisión de rechazar se basó en comparar el valor-p con el nivel de significancia especificado por el director de la IBRC, el valor-p observado de 0.0038 sugiere que $H_0$ habría sido rechazada para cualquier valor de $α ≥ 0.0038$. Por esta razón, el valor-p también se conoce como nivel de significancia observado.
Método del valor crítico
El valor crítico es el valor del estadístico de prueba que corresponde a un área de α (nivel de significancia) en la cola inferior de la distribución de muestreo del estadístico.
En el ejemplo de "Café Sierra", se ilustra el funcionamiento del método del valor crítico. En situaciones donde se conoce la desviación estándar $σ$, la distribución de muestreo del estadístico de prueba $z$ es la distribución normal estándar. El valor crítico es aquel que corresponde a un área de $α = 0.01$ en la cola inferior de esta distribución.
Consultando la tabla de probabilidad normal estándar, se observa que $z ≤ −2.33$ proporciona un área de 0.01 en la cola inferior (ver figura 9.3). Por lo tanto, si el valor del estadístico de prueba obtenido con la muestra es menor o igual a −2.33, el valor-p correspondiente será menor o igual a 0.01, lo que lleva al rechazo de la hipótesis nula. Entonces, en el estudio de "Café Sierra" la regla para el rechazo usando el valor crítico para un nivel de significancia de 0.01 es:
En nuestro ejemplo, $\bar{x} = 2.92$ y el estadístico de prueba es $z = -2.67$. Como $z = -2.67 < -2.33$, $H_0$ puede ser rechazada y concluir que "Café Sierra" está llenando las latas de manera deficiente.
Video:Prueba de hipotesis Valor-P
# importar la clase que permite ver videos
from IPython.display import YouTubeVideo
# crear una instancia del objeto YouTubeVideo
youtube_video=YouTubeVideo('aaJndWRoWWo')
#mostrar el video de youtube
display(youtube_video)
Video:Prueba de hipotesis Valor Critico
# importar la clase que permite ver videos
from IPython.display import YouTubeVideo
# crear una instancia del objeto YouTubeVideo
youtube_video=YouTubeVideo('FJHh-l7OMT0')
#mostrar el video de youtube
display(youtube_video)
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Generar datos de la distribución muestral
x = np.linspace(0 - 4 * 1, 0 + 4 * 1, 1000)
y = norm.pdf(x*3, 0, 4)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
# Agregar información sobre el error estándar
ax.text(0.02, 0.85, r'Distribución de muestreo de',transform=ax.transAxes, fontsize=9, color='#000')
ax.text(0.13, 0.72, r'$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}}$',transform=ax.transAxes, fontsize=15, color='#000')
ax.text(0.02, 0.15, r'α = 0.01',transform=ax.transAxes, fontsize=13, color='#000')
ax.text(0.15, -0.15, r'z = -2.33',transform=ax.transAxes, fontsize=10, color='#000')
# Sombrear la parte de -2.33 hacia la izquierda
ax.fill_between(x, y, where=(x <= -2.33), color='#009929', alpha=0.5)
ax.grid(False)
plt.show()
La regla de rechazo se puede generalizar empleando el método del valor crítico para cualquier nivel de significancia. La regla de rechazo en una prueba de cola inferior es la siguiente:
El estudio de "Café Sierra" sirvió para ilustrar cómo realizar una prueba de cola inferior. El mismo método general se usa para realizar una prueba de cola superior.
Utilizando el método del valor crítico, la hipótesis nula es rechazada si el valor del estadístico de prueba es mayor o igual al valor crítico $z_α$; en otras palabras, $H_0$ es rechazada si $z ≥ z_α$.
Para abardor mejor el punto de "PRUEBA DE UNA COLA" se puede observar el siguiente video, para un mejor entendimiento.
# importar la clase que permite ver videos
from IPython.display import YouTubeVideo
# crear una instancia del objeto YouTubeVideo
youtube_video=YouTubeVideo('UNnQewoA8C0')
#mostrar el video de youtube
display(youtube_video)
Prueba de dos colas
En las pruebas de hipótesis, la forma general de una prueba de dos colas es la siguiente:
$$H_0: μ = μ_0$$ | $$H_a: μ \neq μ_0$$ |
Consideremos el caso de una prueba de hipótesis en la empresa "BoliviaGolfCrafters".
La Federación Boliviana de Golf (FBG) establece estándares para los fabricantes de equipos de golf, y "BoliviaGolfCrafters", una empresa de fabricación de pelotas de golf, utiliza procesos de alta tecnología. La distancia media de recorrido objetivo es 295 yardas, pero el proceso puede desajustarse, produciendo pelotas con distancias diferentes. "BoliviaGolfCrafters" implementa un programa de control de calidad que implica pruebas de hipótesis con muestras de 50 pelotas. La hipótesis nula asume que el proceso está funcionando correctamente, con una distancia media de 295 yardas, mientras que la hipótesis alternativa sugiere que la distancia media no es igual a 295 yardas. Estas hipótesis se expresan como:
Este enfoque permite a "BoliviaGolfCrafters" monitorear y ajustar su proceso de fabricación para cumplir con los estándares de la FBG y satisfacer las expectativas de los clientes.
Si la media muestral $\bar{x}$ es significativamente menor o significativamente mayor que 295 yardas, $H_0$ será rechazada. En este caso, se tomarán medidas para ajustar el proceso de manufactura. Por otro lado, si $x$ no se desvía una cantidad significativa de la media hipotética $μ_0 = 295$, $H_0$ no será rechazada, y no se tomará medida alguna para ajustar el proceso de manufactura.
El equipo de control de calidad elige $α = 0.05$ como nivel de significancia para esta prueba. Datos de pruebas anteriores realizadas sabiendo que el proceso está ajustado, indican que se puede suponer que la desviación estándar poblacional se conoce y que su valor es $σ = 12$. Por ende, con un tamaño de muestra $n = 50$, el error estándar $\bar{x}$ es:
$σ_\bar{x} = \frac{\sigma}{\sqrt{n}} = \frac{12}{\sqrt{50}} = 1.7 $
Como el tamaño de la muestra es grande, el teorema del límite central (capítulo 7) permite concluir que la distribución de muestreo de $\bar{x}$ puede aproximarse mediante una distribución normal. En la (figura 9.4) se ilustra la distribución de muestreo de $\bar{x}$ para la prueba de hipótesis de "BoliviaGolfCrafters" con una media poblacional hipotética de $μ_0 = 295$.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Parámetros de la distribución muestral
media_poblacional = 295
error_estandar = 1.7
# Generar datos de la distribución muestral
x = np.linspace(media_poblacional - 4 * error_estandar, media_poblacional + 4 * error_estandar, 1000)
y = norm.pdf(x, media_poblacional, error_estandar)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
ax.set_xlabel(f'$μ_0$ = {media_poblacional}', fontsize=12)
# Agregar información sobre el error estándar
info_error_estandar = r'$σ_\bar{x}$ = $\frac{\sigma}{\sqrt{n}} = \frac{12}{\sqrt{50}} = 1.7$'
ax.text(0.63, 0.85, info_error_estandar, transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.02, 0.85, r'Distribución de muestreo',transform=ax.transAxes, fontsize=11, color='#000')
ax.text(0.17, 0.77, r'de $\bar{x}$',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.50, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#000')
ax.grid(False)
plt.show()
Método del valor-p
A continuación veremos cómo se calcula el valor-p en la prueba de hipótesis de "BoliviaGolfCrafters". Primero calculamos el valor del estadístico de prueba. En el caso en que se conoce $σ$, el estadístico de prueba $z$ es la variable aleatoria normal estándar. Empleando la ecuación ya conocida con $\bar{x} = 297.6$, el valor del estadístico de prueba es:
$$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}} = \frac{{297.6 - 295}}{{\frac{12}{\sqrt{50}}}} = 1.53$$
En el cálculo del valor-p para la prueba de hipótesis de dos colas en "BoliviaGolfCrafters", se busca la probabilidad de obtener un valor tan improbable como $z = 1.53$. Dado que es una prueba de dos colas, se consideran tanto los valores $z ≥ 1.53$ como $z ≤ −1.53$. La probabilidad se calcula duplicando el área bajo la curva normal estándar a la derecha de $z = 1.53$. Para $z = 1.53$, el área a la izquierda es $0.9370$, y el área a la derecha es $1.0000 - 0.9370 = 0.0630$. Al duplicar este valor, se obtiene $2(0.0630) = 0.1260$ como el valor-p.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Generar datos de la distribución muestral
x = np.linspace(0 - 1 * 2, 0 + 1 * 2, 1000)
y = norm.pdf(x*3, 0, 2)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
ax.set_xlabel(f'$valor-p = 2(0.0630) = 0.1260$', fontsize=10)
# Agregar información sobre el error estándar
ax.text(0.02, 0.15, r'P(z ≤ -1.53) = 0.0630',transform=ax.transAxes, fontsize=9, color='#000')
ax.text(0.76, 0.15, r'P(z ≥ 1.53) = 0.0630',transform=ax.transAxes, fontsize=9, color='#000')
ax.text(0.06, -0.15, r'-1.53',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.86, -0.15, r'1.53',transform=ax.transAxes, fontsize=12, color='#000')
# Sombrear la parte de -1.53 hacia la izquierda
ax.fill_between(x, y, where=(x <= -1.53), color='#009929', alpha=0.5)
# Sombrear la parte de 1.53 hacia la derecha
ax.fill_between(x, y, where=(x >= 1.53), color='#009929', alpha=0.5)
ax.grid(False)
plt.show()
Al comparar el valor-p con el nivel de significancia $α = 0.05$, se encuentra que $0.1260 > 0.05$. Por lo tanto, la hipótesis nula no es rechazada, indicando que no se necesitan medidas para ajustar el proceso de manufactura de "BoliviaGolfCrafters", ya que la distancia media de recorrido no difiere significativamente de $295$ yardas según la muestra analizada.
- Determine el valor del estadístico de prueba $z$.
- Si el valor del estadístico de prueba está en la cola superior ($z > 0$), encuentre el área bajo la curva normal estándar a la derecha de $z$; si está en la cola inferior ($z < 0$), localice el área bajo la curva normal estándar a la izquierda de $z$.
- Duplique el área, o probabilidad, en la cola, obtenida en el paso 2 y determine el valor-p.
Método del valor crítico
En la figura 9.6 se aprecia que los valores críticos en esta prueba se encuentran tanto en la cola superior como en la cola inferior de la distribución normal estándar. Si el nivel de significancia es $α = 0.05$, en cada cola, el área más allá del valor crítico es $α/2 = 0.05/2 = 0.025$. En la tabla de probabilidad normal estándar se encuentra que los valores críticos para el estadístico de prueba son $-z_0.025 = -1.96$ y $z_0.025 = 1.96. Entonces, al utilizar el método del valor crítico, la regla de rechazo para dos colas es:
Como en el estudio de MaxFlight el valor del estadístico de prueba es $z = 1.53$, la evidenciaestadística no permitirá rechazar la hipótesis nula a un nivel de signifi cancia de $0.05$.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Generar datos de la distribución muestral
x = np.linspace(0 - 3 * 1, 0 + 3 * 1, 1000)
y = norm.pdf(x*3, 0, 3)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
ax.set_xlabel(f'<-----| Rechazar $H_0$ |----->', fontsize=10)
# Agregar información sobre el error estándar
ax.text(0.02, 0.20, r'Área = 0.025',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.80, 0.20, r'Área = 0.025',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.15, -0.15, r'-1.96',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.76, -0.15, r'1.96',transform=ax.transAxes, fontsize=12, color='#000')
# Sombrear la parte de -1.96 hacia la izquierda
ax.fill_between(x, y, where=(x <= -1.96), color='#009929', alpha=0.5)
# Sombrear la parte de 1.96 hacia la derecha
ax.fill_between(x, y, where=(x >= 1.96), color='#009929', alpha=0.5)
ax.grid(False)
plt.show()
Para abardor mejor el punto de "PRUEBA DE DOS COLAS" se puede observar el siguiente video, para un mejor entendimiento.
Video: Prueba de hipótesis de 2 colas para la media (P-Valor)
# importar la clase que permite ver videos
from IPython.display import YouTubeVideo
# crear una instancia del objeto YouTubeVideo
youtube_video=YouTubeVideo('qusDCMZiUms')
#mostrar el video de youtube
display(youtube_video)
Video: Prueba de hipótesis de 2 colas para la media (valor crítico)
# importar la clase que permite ver videos
from IPython.display import YouTubeVideo
# crear una instancia del objeto YouTubeVideo
youtube_video=YouTubeVideo('HfFCuRK3H94')
#mostrar el video de youtube
display(youtube_video)
<span ><h2 style="color:#009929"> Video: Prueba de hipótesis de una media con Z </h2></span>
Video: Prueba de hipótesis de una media con Z
# importar la clase que permite ver videos
from IPython.display import YouTubeVideo
# crear una instancia del objeto YouTubeVideo
youtube_video=YouTubeVideo('MKHjW6gG3SY')
#mostrar el video de youtube
display(youtube_video)
Prueba de cola inferior | Prueba de cola superior | Prueba de dos colas | |
---|---|---|---|
Hipótesis | $$H_0: μ ≥ μ_0$$ $$H_a: μ < μ_0$$ | $$H_0: μ ≤ μ_0$$ $$H_a: μ > μ_0$$ | $$H_0: μ = μ_0$$ $$H_a: μ \ne μ_0$$ |
Estadístico de prueba | $$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}}$$ | $$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}}$$ | $$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}}$$ |
Regla de rechazo: Método del valor-p | Rechazar $H_0$ si el valor-p $≤ α$ | Rechazar $H_0$ si el valor-p $≤ α$ | Rechazar $H_0$ si el valor-p $≤ α$ |
Regla de rechazo: Método del valor crítico | Rechazar $H_0$ si $z ≤ -z_α$ | Rechazar $H_0$ si $z ≥ z_α$ | Rechazar $H_0$ si $z ≤ -z_{α/2}$ o si $z ≥ z_{α/2}$ |
En el siguiente código se muestra un video para ayudar a entender mejor el tema, haciendo un repaso de todo lo avanzado.
Ejercicios
Para la parte de ejercicios, primeramente observaremos algunos videos y posteriormente se resolvera los ejercicios planteados.
# importar la clase que permite ver videos
from IPython.display import YouTubeVideo
# crear una instancia del objeto YouTubeVideo
youtube_video=YouTubeVideo('03utL7myA3g')
#mostrar el video de youtube
display(youtube_video)
# importar la clase que permite ver videos
from IPython.display import YouTubeVideo
# crear una instancia del objeto YouTubeVideo
youtube_video=YouTubeVideo('V036IS_sga0')
#mostrar el video de youtube
display(youtube_video)
Ejercicio 1
a) Calcule el valor del estadístico de prueba.
b) ¿Cuál es el valor-p?
c) Use $α = 0.01$, ¿cuál es su conclusión?
d) ¿Cuál es la regla de rechazo si se usa el método del valor crítico? ¿Qué concluye?
$Datos:$
$n =40$
$\bar{x} = 26.4$
$σ = 6$
$σ_\bar{x} = \frac{σ}{\sqrt{n}}$
Inciso a)
$$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}} = \frac{{{26.4} - 25}}{{\frac{6}{\sqrt{40}}}} = 1.48$$
Inciso b)
Se busca el valor de $z = 1.48$ en la tabla normal, entonces:
Inciso c)
La regla me dice que se debe rechazar $H_0$ si el $valor-p ≤ α$, por lo cual tenemos que como el valor-p es mayor que $α$ (0.01) se acepta la hipótesis nula.
Inciso d)
El método del valor critico me dice que debo rechazar $H_0$ si $z ≥ 2.33$, por lo que tenemos que utilizando el valor de $z$ se acepta la hipótesis nula, ya que $1.48 < 2.33$
Ejercicio en código
import math
# Datos
n = 40 # Tamaño de la muestra
x_bar = 26.4 # Media muestral
sigma = 6 # Desviación estándar poblacional
# Estadístico de prueba
mu_0 = 25 # Valor de la hipótesis nula
se = sigma / (n ** 0.5) # Error estándar de la media
z = (x_bar - mu_0) / se # Cálculo del estadístico de prueba (z)
print("Estadístico de prueba (z):", round(z, 2))
# Valor-p
#p_value = 1 - stats.norm.cdf(z) # Cálculo del valor-p utilizando la función cdf() de la distribución normal estándar
p_value = 1 - 0.9306 # Cálculo del valor-p utilizando la función cdf() de la distribución normal estándar
print("Valor-p:", round(p_value, 4))
# Conclusión
alpha = 0.01 # Nivel de significancia
if p_value <= alpha:
print("Se rechaza la hipótesis nula (H0)")
else:
print("Se acepta la hipótesis nula (H0)")
Estadístico de prueba (z): 1.48 Valor-p: 0.0694 Se acepta la hipótesis nula (H0)
Ejercicio 2
a) $\bar{x} = 78.5$
b) $\bar{x} = 77$
c) $\bar{x} = 75.5$
d) $\bar{x} = 81$
$Datos:$
$n = 100$
$σ = 12$
$σ_\bar{x} = \frac{σ}{\sqrt{n}}$
Inciso a)
$$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}} = \frac{{{78.5} - 80}}{{\frac{12}{\sqrt{100}}}} = -1.25$$
Inciso b)
$$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}} = \frac{{{77} - 80}}{{\frac{12}{\sqrt{100}}}} = -2.50$$
Inciso c)
$$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}} = \frac{{{75.5} - 80}}{{\frac{12}{\sqrt{100}}}} = -3.75$$
Inciso d)
$$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}} = \frac{{{81} - 80}}{{\frac{12}{\sqrt{100}}}} = 0.83$$
Ejercicio en código
import math
# Datos
n = 100
sigma = 12
mu_0 = 80
# Cálculo de sigma_x
sigma_x = sigma / math.sqrt(n)
# Inciso a)
x_a = 78.5
z_a = (x_a - mu_0) / sigma_x
print("Inciso a)")
print("z =", z_a)
if z_a >= -2.33: # Valor crítico para alpha = 0.01 (una cola)
print("∴ H0 no es rechazada.")
else:
print("∴ H0 es rechazada.")
# Inciso b)
x_b = 78.5
z_b = (x_b - mu_0) / sigma_x
print("Inciso b)")
print("z =", z_b)
if z_b >= -2.33: # Valor crítico para alpha = 0.01 (una cola)
print("∴ H0 no es rechazada.")
else:
print("∴ H0 es rechazada.")
# Inciso c)
x_c = 75.5
z_c = (x_c - mu_0) / sigma_x
print("Inciso c)")
print("z =", z_c)
if z_c >= -2.33: # Valor crítico para alpha = 0.01 (una cola)
print("∴ H0 no es rechazada.")
else:
print("∴ H0 es rechazada.")
# Inciso d)
x_d = 81
z_d = (x_d - mu_0) / sigma_x
print("Inciso d)")
print("z =", z_d)
if z_d >= -2.33: # Valor crítico para alpha = 0.01 (una cola)
print("∴ H0 no es rechazada.")
else:
print("∴ H0 es rechazada.")
Inciso a) z = -1.25 ∴ H0 no es rechazada. Inciso b) z = -1.25 ∴ H0 no es rechazada. Inciso c) z = -3.75 ∴ H0 es rechazada. Inciso d) z = 0.8333333333333334 ∴ H0 no es rechazada.
Ejercicio 3
Inciso a)
Inciso b)
$Datos:$
$n = 400$
$\bar{x} = Bs. 910$
$σ = Bs. 1600$
$σ_\bar{x} = \frac{σ}{\sqrt{n}}$
$$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}} = \frac{{{910} - 1056}}{{\frac{1600}{\sqrt{400}}}} = -1.83$$
Se busca el valor de $z = -1.83$ en la tabla normal, entonces:
Inciso c)
La regla me dice que se debe rechazar $H_0$ si el $valor-p ≤ α$, por lo cual tenemos que como el valor-p es menor que $α$ (0.05) se rechaza $H_0$, el reembolso medio de los contribuyentes de "última hora" es menor de $Bs. 1056$ .
Inciso d)
Ejercicio en código
import math
from scipy.stats import norm
# Datos del ejercicio
n = 400
x_barra = 910
sigma = 1600
mu_0 = 1056
# Cálculo del error estándar de la media muestral
sigma_x_barra = sigma / math.sqrt(n)
# Inciso a)
z_a = (x_barra - mu_0) / sigma_x_barra
print("Inciso a)")
print("z =", z_a)
if z_a >= -1.645: # Valor crítico para alpha = 0.05 (una cola)
print("∴ H0 no es rechazada.")
else:
print("∴ H0 es rechazada.")
# Inciso b) (ya que no hay un valor x_b en el ejercicio, utilizamos x_barra)
z_b = (x_barra - mu_0) / sigma_x_barra
print("Inciso b)")
print("z =", z_b)
p_value_b = norm.cdf(z_b)
print(f"Valor-p: {p_value_b:.4f}")
if p_value_b < 0.05:
print("∴ H0 es rechazada.")
else:
print("∴ H0 no es rechazada.")
# Inciso c)
x_c = 75.5
z_c = (x_c - mu_0) / sigma_x_barra
print("Inciso c)")
print("z =", z_c)
if z_c >= -1.645: # Valor crítico para alpha = 0.05 (una cola)
print("∴ H0 no es rechazada.")
else:
print("∴ H0 es rechazada.")
# Inciso d)
x_d = 81
z_d = (x_d - mu_0) / sigma_x_barra
print("Inciso d)")
print("z =", z_d)
if z_d >= -1.645: # Valor crítico para alpha = 0.05 (una cola)
print("∴ H0 no es rechazada.")
else:
print("∴ H0 es rechazada.")
Inciso a) z = -1.825 ∴ H0 es rechazada. Inciso b) z = -1.825 Valor-p: 0.0340 ∴ H0 es rechazada. Inciso c) z = -12.25625 ∴ H0 es rechazada. Inciso d) z = -12.1875 ∴ H0 es rechazada.
Ejercicio en 4
a) Formule las hipótesis para una prueba en la que se quiere determinar si los datos muestrales favorecen la conclusión de que la cantidad media mensual pagada por el servicio de Internet en este estado del sur es menor a la media de todo el país, que es de $Bs. 32.79$.
b) ¿Cuál es el valor del estadístico de prueba?
c) ¿Cuál es el valor-p?
d) Con $α = 0.01$, ¿qué concluye?
Inciso a)
Inciso b)
$Datos:$
$n = 50$
$\bar{x} = Bs. 30.63$
$σ = Bs. 5.60$
$σ_\bar{x} = \frac{σ}{\sqrt{n}}$
$$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}} = \frac{{{30.63} - 32.79}}{{\frac{5.60}{\sqrt{50}}}} = -2.73$$
Inciso c)
Se busca el valor de $z = -2.73$ en la tabla normal, entonces:
Inciso d)
La regla me dice que se debe rechazar $H_0$ si el $valor-p ≤ α$, por lo cual tenemos que como el valor-p es menor que $α$ (0.01) se rechaza $H_0$, se concluye que el promedio mensual facturado en Internet es menor en los estados del sur.
Ejercicio en código
import math
from scipy.stats import norm
# Datos del ejercicio
n = 50
x_barra = 30.63
mu_0 = 32.79
sigma = 5.60
# Cálculo del error estándar de la media muestral
sigma_x_barra = sigma / math.sqrt(n)
# Cálculo del valor del estadístico de prueba (z)
z = (x_barra - mu_0) / sigma_x_barra
# Cálculo del valor-p
valor_p = norm.cdf(z)
# Imprimiendo resultados
print(f"Valor del estadístico de prueba (z): {z:.2f}")
print(f"Valor-p: {valor_p:.4f}")
# Conclusión con un nivel de significancia α = 0.01
alpha = 0.01
if valor_p < alpha:
print("Se rechaza la hipótesis nula. Concluimos que el promedio mensual facturado en Internet es menor en los estados del sur.")
else:
print("No se puede rechazar la hipótesis nula. No hay suficiente evidencia para afirmar que el promedio mensual facturado en Internet es menor en los estados del sur.")
Valor del estadístico de prueba (z): -2.73 Valor-p: 0.0032 Se rechaza la hipótesis nula. Concluimos que el promedio mensual facturado en Internet es menor en los estados del sur.
Ejercicio 5
b) En una muestra de 120 clientes, la media muestral de tiempo de espera fue 8.5 minutos. Suponga que la desviación estándar poblacional es $σ = 3.2 minutos$. ¿Cuál es el valor-p?
c) Con $α = 0.05$, ¿cuál es su conclusión?
Inciso a)
Inciso b)
$Datos:$
$n = 120$
$\bar{x} = 8.5 minutos$
$σ = 3.2 minutos$
$σ_\bar{x} = \frac{σ}{\sqrt{n}}$
$$z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}} = \frac{{{8.5} - 8}}{{\frac{3.2}{\sqrt{120}}}} = 1.71$$
Se busca el valor de $z = 1.71$ en la tabla normal, entonces:
Inciso c)
La regla me dice que se debe rechazar $H_0$ si el $valor-p ≤ α$, por lo cual tenemos que como el valor-p es mayor que $α$ (0.05) no se rechaza $H_0$, se concluye que no se puede concluir que el tiempo promedio de espera difiera de 8 minutos.
Ejercicio en código
import math
from scipy.stats import norm
# Datos del ejercicio
n = 120
x_barra = 8.5
mu_0 = 8
sigma = 3.2
# Cálculo del error estándar de la media muestral
sigma_x_barra = sigma / math.sqrt(n)
# Cálculo del valor del estadístico de prueba (z)
z = (x_barra - mu_0) / sigma_x_barra
# Cálculo del valor-p (dos colas)
valor_p = (1 - 0.8294)
# Imprimiendo resultados
print(f"Valor del estadístico de prueba (z): {z:.2f}")
print(f"Valor-p: {valor_p:.4f}")
# Conclusión con un nivel de significancia α = 0.05
alpha = 0.05
if valor_p < alpha:
print("Se rechaza la hipótesis nula. Concluimos que el tiempo promedio de espera difiere de 8 minutos.")
else:
print("No se puede rechazar la hipótesis nula. No hay suficiente evidencia para afirmar que el tiempo promedio de espera difiere de 8 minutos.")
Valor del estadístico de prueba (z): 1.71 Valor-p: 0.1706 No se puede rechazar la hipótesis nula. No hay suficiente evidencia para afirmar que el tiempo promedio de espera difiere de 8 minutos.
9.4 Medida Poblacional: σ desconocida¶
Prueba de una cola
Prueba de una cola
Área en la cola superior | 0.20 | 0.10 | 0.05 | 0.025 | 0.01 | 0.005 |
---|---|---|---|---|---|---|
Valor t (59 gl) | 0.848 | 1.296 | 1.671 | 2.001 | 2.391 | 2.662 |
Prueba de dos colas
concluye que es adecuado usar la distribución t con n - 1 = 24 grados de libertad. Usando la ecuación (9.2) con x = 37.4, μ0 = 40, s = 11.79 y n = 25, el valor que se obtiene para el estadístico de prueba es
Como se trata de una prueba de dos colas, el valor-p es el doble del área bajo la curva de la distribución t para t <=1.10. En la tabla 2 del apéndice B, la fi la de la distribución t para 24 grados de libertad proporciona la información siguiente.
Área en la cola superior | 0.20 | 0.10 | 0.05 | 0.025 | 0.01 | 0.005 |
---|---|---|---|---|---|---|
Valor t (24 gl) | 0.857 | 1.318 | 1.711 | 2.064 | 2.492 | 2.797 |
Resumen y consejo practico
En la tabla 9.3 se proporciona un resumen de los procedimientos de prueba de hipótesis en los casos de σ desconocida. La diferencia principal entre estos procedimientos y el del caso de σ conocida estriba en que para calcular el estadístico de prueba se usa s en lugar de σ. A esto se debe que el estadístico de prueba siga la distribución t. La aplicabilidad de los procedimientos de prueba de hipótesis de esta sección depende de la distribución de la población de donde se toma la muestra y del tamaño de ésta. Si la población tiene una distribución normal, las pruebas de hipótesis descritas en esta sección dan resultados exactos con cualquier tamaño de muestra. Si la población no está distribuida normalmente, los procedimientos son aproximaciones. De cualquier manera, se encuentra que tamaños de muestra de 30 o mayores proporcionan buenos resultados en la mayor parte de los casos. Si la población es aproximadamente normal, muestras pequeñas (por ejemplo, n = 15) pueden ofrecer resultados aceptables. Si la población es muy sesgada o si contiene observaciones atípicas, se recomiendan tamaños de alrededor de 50.
Video: Prueba de hipótesis
# importar la clase que permite ver videos
from IPython.display import YouTubeVideo
# crear una instancia del objeto YouTubeVideo
youtube_video=YouTubeVideo('k3oBZQ5Brbs')
#mostrar el video de youtube
display(youtube_video)
Prueba de cola inferior | Prueba de cola superior | Prueba de dos colas | |
---|---|---|---|
Hipótesis | $$H_0: μ ≥ μ_0$$ $$H_a: μ < μ_0$$ | $$H_0: μ ≤ μ_0$$ $$H_a: μ > μ_0$$ | $$H_0: μ = μ_0$$ $$H_a: μ \ne μ_0$$ |
Estadístico de prueba | $$t = \frac{{\bar{x} - \mu_0}}{{\frac{s}{\sqrt{n}}}}$$ | $$z = \frac{{\bar{x} - \mu_0}}{{\frac{s}{\sqrt{n}}}}$$ | $$z = \frac{{\bar{x} - \mu_0}}{{\frac{s}{\sqrt{n}}}}$$ |
Regla de rechazo: Método del valor-p | Rechazar $H_0$ si el valor-p $≤ α$ | Rechazar $H_0$ si el valor-p $≤ α$ | Rechazar $H_0$ si el valor-p $≤ α$ |
Regla de rechazo: Método del valor crítico | Rechazar $H_0$ si $t ≤ -t_α$ | Rechazar $H_0$ si $t ≥ t_α$ | Rechazar $H_0$ si $t ≤ -t_{α/2}$ o si $t ≥ t_{α/2}$ |
Ejercicios
Metodos
Ejercicio 1
$$H_0: \mu \leq 12$$ $$H_a: \mu > 12 $$
En una muestra de 25, la media muestral es $ \bar{x} = 14 $ y la desviación estándar $s = 4.32 $.
a) Calcule el valor del estadístico de prueba.
b) Use la tabla de distribución t (tabla 2 del apéndice B) a fin de calcular un intervalo para el valor-p.
c) Con $\alpha = 0.05 $, ¿cuál es su conclusión?
d) ¿Cuál es la regla de rechazo usando el valor crítico? ¿Qué concluye?
Solución
Inciso a)
$$ t = \frac{(\bar{x} - \mu_0)}{(s/\sqrt{n})} $$
Donde:
- $(\bar{x})$ es la media muestral,
- $(\mu_0)$ es la media bajo la hipótesis nula,
- $(s)$ es la desviación estándar muestral, y
- $(n)$ es el tamaño de la muestra.
En este caso: $$ t = \frac{(14 - 12)}{(4.32/\sqrt{25})} $$
Calculamos (t) y obtenemos el valor del estadístico de prueba.
Inciso b) Intervalo para el Valor-p:
Usaremos la tabla de distribución t (Tabla 2 del apéndice B) para encontrar los valores críticos $(t_{\text{crítico}})$ con 24 grados de libertad y $(\alpha/2 = 0.025)$. Luego, calcularemos el intervalo para el valor-p.
Inciso c)
$(\alpha = 0.05)$:
Si el valor-p es menor que $(\alpha)$, rechazamos la hipótesis nula $((H_0))$.
Inciso d)
Rechazamos $(H_0)$ si $(t > t_{\text{crítico}})$.
a)
$$ t = \frac{(14 - 12)}{(4.32/\sqrt{25})} $$
$$ t = 3.108 $$
b)
Usando la tabla de distribución t, encontramos $(t_{\text{crítico}})$ para $( \alpha/2 = 0.025 )$ con 24 grados de libertad.
c)
Compararemos el valor-p con $(\alpha)$ y decidiremos si rechazamos $(H_0)$.
d)
Rechazamos $(H_0)$ si $(t > t_{\text{crítico}})$.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Generar datos de la distribución muestral
x = np.linspace(0 - 1 * 2, 0 + 1 * 2, 1000)
y = norm.pdf(x*4, 0, 2)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
# Etiquetas y texto
ax.set_xlabel(f'$valor-p = 2(0.0630) = 0.1260$', fontsize=10)
ax.text(0.02, 0.15, r'P(z ≤ -1.53) = 0.0630', transform=ax.transAxes, fontsize=7.5, color='#000')
ax.text(0.76, 0.15, r'P(z ≥ 1.53) = 0.0630', transform=ax.transAxes, fontsize=7.5, color='#000')
ax.text(0.06, -0.11, r'-1.53', transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.86, -0.11, r'1.53', transform=ax.transAxes, fontsize=12, color='#000')
# Líneas verticales
for i in np.arange(0.02, 0.98, 0.02):
ax.text(i, 0.01, r'|', transform=ax.transAxes, fontsize=12, color='#009929')
# Líneas horizontales
ax.text(0.10, -0.04, r'|', transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.89, -0.04, r'|', transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.89, 0.01, r'|', transform=ax.transAxes, fontsize=12, color='#009929')
# Ajustes del gráfico
ax.grid(False)
plt.show()
Ejercicio 2
$$H_0: \mu = 18 $$ $$H_a: \mu\neq 18 $$
En una muestra de 48, la media muestral es $\bar{x} = 17 $ y la desviación estándar muestral $s = 4.5$ .
a) Calcule el valor del estadístico de prueba.
b) Use la tabla de distribución t (tabla 2 del apéndice B) con objeto de calcular un intervalo para el valor-p.
c) Con $\alpha = 0.05 $, ¿cuál es su conclusión?
d) ¿Cuál es la regla de rechazo usando el valor crítico? ¿Qué concluye?
Solución
Inciso a)
El estadístico de prueba (t) se calcula utilizando la fórmula:
$$ t = \frac{(\bar{x} - \mu_0)}{(s/\sqrt{n})} $$
Donde:
- $\bar{x}$ es la media muestral,
- $\mu_0$ es la media bajo la hipótesis nula,
- $s$ es la desviación estándar muestral, y
- $n$ es el tamaño de la muestra.
En este caso: $$ t = \frac{(17 - 18)}{(4.5/\sqrt{48})} $$
Calculamos (t) y obtenemos el valor del estadístico de prueba.
Inciso b)
Usaremos la tabla de distribución t (Tabla 2 del apéndice B) para encontrar los valores críticos $t_{\text{crítico}}$ con 47 grados de libertad y $\alpha/2 = 0.025$. Luego, calcularemos el intervalo para el valor-p.
Inciso c)
Si el valor-p es menor que $\alpha$, rechazamos la hipótesis nula $(H_0)$.
Inciso d)
Rechazamos $H_0$ si $t > t_{\text{crítico}}$ o $t < -t_{\text{crítico}}$.
a)
$$t = \frac{(17 - 18)}{(4.5/\sqrt{48})} $$
b)
Usando la tabla de distribución t, encontramos $t_{\text{crítico}}$ para $\alpha/2 = 0.025$ con 47 grados de libertad.
cc)
Compararemos el valor-p con $\alpha$ y decidiremos si rechazamos $H_0$.
d)
Rechazamos $H_0$ si $t > t_{\text{crítico}}$ o $t < -t_{\text{crítico}}$.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import t
# Generar datos de la distribución t
x = np.linspace(-4, 4, 1000)
y = t.pdf(x, 47)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
# Etiquetas y texto
ax.set_xlabel('Distribución t con 47 grados de libertad', fontsize=10)
# Línea vertical en t crítico para alfa/2
ax.axvline(t.ppf(0.025, 47), color='#009929', linestyle='--', label=r'$t_{\alpha/2}$')
# Línea vertical en -t crítico para alfa/2
ax.axvline(-t.ppf(0.025, 47), color='#009929', linestyle='--')
# Ajustes del gráfico
ax.legend()
ax.grid(False)
plt.show()
Ejercicio 3
$$H_0: \mu \geq 45 $$ $$ H_a: \mu < 45 $$
Se usa una muestra de 36. Identifique el valor-p y establezca su conclusión para cada uno de los siguientes resultados muestrales. Use $\alpha$ = 0.01 .
a) $ \bar{x} = 44$ y $s = 5.2 $
b) $ \bar{x} = 43 $ y $ s = 4.6 $
c) $ \bar{x} = 46 $ y $ s = 5.0 $
Solucion
La prueba de hipótesis se realiza utilizando la fórmula del valor-p para una prueba de una cola (p-value):
$$ p = P(\bar{X} < \bar{x} \,|\, H_0 \, \text{es verdadera}) $$
Donde:
- $\bar{X}$ es la media muestral bajo la hipótesis nula,
- $\bar{x}$ es la media muestral observada,
- $n$ es el tamaño de la muestra, y
- $s$ es la desviación estándar muestral.
Si $p < \alpha$, se rechaza la hipótesis nula.
a)
Para $\bar{x} = 44$ y $s = 5.2$:
$$ p = P(\bar{X} < 44 \,|\, \mu \geq 45) $$
b)
Para $\bar{x} = 43$ y $s = 4.6$:
$$ p = P(\bar{X} < 43 \,|\, \mu \geq 45) $$
c)
Para $\bar{x} = 46$ y $s = 5.0$:
$$ p = P(\bar{X} < 46 \,|\, \mu \geq 45) $$
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import t
# Parámetros del problema
mu_0 = 45
alpha = 0.01
n = 36
# Valores críticos para la región de rechazo
critical_value = t.ppf(alpha, n-1)
# Datos para cada caso
sample_means = [44, 43, 46]
sample_std_devs = [5.2, 4.6, 5.0]
# Crear la gráfica
fig, ax = plt.subplots()
# Dibujar la distribución t bajo H0
x = np.linspace(mu_0 - 3 * (sample_std_devs[0] / np.sqrt(n)), mu_0 + 3 * (sample_std_devs[0] / np.sqrt(n)), 1000)
ax.plot(x, t.pdf(x, n-1), color='#009929', label=r'$H_0: \mu \geq 45$')
# Línea vertical en t crítico para alfa
ax.axvline(mu_0 + critical_value * (sample_std_devs[0] / np.sqrt(n)), color='#009929', linestyle='--', label=r'Región de Rechazo')
# Pintar el área de rechazo
x_fill = np.linspace(mu_0 + critical_value * (sample_std_devs[0] / np.sqrt(n)), mu_0 + 3 * (sample_std_devs[0] / np.sqrt(n)), 1000)
y_fill = t.pdf(x_fill, n-1)
ax.fill_between(x_fill, y_fill, color='#009929', alpha=0.3)
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
# Etiquetas y texto
ax.set_xlabel('Media Muestral ($\\bar{x}$)', fontsize=10)
# Ajustes del gráfico
ax.legend()
ax.grid(False)
# Mostrar la gráfica
plt.show()
9.5 Proporcion Poblacional¶
$H_{0}:p \geq p_0$ | $H_{0}:p \leq p_0$ | $H_{0}:p = p_0$ |
$H_{a}:p < p_0$ | $H_{a}:p > p_0$ | $H_{a}:p \neq p_0$ |
Ejemplo
Las hipotesis nula y alternativa para esta prueba son:
$H_{0}:p \geq 0,20$ |
$H_{a}:p > 0,20$ |
El paso siguiente en el procedimiento de prueba de hipótesis es seleccionar una muestra y calcular el valor del estadístico de prueba adecuado.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Generar datos de la distribución muestral
x = np.linspace(0 - 2.05 * 1, 0 + 2.05 * 1, 2000)
y = norm.pdf(x*4, 0, 2)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
# Agregar información sobre el error estándar
ax.text(0.60, 0.80, r'Área = 0.9938',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.60, 0.10, r'Valor-p = P(z ≥ 2.50)=0.0062',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.86, -0.11, r'2.5',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.89, -0.04, r'|',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.89, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.891, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.893, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.895, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.897, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.899, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.90, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.902, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.904, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.906, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.908, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.910, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.912, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.914, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.916, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.918, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.920, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.922, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.924, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.926, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.928, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.930, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.932, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.934, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.936, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.938, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.940, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.942, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.944, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.946, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.948, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.950, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.952, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.954, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.956, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.958, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.960, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.962, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.964, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.966, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.968, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.970, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.grid(False)
plt.show()
Prueba de cola inferior | Prueba de cola superior | Prueba de dos colas | |
---|---|---|---|
Hipótesis | $$H_0: p ≥ p_0$$ $$H_a: p < p_0$$ | $$H_0: p ≤ p_0$$ $$H_a: p > p_0$$ | $$H_0: p = p_0$$ $$H_a: p \ne p_0$$ |
Estadístico de prueba | $$z = \frac{\bar{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}$$ | $$z = \frac{\bar{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}$$ | $$z = \frac{\bar{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}$$ |
Regla de rechazo: Método del valor-p | Rechazar $H_0$ si el valor-p $≤ α$ | Rechazar $H_0$ si el valor-p $≤ α$ | Rechazar $H_0$ si el valor-p $≤ α$ |
Regla de rechazo: Método del valor crítico | Rechazar $H_0$ si $z ≤ -z_α$ | Rechazar $H_0$ si $z ≥ z_α$ | Rechazar $H_0$ si $z ≤ -z_{α/2}$ o si $z ≥ z_{α/2}$ |
Resumen
Ejercicios
Métodos
1. Considere la prueba de hipótesis siguiente.
$H_a: p \neq 0.20 $
En una muestra de 400, se encontro un proporcion muestral de $\bar {p}=0.175$
a) Calcule el valor del estadístico de prueba.
b) ¿Cual es el valor-p.?
c) Con $\alpha = 0.05 $, ¿cuál es su conclusión?
d) ¿Cuál es la regla de rechazo usando el valor crítico? ¿Qué concluye?
Solución
a) Estadístico de Prueba ((t)):¶
El estadístico de prueba (t) se calcula utilizando la fórmula:
$$
\large z = \frac{\bar{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}
$$
Donde:
- $(\bar{p})$ es la proporcion muestral,
- $(p_0)$ es la proporcion poblacional,
- $(n)$ es el tamaño de la muestra.
En este caso: $$ \large z = \frac{0.175 - 0.20}{\sqrt{\frac{0.20(1-0.20)}{400}}} $$
Calculamos (z) y obtenemos el valor del estadístico de prueba.
b) Intervalo para el Valor-p:¶
Usaremos la tabla de distribución z para encontrar los valores críticos $(z_{\text{crítico}})$ y $(\alpha/2 = 0.025)$. Luego, calcularemos el intervalo para el valor-p.
c) Conclusión con $(\alpha = 0.05)$:¶
Si el valor-p es menor que $(\alpha)$, rechazamos la hipótesis nula $((H_0))$.
d) Regla de Rechazo usando el Valor Crítico:¶
Rechazamos $(H_0)$ si $(z > z_{\text{crítico}})$.
Resultados:¶
a) Estadístico de Prueba ((z)):
$$
\large z = \frac{0.175 - 0.20}{\sqrt{\frac{0.20(1-0.20)}{400}}}
$$
$$\large z = -1.25 $$
b) Intervalo para el Valor-p: Usando la tabla de distribución normal z, encontramos $(z_{\text{crítico}})$ para $( \alpha/2 = 0.025 )$.
c) Con $α = 0.05$
El valor$-p=2(0.1056)=0.2112$
El valor$-p\neq (0.05);H_0$ no es rechazada
d) Regla de Rechazo usando el Valor Crítico:
Rechazamos $(H_0)$ si $(z > z_{\text{crítico}})$.
Se concluye que no se rechaza la $(H_0)$ y se acepta la $(H_a)$
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Generar datos de la distribución muestral
x = np.linspace(0 - 2.05 * 1, 0 + 2.05 * 1, 1000)
y = norm.pdf(x*4, 0, 2)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
# Agregar información sobre el error estándar
ax.text(0.06, -0.11, r'-1.36',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.86, -0.11, r'1.36',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.02, 0.15, r'P(z ≤ -1.25) = 0.1056', transform=ax.transAxes, fontsize=7.5, color='#000')
ax.text(0.76, 0.15, r'P(z ≥ 1.25) = 0.1056', transform=ax.transAxes, fontsize=7.5, color='#000')
ax.text(0.10, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.098, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.096, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.094, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.092, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.090, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.088, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.086, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.084, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.082, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.080, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.078, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.076, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.074, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.072, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.070, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.068, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.066, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.064, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.062, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.060, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.058, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.056, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.054, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.052, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.050, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.048, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.046, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.044, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.042, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.040, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.038, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.036, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.034, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.032, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.030, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.028, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.026, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.024, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.022, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.020, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.028, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.10, -0.04, r'|',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.89, -0.04, r'|',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.89, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.891, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.893, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.895, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.897, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.899, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.90, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.902, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.904, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.906, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.908, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.910, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.912, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.914, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.916, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.918, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.920, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.922, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.924, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.926, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.928, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.930, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.932, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.934, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.936, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.938, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.940, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.942, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.944, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.946, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.948, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.950, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.952, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.954, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.956, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.958, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.960, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.962, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.964, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.966, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.968, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.970, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.grid(False)
plt.show()
2. Considere la prueba de hipótesis siguiente.
$H_a: p < 0.75 $
En una muestra de 300 elementos. Calcule el valor-$p$ y estableza su conclusion para cada uno de los resultados muestrales siguiientes. Use $(\alpha = 0.05)$
a) $\bar {p}=0.68$
b) $\bar {p}=0.72$
c) $\bar {p}=0.70$
d) $\bar {p}=0.77$
Solución
Utilizando la fórmula:
$
\large z = \frac{\bar{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}
$
Donde:
- $(\bar{p})$ es la proporcion muestral,
- $(p_0)$ es la proporcion poblacional,
- $(n)$ es el tamaño de la muestra.
Si valor-$p$ $es \leq \alpha$ rechazamos $H_0$
Resultados:¶
a) $\bar {p}=0.68$
El valor$-p=0.0026$
El valor$-p\leq0.05; H_0$ es rechazada
b) $\bar {p}=0.72$
El valor$-p=0.1151$
El valor$-p\leq0.05; H_0$ no es rechazada
c) $\bar {p}=0.70$
El valor$-p=0.0228$
El valor$-p\leq0.05; H_0$ es rechazada
d) $\bar {p}=0.77$
El valor$-p=0.7881$
El valor$-p\leq0.05; H_0$ no es rechazada
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Generar datos de la distribución muestral
x = np.linspace(0 - 2.05 * 1, 0 + 2.05 * 1, 2000)
y = norm.pdf(x*4, 0, 2)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
# Agregar información sobre el error estándar
ax.text(0.06, -0.11, r'-2.50',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.60, 0.80, r'Área = 0.9974',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.10, 0.10, r'Valor-p = P(z ≤ -2.80)=0.0026',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.10, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.098, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.096, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.094, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.092, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.090, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.088, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.086, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.084, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.082, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.080, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.078, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.076, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.074, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.072, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.070, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.068, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.066, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.064, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.062, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.060, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.058, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.056, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.054, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.052, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.050, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.048, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.046, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.044, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.042, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.040, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.038, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.036, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.034, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.032, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.030, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.028, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.026, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.024, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.022, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.020, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.028, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.89, -0.04, r'|',transform=ax.transAxes, fontsize=12, color='#000')
ax.grid(False)
plt.show()
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Generar datos de la distribución muestral
x = np.linspace(0 - 2.05 * 1, 0 + 2.05 * 1, 2000)
y = norm.pdf(x*4, 0, 2)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
# Agregar información sobre el error estándar
ax.text(0.06, -0.11, r'-1.20',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.60, 0.80, r'Área = 0.8849',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.10, 0.10, r'Valor-p = P(z ≤ -1.20)=0.1151',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.10, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.098, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.096, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.094, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.092, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.090, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.088, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.086, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.084, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.082, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.080, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.078, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.076, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.074, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.072, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.070, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.068, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.066, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.064, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.062, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.060, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.058, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.056, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.054, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.052, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.050, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.048, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.046, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.044, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.042, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.040, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.038, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.036, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.034, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.032, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.030, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.028, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.026, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.024, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.022, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.020, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.028, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.89, -0.04, r'|',transform=ax.transAxes, fontsize=12, color='#000')
ax.grid(False)
plt.show()
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Generar datos de la distribución muestral
x = np.linspace(0 - 2.05 * 1, 0 + 2.05 * 1, 2000)
y = norm.pdf(x*4, 0, 2)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
# Agregar información sobre el error estándar
ax.text(0.06, -0.11, r'-2.00',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.60, 0.80, r'Área = 0.9778',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.10, 0.10, r'Valor-p = P(z ≤ -2.00)=0.0228',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.10, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.098, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.096, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.094, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.092, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.090, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.088, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.086, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.084, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.082, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.080, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.078, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.076, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.074, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.072, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.070, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.068, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.066, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.064, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.062, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.060, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.058, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.056, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.054, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.052, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.050, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.048, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.046, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.044, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.042, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.040, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.038, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.036, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.034, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.032, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.030, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.028, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.026, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.024, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.022, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.020, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.028, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.89, -0.04, r'|',transform=ax.transAxes, fontsize=12, color='#000')
ax.grid(False)
plt.show()
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Generar datos de la distribución muestral
x = np.linspace(0 - 2.05 * 1, 0 + 2.05 * 1, 2000)
y = norm.pdf(x*4, 0, 2)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
# Agregar información sobre el error estándar
ax.text(0.06, -0.11, r'0.80',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.60, 0.80, r'Área = 0.2119',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.10, 0.10, r'Valor-p = P(z ≤ 0.80)=0.7881',transform=ax.transAxes, fontsize=10, color='#000')
ax.text(0.10, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.098, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.096, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.094, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.092, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.090, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.088, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.086, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.084, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.082, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.080, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.078, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.076, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.074, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.072, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.070, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.068, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.066, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.064, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.062, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.060, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.058, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.056, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.054, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.052, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.050, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.048, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.046, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.044, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.042, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.040, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.038, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.036, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.034, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.032, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.030, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.028, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.026, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.024, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.022, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.020, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.028, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.89, -0.04, r'|',transform=ax.transAxes, fontsize=12, color='#000')
ax.grid(False)
plt.show()
$a)$ Formule las hipótesis para determinar si el porcentaje de clientes de los supermercados que considera las salsas de tomate de marca propia de estos establecimientos tan buenas como la de marca nacional difiere de $64$%.
$b)$ Si en una muestra de $100$ clientes, $52$ opinan que las marcas de los supermercados son tan buenas como las nacionales, ¿cuál es el valor-$p$?
$c)$ Con α = 0.05, ¿cuál es la conclusión?
$d)$ ¿Le dará gusto esta conclusión al fabricante de la marca nacional de salsa de tomate? Explique.
Solución
Utilizando la fórmula:
$
\large z = \frac{\bar{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}
$
Donde:
- $(\bar{p})$ es la proporcion muestral,
- $(p_0)$ es la proporcion poblacional,
- $(n)$ es el tamaño de la muestra.
Si valor-$p$ $es \leq \alpha$ rechazamos $H_0$
Resultados:¶
a) con el $64$%
$H_a: p \neq 0.64 $
El valor$-p=2(0.0062)$
c) Con $α = 0.05$
El valor$-p=2(0.0062)=0.0124$
El valor$-p\neq (0.05);H_0$ no es rechazada
La proporcion difiere del $0.64$ reportado
d) Sí, porque p $0.52$ indica que muy pocos creen que la marca de supermercados sea tan buena como la marca nacional
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Generar datos de la distribución muestral
x = np.linspace(0 - 2.05 * 1, 0 + 2.05 * 1, 1000)
y = norm.pdf(x*4, 0, 2)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x, y, color='#009929')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
# Agregar información sobre el error estándar
ax.text(0.06, -0.11, r'-2.50',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.86, -0.11, r'2.50',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.02, 0.15, r'P(z ≤ -2.50) = 0.0062', transform=ax.transAxes, fontsize=7.5, color='#000')
ax.text(0.76, 0.15, r'P(z ≥ 2.96) = 0.0062', transform=ax.transAxes, fontsize=7.5, color='#000')
ax.text(0.10, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.098, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.096, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.094, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.092, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.090, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.088, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.086, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.084, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.082, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.080, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.078, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.076, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.074, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.072, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.070, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.068, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.066, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.064, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.062, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.060, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.058, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.056, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.054, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.052, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.050, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.048, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.046, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.044, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.042, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.040, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.038, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.036, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.034, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.032, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.030, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.028, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.026, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.024, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.022, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.020, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.028, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.10, -0.04, r'|',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.89, -0.04, r'|',transform=ax.transAxes, fontsize=12, color='#000')
ax.text(0.89, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.891, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.893, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.895, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.897, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.899, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.90, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.902, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.904, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.906, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.908, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.910, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.912, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.914, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.916, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.918, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.920, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.922, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.924, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.926, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.928, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.930, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.932, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.934, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.936, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.938, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.940, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.942, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.944, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.946, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.948, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.950, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.952, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.954, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.956, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.958, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.960, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.962, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.964, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.text(0.966, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.968, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929');ax.text(0.970, 0.01, r'|',transform=ax.transAxes, fontsize=12, color='#009929')
ax.grid(False)
plt.show()
# importar la clase que permite ver videos
from IPython.display import YouTubeVideo
# crear una instancia del objeto YouTubeVideo
youtube_video=YouTubeVideo('EsTm9MGZacI')
#mostrar el video de youtube
display(youtube_video)
9.6 Prueba de hipotesis y toma de decisiones¶
$H_a: \mu < 120 $
Si $H_0$ es rechazada, se concluye que la hipótesis alternativa es verdadera. Esta conclusión indica que lo adecuado es devolver el pedido al proveedor. Pero si $H_0$ no es rechazada, la personaque toma la decisión deberá determinar qué medidas tomar. Así, sin haber concluido que $H_0$ es verdadera, sino sólo por no haberla rechazado, dicha persona tendrá que aceptar el envío y considerarlo de la calidad adecuada. En tales situaciones es recomendable que el procedimiento de prueba de hipótesis se amplíe para controlar la probabilidad de cometer un error tipo II. Como se tomará una decisión y alguna medida cuando H0 no sea rechazada, será útil conocer la probabilidad de cometer un error de este tipo. En las secciones 9.7 y 9.8 se explica cómo calcular la probabilidad de cometer un error tipo II y ajustar el tamaño de la muestra para controlar esta probabilidad.
Video: Prueba de hipotesis para la Proporcion Poblacional
# importar la clase que permite ver videos
from IPython.display import YouTubeVideo
# crear una instancia del objeto YouTubeVideo
youtube_video=YouTubeVideo('hm6CkL-Y8vY')
#mostrar el video de youtube
display(youtube_video)
9.7 Calculo de la probabilidad de los errores tipo II ¶
$$ z = \frac{{\bar{x} - \mu_0}}{{\frac{\sigma}{\sqrt{n}}}} = \frac{{\bar{x} - 120}}{{\frac{\sigma}{\sqrt{n}}}} $$
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Parámetros
n = 36
alpha = 0.05
critical_value = norm.ppf(alpha)
# Valor específico de μ
mu = 112
# Calcular la media y la desviación estándar de la distribución de muestreo
sampling_mean = mu
sampling_std = 12 / np.sqrt(n)
# Generar datos para la distribución de muestreo
x_values = np.linspace(mu - 3 * sampling_std, mu + 3 * sampling_std, 1000)
y_values = norm.pdf(x_values, loc=sampling_mean, scale=sampling_std)
# Calcular el valor z correspondiente a la zona de rechazo
rejection_zone = x_values[x_values >= mu + critical_value * sampling_std]
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x_values, y_values, label=f'Distribución de muestreo de $x$, μ = {mu}', color='#009929')
ax.fill_between(rejection_zone, norm.pdf(rejection_zone, loc=sampling_mean, scale=sampling_std), alpha=0.3, label=f'Zona de rechazo, μ = {mu}', color='#D4F8B7')
# Punto específico en la gráfica
plt.scatter([116.71], [0], color='#D4F8B7', marker='o', label='Punto específico (116.71, 0)')
# Anotaciones
plt.annotate(f'$\mu = {mu}$', xy=(mu, 0), xytext=(mu, 0.02), ha='center', arrowprops=dict(facecolor='#D4F8B7', shrink=0.05))
# Etiquetas y título
ax.set_title('Distribución de muestreo de $x$ con Zona de rechazo y Punto Específico', fontsize=14)
ax.set_xlabel('$x$', fontsize=12)
ax.set_ylabel('Densidad de probabilidad', fontsize=12)
ax.legend()
# Cambiar el color de fondo del gráfico
ax.set_facecolor('#d4f8b7')
# Cambiar el color de fondo de la figura
fig.patch.set_facecolor('#D4F8B7')
plt.show()
9.8Determinación del tamaño de la muestra en una prueba de hipótesis para la media poblacional ¶
Para determinar el tamaño de muestra que se necesita, primero se despeja $\sqrt{n}$ como sigue.
$$ \sqrt{n} = \frac{{(\mu_0 - \mu_a)}}{{(z_\alpha - z_\beta)}} \cdot \sigma $$
y
$$ n = \left(\frac{{z_\alpha - z_\beta \cdot \sigma}}{{\mu_0 - \mu_a}}\right)^2 $$
Tamaño de la Muestra en una Prueba de Hipótesis de una Cola para la Media Poblacional
$$ n = \left(\frac{{(z_\alpha - z_\beta)^2 \cdot \sigma^2}}{{(\mu_0 - \mu_a)^2}}\right) $$
donde:
- $z_\alpha$ = el valor de $z$ que proporciona un área de $\alpha$ en la cola superior de la distribución normal estándar.
- $z_\beta$ = el valor de $z$ que proporciona un área de $\beta$ en la cola superior de la distribución normal estándar.
- $\sigma$ = la desviación estándar poblacional.
- $\mu_0$ = el valor de la media poblacional en la hipótesis nula.
- $\mu_a$ = el valor de la media poblacional utilizado para el error tipo II.
Declaración para el error tipo I:
Si la vida media de las baterías del pedido es $\mu \leq 120$, estoy dispuesto a asumir el riesgo de que la probabilidad de rechazar el embarque sea $\alpha = 0.05$.Declaración para el error tipo II:
Si la vida media de las baterías del pedido es 5 horas por debajo de lo que indican las especificaciones (es decir, $\mu = 115$, estoy dispuesto a asumir el riesgo de que la probabilidad de aceptar el embarque sea $\beta = 0.10$.$$ n = \left(\frac{{(1.645 + 1.28)^2 \cdot (12)^2}}{{(120 - 115)^2}} = 49.3\right) $$
Una vez que se tienen dos de estos tres valores, el tercero puede calcularse.
Dado un nivel de significancia $\alpha$, aumentando el tamaño de la muestra se reduce $\beta$.
Dado un tamaño de muestra, al reducirse $\alpha$ aumenta $\beta$ y al incrementarse $\alpha$, disminuye $\beta$.
Ejercicios
Métodos
Ejercicio 1
$$ n = \left(\frac{(z_\alpha + z_\beta)^2 \cdot \sigma^2}{(\mu_0 - \mu_a)^2}\right) $$
donde:
- $ z_\alpha $ es el valor crítico correspondiente al nivel de significancia $ \alpha $, y como $ \alpha = 0.05 $, entonces $ z_\alpha = -1.645 $ (ya que estamos en la cola inferior),
- $ z_\beta $ es el valor crítico correspondiente a la probabilidad de error tipo II $ \beta $, y como $\beta = 0.10 $, entonces $z_\beta = -1.28 $ (según la información proporcionada),
- $ \sigma $ es la desviación estándar poblacional, que en este caso es $ \sigma = 5 $,
- $ \mu_0 $ es la media bajo la hipótesis nula, que es $ \mu_0 = 10 $,
- $ \mu_a $ es la media bajo la hipótesis alternativa, que es $ \mu_a = 9 $.
Sustituimos estos valores en la fórmula:
$$ n = \left(\frac{(-1.645 - (-1.28))^2 \cdot 5^2}{(10 - 9)^2}\right) $$
Calculamos:
$$ n = \left(\frac{(-0.365)^2 \cdot 25}{1}\right) $$
$$ n = \left(\frac{0.133225 \cdot 25}{1}\right) $$
$$ n = \left(\frac{3.330625}{1}\right) $$
$$ n = 3.330625 $$
Redondeamos hacia arriba para obtener un número entero, ya que el tamaño de la muestra debe ser un número entero positivo:
$$ n = 4 $$
Por lo tanto, se recomienda un tamaño de muestra de 4 para reducir la probabilidad de error tipo II a $ \beta = 0.10 $ si la media poblacional verdadera es $ \mu = 9 $.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Parámetros del problema
alpha = 0.05
beta = 0.10
sigma = 5
mu_0 = 10
mu_a = 9
# Valores críticos z_alpha y z_beta
z_alpha = norm.ppf(alpha)
z_beta = norm.ppf(beta)
# Datos para la distribución muestral bajo H0
x_h0 = np.linspace(mu_0 - 4 * sigma, mu_0 + 4 * sigma, 1000)
y_h0 = norm.pdf(x_h0, mu_0, sigma)
# Datos para la distribución muestral bajo Ha
x_ha = np.linspace(mu_a - 4 * sigma, mu_a + 4 * sigma, 1000)
y_ha = norm.pdf(x_ha, mu_a, sigma)
# Crear la gráfica
fig, ax = plt.subplots()
ax.plot(x_h0, y_h0, label=r'$H_0: \mu \geq 10$', color='green')
ax.plot(x_ha, y_ha, label=r'$H_a: \mu < 10$', color='green')
# Marcar los valores críticos
ax.axvline(mu_a + z_beta * sigma, color='green', linestyle='--', label=r'$z_\beta$')
# Establecer el color de fondo
ax.set_facecolor('#d4f8b7')
# Pintar el fondo externo del gráfico
fig.patch.set_facecolor('#D4F8B7')
ax.set_xlabel(r'$\bar{x}$ (Media Muestral)', fontsize=12)
# Agregar información sobre los valores críticos
ax.text(0.76, 0.15, f'$z_{{\\beta}}$ = {z_beta:.2f}', transform=ax.transAxes, fontsize=9, color='green')
# Sombrear las regiones críticas
ax.fill_between(x_h0, y_h0, where=(x_h0 <= mu_0 + z_alpha * sigma), color='green', alpha=0.3)
ax.fill_between(x_ha, y_ha, where=(x_ha <= mu_a + z_beta * sigma), color='green', alpha=0.3)
# Leyenda y etiquetas adicionales
ax.legend()
ax.grid(False)
plt.show()