El examen se deberá enviar por correo antes de las 11 PM del 5 de junio de 2020. Se puede entregar por parejas o individualmente.

Cuando no se especifique, considere una significancia \(\alpha=\).05. En caso de responder sobre el script, favor de indicar las hipótesis que se contrastan y la interpretación de forma clara y que se puede identificar fácilmente, en otro caso anexe el script.

1.

Los datos de la siguiente tabla muestran las mediciones de “low density lipid (LDL) cholesterol” también conocido como colesterol malo por las consecuencias que puede tener altos niveles de este colesterol. Cuatro tratamientos (treat:1,2,3,4) se probaron con la finalidad de reducir los niveles de LDL, los datos se muestran en la tabla siguiente (datos “quail” en paquete “Rfit”).

  1. Presente el boxplot de la variable LDL para cada tratamiento (grupo).
  2. Indique si se puede asumir que los datos en cada grupo provienen de una distribución Normal.
  3. Dependiendo de la respuesta anterior, realice una prueba adecuada para indicar si es plausible asumir que la varianza es similar en los cuatro grupos.
  4. ¿Los cuatro tratamientos proporcionan los mismos valores de LDL? Realice la prueba adecuada con \(\alpha=\).1.
  5. Si la respuesta a la pregunta del inciso iv) es negativa, indique si hay algún grupo que reduzca más los niveles de colesterol en comparación con el resto de tratamientos. Use \(\alpha=\).1.
n=39
treat ldl treat ldl treat ldl treat ldl
1 52 2 36 3 52 4 62
1 67 2 34 3 55 4 71
1 54 2 47 3 66 4 41
1 69 2 125 3 50 4 118
1 116 2 30 3 58 4 48
1 79 2 31 3 176 4 82
1 68 2 30 3 91 4 65
1 47 2 59 3 66 4 72
1 120 2 33 3 61 4 49
1 73 2 98 3 63

2.

Los \(ping\ddot{u}inos\) \(Macaroni\) ponen nidadas de dos huevos. El peso en gramos de los huevos de 11 nidadas se presenta en la tabla de abajo, \(x\) corresponde al huevo de peso menor y \(y\) al de peso mayor.

El objetivo es identificar si los pesos de los dos huevos de las nidadas es diferente. Realice

  1. La prueba parámetrica asociada.
  2. La prueba no parámetrica asociada.
x 79 93 100 105 101 96 96 109 70 71 87
y 133 143 164 171 165 159 162 170 127 133 148

3.

Los datos de la tabla de abajo muestran los resultados en la escala de depresión “Hamilton Depression Scale Factor IV” para nueve pacientes con depresión, antes de recibir un tratamiento (x) y después de recibir el tratamiento (y). A menor valor en la escala se observa una mejoría. En este sentido ¿se puede concluir que el tratamiento ha tenido éxito? Realice.

  1. La prueba parámetrica asociada.
  2. La prueba no parámetrica asociada.
Paciente 1 2 3 4 5 6 7 8 9
x 1.83 0.5 1.62 2.48 1.68 1.88 1.55 3.06 1.3
y 0.878 0.647 0.598 2.05 1.06 1.29 1.06 3.14 1.29

4.

Considere los datos de la tabla de abajo. Calcule las medidas de asociación

  1. Coeficiente de correlación de Pearson
  2. Coeficiente tau de Kendall
  3. Coeficiente rho de Spearman

Presente la gráfica de dispersión de las variables \(x\) y \(y\). El coeficiente de correlación de Pearson se interpreta en términos de la asociación lineal entre dos variables y su medición se ve afectada de forma considerable ante presencia de observaciones extremas. Por otro lado, los coeficientes Kendall’s tau y Spearman’s rho se interpretan en términos de asociaciones monótonas entre dos variables y son más robustos ante la presencia de observaciones extremas, además de que se pueden usar para variables continuas u ordinales.

Con base en lo anterior, use la función de R “cor.test()” modificando el argumento “method = c(”pearson“,”kendall“,”spearman“)”. La hipótesis nula en todos los casos es “el coeficiente YYY =0”, con YYY en \(c("pearson", "kendall", "spearman")\). ¿Qué conclusiones consideraría adecuados para estos datos?

x 2.9 7.9 4.1 8.8 9.4 0.46 5.3 8.92 5.5 4.57 57.5 28 41.0 34.8 7.1 54.1 15.5 3.5 20.4 57.3
y 2.7 2.5 1.9 2.3 1.5 1.63 2.3 -0.47 2.6 0.88 2.6 3 2.3 2.6 1.1 1.7 3.9 1.4 1.5 5.7

5.

Una muestra de 23 estudiantes respondieron a la pregunta ¿Está de acuerdo con incluir la materia de Inglés como obligatoria desde el inicio de educación primaria? Los años que han estudiado cada uno de los estudiantes también fueron recolectados y se presentan en la tabla de abajo. ¿Se puede concluir que entre más años de estudio los estudiantes tienden a estar más de acuerdo con la inclusión de la materia Inglés desde el inicio de la educación primaria?

Calcule el test adecuado para responder la pregunta. Recuerde que la mayoría de las funciones asociadas a pruebas de hipótesis en R tienen la opción de incluir el argumento alternative =c(“two.sided”, “less”, “greater”).

Nada   Poco   Más o menos   Mucho
5   9   12   16
4   10   13   18
10   7   9   12
12   12   12   19
3   12   16   14
  10   15  
    14  

6.

La sustancia Sulphinpyrazone fue usada para la reducción de muerte cardíaca después de un infarto. Para saber si esto es cierto, investigadores recolectaron información de 1475 pacientes que sufrieron un paro cardíaco. A cada paciente, de forma aleatoria, se le recetó tomar tabletas con Sulphinpyrazone o bien un placebo por un período de dos años (733 lo recibieron y 742 no). Durante este tiempo se tomó registro de los pacientes que habían sobrevivido y de los que habían muerto. Los datos observados son los siguientes.

Frec Tratamiento Vivo
692 Sulphinpyrazone
41 Sulphinpyrazone No
682 Placebo
60 Placebo No

Realice una prueba de hipótesis para indicar si la condición de muerte después de un paro cardíaco es diferente de acuerdo a si se recibió o no el tratamiento con Sulphinpyrazone. Considere \(\alpha=.01\). Realizar los cálculos paso a paso, después contrastar los resultados usando las funciones asociadas en R.

7.

Se reportan 40 números aleatorios presentados en orden creciente.

0.0023, 0.0150, 0.0298, 0.0337, 0.0729, 0.0943, 0.0950, 0.1080, 0.1180, 0.1300, 0.1500, 0.1592, 0.1617, 0.2016, 0.2083, 0.2316, 0.2403, 0.2863, 0.3427, 0.3766, 0.4384, 0.4715, 0.4895, 0.5544, 0.5575, 0.5910, 0.5960, 0.6224, 0.6517, 0.6602, 0.7197, 0.7317, 0.7687, 0.8212, 0.9439, 1.1242, 1.2681, 1.2885, 1.3626, 2.6055

Suponga que se desea contrastar las hipótesis:

\(H_0:\) los datos provienen de la densidad \(f(x)=2e^{-2x}, \; x>0\)

vs

\(H_a:\) los datos no provienen de la densidad \(f(x)\).

Usando la prueba de bondad de ajuste ji-cuadrada, con \(\alpha=.05\), pruebe la hipótesis nula en las dos formas siguientes.

  1. Usando \(k=4\), donde las clases están determinadas por: \((0,0.4], (0.4,0.8], (0.8,1.2], (1.2,\infty)\).
  2. Usando \(k=4\), donde las clases están determinadas por intervalos equiprobables.

En cada caso, realizar los cálculos paso a paso, después contrastar los resultados usando las funciones asociadas en R.

8.

Use los datos del ejercicio 7. Considerando la densidad \(f(x)=2e^{-2x}, \; x>0\),

  1. Obtenga el Q-Q plot asociado e interprete. Realizar los cálculos paso a paso, después usar la función asociada en R.
  2. En una misma gráfica incluya la función de distribución empírica o muestral y la función de distribución de la densidad \(f(x)=2e^{-2x}, \; x>0\).

9.

Use los datos del ejercicio 7 y usando la prueba adecuada tipo Kolmogorov–Smirnov haga la prueba de hipótesis siguiente.

\(H_0:\) los datos provienen de una distribución \(Exp(\lambda)\)

vs

\(H_a:\) los datos no provienen de una distribución \(Exp(\lambda)\)

Realizar los cálculos paso a paso, después contrastar los resultados usando las funciones asociadas en R.

10.

La tabla de abajo muestra la distribución de individuos sobre su comportamiento después de ser liberados de la cárcel: adecuado y no adecuado, y sobre su raza o grupo étnico: Asiático, Negro, Hispano y Blanco.

Frec GrupoEt Comportamiento
6 Asiático Adecuado
14 Negro Adecuado
29 Hispano Adecuado
12 Blanco Adecuado
4 Asiático No Adecuado
7 Negro No Adecuado
18 Hispano No Adecuado
10 Blanco No Adecuado

Pruebe si el comportamiento de los individuos al salir de la cárcel depende o no de los diferentes grupos étnicos. Use \(\alpha = .01\).

Realizar los cálculos paso a paso, después contrastar los resultados usando las funciones asociadas en R.