lunes, 15 de junio de 2009

COmo realizar una tabla ANOVA

ANÁLISIS DE VARIANCIA.

INTRODUCCIÓN

Puede definirse como una técnica mediante la cual la variación total presente en un conjunto de datos se distribuye en varios componentes. Asociada con cada uno de estos componentes hay una fuente específica de variación, de modo que en el análisis es posible averiguar la magnitud de las contribuciones de cada una de estas fuentes a la variación total.

El desarrollo de esta materia se debe principalmente al trabajo del desaparecido Ronald A. Fisher, cuyos trabajos en la Estadística abarcaron los años de 1912 a 1962, que hoy en día tiene mucha influencia en el pensamiento estadístico moderno.

El análisis de la variancia tiene su aplicación más amplia en el análisis de los datos obtenidos a partir de experimentos. No estudiaremos en detalle sobre los principios del diseño de experimentos, pero el que quiera puede consultar varios libros, incluyendo los de Cochran y Cox, Cox, Fisher, Daniel, Torrie, etc.

Para el análisis de variancia para diferentes diseños, se sigue el siguiente formato:

· Modelo. El modelo consistirá de una representación simbólica de un valor típico tomado de los datos que se están analizando.

· Suposiciones. Se especificarán las suposiciones que fundamentan el modelo.

· Hipótesis. Se indicarán las hipótesis que puedan probarse de acuerdo al modelo, Se indicarán las hipótesis nula y alternativa apropiadas.

· Cálculos. Se explicarán los cálculos aritméticos necesarios.

· Tabla de ANDEVA. Los resultados de los cálculos aritméticos se resumirán en una tabla que permitirán una estimación rápida y conveniente de los resultados.

Decisión. Se tomará una decisión estadística en lo referente a si debe rechazarse o no una hipótesis nula. Cualquier decisión administrativa, clínica, producción, obtención de un metabolito, etc.


ANÁLISIS DE VARIANCIA DE UNA SOLA ENTRADA DE FISHER.

Este procedimiento fue diseñado por R.A. Fisher en 1920. Esta prueba tiene una relación entre el análisis de varianza y la prueba “t” de Student, pues utilizan los mismos métodos matemáticos. Se utiliza cuando en el modelo experimental se tienen más de dos muestras independientes. Esta prueba estadística tiene la ventaja de que es versátil, flexible y de gran potencia/eficiencia.

Dada la versatilidad, parece difícil de aplicar, pero en realidad es sencilla. Para fines didácticos a diferencia de otras pruebas estadísticas, se tiene para esto, para el procesamiento aritmético se facilite se dividirá en tres etapas: Cálculo de áreas, construcción de la tabla de andeva y finalmente su análisis.

Ejemplo 4.2 Se trata de encontrar cuáles son las factores de variación que favorezcan en determinado diseño experimental, por ejemplo, la temperatura y humedad relativa de un cuarto de fermentación (condiciones ideales) para el desarrollo de una masa de pan elaborado con levadura en el menor tiempo posible. La función de la levadura durante la elaboración del pan es la producir gas (CO2) al consumir los carbohidratos disponibles en la masa elaborada. El gas producido queda atrapado en la masa aumentando esta su volumen, es entonces cuando se dice que “levantó” o bien se logró el desarrollo de la masa.

Para realizar la investigación se propuso un diseño por bloques 3x3x5 (dos criterios de clasificación y sus repeticiones), que corresponde a 3 niveles de humedad relativa (humrel) y 3 niveles de temperatura (temp) con 5 repeticiones (rep), tomando como variable respuesta el tiempo (en minutos) que se necesita para que la masa se diga que levantó.

HIPÓTESIS A PROBAR SON:

HIPÓTESIS NULA (Ho): No hay diferencias o efectos en los tratamientos.

Ho : mA = mB = mC = mN

HIPÓTESIS ALTERNA O DE TRABAJO (HA): Al menos uno de los promedios es distinto.

HA : mA ¹ mB ¹ mC ¹ mN

Tabla 4.2.1. Resultados.

Tratamientos

temp

25ºC

temp

28ºC

temp

32ºC

humrel

70%

200

193

193

191

194

194

193

192

195

197

192

195

188

190

186

humrel

75%

188

190

192

187

193

180

181

177

178

184

175

177

176

173

178

humrel

80%

192

190

189

193

192

184

186

187

188

189

168

170

169

167

172

PROCESO:

1º Calcular las áreas A, B y C. Ver la siguiente tabla 4.3.1.

ÁREA A = å X2 = 2002 + 1932 + 1932 + . . . 1722 = 1555668

ÁREA B = å(åX)2 / n. = (971)2 /5 + (950)2 /5 + . . . = 1555446.4

ÁREA C = å(ååX)2 / N = (971 + 950 + . . . 846)2 / 45 = 1552359.2

TABLA 4.3.1. Concentrado de resultados de todas las sumatorias.

Tratam.

Temp

25ºC

temp

28ºC X2

temp

32ºC X2

åX

Humrel

70%

200

193

193

191

194

40000

37249

37249

36481

37636

194

193

192

195

197

37636

37249

36864

38025

38809

192

195

188

190

186

36864

38025

35344

36100

34596

2893

å

971

971

951

Humrel

75%

188

190

192

187

193

35344

36100

36864

34969

37249

180

181

177

178

184

32400

32761

31329

31684

33856

175

177

176

173

178

30625

31329

30976

29929

31684

2729

å

950

900

879

humrel

80%

192

190

189

193

192

36864

36100

35721

37249

36864

184

186

187

188

189

33856

34596

34969

35344

35721

168

170

169

167

172

28224

28900

28561

27889

29584

2736

å

956

934

846

åX

2877

2805

2676

åX2

551939

525099

478630

1555668

å( åX)2

551855.4

525039.4

478551.8

1555446.4

2º ELABORAR LA TABLA DE ANDEVA (ANOVA).

Tabla 4.3.2. Modelo general para construir una tabla de ANDEVA.

FUENTE DE gl SC CM F a=0.05

VARIACIÓN

Entre grupos k-1 (B-C) (B-C)/(k-1) (B-C)/(k-1)

(A-B)/(N-k)

Dentro de grupos N-k (A-B) (A-B)/(N-k)

Total N-1 (A-C)

Tabla de ANDEVA 4.3.3. Resultado donde se aprecian los efectos generales.

FUENTE DE gl SC CM F a=0.05

VARIACIÓN


Entre grupos 8 3087.2 385.9 92.691333 30/8 2.27

40/8 2.18

Dentro de grupos 36 221.6 6.155555

Total 44 3308.8

Regla:

F exp > F tabla se acepta HA y se rechaza HO.

F exp <>O y se rechaza HA.

Decisión.

Al aceptarse HA, se tiene por lo menos un tratamiento distinto.

Conclusiones: Se sugiere encontrar cuál es el tratamiento que es diferente, debido a que no se puede decidir cuál tratamiento es el mejor, por lo que se sugiere buscar (las).


ANÁLISIS DE VARIANCIA DE DOS O MÁS ENTRADAS DE FISHER.

Esta prueba estadística es una alternativa donde se logra la versatilidad en la estadística de inferencia. Se aplica a problemas donde se tienen muestras dependientes o independientes y es muy útil en diversos diseños experimentales (cuadrados latinos, factoriales, ortogonales, hieráticos y regresiones lineales).

Esta prueba es importante, en que se pueden conocer los efectos que aportan los factores y/o variables que intervienen en el experimento y permite también la cancelación de otros factores, así mismo como interactúan entre sí las diversas variables recíprocamente.

Análisis de dos o más entradas.

Siguiendo el ejemplo 4.2. y a las sugerencia anterior se procede a analizarse efectos simples, después los efectos combinados de dos o más.

Se construye la tabla de andeva 4.4.1.

a) Efectos simples: Se calcula las áreas B, para temperatura y humedad relativa.

Se calcula el área Btemp (factor de temperatura) y se construye la tabla 4.4.1a.

Tabla 4.4.1a. Factor de variación: Temperatura.

Temp

25°C

Temp

28°C

Temp

32°C

971 + 950 + 956

2877

971 + 900 + 934

2805

951 + 879 + 846

2676

Para Btemp= å(åX)2/n=(2877)2/15 + (2805)2/15 + (2676)2/15

Btemp = 1553742

Se calcula SC del factor de temperatura.

SCtemp = Btemp – C = 1553742 – 1552359.2 = 1382.8

Grados de libertad = K – 1 = 3 – 1 = 2.


Se calcula el área Bhumrel (factor de humedad relativa) y se construye la tabla 4.4.1b.

Tabla 4.4.1b. Factor de variación: Humedad relativa.

Humrel

70%

Humrel

75 %

Humrel

80 %

971 + 971 + 951

2893

950 + 900 + 879

2729

956 + 934 846

2736

Para BHumrel= å(åX)2/n=(2893)2/15 + (2729)2/15 + (2736)2/15

BHumrel = 1553505.7

Se calcula SC del factor de temperatura.

SCHumrel = BHumrel – C = 1553505.7 – 1552359.2 = 1146.5

Grados de libertad = K – 1 = 3 – 1 = 2.

Y por último se calcula la interacción de Temp * Humrel.

Para esto se construye la tabla 4.4.1c.

Tabla 4.4.1c. Efectos de la interacción Temp * Humrel.

Tratamiento

Temp

25°C

Temp

28°C

Temp

32°C

Humrel 70 %

971

971

951

Humrel 75 %

950

900

879

Humrel 80 %

956

934

846

Para BTem * Humrel= å(åX)2/n=(971)2/5 + (950)2/5 + (956)2/5 + (971)2/5 + (900)2/5 + (934)2/5 + (951)2/5 + (879)2/5 + (846)2/5

BTemp * Humrel = 1555446.4

Se calcula SC del factor de temperatura y humedad relativa.

SCTemp * Humrel = BTemp * Humrel – C – ( SC de los factores participantes) = 1555446.4 – 1552359.2 – (1382.8 -+ 1146.5) = 557.9

Grados de libertad de la interacción = glTemp x glHumre = 2 x 2 = 4.

Tabla de ANDEVA 4.4.1. Resultado donde se aprecian los efectos simples y combinados.


FUENTE DE gl SC CM F a=0.05

VARIACIÓN


Temp 8 1382.8 691.4 112.321* 2/30 = 3.32

2/40 = 3.23

Humrel 36 1146.5 573.25 93.128* 2/30 = 3.32

2/40 = 3.23

Temp * Humrel 44 557.9 139.475 22.658* 4/30 = 2.69

4/40 = 2.61

Residual o 36 221.6 6.155555

(Dentro de

grupos)

Total 44 3308.8

* = Significa diferente.

ns = No significativo.


No hay comentarios:

Publicar un comentario en la entrada