ANÁLISIS DE VARIANCIA.
INTRODUCCIÓN
Puede definirse como una técnica mediante la cual la variación total presente en un conjunto de datos se distribuye en varios componentes. Asociada con cada uno de estos componentes hay una fuente específica de variación, de modo que en el análisis es posible averiguar la magnitud de las contribuciones de cada una de estas fuentes a la variación total.
El desarrollo de esta materia se debe principalmente al trabajo del desaparecido Ronald A. Fisher, cuyos trabajos en la Estadística abarcaron los años de 1912 a 1962, que hoy en día tiene mucha influencia en el pensamiento estadístico moderno.
El análisis de la variancia tiene su aplicación más amplia en el análisis de los datos obtenidos a partir de experimentos. No estudiaremos en detalle sobre los principios del diseño de experimentos, pero el que quiera puede consultar varios libros, incluyendo los de Cochran y Cox, Cox, Fisher, Daniel, Torrie, etc.
Para el análisis de variancia para diferentes diseños, se sigue el siguiente formato:
· Modelo. El modelo consistirá de una representación simbólica de un valor típico tomado de los datos que se están analizando.
· Suposiciones. Se especificarán las suposiciones que fundamentan el modelo.
· Hipótesis. Se indicarán las hipótesis que puedan probarse de acuerdo al modelo, Se indicarán las hipótesis nula y alternativa apropiadas.
· Cálculos. Se explicarán los cálculos aritméticos necesarios.
· Tabla de ANDEVA. Los resultados de los cálculos aritméticos se resumirán en una tabla que permitirán una estimación rápida y conveniente de los resultados.
ANÁLISIS DE VARIANCIA DE UNA SOLA ENTRADA DE FISHER.
Este procedimiento fue diseñado por R.A. Fisher en 1920. Esta prueba tiene una relación entre el análisis de varianza y la prueba “t” de Student, pues utilizan los mismos métodos matemáticos. Se utiliza cuando en el modelo experimental se tienen más de dos muestras independientes. Esta prueba estadística tiene la ventaja de que es versátil, flexible y de gran potencia/eficiencia.
Dada la versatilidad, parece difícil de aplicar, pero en realidad es sencilla. Para fines didácticos a diferencia de otras pruebas estadísticas, se tiene para esto, para el procesamiento aritmético se facilite se dividirá en tres etapas: Cálculo de áreas, construcción de la tabla de andeva y finalmente su análisis.
Ejemplo 4.2 Se trata de encontrar cuáles son las factores de variación que favorezcan en determinado diseño experimental, por ejemplo, la temperatura y humedad relativa de un cuarto de fermentación (condiciones ideales) para el desarrollo de una masa de pan elaborado con levadura en el menor tiempo posible. La función de la levadura durante la elaboración del pan es la producir gas (CO2) al consumir los carbohidratos disponibles en la masa elaborada. El gas producido queda atrapado en la masa aumentando esta su volumen, es entonces cuando se dice que “levantó” o bien se logró el desarrollo de la masa.
Para realizar la investigación se propuso un diseño por bloques 3x3x5 (dos criterios de clasificación y sus repeticiones), que corresponde a 3 niveles de humedad relativa (humrel) y 3 niveles de temperatura (temp) con 5 repeticiones (rep), tomando como variable respuesta el tiempo (en minutos) que se necesita para que la masa se diga que levantó.
HIPÓTESIS A PROBAR SON:
HIPÓTESIS NULA (Ho): No hay diferencias o efectos en los tratamientos.
Ho : mA = mB = mC = mN
HIPÓTESIS ALTERNA O DE TRABAJO (HA): Al menos uno de los promedios es distinto.
HA : mA ¹ mB ¹ mC ¹ mN
Tabla 4.2.1. Resultados.
Tratamientos | temp 25ºC | temp 28ºC | temp 32ºC |
humrel 70% | 200 193 193 191 194 | 194 193 192 195 197 | 192 195 188 190 186 |
humrel 75% | 188 190 192 187 193 | 180 181 177 178 184 | 175 177 176 173 178 |
humrel 80% | 192 190 189 193 192 | 184 186 187 188 189 | 168 170 169 167 172 |
PROCESO:
1º Calcular las áreas A, B y C. Ver la siguiente tabla 4.3.1.
ÁREA A = å X2 = 2002 + 1932 + 1932 + . . . 1722 = 1555668
ÁREA B = å(åX)2 / n. = (971)2 /5 + (950)2 /5 + . . . = 1555446.4
ÁREA C = å(ååX)2 / N = (971 + 950 + . . . 846)2 / 45 = 1552359.2
TABLA 4.3.1. Concentrado de resultados de todas las sumatorias.
Tratam. | Temp 25ºC | temp 28ºC X2 | temp 32ºC X2 | åX | |||
Humrel 70% | 200 193 193 191 194 | 40000 37249 37249 36481 37636 | 194 193 192 195 197 | 37636 37249 36864 38025 38809 | 192 195 188 190 186 | 36864 38025 35344 36100 34596 | 2893 |
å | 971 | | 971 | | 951 | | |
Humrel 75% | 188 190 192 187 193 | 35344 36100 36864 34969 37249 | 180 181 177 178 184 | 32400 32761 31329 31684 33856 | 175 177 176 173 178 | 30625 31329 30976 29929 31684 | 2729 |
å | 950 | | 900 | | 879 | | |
humrel 80% | 192 190 189 193 192 | 36864 36100 35721 37249 36864 | 184 186 187 188 189 | 33856 34596 34969 35344 35721 | 168 170 169 167 172 | 28224 28900 28561 27889 29584 | 2736 |
å | 956 | | 934 | | 846 | | |
åX | 2877 | | 2805 | | 2676 | | |
åX2 | | 551939 | | 525099 | | 478630 | 1555668 |
å( åX)2 | | 551855.4 | | 525039.4 | | 478551.8 | 1555446.4 |
Tabla 4.3.2. Modelo general para construir una tabla de ANDEVA.
FUENTE DE gl SC CM F a=0.05
VARIACIÓN
Entre grupos k-1 (B-C) (B-C)/(k-1) (B-C)/(k-1)
(A-B)/(N-k)
Dentro de grupos N-k (A-B) (A-B)/(N-k)
Total N-1 (A-C)
Tabla de ANDEVA 4.3.3. Resultado donde se aprecian los efectos generales.
FUENTE DE gl SC CM F a=0.05
VARIACIÓN
Entre grupos 8 3087.2 385.9 92.691333 30/8 2.27
40/8 2.18
Dentro de grupos 36 221.6 6.155555
Total 44 3308.8
Regla:
F exp > F tabla se acepta HA y se rechaza HO.
F exp <>O y se rechaza HA.
Decisión.
Al aceptarse HA, se tiene por lo menos un tratamiento distinto.
Conclusiones: Se sugiere encontrar cuál es el tratamiento que es diferente, debido a que no se puede decidir cuál tratamiento es el mejor, por lo que se sugiere buscar (las).
ANÁLISIS DE VARIANCIA DE DOS O MÁS ENTRADAS DE FISHER.
Esta prueba estadística es una alternativa donde se logra la versatilidad en la estadística de inferencia. Se aplica a problemas donde se tienen muestras dependientes o independientes y es muy útil en diversos diseños experimentales (cuadrados latinos, factoriales, ortogonales, hieráticos y regresiones lineales).
Esta prueba es importante, en que se pueden conocer los efectos que aportan los factores y/o variables que intervienen en el experimento y permite también la cancelación de otros factores, así mismo como interactúan entre sí las diversas variables recíprocamente.
Análisis de dos o más entradas.
Siguiendo el ejemplo 4.2. y a las sugerencia anterior se procede a analizarse efectos simples, después los efectos combinados de dos o más.
Se construye la tabla de andeva 4.4.1.
a) Efectos simples: Se calcula las áreas B, para temperatura y humedad relativa.
Se calcula el área Btemp (factor de temperatura) y se construye la tabla 4.4.1a.
Tabla 4.4.1a. Factor de variación: Temperatura.
Temp 25°C | Temp 28°C | Temp 32°C |
971 + 950 + 956 2877 | 971 + 900 + 934 2805 | 951 + 879 + 846 2676 |
Para Btemp= å(åX)2/n=(2877)2/15 + (2805)2/15 + (2676)2/15
Btemp = 1553742
Se calcula SC del factor de temperatura.
SCtemp = Btemp – C = 1553742 – 1552359.2 = 1382.8
Grados de libertad = K – 1 = 3 – 1 = 2.
Se calcula el área Bhumrel (factor de humedad relativa) y se construye la tabla 4.4.1b.
Tabla 4.4.1b. Factor de variación: Humedad relativa.
Humrel 70% | Humrel 75 % | Humrel 80 % |
971 + 971 + 951 2893 | 950 + 900 + 879 2729 | 956 + 934 846 2736 |
Para BHumrel= å(åX)2/n=(2893)2/15 + (2729)2/15 + (2736)2/15
BHumrel = 1553505.7
Se calcula SC del factor de temperatura.
SCHumrel = BHumrel – C = 1553505.7 – 1552359.2 = 1146.5
Grados de libertad = K – 1 = 3 – 1 = 2.
Y por último se calcula la interacción de Temp * Humrel.
Para esto se construye la tabla 4.4.1c.
Tabla 4.4.1c. Efectos de la interacción Temp * Humrel.
Tratamiento | Temp 25°C | Temp 28°C | Temp 32°C |
Humrel 70 % | 971 | 971 | 951 |
Humrel 75 % | 950 | 900 | 879 |
Humrel 80 % | 956 | 934 | 846 |
Para BTem * Humrel= å(åX)2/n=(971)2/5 + (950)2/5 + (956)2/5 + (971)2/5 + (900)2/5 + (934)2/5 + (951)2/5 + (879)2/5 + (846)2/5
BTemp * Humrel = 1555446.4
Se calcula SC del factor de temperatura y humedad relativa.
SCTemp * Humrel = BTemp * Humrel – C – ( SC de los factores participantes) = 1555446.4 – 1552359.2 – (1382.8 -+ 1146.5) = 557.9
Grados de libertad de la interacción = glTemp x glHumre = 2 x 2 = 4.
Tabla de ANDEVA 4.4.1. Resultado donde se aprecian los efectos simples y combinados.
FUENTE DE gl SC CM F a=0.05
VARIACIÓN
Temp 8 1382.8 691.4 112.321* 2/30 = 3.32
2/40 = 3.23
Humrel 36 1146.5 573.25 93.128* 2/30 = 3.32
2/40 = 3.23
Temp * Humrel 44 557.9 139.475 22.658* 4/30 = 2.69
4/40 = 2.61
Residual o 36 221.6 6.155555
(Dentro de
grupos)
Total 44 3308.8
* = Significa diferente.
No hay comentarios:
Publicar un comentario