Aportaciones Académicas
 


DISEÑOS EXPERIMENTALES

Disponemos de varias alternativas para examinar la relación entre dos o más variables. Entre ellas contamos con los diseños de comparación de grupos. Estos nos proporcionan un marco sistemático, al comparar grupos de sujetos que se exponen a las condiciones experimentales con grupos control, para obtener inferencias válidas. Cuando programamos una investigación de comparación de grupos lo hacemos con el propósito de cuantificar las diferencias entre dos o más grupos, con la finalidad última de encontrar diferencias estadísticamente significativas entre ellas. El papel de la comparación también es cualitativamente distinto a otros métodos de diseñar experimentos. El contribuir a la búsqueda de un conocimiento científico a gran escala prima sobre cualquier otra cuestión (Beck, Andrasik y Arena, 1984).

Esta forma de proceder puede dar lugar a toda una diversidad de diseños de comparación de grupos, aunque todos ellos requieren de la asignación al azar de los sujetos a los grupos y algún tipo de condición control. La asignación aleatoria de los sujetos a los grupos está relacionada con el proceso de formación de los grupos, condición previa a la aplicación del diseño experimental programado. La asignación al azar no es sinónimo de una selección hecha de cualquier modo. Por el contrario, más bien significa un proceso de selección que da a todos los sujetos la misma oportunidad de ser asignados a los grupos que van a participar en la investigación, con lo que nos aseguramos que las variables perturbadoras se distribuyan de modo uniforme entre los grupos. Una tabla de números aleatorios nos puede servir perfectamente para garantizar un proceso de selección al azar (Fleiss, 1981). Los sujetos serán asignados a los grupos siguiendo el orden cuyo número venga dado por la tabla de números aleatorios. Esta forma de proceder nos puede llevar o no a obtener grupos del mismo tamaño. El formar grupos que contengan el mismo número de sujetos es deseable porque algunas pruebas estadísticas, o no se pueden aplicar, o pierden potencia. La solución está en agrupar los sujetos en bloques. Cada bloque tiene que incluir tantos sujetos como el número de condiciones que haya. Una vez formados los bloques, se asignan los sujetos de los mismos a los grupos de modo aleatorio.

Sin embargo, hay que tener presente que la asignación aleatoria en determinadas condiciones, como cuando el tamaño de la muestra es pequeño (ver Strube, 1991) o cuando hay puntuaciones extremas en la muestra, puede no garantizarnos la equivalencia de los grupos en cuestión. Habrá que utilizar otros procedimientos alternativos para poder inferir que la presencia o no de cambios, que se han producido en la variable dependiente, se deben probablemente a la manipulación de la variable experimental y no a otros factores. Una de las estrategias alternativas a la asignación aleatoria que se utiliza con más frecuencia para formar grupos equivalentes es el emparejamiento. Esta nos permite agrupar a los sujetos en función de la similitud de una dimensión o conjunto de dimensiones, que conocemos o sospechamos que se relacionan con la ejecución en la medida(s) dependiente(s), y posteriormente, procedemos a asignar aleatoriamente a los sujetos a los grupos. Si no se neutralizan las diferencias que pueda haber antes de la intervención entre los grupos, en una variable que influye en la ejecución de la medida dependiente, puede generar confusión en las conclusiones a las que se llegue al final del experimento. El emparejamiento se puede realizar de diferentes maneras. Por ejemplo, formamos bloques de sujetos con un tamaño igual al número de grupos que vamos a utilizar en el experimento, que posean idénticas puntuaciones en una característica o patrón de características pretratamiento. A continuación, asignamos al azar cada uno de los sujetos de cada bloque a los grupos, utilizando la tabla de números aleatorios o mediante una moneda lanzada al aire.

Normalmente una investigación, en la que se utilice alguna modalidad de diseños de comparación de grupos, comienza con la selección del número de sujetos objeto de estudio, le sigue la asignación aleatoria de los mismos a los grupos experimental y control y finaliza con la evaluación de las diferencias entre los grupos al final del tratamiento. A continuación vamos a exponer aquellos diseños que se utilizan con mayor frecuencia en la evaluación de los tratamientos psicológicos. Para aportar una mayor claridad a la exposición de las características distintivas de los diseños nos remitiremos a la nomenclatura acuñada por Campbell y Stanley (1966). Con ella pretendemos presentar los diseños experimentales a través de un código y unos símbolos gráficos uniformes que nos ayuden a identificar el diseño en cuestión. Una X representará la exposición del grupo a la variable independiente que manipulamos o tratamiento, la O nos señalará que hay una evaluación de la ejecución o proceso de observación y la R indicará la asignación aleatoria de los sujetos a los diferentes grupos. Los símbolos X y O cuando aparecen de izquierda a derecha serán indicio de orden temporal y cuando lo hacen de forma vertical representarán simultaneidad.

- Diseños de grupo control pretest-postest.

Este diseño, sin lugar a dudas, es el que más se utiliza en la investigación cuando utilizamos un diseño experimental de comparación de grupos. Incluye un mínimo de dos grupos, uno recibe tratamiento y el otro no. Los sujetos se asignan aleatoriamente a las condiciones experimental y control, ya sea antes o después de la aplicación del pretest. Ahora bien, lo peculiar del mismo es la evaluación que se realiza antes y al final del tratamiento a los grupos experimental y control. Esto nos permite averiguar el efecto de la intervención, que viene dado por la cantidad de cambio que se ha producido desde la evaluación pretratamiento a la postratamiento. Este tipo de diseño se representará gráficamente de la siguiente forma: asignación aleatoria de los sujetos (R), observación o evaluación (0) e intervención experimental o tratamiento (X)

R 01 X
02
R O3
O4

Además de excluir explicaciones alternativas de los resultados debido a la incorporación de grupos control, y siempre que el período de intervención entre la evaluación pre y postest sea el mismo para todos los grupos, con lo que nos permite un control de las amenazas a la validez interna (ej., historia, maduración, medición, instrumentación), la utilización de un pretest reporta varias ventajas. Posibilita evaluar la cantidad de cambio que se produjo con la intervención, cuántos sujetos han cambiado en una dimensión particular, la posibilidad de equiparar a los sujetos en base a alguna dimensión importante y asignar al azar a los grupos los sujetos emparejados, la valoración de los efectos de diferentes niveles de ejecución en el pretest, examinar los factores del pretest que predicen el abandono del tratamiento, precisar pormenorizadamente en las explicaciones de los cambios observados a consecuencia de la manipulación experimental, la valoración de la atracción de un modo más riguroso y acarrea ventajas de orden estadístico a la hora de analizar los datos porque la utilización de un pretest reduce la variabilidad intragrupo.

Ahora bien, este diseño presenta algunos inconvenientes. Sin duda el más acusado es la imposibilidad de control sobre la sensibilización inherente a la utilización del pretest. Existe la posibilidad de que al evaluar a los sujetos antes de que reciban tratamiento, les conduzca a responder de un modo específico a la intervención subsiguiente. O lo que es lo mismo, la posibilidad de que un tratamiento genere algún cambio cuya explicación puede residir en la susodicha sensibilización de los sujetos a la intervención. Esto no mengua la validez interna, pero sí supone coartar la validez externa. Los resultados del estudio sólo se pueden generalizar a aquellos sujetos que recibieron una evaluación pretest. Una solución "relativa" es espaciar la manipulación experimental en el tiempo y en el contexto en que se realiza. La solución es "relativa" porque cuanto más tiempo transcurra entre el pretest y la intervención, aumenta la probabilidad de que aparezcan nuevas amenazas a la validez interna (ej., historia, maduración). Ahora bien, en la investigación de la eficacia de los tratamientos el fenómeno de la sensibilización es trivial, dada la importancia clínica que nos puede proporcionar el pretest, porque la sensibilización no siempre ocurre (no ha demostrado ser una influencia generalizada en los resultados) y su efecto es similar a través de las distintas condiciones de una investigación dada. La importancia clínica de los datos del pretest hace referencia a que nos ayudan a comprender el funcionamiento del cliente, identificar los problemas en los que tenemos que intervenir y es un procedimiento útil para fijar los criterios de inclusión y exclusión para una determinada investigación o tratamiento (ver Kazdin, 1992).

- Diseño de grupo control con sólo postest.

Este tipo de diseño se utiliza mucho menos en la investigación clínica por no utilizar un pretest. Necesita un mínimo de dos grupos y es similar al diseño de grupo control pretest-postest; sólo se diferencia en que no incluye pretest. A un grupo sólo se le efectúa una medida después de la intervención y al otro también se le administra una medida al final, sin que haya sido expuesto a un tratamiento previo. Su representación gráfica es la siguiente: asignación aleatoria para formar ambos grupos (R), se aplica la intervención al grupo experimental (X) y se evalúa el resultado tanto para la condición experimental como para la control (0)

R X 01
R
02

La ausencia de un pretest subsana los problemas de la sensibilización, que se puede presentar en el diseño de grupo control pretest-postest. Se gana en validez externa porque el resultado final del tratamiento no se debería a que el pretest ha provocado una sensibilización en los sujetos, con lo que la generalización ya no estaría limitada sólo a sujetos que recibieron el pretest. Además, este diseño, permite controlar las amenazas a la validez interna, siempre y cuando hayamos contado con un número grande de sujetos que fueron asignados aleatoriamente a los distintos grupos de la investigación. Con estas dos medidas la probabilidad de equivalencia de los grupos es alta. Por tanto, minimizamos la posibilidad de que las diferencias de grupo después de la intervención se deban a las diferencias entre las condiciones antes de la intervención.

El diseño de grupo control con postest presenta varios problemas. En primer lugar, si la muestra es pequeña, aunque se asignaran los sujetos al azar, estamos ante la posibilidad de que los resultados obtenidos en la investigación se puedan achacar a las diferencias entre los grupos antes del tratamiento. Es más, utilizando una muestra adecuada y la asignación aleatoria no podemos ni evaluar ni asegurar con total garantía la posibilidad de que las condiciones de partida sean homogéneas. En segundo lugar, la ausencia de un pretest nos impide conocer el nivel de funcionamiento de las personas antes del tratamiento, lo cual muchas veces es determinante y necesario en algunos estudios (ej., estudios diseñados para tratar o prevenir distintos trastornos) que se abordan en la investigación clínica. Y, en tercer lugar, las ventajas enumeradas para el grupo control pretest-postest pasan a ser desventajas para el grupo control postest (Kazdin, 1994). Además de la incapacidad para asegurar la posibilidad de grupos equivalentes, no poder emparejar a los sujetos en el nivel de ejecución previamente al proceso de asignación al azar, también encontramos otras tales como la ausencia de información para valorar la atracción diferencial entre los grupos o una potencia estadística reducida.

- Diseño de cuatro grupos de Solomon.

Este diseño es una integración de los dos anteriores y la finalidad del mismo es evaluar los efectos del pretest sobre los resultados obtenidos en una investigación dada (Solomon, 1949). Incorpora cuatro grupos, dos grupos con pretest y los otros dos sólo con postest. De esta forma se consigue evaluar directamente las influencias pretest, comparando los resultados de los grupos en los que se ha administrado el pretest con aquellos en los que no se ha utilizado. Este objetivo no está al alcance de los diseños que se han expuesto anteriormente, ya que el diseño de grupo control pretest-postest está expuesto a una posible sensibilización pretest que pone cortapisas a su validez externa, y en el diseño postest, se obvia esta amenaza a dicha validez a costa de eliminar el pretest. A continuación presentamos un esbozo del diseño de cuatro grupos de Solomon:

R 01
X 02
R 03
04
R
X 05
R
O6

Tal y como podemos intuir este diseño aúna las ventajas del diseño de grupo control pretest-postest y de grupocontrol con sólo postest. Permite un control exhaustivo de las amenazas validez interna y subsana la amenaza a la validez externa derivada de lasensibilización pretest. Posibilita que se puedan evaluar los efectos derivados de la medición pretest y de la interacción pretest x tratamiento, a través de la comparación entre los grupos control con y sin pretest (O4 vs. O6) y las condiciones experimentales con y sin pretest (O2 vs. O5), respectivamente. Además, la utilización de este diseño conlleva una réplica del tratamiento y de las condiciones de control en un único estudio. Como inconveniente natural se ha argüido el costo, derivado de la necesidad de incluir el doble de sujetos que en otros diseños. No obstante, el costo que pueda acarrear el diseño de cuatro grupos de Solomon se ve compensado con creces en la robustez de las inferencias que se puedan extraer de una investigación particular.

- Diseños factoriales.

Al contrario que los diseño simples, los factoriales nos brindan la oportunidad de estudiar dos o más variables (factores) en una sola investigación (Kazdin, 1980; 1992; McGuigan, 1983). En cada variable se administran dos o más condiciones (niveles). El diseño factorial más simple incorpora dos variables, en que a su vez, cada una de ellas consta de dos niveles diferentes (diseño 2 x 2); dos variables A y B con dos niveles, A1 y A2 vs. B1 y B2. Por tanto, tenemos cuatro grupos que representan las posibles combinaciones de los niveles de las dos variables. El elsiguiente diagrama se ilustra este diseño.

El diseño factorial se considera como una familia de diseños que varía en el número y tipo de variables, así como en el número de niveles para cada variable. La complejidad de los diseños están en función del número de variables y de niveles que incluyamos en un

FACTOR A
A1 A2
FACTOR B B1 A1B1 A2B1
B2 A1B2 A2B2

determinado estudio (ej., 2 x 3; 2 x 3 x 2; 2 x 5 x 3 x 6). En algunas ocasiones, bajo determinadas condiciones, por ejemplo, cuando todos los sujetos reciben todas las condiciones experimentales, se utiliza un enfoque de medidas repetidas. También podemos utilizar la evaluación como un factor, en concreto, cuando utilizamos un pretest, para evaluar las influencias de la medición repetida en una investigación particular. De tal forma que tenemos una variable independiente, la evaluación, con dos niveles, el pretest y el postest. La ventaja principal que nos ofrecen estos diseños es la oportunidad de analizar los efectos individuales y combinados (interacción) de las variables incluidas en un único estudio. La interacción nos indica que el efecto de una variable depende de alguna de las otras condiciones bajo la cual es administrada. La variable produce unos determinados resultados sólo bajo ciertas condiciones. Ello significa que la generalización de dicho efecto queda restringido a esas situaciones concretas.

Los diseños factoriales no suponen un menoscabo de la utilidad de los diseños simples. Estos últimos se deben utilizar cuando se plantean cuestiones relativamente simples acerca de una variable de interés, lo que normalmente sucede cuando se inician nuevas áreas de investigación, pues el estudio de las cuestiones más sencillas se hace imprescindible en esas primeras fases. A medida que vamos acumulando información a través de diseños simples, se pueden plantear cuestiones más complejas, pero echando mano de otras estrategias. Precisamente, los diseños factoriales nos permiten apresar estas cuestiones derivadas de la acumulación del conocimiento sobre un aspecto concreto. De hecho estos se han utilizado con una mayor asiduidad en la investigación clínica y psicológica en general. Además, posibilitan llegar a las mismas conclusiones que las aportadas por diseños más simples, utilizando un menor número de sujetos y observaciones, lo que se traduce en una mayor prestación en cuanto a los costes.

Los inconvenientes que pueda presentar este diseño se relacionan directamente con el número de factores y niveles que se incluyan en el estudio. Por ejemplo, un diseño factorial de 2 x 3 x 2 implica doce grupos experimentales. Por tanto, a medida que incrementamos ambos se necesitan más sujetos y también se hace más difícil la interpretación de los resultados.

{ Anterior } { Indice } { Siguiente }

Regresar a la página principal