2º Bachillerato Psicología UD 5 El aprendizaje

 

3. Condicionamiento clásico

Os pongo aquí un artículo interesante sobre el trabajo de Pavlov que sentó las bases del condicionamiento clásico.


Como ya estudiamos en el primer tema Watson fue uno de los grandes impulsores del conductismo y trabajó a partir del trabajo de Pavlov. Aquí os dejo uno de sus experimentos más llamativos (y que hoy sería imposible de realizar):


3. Condicionamiento operante

En clase estudiamos el condicionamiento clásico que consiste en la capacidad del ser vivo de prever acontecimientos futuros y asociarlos a estímulos que, en principio, no guardan relación directa con ellos. El condicionamiento operante se diferencia en que el organismo no es un sujeto pasivo sino que, de forma voluntaria, actúa para obtener un objetivo.

La definición, que copiamos en su cuadrito bonito correspondiente sería:

Condicionamiento operante: condicionamiento en que el organismo opera, actúa o interviene para obtener un refuerzo. También se le denomina condicionamiento instrumental puesto que la respuesta del organismo es un medio para obtener una meta.

3.1 Primeras investigaciones

Thorndike, en la primera mitad del siglo XX, hizo numerosos experimentos introduciendo gatos en distintas jaulas diseñadas por él mismo y de las que el gato podía escapar accionando un pestillo. Al principio los gatos producían respuestas estereotipadas e innatas (oler la comida, golpear las paredes, intentar llegar a ella) hasta que accionaban el pestillo y conseguían abrir la puerta y acceder a la comida. Cuando repetía los ensayos los gatos salían de la jaula cada vez más rápido: obviamente estaban aprendiendo para qué era el pestillo y cómo abrir la puerta.

Los animales aprenderían mediante ensayo-error

Como resultado de estos experimentos estableció la ley del efecto que se enuncia: Cualquier conducta que en una situación produce un resultado satisfactorio, se hará más probable en el futuro. Si una respuesta va seguida de un hecho satisfactorio, la asociación entre el estímulo y la respuesta se fortalece; y sí a la respuesta le sigue un hecho desagradable, la asociación disminuye.




El trabajo de Thorndike está muy desfasado pero su influencia y especialmente ideas como el poder de la recompensa en el aprendizaje han sido claves para los trabajos posteriores.

Skinner desarrolló el concepto de condicionamiento operante o instrumental a partir de las ideas de Thorndike. Él se planteaba dos problemas en la investigación sobre la conducta basada en consecuencias:

a) Si utilizamos cajas-problema o laberintos, la conducta que observamos es discreta.

b) ¿Cómo dividir la conducta en trozos analizables, cuando en el mundo real vemos que es un continuo?

Para dar solución a estos problemas utilizó dos estrategias:

a) Diseñó un dispositivo (caja de Skinner) que permitiese al organismo emitir la conducta sin restricciones para así poder medir conductas semejantes a las que ocurren en el mundo real.

b) Planteó la idea de operante: una unidad conductual que se define por los efectos que opera en el ambiente (da lugar al nombre de condicionamiento operante).


Hemos de tener en cuenta que Skinner no habla de asociación estímulo-respuesta, sino de incremento de la fuerza de la respuesta por las consecuencias que la siguen. Las respuestas a una situación que van seguidas por un refuerzo, se fortalecen y tienen mayor probabilidad de repetirse en el futuro.  




3.2. Elementos del condicionamiento instrumental

El condicionamiento instrumental es el aprendizaje en el que una respuesta voluntaria se refuerza o debilita, según las consecuencias sean positivas o negativas. A diferencia del condicionamiento clásico, donde los comportamientos son las respuestas biológicas naturales a la presencia de estímulos (como el alimento, agua, dolor, etc etc), en el condicionamiento operante el organismo actúa en su ambiente con unas respuestas voluntarias para producir el resultado deseado.

Un refuerzo es cualquier estímulo que aumenta la probabilidad de una conducta. El refuerzo puede ser tanto un estímulo apetitivo (consecuencia placentera) como un estímulo aversivo (consecuencia desagradable o dolorosa). Según Skinner, podemos distinguir:

a) Refuerzos primarios; son estímulos biológicamente importantes porque son innatos como la sensación de placer durante el coito (apetitivo) o el dolor con una quemadura (aversivo).

b) Refuerzos secundarios; son estímulos cuyas propiedades reforzantes se deben a su asociación con los refuerzos primarios: por ejemplo un premio tras hacer bien una tarea (apetitivo) o un castigo tras no hacerla (aversivo).

3.3. Procedimientos del condicionamiento operante

Hay cuatro tipos de condicionamiento instrumental: refuerzo positivorefuerzo negativoentrena-miento por omisión y castigo.

3.3.1. Refuerzo positivo

El refuerzo positivo es un objeto, premio o conducta que incrementa la frecuencia de la respuesta (por ejemplo la comida, el dinero, …). Es un mecanismo muy efectivo para que los animales y los seres humanos aprendan. La efectividad del refuerzo positivo depende de algunas variables, tales cómo:

a) Cuanto mayor es la cantidad de recompensa (intensidad), mayor es el esfuerzo realizado. Si modificamos el tipo de recompensa, se produce una variación en la conducta. No es igual trabajar por un salario que por otro. Las alabanzas, las notas, etc etc, también ejercen un efecto positivo en los estudiantes.

b) Entre el refuerzo y la conducta reforzada tiene que haber una proximidad temporal. Si se demora la entrega del refuerzo, se reduce la ejecución de la conducta (incluso puede no asociarse el refuerzo a la conducta al no relacionar el uno con la otra).

c) El nivel de motivación es fundamental en el aprendizaje. Si colocamos a dos ratas, una hambrienta y otra saciada, en un laberinto con un trozo de queso en la meta, la hambrienta dedicará todas sus energías a recorrer el laberinto mientras la segunda se demorará curioseando.

Debemos tener cuidado con nunca reforzar positivamente conductas indeseadas pues estaremos haciendo que sean más frecuentes e intensas. Por ejemplo, si damos una chuche, un regalo, o incluso simplemente atención, a un niño que tiene una rabieta o se comporta mal estaremos enseñándole que esos comportamientos son la forma de obtener lo que desea y, por lo tanto, en lugar de evitar esas conductas las estaremos promoviendo.

3.3.2. Refuerzo negativo

El refuerzo negativo se produce cuando la realización de una conducta elimina un estímulo aversivo. No debe confundirse con el castigo (son cosas totalmente diferentes) ni asociar positivo a bueno y negativo a malo. Existen dos procedimientos:

a) Condicionamiento de escape; en esta situación el estímulo aversivo se presenta continuamente, pero se puede interrumpir si se da la respuesta instrumental. Por ejemplo podemos escapar de un programa de televisión aburrido apagando la televisión.

b) Aprendizaje de evitación; el estímulo aversivo se programa para ser presentado en el futuro, y la respuesta lo evita. Por ejemplo tenemos unos hábitos de vida saludables para prevenir enfermedades futuras.


3.3.3. Entrenamiento por omisión

Se produce cuando la respuesta operante impide la presentación de un reforzador apetitivo o de un hecho agradable. Con este procedimiento, también denominado "tiempo fuera", se logra un descenso en la conducta instrumental.

Un ejemplo muy típico se produce cuando un niño demanda atención de forma inadecuada portándose mal o con una rabieta y se le manda solo a otra habitación. De esta manera se le está negando la recompensa que quiere con esa conducta: la atención paterna (o de sus compañeros si ocurre en una clase).




3.3.4. Castigo

El castigo es el precio que se paga por una conducta inadecuada y sirve de amenaza para conseguir la adhesión del individuo a las normas. El castigo provoca una disminución de una conducta porque el suceso que la sigue recibe un estímulo aversivo.

Podemos distinguir dos tipos de castigos:

a) Castigo positivo; consiste en administrar un estímulo indeseado. Por ejemplo, si no ordenamos nuestra habitación recibimos la riña de nuestros progenitores.

b) Castigo negativo; implica retirar un estímulo deseado por el sujeto. Por ejemplo, el profesor castiga sin recreo a un alumno que no ha trabajado durante la clase.

Al igual que pasaba con el refuerzo, los principales factores que influyen en la efectividad del castigo son: intensidad (cuánto más fuerte sea el castigo, mayor es la supresión de la conducta), inmediatez (cuanto menor sea el tiempo entre la conducta y el castigo más efectivo será) y constancia (es fundamental que la misma conducta sea siempre castigada; sí a veces se castiga, y a veces no, se tenderá a desconectar la relación causal entre conducta y castigo y, por lo tanto, su efectividad).


El castigo enseña qué es lo que no hay que hacer pero no lo que hay que hacer así que debe verse complementado con otras técnicas conductistas.

Un caso especial y llamativo en el que se aprecia que el castigo o el refuerzo no nos enseñan que hacer de forma correcta por sí solos sería la conducta supersticiosa. La superstición es la creencia de que un evento influye en otro evento sin tener una relación causal demostrada (por ejemplo, si me cruzo con un gato negro tendré mala suerte y me pasarán cosas malas). Obviamente no hay ninguna relación pero cuando me pase algo negativo después del primer suceso lo asociaré vivamente a él reforzando mi creencia supersticiosa (mientras que todas las cosas neutras o positivas que me ocurran tras cruzarme con un gato negro no despertarán esa atención).

















No hay comentarios:

Publicar un comentario