Loading

agosto 14, 2009

Breve escrito sobre la conducta operante

Obra original de B. F. Skinner

Se ha sabido desde hace mucho que la conducta es afectada por sus consecuencias. Recompensamos y castigamos a la gente, por ejemplo, de modo que ella se comporte en maneras diferentes. Un efecto más específico de una consecuencia primero fue estudiado experimental por Edward L. Thorndike en un experimento bien conocido. Un gato incluido en una caja luchó para escaparse y movió eventualmente el cierre que abrió la puerta. Cuando estaba incluido en varias ocasiones en una caja, el gato dejó gradualmente de hacer esas cosas que habían probado ineficaz (los “errores”) y eventualmente lo habían hecho la respuesta acertada muy rápidamente.

La operante que condiciona, la conducta también es afectada por sus consecuencias, pero el proceso no es aprendizaje por prueba y error. Puede ser explicado mejor con un ejemplo. Una rata hambrienta se coloca en una caja semi-insonora. Por varios días los pedacitos del alimento son entregados de vez en cuando en una bandeja por un dispensador automático. La rata pronto va a la bandeja inmediatamente sobre la audición del sonido del dispensador. Una pequeña sección horizontal de una palanca que resaltaba de la pared se ha estado reclinando en su posición más baja, pero ahora se levanta levemente de modo que cuando la rata la toca, se mueva hacia abajo. Al hacer eso cierra un circuito eléctrico y funciona el dispensador del alimento. Inmediatamente después de comer el alimento entregado la rata comienza a presionar la palanca bastante rápidamente. La conducta ha sido consolidada o reforzada por una sola consecuencia. La rata “no intentaba” hacer cualquier cosa cuando primero tocó la palanca y no aprendió de “errores.”

Para una rata hambrienta, el alimento es un reforzador natural, pero el reforzador en este ejemplo es el sonido del dispensador del alimento, que fue condicionado como reforzador cuando fue seguido en varias ocasiones por la entrega del alimento antes de que la palanca fuera presionada. De hecho, el sonido de esa operación del dispensador habría tenido un efecto observable aunque no se entregara ningún alimento en esa ocasión, pero cuando el alimento sigue no más presionar la palanca, la rata para eventual de presionar. La conducta, se dice se ha extinguido.

Una operante puede llegar a estar bajo el control de un estímulo. Si se refuerza presionar la palanca cuando una luz está encendida pero no cuando está apagada, las respuestas continúan siendo hechas en la luz pero raramente, si en absoluto, en la obscuridad. La rata ha formado una discriminación entre ligero y la obscuridad. Cuando uno enciende la luz, una respuesta ocurre, pero eso no es una respuesta refleja.

La palanca se puede presionar con diversas cantidades de fuerza, y si solamente se refuerzan las respuestas fuertes, la rata presiona cada vez más poderosamente. Si solamente se refuerzan las respuestas débiles, responde eventualmente presionando muy débil. El proceso se llama discriminación. Una respuesta debe primero ocurrir por otras razones antes de que esta sea reforzada y siente bien a una operante. Puede parecer como si una respuesta muy compleja nunca ocurriera para ser reforzada, pero las respuestas complejas pueden ser formadas reforzando sus piezas por separado y poniéndolas juntas en la forma final por el operador. La operante que refuerza no sólo forma la topografía de la conducta, él la mantiene después de que se haya formado. Los horarios del refuerzo son importantes en comportamiento que mantiene. Si una respuesta se ha reforzado por algún tiempo solamente una vez cada cinco minutos, por ejemplo, las paradas de la rata pronto respondían inmediatamente después que refuerzo, pero responde cada vez más rápidamente mientras que la época para el refuerzo siguiente se acerca. (Esto se llama horario de intervalo fijo del refuerzo.) Si una respuesta ha sido reforzada el promedio cada cinco minutos pero imprevisible, la rata responde a una tarifa constante. (Esto es un horario de refuerzo de intervalo variable.) Si el intervalo medio es corto, la tarifa es alta; si es larga, la tarifa es baja.

Si se refuerza una respuesta cuando un número dado de respuestas se ha emitido, la rata responde cada vez más rápidamente mientras que se acerca el número requerido. (Esto es el cociente de refuerzo fijo.) El número se puede aumentar en las etapas fáciles hasta mismo un elevado valor; la rata continuará respondiendo aunque una respuesta se refuerza solamente muy raramente. La “paga del pedazo-tarifa” en industria es un ejemplo de un horario de cociente fijo, y aumentando tientan a los patrones a veces “para estirarlo” la cantidad de trabajo requerida para cada unidad de pago. Cuando el refuerzo ocurre después de un número medio de respuestas pero imprevisible, el horario se llama cociente variable. Es familiar en los dispositivos y los sistemas de juego que arreglan rentabilidades ocasionales pero imprevisibles. El número requerido de respuestas puede ser estirado fácilmente, y en una empresa de juego tal como un casino el cociente medio debe ser tal que el jugador pierde a largo plazo si el casino logra un beneficio.

Los reforzadores pueden ser positivos o negativos. Un reforzador positivo refuerza cuando se presenta; un reforzador negativo refuerza cuando se retira. El refuerzo negativo no es castigo. Los reforzadores consolidan la conducta; eso es lo que “reforzó”. El castigo se utiliza para suprimir la conducta. Consiste en retirar un reforzador positivo o el presentar uno negativo. Parece a menudo funcionar condicionando reforzadores negativos. La persona castigada en adelante actúa de las maneras que reducen la amenaza del castigo y con las cuales sea incompatible, y por lo tanto toma el lugar de, la conducta castigada.

La especie humana se distingue por el hecho de que sus respuestas vocales se pueden condicionar fácilmente como operantes. Hay muchas clases de operantes verbales porque la conducta se debe reforzar solamente con la mediación de otra gente, y hacen muchas otras cosas. Las prácticas de refuerzo de una cultura dada componen lo que se llama una lengua. Las prácticas son responsables la mayor parte de de los logros extraordinarios de la especie humana. Otras especies adquieren comportamiento de uno a con delimitación y el modelado (se demuestran qué hacer), pero él no puede decirse qué hacer. Adquirimos la mayor parte de nuestro comportamiento con esa ayuda. Tomamos consejo, prestamos atención a advertencias, observamos reglas, y obedecemos leyes, y después nuestra conducta viene bajo control de las consecuencias que no serían de otra manera eficaces. La mayor parte de nuestra conducta es demasiada compleja para haber ocurrido por primera vez sin tal ayuda verbal. Tomando consejo y después de reglas adquirimos un repertorio mucho más extenso que sería imposible a través de un contacto solitario con el ambiente.

La respuesta porque la conducta ha tenido refuerzo de consecuencias es muy diferente de la respuesta tomando consejo, después de reglas, o de obedecer leyes. No tomamos consejo debido a la consecuencia particular que seguirá; la tomamos solamente cuando tomar el otro consejo de fuentes similares ha tenido ya refuerzo de consecuencias. Estamos inclinados generalmente mucho más fuertemente para hacer cosas si han tenido consecuencias de refuerzo inmediatas que si nos han aconsejado simplemente hacerlas.

La conducta natural estudiada por los etólogos es formada y mantenida por su contribución a la supervivencia del individuo y de la especie. La conducta operante es formada y mantenida por sus consecuencias para el individuo. Ambos procesos tienen características polémicas. Ni uno ni otro parece tener cualquier lugar para un plan anterior o los propósitos. En ambos, la selección substituye la creación.

La libertad personal también parece amenazada. Es solamente la sensación de la libertad; sin embargo, es afectada. Los que responden porque su conducta ha tenido positivamente refuerzo de consecuencias generalmente para sentir libremente. Parecen hacer lo que quieren hacer. Los que responden porque el refuerzo ha sido negativo y que son por lo tanto que evitan o de escapes del castigo están haciendo lo que tienen que hacer y no lo sienten como tomado libremente. Estas distinciones no implican el hecho de la libertad.

El análisis experimental de la conducta de la operante ha llevado a una modificación de la conducta a menudo llamada de la tecnología. Consiste en generalmente cambiar las consecuencias de la conducta, el quitar de las consecuencias que han causado apuro, o el arreglar las nuevas consecuencias para la conducta que han carecido de fuerza. Históricamente, han controlado a la gente sobre todo con el refuerzo negativo es decir, que la han castigado cuando ella no ha hecho lo qué esta reforzando a los que podrían castigarlos. El refuerzo positivo ha sido de uso menos frecuente, en parte porque su efecto se difiere levemente, pero puede ser tan eficaz como el refuerzo negativo y tiene muchos pocos subproductos indeseados. Por ejemplo, los estudiantes se castigan cuando no estudian y pueden estudiar, solamente ellos pueden también permanecer lejos de la escuela (haraganería), destrozan las características de la escuela, atacan a los profesores, u obstinados no hacen nada. Los sistemas escolares de reajuste para los estudiantes, lo que hacen es reforzar más a menudo positivamente y pueden hacer una gran diferencia.

(Para otros detalles, vea “la conducta de los organismos”, “ciencia y conducta humana”, y “los horario del refuerzo” por C. F. Ferster y yo.) B.F. Skinner

Traducción: Skinner’s Box Club


V

1 comentario:

Anónimo dijo...

los artículos son interesantes, pero tienen errores gramaticales, cuidado a la hora de redactar!