본문 바로가기

마이어스의 심리학/학습

달마 [심리학_학습] 조작적 조건형성

조작적 조건 형성이란 무엇인가?

조작적 조건형성에서는 강화가 뒤따르는 행동이 증가한다. 처벌자극이 뒤따르는 행동은 감소하기 십상이다. 

스키너는 누구인가? 어떻게 조작행동을 강화하고 있는가?

스키너는 학부에서 영문학을 전공하였으며, 나중에 심리학을 전공하고자 대학원에 입학한 포부가 대단한 작가였다. 그는 오늘날 행동주의에서 가장 영향력이 크고 논란의 대상이 된 인물이 되었다.

에드워드 손다이크의 효과의 법칙을 확장한 스키너 등은 조작싱(스키너상자)에 집어넣은 쥐나 비둘기의 행동을 원하는 행동으로 조금씩 접근하도록 만드는 강화물을 사용하여 조성할 수 있다는 사실을 밝혀냈다.

스키너, 스키너 박스

 

정적 강화와 부적 강화는 어떻게 다른가? 강화물의 기본 유형에는 어떤 것이 있는가?

강화는 행동을 강력하게 만드는 결과이다. 정적 강화는 바람직한 자극을 제공하여 행동의 빈도를 증가시키는 것이다. 부적 강화는 혐오자극을 제거하여 행동의 빈도를 증가시키는 것이다. 

 배고플 때 먹이를 제공받는 것이나 병이 났을 때 구토가 멈추게 해주는 것과 같은 일차 강화물은 생득적으로 만족을 제공하는 것이며, 학습이 필요하지 않다. 돈과 같은 조건 강화물(또는 이차 강화물)이 만족스러운 까닭은 음식이나 약물과 같은 기본적인 보상과 연합하는 것을 학습하였기 때문이다. 즉각적인 강화물은 보상을 즉시 제공한다. 지연강화물은 만족을 지연하는 능력을 요구한다. 

강화의 종류

+ 1차 강화물을 얻을 수 있게 하는것이 2차 강화물이다.)

정적강화 = 좋아하는 것을 주어 행동을 증가시키는것 ex) 장학금을 줄테니 공부해라
부적강화 = 싫어하는 것을 제거하여 행동을 증가시키는것 ex) 통증을 가라앉히기 위해 진통제를 복용한다.
정적처벌 = 싫어하는 것을 주어 행동을 감소시키는것 ex) 회초리로 때려서 나쁜행동을 안하게함
부적처벌 = 좋아하는것을 뺏어 행동을 감소시키는것 ex) 용돈을 삭감해서 나쁜행동을 안하게 함 

상이한 강화 계획들이 어떻게 행동에 영향을 미치는가?

강화 계획이란 반응을 얼마나 자주 강화할 것인지를 나타내는 것이다. 원하는 반응이 나타날 때마다 강화를 주는 연속 강화에서는 학습이 신속하게 일어나지만 보상을 더 이상 제공하지 않을때 소거도 신속하게 일어난다. 부분강화에서는 최초의 학습이 느리게 일어나지만, 그 행동은 소거에 대한 저항이 훨씬 크다. 고정비율 계획은 일정한 수의 반응 후의 행동을 강화한다. 변동비율 계획은 예측할 수 없는 시행 후에 강화를 준다. 고정간격 계획은 일정한 시간이 지난 후에 나타나는 행동을 강화한다. 변동 간격 계획은 예측할 수 없는 시간후에 강화를 준다. 

FI(고정간격), VI(변동간격), FR(고정비율), VR(고정비율)

Fixed : 고정된 ,, Variable : 변동된 ,, Interval : 간격 ,, Ratio : 비율

 

처벌은 부적 강화와 어떻게 다른 것인가? 처벌은 어떻게 행동에 영향을 미치는가?

처벌은 아동의 반항과 같은 행동의 빈도를 낮추기 위하여 회초리와 같이 원치 않은 결과를 제공하거나 좋아하는 장난감을 치워버리는 것처럼 무엇인가 원하는 것을 없애버리는 것이다. 두통약을 복용하는 것과 같은 부적 강화는 혐오자극(두통)을 제거하는 것이다. 이렇게 원하는 결과(통증으로부터 벗어남)는 두통을 없애기 위하여 두통약을 복용하는 것과 같은 행동을 반복할 가능성을 증가시킨다. 

처벌은 원치 않는 행동을 변화시키기보다는 억압하고, 공격성을 가르치며, 공포를 조장하고, 변별을 부추기며(처벌자극이 존재 하지 않을 때는 바람직하지 않은 행동이 나타난다.), 우울과 무기력감을 조장하는 등 바람직하지 않은 부작용을 초래할 수 있다. 

스키너의 생각이 논쟁을 불러일으킨 이유는 무엇인가? 그의 조작적 조건형성 원리들을 어떻게 학교, 스포츠, 직장, 가정에 적용할 수 있겠는가?

스키너 원리의 비판자들은 그 접근이 개인의 자유를 무시하고 행동을 통제하고자 시도함으로써 사람들을 비인간화시킨다고 생각하였다. 스키너는 이미 외적 결과가 사람들의 행위를 제어하고 있으며, 강화는 행동을 제어하는 수단으로 처벌보다 더 인간적인 방법이라고 응수 하였다. 

 학교에서 교사는 조성 기법을 사용하여 학생들의 행동을 유도할 수 있으며, 상호작용적 소프트웨어와 웹사이트를 사용하여 즉각적인 피드백을 제공할 수 있다. 스포츠에서 코치는 사소해 보이는 성과에 보상을 줌으로써 생산성과 사기를 고양시킬 수 있다. 가정에서 부모는 바람직한 행동에 보상을 주고 그렇지 않은 행동에는 보상을 주지 않을 수 있다. 우리 스스로도 자시의 목표를 천명하고 바람직한 행동의 빈도를 감시하며, 그 행동에 보상을 주고, 그 행동이 습관적으로 바뀜에 따라 점차적으로 점차적으로 보상을 줄이는 방식으로 행동을 조성해갈 수 있다. 

조작적 조건 형성은 파블로프식 조건 형성과 어떻게 다른가?

조작적 조건형성에서 유기체는 자신의 행동과 그 결과로 나타나는 사건 간의 연합을 학습한다. 이러한 형태의 조건형성은 조작행동, 즉 환경에 조작을 가하고 보상이나 처벌이라는 결과를 초래하는 행동을 수반한다. 파블로프식 조건 형성에서 유기체는 자신이 제어하지 못하는 자극-사건 간의 연합을 형성한다. 이 형태의 조건형성은 반응행동, 즉 특정 자극에 대한 자동 반응을 수반한다.