15.09.2021

Что такое оперантное научение? Теория оперантного обусловливания Б.Скиннера Оперантное обучение дает наилучший эффект.


  • 6.1.1. Определение оперантного обусловливания
  • 6.1.2. Принципы оперантного обусловливания
  • 6.1.3. Режимы подкрепления
  • 6.1.4. Рост и развитие личности
  • 6.1.5. Психопатология
  • 6.1.6. Достоинства и недостатки теорий научения

Психологические понятия - научение, обучение, учение описывают широкий круг явлений, связанных с приобретением опыта, знаний, навыков, умений в процессе активного взаимоотношения субъекта с предметным и социальным миром - в поведении, деятельности, общении.

  • Когда речь идет о научении , то исследователь имеет в виду такие аспекты этого процесса как:
    • постепенность изменения;
    • роль упражнения;
    • специфику научения по сравнению с врожденными особенностями индивида.

Обычно термины обучение и учение обозначают процесс приобретения индивидуального опыта, а термин "научение" описывает и сам процесс , и его результат .
Итак, научение (обучение, учение) - процесс приобретения субъектом новых способов осуществления поведения и деятельности, их фиксации и/или модификации. Изменение психологических структур, которое происходит в результате этого процесса, обеспечивает возможность дальнейшего совершенствования деятельности.
Известны классические концепции научения. Это, например, учение И.П. Павлова (1849-1936) об образовании условных рефлексов. В результате одного или нескольких предъявлений индифферентного разграничителя (условного стимула) и следующего за ним безусловного стимула (пищи), который вызывает безусловную, врожденную реакцию (слюноотделение), индифферентный раздражитель сам начинает вызывать реакцию. В процессе установления временной связи безусловный стимул выполняет функцию подкрепления, условный - сигнальное значение, а рефлекс способствует адаптации организма к меняющимся условиям среды.
Впервые закономерности научения, установленные экспериментальными методами, были установлены в рамках бихевиоризма. Эти закономерности, или "законы обучения", сформулированы Э. Торндайком и дополнены, а также модифицированы К. Халлом, Э. Толменом и Э. Газри.

  • Ими являются:
    • Закон готовности : чем сильнее потребность, тем успешнее научение. Закон выводится на основе установления связи между потребностью и научением.
    • Закон эффекта : поведение, которое приводит к полезному действию, вызывает снижение потребности и поэтому будет повторяться.
    • Закон упражнения : при прочих равных условиях повторение определенного действия облегчает совершение поведения и приводит к более быстрому выполнению и снижению вероятности ошибок. Позже Торндайк показал, что не всегда упражнение, повторение способствует упрощению навыка, хотя при моторном научении это фактор является очень важным, способствуя модификации поведения.
    • Закон недавности : лучше заучивается тот материал, который предъявляется в конце серии. Этот закон противоречит эффекту первичности - тенденции к лучшему заучиванию материала, который предъявляется в начале процесса научения. Противоречие устраняется при формулировке закона "эффект края". U-образная зависимость степени заученности материала от его места в процессе научения отражает этот эффект и называется "позиционной кривой".
    • Закон соответствия : существует пропорциональное отношение между вероятностью ответа и вероятностью подкрепления.
  • Теперь обратимся к теориям научения в психологии личности.
    Теории исходят из двух положений:
  1. Всякое поведение усваивается в процессе научения.
  2. В целях соблюдения научной строгости при проверке гипотез необходимо соблюдать принцип объективности данных. В качестве переменных, которыми можно манипулировать, выбираются внешние причины (пищевое вознаграждение), в отличие от "внутренних" переменных в психодинамическом направлении (инстинкты, защитные механизмы, Я-концепция), которыми манипулировать нельзя.

В теориях научения (И.П. Павлов) приспособление рассматривается как аналог развития человека. Оно может осуществляется разными путями, например посредством классического обусловливания по Павлову.

  • При этом были исследованы важные феномены:
    • Генерализация - условная реакция на первоначально нейтральный стимул распространяется и на другие стимулы, похожие на условный раздражитель (страх, возникший на конкретную собаку, затем распространяется на всех собак).
    • Дифференцировка - специфичная реакция на похожие стимулы, которые различаются по степени подкрепления (например, дифференцировка реакций на круг и эллипс).
    • Угашение - разрушение связи между условным стимулом и реакцией, если он не сопровождается подкреплением.

Типичный эксперимент заключался в том, что собаку закрепляли ремнями, ограничивая ее движение, затем включали свет. Через 30 секунд, после того как зажигался свет, в рот собаки клали немного пищи, что вызывало слюноотделение. Сочетание включения света и пищи повторяли несколько раз. Через какое-то время свет, изначально выступавший индифферентным раздражителем, сам по себе начинал вызывать реакцию слюноотделения.
Аналогичным образом можно выработать условные оборонительные реакции на первоначально нейтральные стимулы. В первых исследованиях по оборонительному обусловливанию на собаку надевали специальную упряжь, чтобы удерживать ее в станке, а к лапе прикрепляли электроды. Подача электрического тока (безусловный раздражитель) на лапу вызывала отдергивание лапы (безусловный рефлекс), которое было рефлекторной реакцией животного. Если непосредственно перед ударом током несколько раз звонил звонок, то постепенно звук сам по себе был способен вызывать оборонительный рефлекс отдергивания лапы.
По терминологии И.П. Павлова, пища (или удар током) были безусловными раздражителями, а свет (или звук) - условным. Слюноотделение (или отдергивание лапы) при появлении пищи (или ударе током) были названо безусловным рефлексом, а слюноотделение на включение света (или отдергивание лапы на звук) - условным. Реакции, которые изучал Павлов, стали называть ответными, или респондентными, поскольку они автоматически возникали вслед за известными стимулами (пищей, ударом тока). Ведущим в модели И.П. Павлова является стимул, манипуляция которым приводит к возникновению новых форм поведения.
Итак, классическое обусловливание - это процесс, открытый И.П. Павловым, благодаря которому первоначально нейтральный стимул начинает вызывать реакцию из-за своей ассоциативной связи со стимулом, автоматически порождающим ту же самую или похожую реакцию.
Теория, разработанная Б.Ф. Скиннером (1904-1990), носит название теории оперантного обусловливания . Он говорил, что ученый, как и всякий другой организм, является продуктом уникальной истории. Поприще, которое он выберет для себя в качестве предпочтительного, частично будет зависеть от его личной биографии.
Интерес к формированию и модификации поведения возник у Скиннера после знакомства с работой И.П. Павлова "Условные рефлексы" и статьей (критической по своей направленности) Бертрана Рассела. Статьи последнего не только не оттолкнули от павловских идей, но, наоборот, усилили их влияние.
Скиннер ставил перед собой цель объяснить механизмы научения у человека и животных (крыс и голубей) на основе ограниченного набора базовых принципов. Основная идея состояла в том, чтобы управлять средой, контролировать ее, получая при этом упорядоченные изменения. Он говорил: "Проконтролируйте условия (среду), и вам откроется порядок".

Согласноэтой теории, большинство форм человеческого поведения произвольны, т.е. оперантны; они становятся более или менее вероятными в зависимости от последствий – благоприятных или неблагоприятных. В соответствии с этой идеей и было сформулировано определение.

Оперантное (инструментальное) научение – вид научения, в котором правильная реакция или изменение поведения подкрепляется и становится более вероятным.

Этот вид научения экспериментально изучали и описали американские психологи Э. Торндайк и Б. Скиннер. Эти учёные внесли в схему научения необходимость подкрепления результатов упражнений.

В основе концепции оперантного научения лежит схема «ситуация – реакция – подкрепление».

Психолог и педагог Э.Торндайк ввёл в схему научения в качестве первого звена проблемную ситуацию, выход из которой сопровождался пробами и ошибками, приводящими к случайному успеху.

Эдуард Ли Торндайк (1874–1949) - американский психолог и педагог. Проводил исследования поведения животных в «проблемных ящиках». Автор теории научения путем проб и ошибок с описанием так называемой «кривой научения». Сформулировал ряд известных законов научения.

Э.Торндайк проводил эксперимент с голодными кошками, находящимися в проблемных клетках. Помещённое в клетку животное могло выйти из него и получить подкормку, лишь приведя в действие специальное устройство, - нажав на пружину, потянув за петлю и т.п. Животные совершали множество движений, бросались в разные стороны, царапали ящик и т.п., пока одно из движений случайно не оказывалось удачным. С каждым новым успехом у кошки все чаще наблюдаются реакции, ведущие к цели, и все реже – бесполезные.

Рис. 12. Проблемные клетки, по Э. Торндайку

«Пробы, ошибки и случайный успех» – такова была формула для всех типов поведения как животных, так и человека. Торндайк высказал предположение, что этот процесс определяется 3 законами поведения:

1)законом готовности – для образования навыка в организме должно иметься состояние, толкающее к активности (например, голод);

2)законом упражнения – чем чаще какое-нибудь действие совершается, тем чаще это действие будет выбираться впоследствии;

3)законом эффекта –чаще повторяется то действие, которое дает положительный эффект («награждается»).

Касаясь проблем школьного обучения и воспитания, Э. Торндайк определяет «искусство обучения как искусство создавать и задерживать стимулы с тем, чтобы вызвать или предотвратить те или другие реакции» . При этом стимулами могут быть слова, обращенные к ребенку, взгляд, фраза, которую он прочтет и т.д., а ответными реакциями – новые мысли, чувства, действия ученика, его состояние. Можно рассмотреть это положение на примере развития учебных интересов.



Ребенок, благодаря собственному опыту, имеет разнообразные интересы. Задача учителя – увидеть среди них «хорошие» и, исходя из них, развивать интересы, необходимые для обучения. Направляя интересы ребенка в нужное русло, учитель использует три пути. Первый путь – связать выполняемую работу с чем-то важным для ученика, доставляющим ему удовлетворение, например, с положением (статусом) среди сверстников. Второй – использовать механизм подражания: учитель сам интересующийся своим учебным предметом, заинтересует и класс, в котором преподает. Третий – сообщать ребенку такую информацию, которая рано или поздно вызовет интерес к предмету.

Другой известный учёный-бихевиорист Б. Скиннер выявил особую роль подкрепления правильной реакции, что предполагает «конструирование» выхода из ситуации и обязательность правильного ответа (в этом заключалось одно из оснований программированного обучения). Согласно законам оперантного научения поведение определяется событиями, которые последуют за ним. Если последствия благоприятны, то вероятность повторения поведения в будущем усиливается. Если последствия неблагоприятны и не подкреплены, то вероятность поведения уменьшается. Поведению, которое не приводит к должному эффекту, не научаются. Вы скоро перестанете улыбаться человеку, который в ответ не улыбается. Происходит научение плачу в семье, где есть маленькие дети. Плач становится средством воздействия на взрослых людей.

В основе этой теории также как и в павловской лежит механизм установления связей (ассоциаций). В основе оперантного научения также лежат механизмы условных рефлексов. Однако это – условные рефлексы иного типа, чем классические. Скиннер назвал такие рефлексы оперантными или инструментальными. Их особенность в том, что активность сначала порождается не сигналом извне, а потребностью изнутри. Активность эта носит хаотический случайный характер. В ходе её с условными сигналами связываются не только врожденные ответы, а любые случайные действия, которые получили награду. В классическом условном рефлексе животное как бы пассивно ждет, что с ним сделают, в оперантном рефлексе – животное само активно ищет правильное действие и когда его находит, то оно его усваивает.

Техника выработки «оперантных реакций» была применена последователями Скиннера при обучении детей, их воспитании, при лечении невротиков. Во время второй мировой войны Скиннер работал над проектом использования голубей для управления стрельбой по самолётам.

Посетив однажды урок арифметики в колледже, где занималась его дочь, Б.Скиннер ужаснулся, сколь мало используются данные психологии. В целях улучшения преподавания он изобрёл серию обучающих машин и разработал концепцию программированного обучения. Он надеялся, основываясь на теории оперантных реакций, создать программу «изготовления» людей для нового общества.

Последнее обновление: 09/12/2018

Оператное научение включает в себя систему поощрений и наказаний с целью усилить или прекратить определенный тип поведения.

Оперантное научение – это метод обучения, который происходит посредством вознаграждения и наказания за определенный тип поведения. Суть оперантного научения заключается в том, чтобы установить ассоциативную связь между поведением и следствием этого поведения.

Идея оперантного научения принадлежит бихевиористу , поэтому часто этот метод обучения называют методом Скиннера. Скиннер считал, что невозможно объяснить поведение внутренними мыслями и мотивацией. Вместо этого он предложил обратить внимание на внешние причины, влияющие на поведение человека.

Скиннер использовал термин «оперантный» для описания любого поведения, которое под влиянием внешних факторов выливается в определенные последствия. Иными словами, теория Скиннера объясняет, как мы приобретаем различные повседневные привычки и модели поведения.

Примеры оперантного научения

На самом деле, примеров оперантного научения вокруг нас множество: школьник, который делает домашнее задание, чтобы получить награду от родителей, или сотрудники, которые работают над проектом ради повышения зарплаты или продвижения по службе.
Эти примеры показывают нам, что перспектива награды способствует выполнению задания, но оперантное научение также может использоваться, чтобы отучить человека от чего-либо посредством наказания или лишения желаемого. Например, детей можно отучить разговаривать в классе, если лишить их за это возможности играть на большой перемене.

Компоненты оперантного научения

Подкрепление – это любое действие, которое будет влиять на развитие определенной модели поведения. Существует два вида подкрепления:
Позитивное подкрепление – это вознаграждение, которое используется для поощрения желаемого поведения: например, похвала или награда.
Негативное подкрепление – это неприятные действия или результаты, которые прекращаются или снижаются для поощрения желаемого поведения.
Оба вида подкрепления используются, чтобы поощрять определенную модель поведения.

Наказание – это неприятные действия, которые предпринимаются для того, чтобы прекратить нежелательную модель поведения.

Существует два вида наказаний:

  1. Позитивное наказание подразумевает использование нежелательного действия, чтобы ослабить последующую за ним реакцию.
  2. Негативное наказание подразумевает собой прекращение желаемого действия или лишение желаемого предмета в случае проявления поведения, от которого необходимо отучить.

Оба вида наказания направлены на то, чтобы ослабить нежелательную модель поведения.

» Оперантная теория Скиннера

© В.А. Роменець, И.П. Маноха

Теория оперантного обусловливания Берреса Ф. Скиннера (1904-1990)

Вторым после К. Халла ведущим необихевиористом считается Беррес Фредерик Скиннер (Burrhus Frederic Skinner), но по популярности он значительно его превышает. До самой своей смерти он оставался одним из самых известных психологов мира, его идеи и сегодня влияют на характер психологических исследований, на педагогику и практику психологии. Историки науки задают вопрос: сделал ли Скиннер существенный вклад в человеческое самопознание? И в основном отвечают так: «Он был слишком далек от такого рода вопросов».

Понимание человеком самого себя, или по крайней мере того, что искали философы и психологи на протяжении многих веков, никак не было целью Скиннера. Всю свою долгую жизнь он придерживался крайней бихевиористской позиции, согласно которой «субъективные сущности», такие как ум, мышление, память, аргументация, не существуют вовсе, а есть только «вербальными конструктами», грамматическими ловушками, в которые человечество попало с развитием речи. Скиннер отыскивал детерминанты поведения: каким образом оно обуславливается внешними причинами. Он не сомневался в правильности своей позиции, поскольку считал, что «бихевиоризм нуждается в объяснении».

Теория обусловливания, которую стремился создать Скиннер, должна была подытожить его достаточно необычные исследования: все, что мы делаем и чем мы являемся, детерминировано историей нашей наград и наказаний. Детали его теории исходили из таких принципов, как частичное подкрепление эффекта, изучение обстановки, вызывающей определенное поведение или прекращающей его.

Подобно Дж. Уотсону , Скиннер был общественно активным, в частности как публицист. В одном из своих ранних выступлений по телевидению он привел дилемму, которую предложил еще М Монтень: «Что сделали бы вы, если бы вам надо было выбрать: родить детей или создать книги?» - и ответил, что для себя лично он родил бы детей, однако его вклад в будущее был бы значительным благодаря его трудам.

Скиннер любил смеяться над терминами, которыми специалисты пользовались для понимания человеческого поведения: «Поведение свойственно человеческой природе, и потому должна быть экстенсивная «психология индивидуальных различий», в которой люди сравниваются между собой и описываются в терминах черт характера, способностей, наклонностей. Но за традицией каждый, кто имеет дело с человеческими поступками, продолжает толковать человеческое поведение донаучным способом».

Скиннер также отвергал попытки понять внутреннюю сторону характера личности: «Мы не имели потребности говорить о том, что личности, состояния ума, чувств, черты характера человека реально существуют, чтобы можно было их примирить с научным анализом поведения... Мышление и все другое является поведением. Ошибка заключается в попытках отнести поведение к душе».

По мнению Скиннера, необходимо знать внешние причины поведения и его результаты, которые можно наблюдать. Только исходя из таких предположений можно дать ясную картину активности организма как поведенческой системы.

Согласно этой позиции он выступал как убежденный детерминист: «Мы такие, какие предстаем в нашей истории. Мы хотим думать, что мы выбираем, что мы действуем, но я не могу согласиться с тем, что личность является или свободной, или ответственной». Самодостаточное и автономное человеческое бытие Скиннер считает иллюзией. Для него хороший человек является таковым, потому что полностью обусловлен вести себя определенным образом, а хорошее общество должно быть основано на «бихевиоральной технике», что означает научный контроль за поведением с использованием методов положительного подкрепления.

Современники Скиннера считали его ловким популяризатором науки: он был красноречив, уверенно эгоистичен, умел захватить внимание. Для демонстрации преимуществ техники обусловливания он учил голубя играть мелодию на игрушечном пианино, а пару голубей - в настольный теннис, когда они перекатывали мяч своими клювиками. Миллионы зрителей смотрели это по телевидению как научно-документальный фильм.


Два голубя играют в пинг-понг во время эксперимента по оперантному обучению. Кембридж, Массачусетс, июнь 1950 года.

Скиннер переносил свои натуралистические видения на придуманное им общество. В утопической новелле «Walden Two» (1948) он описывает небольшое сообщество, в котором поведение детей с самого рождения было строго обусловлено наградами (положительное подкрепление), чтобы они стали на путь сотрудничества и социабельности, все поведение научно контролируется ради всеобщего блага. Несмотря на искусственность диалогов и несколько избитый сюжет, эта книга стала любимой среди студентов. Она была быстро продана тиражом более двух миллионов экземпляров.

Популярность Скиннера у публики была намного больше, чем среди коллег-профессионалов. Журнал «Американский психолог» писал: «Скиннер является ведущей фигурой в бихевиористском мифе. Он ученый-герой, Прометей, несущий огонь открытия, мастер-технологист, главный мятежник, который освобождает наши мысли от старых взглядов».

Скиннер родился в маленьком городке в Пенсильвании, его отец был юристом. Мальчиком он увлекался изобретениями, позже, уже как психолог, он создавал оригинальную и эффективную аппаратуру для экспериментов с животными. В школе и колледже Скиннер мечтал стать писателем, а после колледжа пробовал писать. Хотя он вплотную наблюдал различные формы человеческого поведения вокруг себя, он однажды четко понял, что не может ничего сказать о том, что видел и переживал, и в глубокой печали отказался от такого рода усилий.

Но вскоре Скиннер нашел другой, более практичный для себя путь понимания человеческого поведения. Знакомясь с трудами Уотсона и Павлова, он осознал, что его будущее лежит в научном раскрытии человеческого поведения, в частности в изучении реакций обусловливания. Я был очень расстроен моим неудачами в литературе, - говорил он в 1977 г. - я был убежден, что писатель ничего на самом деле не понимает. И это повлекло то, что я вернулся в психологию».

Хотя в Гарварде тогда царила интроспективная психология, Скиннер не интересовался «внутренней историей» человека и пошел своей дорогой, проводя бихевиористские исследования с крысами. В автобиографии он откровенно говорит о том, что вопреки профессорскому обучению он становился все более бихевиористом, а на защите диссертации резко отверг критику бихевиоризма.

Опираясь на свои изобретательские способности, он сконструировал «проблемную клетку» , что было значительным достижением после известной торндайковской модели. Она была довольно просторная для белых крыс, а на стене находился бар с едой и питьем. Когда крыса, прогуливаясь по клетке, случайно упиралась передними лапами в бар, нажимая на него, еда в форме шарика попадала на поднос.

Это позволило получить более объективные данные о поведении, чем это было до скиннеровских опытов. Именно крыса «определяла», какое количество времени проходит между нажатиями на бар. Поэтому за свое открытием принципа обучения Скиннер мог благодарить так называемый «ответ крысы» - класс достижений, когда поведение животного меняется в ответ на подкрепление без вмешательства экспериментатора.

Скиннер построил исследовательскую программу с клеткой таким образом, что приближал ее условия к реальным ситуациям, где поведение подкрепляется либо не подкрепляется. Он, в частности, исследует обучение ответам, если они регулярно подкрепляются или подкрепления внезапно прерываются, а также влияние на обучение временных интервалов с их регулярностью и иррегулярностью.

На этой основе Скиннер сформулировал ряд принципов, которые проливают свет не только на поведение крыс, но и на человеческое бытие. Речь идет, в частности, о его открытии важных вариаций эффекта парциального, частичного подкрепления. Скиннер находит аналогию в поведении игроков с игровым автоматом в казино: ни крыса, ни игроки не могут предсказать, когда появится следующее подкрепление, но в них есть надежда, что оно появится при каждой новой попытке.

Важным вкладом Скиннера в науки о поведении является его концепция оперантного научения. Одним этим он уже заслуживает, по мнению американских историков психологии, видное место в кругу знаменитых психологов мира.

В классическом Павловском обусловливании безусловный ответ животного (слюноотделение) на еду превращается в условный ответ по отношению к предыдущему нейтральному стимулу (звуки метронома или звонка: решающим элементом в поведенческом изменении является новый стимул.

В торндайковском «инструментальном» обусловливании решающим элементом поведенческого изменения является ответ, а не стимул. Нейтральный ответ - случайный шаг (нажатие) на педаль во время случайных усилий получить еду - является подкрепляющим научающим шагом поведения, что приводит к изменению, которому ранее животное не было обучено.

Скиннеровское оперантное обусловливание является важным развитием инструментального. Случайное движение, которое осуществляет животное, в любом случае может быть понято как оперантное для окружающих и поэтому является, по Скиннеру, именно оперантным. Подкрепительное движение приводит к оперантному научению. При подкреплении серии небольших случайных движений экспериментатор может «создавать» поведение животного, пока оно действует такими способами, которые не были частью его оригинального природного репертуара.


Беррес Ф. Скиннер

Данный подход дал возможность Скиннеру «создать» поведение голубя - заставить того клевать большой цветной пластиковый диск, прикрепленный на стенке «скиннеровской» клетки. Он об этом пишет так: «Мы сначала дали птице пищу, когда она медленно повернулась в направлении диска. Это и обусловило частотность такого поведения. Мы поддерживали подкрепление, пока незначительное движение не было направлено к пятну (диску). Это опять меняло общее распределение поведения без выработки нового единства. Мы продолжали с помощью подкрепления позиции успешный подход к пятну, далее подкрепление было только в случае, когда голова двигалась медленно вперед, и, наконец, только тогда, когда клюв действительно имел контакт с пятном.

Таким образом, мы можем построить оперантное поведение, которое никогда не появилась бы в репертуаре организма иным образом. При подкреплении серии успешных приближений мы получаем ответ за короткое время. Возникает функционально связанное единство поведения; оно конструируется продолжающимся процессом дифференциального подкрепления в сторону от недифференциального поведения».

Скиннер уподобил оперантные тренировки голубя детскому обучению разговаривать, петь, танцевать, играть, а со временем и всему репертуару человеческого поведения, созданному из мелких звеньев простых поведенческих актов. Это можно было бы назвать «an Erector-set» (взглядом от человеческого бытия), бездумным роботом, собранным оперантным обусловливанием из многих бессмысленных кусков.

Скиннера так или иначе долго не признавали ведущие психологические учреждения, но постепенно у него появлялись сторонники, что впоследствии выразилось в издании четырех журналов скиннеровских бихевиористских работ, а также в создании специальной секции скиннеровских исследований.

Скиннеровская техника оперантного обусловливания широко использовалась в экспериментальной психологии. В последние годы его труды цитировались в сотнях научных публикаций ежегодно (что-то около седьмой части от частоты упоминаний Фрейда). Кроме того, Скиннер имел большое влияние вне главных направлений психологии.


Дэрби, 13-месячная дочь профессора Б.Ф. Скиннера, с момента рождения жила в пыленепроницаемом, закрытом и застекленном детском манеже, в котором температура и влажность регулировались автоматически. Скиннер постепенно сокращал время, которое Дэрби проводила в своем ящике, так что в конце концов она станет только спать в нем.

В 1956 г.. Во время визита в школу к своей дочери Скиннеру пришло в голову, что оперантная техника, применяемая для обучения голубя игре на пианино, может стать более эффективной для обучения, чем традиционные методы. Сложные предметы можно расчленить на простые шаги в логической последовательности; студентам могут быть поставлены вопросы, и преподавателю следует сразу ответить, какие их ответы являются правильными. Здесь работают два принципа: 1) знания, о которых рассказывают правильно, должны стать подкрепленным поведением; 2) непосредственное позитивное подкрепление работает лучше, чем разрушительное негативное подкрепление. Результат известен как «программируемая инструкция».

Поскольку педагог не может одновременно применять подкрепление в классе, где много учеников, новые учебники должны быть написаны так, чтобы вопросы и ответы следовали одни за другими. Кроме того, Скиннер предложил учебные машины для оперантного самообучения. Механическая модель со временем была отвергнута, но сегодня применение обучающих инструкций, основанных на компьютере с непосредственным подкреплением, переживает второе рождение.

В течение нескольких лет движение за программированное обучение получило широкое распространение. Принципы оперантного обусловливания были приспособлены для обучения в школах и колледжах США и других стран. Но воспитатели поняли, что «атомистические» методы программируемой инструкции являются только частью того, в чем нуждается человеческое бытие: необходимы также цельные, иерархизированные мыслительные структуры. Более поздние исследования показали, что отложенное подкрепление часто дает лучший результат, чем подкрепление мгновенное. Рассуждения о характере ответа может привести к большему эффекту в обучении, чем быстрое получение ответа. Вместе с тем скиннеровское учение о непосредственном подкреплении было квалифицировано как полезное и содержится во многих учебных планах и школьных учебниках.

Беррес Скиннер также имел определенный успех в раскрытии причин умственных и эмоциональных расстройств. Система небольших подкреплений для небольших изменений в сторону здоровья дает возможность изменить поведение пациента. В конце 40-х годов Скиннер и два его студента осуществили первое экспериментальное испытание того, что стало известно как модификация поведения . Они устроили стационар в психиатрическом госпитале близ Бостона, в котором по соответствующей методике психотические пациенты получали конфеты или сигареты, чтобы оперировать машиной соответствующим образом. Терапевты давали стимулы пациентам для соответствующего поведения, такие как средства произвольного внимания, поддержка в хозяйственных задачах, привилегии избрания компании для обеда, разговор с врачом или возможность смотреть телевизор.

Подкрепление желаемого поведения у таких людей срабатывало часто. Одна депрессивная женщина не хотела есть и боялась умереть от голодания. Но она принимала гостей, смотрела телепередачи, слушала радио, читала книги и журналы, имела цветы в своей комнате. Терапевты перевели ее в комнату, лишенную этого комфорта и направили свет прямо на нее. Если она что-то ела, определенные предметы комфорта временно возвращали в комнату. Постепенно женщина вернула свой вес. Через 18 месяцев она уже вела нормальную жизнь.

Движение «бихевиоральной модификации» распространилось на многие психиатрических больницы и школы. Такую модификацию применяли для решения важных проблем, таких как курение, ожирение, робость, тики, речевые затруднения. Это была специализированная техника бихевиоральной терапии, но основана больше на Павловском обусловливании, чем на скиннеровской модификации.


Burrhus F. Skinner

Известная книга Скиннера - «Walden Two» - не осчастливила американское общество или хотя бы часть его, но она, несомненно, повлияла на социальные представления миллионов его читателей. Некоторые усилия были сделаны, чтобы реализовать утопию по модели «Walden Two» - Тwin Oaks Community в Луизиане, штат Вирджиния, и коммуна, основанная восьмерьми людьми в 1966 году. После нескольких лет выживания эта коммуна выросла до 81 члена. Они пыталис на основе соответствующих знаний вызывать идеальное поведение и создавать модели различных его форм по методам скиннеровского подкрепления.

Скиннер как-то заметил: «Мое влияние на других людей было значительно меньшим, чем на крыс и голубей или на людей как объектов эксперимента». Это, видимо, не следует понимать буквально. То, о чем он думал всерьез, было таким: «Я никогда не сомневался в важности моей работы». И добавлял в характерном для него перверсивном стиле: «Когда эта работа начала привлекать внимание, я остерегался этого эксперимента больше, чем был доволен им. Некоторые упрекают меня, что я боялся или впадал в депрессию от так называемого самолюбия и жажды слава. Я отвергаю любой гонор, который забирал бы у меня время от моей работы или слишком подкреплял ее специфические аспекты.

Историк психологии М. Хант, излагая идеи Скиннера, не идет дальше констатации отдельных фактов и описания характерологических черт самого ученого. Но и это изложение не может не наталкивать на мысль: можно ли провести параллель между намерениями Скиннера построить идеальное коммунистическое сообщество, опираясь на идею оперантного научения, и намерениями марксистов изменить мир, опираясь на «научный коммунизм» как технологию социальной трансформации?

Роменець В.А., Маноха И.П. История психологии XX века. - Киев, Лыбидь, 2003 .

Отдельную линию в развитии бихевиоризма представляет система взглядов Б. Скиннера. Беррес Фредерик Скиннер (1904-1990) выдвинул теорию оперантного бихевиоризма .

Основываясь на экспериментальных исследованиях и теоретическом анализе поведения животных, он сформулировал положение о трех видах поведения: безусловно-рефлекторном , условно-рефлекторном и оперантном . Последнее и составляет специфику учения Б. Скиннера.

Первые два вида вызываются стимулами (S) и называются респондентным , отвечающим поведением. Это реакции обусловливания типа S. Они составляют определенную часть репертуара поведения, но ими одними не обеспечивается адаптация к реальной среде обитания. Реально процесс приспособления строится на основе активных проб - воздействий организма на окружающий мир. Некоторые из них случайно могут приводить к полезному результату, который в силу этого закрепляется. Часть из таких реакций (R), не вызываемых стимулом, а выделяемых («испускаемых») организмом, оказывается правильными и подкрепляются. Их Скиннер и назвал оперантными. Это реакции типа R.

Оперантное поведение предполагает, что организм активно воздействует на окружение и в зависимости от результатов этих активных действий они закрепляются или отвергаются. По Скиннеру, именно эти реакции - преобладающие в адаптации животного: они являются формой произвольного поведения. Катание на роликовой доске, игра на фортепиано, обучение письму - это все примеры оперантных действий человека, контролируемых их последствиями. Если последние благоприятны для организма, тогда вероятность повторения оперантной реакции усиливается.

Проанализировав поведение, Скиннер сформулировал свою теорию научения. Главным средством формирования нового поведения выступает подкрепление. Вся процедура научения у животных получила название «последовательного наведения на нужную реакцию».

Скиннер выделяет четыре режима подкрепления:

  1. Режим подкрепления с постоянным соотношением, когда уровень положительного подкрепления зависит от количества правильно выполненных действий. (Например, работнику платят пропорционально количеству произведенной продукции, т. е. чем чаще возникает правильная реакция организма, тем больше подкреплений он получает.)
  2. Режим подкрепления с постоянным интервалом, когда организм получает подкрепление после того, как пройдет строго фиксированное время с момента предыдущего подкрепления. (Например, работнику платят зарплату через каждый месяц или у студента сессия через каждые четыре месяца, при этом скорость реагирования ухудшается сразу после получения подкрепления - ведь следующая зарплата или сессия будет еще не скоро.)
  3. Режим подкрепления с вариативным соотношением. (Например, выигрыш-подкрепление в азартной игре бывает непредсказуем, непостоянен, человек не знает, когда и каким будет следующее подкрепление, но всякий раз надеется на выигрыш - такой режим значимо воздействует на поведение человека.)
  4. Режим подкрепления с вариативным интервалом. (Через неопределенные интервалы времени человек получает подкрепления или знания студента контролируют с помощью «неожиданных контрольных» через случайные промежутки времени, что побуждает соблюдать более высокий уровень прилежания и реагирования в отличие от подкрепления с «постоянным интервалом».)

Скиннер выделял «первичные подкрепления» (пища, вода, физический комфорт, секс) и вторичные, или условные (деньги, внимание, хорошие оценки, привязанность и т. п.). Вторичные подкрепления генерализуются, объединяются со многими первичными: например, деньги являются средством для получения множества удовольствий. Еще более сильным генерализованным условным подкреплением является социальное одобрение: ради его получения со стороны родителей, окружающих человек стремится хорошо себя вести, соблюдать социальные нормы, прилежно учиться, делать карьеру, красиво выглядеть и т. п.

Ученый полагал, что условные подкрепляющие стимулы очень важны в контроле поведения человека, а аверсивные (болевые или неприятные) стимулы, наказание - это наиболее общий метод контроля над поведением. Скиннер выделял позитивные и негативные подкрепления, а также позитивные и негативные наказания (табл. 5.2).

Таблица 5.2.

Скиннер боролся против того, чтобы использовать наказание для контроля над поведением, потому что это вызывает отрицательные эмоциональные и социальные побочные эффекты (страх, тревогу, антисоциальные действия, ложь, потерю самоуважения и уверенности). Кроме того, оно всего лишь на время подавляет нежелательное поведение, которое вновь проявится, если уменьшится вероятность наказания.

Вместо аверсивного контроля Скиннер рекомендует позитивное подкрепление как наиболее эффективный метод для устранения нежелательных и поощрения желательных реакций. «Метод успешного приближения или формирования поведения» заключается в положительном подкреплении тех действий, которые наиболее близки к ожидаемому оперантному поведению. К этому приближаются шаг за шагом: одна реакция закрепляется, а затем заменяется другой, более близкой к предпочтительной (так формируют речь, трудовые навыки и т. п.).

Данные, полученные при изучении поведения животных, Скиннер перенес на поведение людей, что привело к биологизаторской трактовке. Так, возник скиннеровский вариант программированного обучения. Его принципиальная ограниченность состоит в сведении обучения к набору внешних актов поведения и подкреплению правильных из них. При этом игнорируется внутренняя познавательная деятельность человека, следовательно, нет обучения как сознательного процесса. Вслед за установкой уотсоновского бихевиоризма Скиннер исключает внутренний мир человека, его сознание из поведения и производит бихевиоризацию психики. Мышление, память, мотивы и тому подобные психические процессы он описывает в терминах реакции и подкрепления, а человека - как реактивное существо, подвергающееся воздействиям внешних обстоятельств.

Биологизация мира людей, характерная для бихевиоризма в целом, принципиально не проводящего различий между человеком и животным, достигает у Скиннера своих пределов. Культурные явления оказываются в его трактовке «хитроумно придуманными подкреплениями».

Для разрешения социальных проблем современного общества Б. Скиннер выдвинул задачу создания технологии поведения , которая призвана осуществлять контроль одних людей над другими. Поскольку намерения, желания, самосознание человека не принимаются во внимание, управление поведением не связано с сознанием. Таким средством выступает контроль за режимом подкреплений, позволяющий манипулировать людьми. Для наибольшей эффективности необходимо учитывать, какое подкрепление наиболее важно, значимо, ценно в данный момент (закон субъективной ценности подкрепления ), а затем предоставлять такое субъективно ценное подкрепление в случае правильного поведения человека или угрожать его лишением в случае неправильного поведения. Подобный механизм и позволит управлять поведением.

Скиннер сформулировал закон оперантного обусловливания:

«поведение живых существ полностью определяется последствиями, к которым оно приводит. В зависимости от того, будут ли эти последствия приятными, безразличными или неприятными, живой организм проявит тенденцию повторять данный поведенческий акт, не придавать ему никакого значения или же избегать его повторения в дальнейшем».

Человек способен предвидеть возможные последствия своего поведения и избегать тех действий и ситуаций, которые приведут к негативным для него последствиям. Он субъективно оценивает вероятность их наступления: чем больше возможность негативных последствий, тем сильнее это влияет на поведение человека (закон субъективной оценки вероятности последствий ). Эта субъективная оценка может не совпадать с объективной вероятностью последствий, но на поведение влияет именно она. Поэтому один из способов воздействовать на поведение человека - «нагнетание обстановки», «запугивание», «преувеличение вероятности негативных последствий». Если человеку кажется, что последняя, вытекающая из какой-либо его реакции, незначительна, он готов «рискнуть» и прибегнуть к данному действию.