Оперантный способ дрессировки собак

Содержание

Оперантный метод дрессировки собак
Что это такое?
Чем оперантное обучение отличается от классического?
Преимущества оперантного обучения
Как проводить занятия?
Практические советы
Сервис Petstory – онлайн-помощник для владельцев собак
Оперантный способ дрессировки собак

Оперантный метод дрессировки собак

С восхищением и завистью смотрите на лихие трюки, которые проделывают чужие собаки на дрессировочной площадке? Ваш пес тоже способен научиться подобному высшему пилотажу! Просто попробуйте оперантный метод обучения собак.

Что это такое?

Предтечей оперантного метода можно назвать американского зоопсихолога Эварда Ли Тонрдайка. Еще в 1930-х годах он обнаружил, что процесс обучения наиболее эффективен в случае, если обучающийся принимает в нем самое активное участие, а его правильные решения всецело поощряются.

В эксперименте с так называемым «проблемным ящиком Торндайка» ученый закрывал в деревянном решетчатом ящике голодную кошку, а по ту сторону решетки клал еду. Кошка могла открыть дверцу, наступив на рычаг внутри ящика. Однако поначалу узница пыталась подцепить еду лапой, которую просовывала сквозь прутья.

После ряда неудач кошка обследовала все предметы внутри клетки. В конце концов, она наступала на педаль, и дверца открывалась. В многочисленных повторных экспериментах кошка больше не тратила времени на бессмысленные действия, а сразу уверенно открывала дверцу.

Впоследствии эти исследования продолжил классик бихевиоризма, американский психолог Беррес Фредерик Скиннер. В результате было сделано крайне важно для дрессировки заключение: в последующих пробах животные с большей вероятностью повторяют те действия, которые подкрепляются. Действия, оставшиеся без подкрепления, постепенно затухают.

Чем оперантное обучение отличается от классического?

В основе классической дрессировки лежит реактивное поведение. У животного вырабатывается условный рефлекс на определенные стимулы, подкрепляемый вознаграждением.

Оперантное обучение основывается на проактивном поведении. Собака самостоятельно выполняет то или иное действие, а человек подкрепляет ее инициативу.

Например, при классическом подходе в ходе обучения команде «Лежать» собаке обеими руками надавливают на холку и на зад с одновременным произнесением команды «Лежать». Когда собака ляжет, ей дают вознаграждение.

При оперантном подходе вы наблюдаете за собакой. Рано или поздно она решит улечься. Сразу за этим вы подкрепляете ее самостоятельный выбор с помощью лакомства.

Обратите внимание, в качестве подкрепления сначала всегда должен использоваться сенсорный стимульный сигнал (например, щелчок специального устройства — кликера). Лакомство дается только после этого сигнала.

Преимущества оперантного обучения

Как вы уже убедились, в рамках оперантного метода собака принимает активное участие в процессе дрессировки. Животное получает возможность делать выводы, держать ситуацию под контролем и управлять ею.

Конечно, для обучения питомца базовому набору команда можно и с помощью более простого классического метода. Однако «классика» легко дает сбой там, где нельзя непосредственно воздействовать на животное (например, надавливая собаке на холку).

Кроме того, оперантный метод превращает обучение в игру, и собака учится командам не только из подчинения воле хозяина, но и ради удовольствия. В результате она становится более инициативной, уверенной в себе, у нее повышается самоконтроль и умение спокойно работать даже в сложных условиях.

Оперантный метод – больше, чем дрессировка. Используя мягкий подход, вы выстраиваете сложную систему взаимодействия с собакой – систему, в которой фундаментом служит любовь, уважение и обоюдный интерес к работе.

Как проводить занятия?

Приготовьте 20-30 маленьких кусочков вкусного лакомства (ломтики курицы, нарезанные сосиски, твердый сыр). Щелкните кликером и одновременно поднесите лакомство к морде питомца, чтобы он мог его взять. Упражнение повторяется несколько раз, чтобы ваш ученик твердо усвоил значение щелчка.

Теперь щелкните и киньте лакомство на пол, где его сможет увидеть собака. Повторите упражнение несколько раз, бросая лакомство в разные места. Таким образом вы объясняете питомцу, что щелчок означает скорое появление лакомства.

Теперь рассмотрим механизм дрессировки на примере обучения команде «Сидеть». Поднимите руку с лакомством немного выше лба стоящего пса. Если питомец сядет, щелкните кликером и позвольте ей съесть лакомство.

А если собака не может взять в толк, чего от нее хотят? Тогда передвиньте руку слегка назад, в сторону хвоста собаки, и попытайтесь с помощью лакомства побудить питомца подогнуть задние ноги и сесть. Щелкните, когда пес начнет садиться, и сразу вручите ему лакомство.

Если собака просто скачет вокруг вас, игнорируйте это поведение. Подождите, пока она успокоится, и возобновите движение руки.

После нескольких повторений упражнения в следующий раз не щелкайте немедленно. Немного отсрочьте щелчок, чтобы увеличить продолжительность действия.

Со временем откажитесь от приманки – пускай собака знает, что в руке у вас лакомство, но вести ее уже не нужно. Зато когда собака правильно выполнит то, что вы от нее ждете, в награду дайте ей целую пригоршню лакомства.

Практические советы

Сначала щелкайте, и лишь потом давайте лакомство. Щелчок всегда должен раздаваться в момент выполнения нужного действия.
Щелкайте лишь один раз. Не нужно делать несколько щелчков – так вы только запутаете питомца.
Используйте кликер только для дрессировки. При попытках с его помощью просто подзывать собаку он перестанет работать как передатчик информации.
Занятия должны развлекать собаку. Между сложными заданиями вставляйте несколько легких. Последним всегда должно идти веселое и легкое задание, на котором питомец абсолютно точно заработает поощрение.

Сервис Petstory – онлайн-помощник для владельцев собак

Какой бы метод дрессировки вы ни выбрали, перед началом обучения убедитесь в здоровье питомца. Установите на свой смартфон приложение Petstory, и тогда в случае любых тревожных симптомов вы уже через несколько минут сможете проконсультироваться с опытным ветеринарным врачом.

Кроме того, сервис обеспечивает возможность дистанционной записи в выбранную ветеринарную клинику. А еще показывает месторасположение зоомагазинов и развлекательных заведений вашего города, куда можно прийти провести время с четвероногим другом на поводке.

Источник

Оперантный способ дрессировки собак

Теория оперантного обучения объясняет, как, ведя себя произвольным образом, собака обучается, к чему, плохому или хорошему, ее действия приведут в результате. Оперантное обучение включает четыре метода, которые усиливают желательное поведение и уменьшают нежелательное поведение.

Первые два метода – это подкрепление, отрицательное и положительное. При положительном подкреплении собаку поощряют за поведение: села = угощение. При отрицательном подкреплении желаемое поведение собаки подкрепляется избавлением от неприятного воздействия: села = нет рывка поводком.

В двух других методах используются отрицательное и положительное наказание. При положительном наказании, неблагоприятное последствие связывается с нежелательным поведением: не села = рывок поводком. При отрицательном наказании, поощрение, или положительное воздействие прекращается, если собака демонстрирует нежелательное поведение: не села = нет угощения.

НАУЧЕНИЕ НА ОСНОВЕ ОБРАЗОВАНИЯ ИНСТРУМЕНТАЛЬНЫХ УСЛОВНЫХ РЕФЛЕКСОВ
(ОПЕРАНТНОЕ НАУЧЕНИЕ)

Отцом инструментальной формы научения считается Э. Торндайк, который еще в конце прошлого века назвал такую форму научения обучением «методом проб, ошибок и случайного успеха». Торндайк проводил опыты, в которых кошки и другие животные должны были нажимать на задвижки или тянуть за пружины, чтобы, открыв дверцу, выйти из ящика и получить снаружи пищу. Ящики были сделаны так, что пища была заметна. Голодная кошка, впервые посаженная в ящик, производит множество действий, в том числе тянется к пище через щели и скребет предметы, находящиеся внутри ящика. Наконец она случайно ударяет по запирающему механизму и выскакивает наружу. При последующих пробах действия кошки постепенно концентрируются вблизи этого механизма, и другая активность со временем прекращается. Наконец кошка становится способной правильно вести себя, как только ее поместят в ящик. По словам Д. Мак-Фарленда: «Цирковые дрессировщики знали о научении такого типа в течение столетий, но Торндайк первый исследовал его систематически и создал на основе своих наблюдений стройную теорию».

Но отечественному читателю более известен американский ученый Беррес Фредерик Скиннер, который внес основной вклад в изучение закономерностей образования инструментальных условных рефлексов. Предложенное им определение оперантного научения и оперантного условного рефлекса сейчас наиболее употребимы при характеристике инструментальной формы научения. Может быть не очень систематично, но популярно и талантливо оперантный метод научения и оперантный метод дрессировки изложен в работах американского психолога и дрессировщика Карен Прайор.

Вместо неоднократного применения сочетаний, характерного для классической выработки условных рефлексов, Скиннер разработал методику свободного оперантного поведения, при которой животному позволяют совершать различные действия, нужные из которых подкрепляют. Чаще всего для таких опытов выбирались крысы и голуби, хотя использовались и другие животные, а также человек. Знаменитый «ящик Скиннера» на самом деле представляет собой ящик с одной из сторон которого имеется педаль (рычаг), который соединен с кормушкой. Снаружи за стенкой расположен сложный механизм, функция которого состоит в том, что после каждого нажатия на педаль в кормушку падает гранула корма. Как только крысу сажают в ящик, она начинает активно исследовать его — обнюхивать и карабкаться на стенки. При этом случайно нажимает на педаль после чего в кормушку падает корм. Обычно животное этого не замечает, но найдя пищу, съедает ее. Продолжая обследовать ящик, крыса вновь случайно нажимает на педаль и постепенно обнаруживает зависимость между этим действием и результатом. Как только временная связь станет для нее понятной, крыса начинает нажимать на педаль, когда захочет есть. Характерно, что вначале крыса нажимает на рычаг очень редко, затем число нажатий начинает медленно расти. После примерно 140 минут опыта число нажатий вдруг возрастает очень быстро. Совсем не обязательно ждать от животного случайного нажатия на рычаг. Это действие можно спровоцировать (инициировать) различными способами, например, для обучения голубя клевать педаль, к ней можно приклеить зернышко. Если говорить о наработке форм поведения связанных с пищевой потребностью, то рекомендуется понизить массу тела животного до 80% (!) от первоначальной, то есть создать у животного выраженную пищевую потребность (мотивацию).

В «ящике Скиннера» животное может освоить не только формы пищевого поведения. Например, если соединить рычаг с обогревателем воздуха, крыса быстро обучается поддерживать оптимальную для себя температуру, регулярно отключая и включая обогреватель нажимом на рычаг.

Хотя открытие и изучение инструментальных условных рефлексов считается заслугой американской науки, они исследовались и в школе И.П. Павлова (например, А.Г. Ивановым-Смоленским, Г. Зеленым). Известный польский ученый Ю.М. Конорски, который также является учеником Павлова, считается одним из создателей теории об инструментальных условных рефлексах, которые он называл условными рефлексами второго типа.

Однако еще раньше в России обнаружил эту форму научения и использовал ее в своей работе талантливый цирковой дрессировщик В.Л. Дуров.

Обстоятельства и ситуации в которые попадают животные вынуждают их совершать те или иные формы поведения, приспособливаясь или активно сопротивляясь. Ученые назвали такое поведение оперантным (от латинского operatio — действие). Действия животных приводят к каким-либо последствиям или результатам, от которых зависит, будут ли они повторять эти действия или избегать их. То есть инструментальные условные рефлексы строятся на основе активной целенаправленной деятельности животного. Последовательность событий и результат их в данном случае, зависят не только от внешней сигнализации, но и от поведения самого животного. Таким образом, первое отличие инструментального условного рефлекса от классического заключается в активной, целенаправленной деятельности обучающегося животного. Вторым отличием является то, что инструментальный рефлекс не воспроизводит лежащую в его основе безусловную реакцию, в то время как классический условный рефлекс частично или полностью воспроизводит ее.
При образовании инструментальных условных рефлексов основную роль играет «внутренняя активность животного» — его потребность и мотивация. То есть в основе поведения лежит не внешняя сигнализация, а внутренняя потребность животного. И считается, что выбор реакции животным определяется не вызывающим ее раздражителем, а установлением временной последовательности между реакцией, выполняемой животным в данной ситуации и подкрепляющим раздражителем. При классических условных рефлексах связь устанавливается между стимулами и результатом, а при инструментальном научении, она возникает между реакцией и результатом. Таким образом, действие животного приобретает сигнальную функцию по отношению к результату (подкреплению).

Эффективность научения в форме образования инструментальных условных рефлексов заключается не только в том, что животное само стремится совершить какое-либо действие, но и в том, что подкрепление — это не просто событие, связанное временной последовательностью с каким-либо сигналом, а всегда удовлетворение доминирующей потребности, поэтому и становится биологически важным, а действия приводящие к нему — биологически целесообразными.

Несмотря на кажущуюся близость инструментальных условных рефлексов двигательным классическим рефлексам, специальными исследованиями было доказано существование различий между ними. В одном из них собака должна была до тех пор реагировать на первый раздражитель, пока не предъявлялся второй, за которым следовало пищевое подкрепление. Оказалось, что первый раздражитель вызывал инструментальную реакцию, не сопровождающуюся слюноотделением, тогда как второй вызывал слюноотделение.

Но следует отметить, что хотя естественное поведение животных в основном инструментально, в формировании поведенческого акта трудно различить роль и участие того или иного вида условного рефлекса.

Этапы оперантного научения:
1. Создание состояния выраженной потребности у животного.
2. Первичная инициация нужного поведения (поведенческого акта) одним из способов дрессировки. При этом избегаются способы болевого воздействия (оборонительного поведения) и предпочитаются способы, основанные на отборе поведения.
3. Создание условий при которых животные самостоятельно воспроизводят первично инициированное поведение.
4. Введение стимула, санкционирующего данный поведенческий акт.
5. Использование свойств подкрепления и тренировочного процесса для закрепления поведенческого акта до навыка.

Оперантное научение может быть основано на любой потребности, выбор которой определяется задачами дрессировки и особенностями животного. Например, для одной собаки при отработке навыка подхода к дрессировщику, можно применить социальную потребность (потребность в стае), для другой эффективней использование пищевой потребности, а с третьей — приходится применять потребность в самосохранении или оборонительную.
Как известно, потребность, вызывая мотивированное поведение6 активизирует механизмы памяти, способствует сохранению внимания и достаточно долго поддерживает необходимое поведение и общую двигательную активность животного.

Инициировать нужное поведение можно любым способом, однако в оперантной дрессировке наиболее употребимы способы отбора поведения, усиления поведенческого акта или его элемента и наведения. Важно вовремя прекратить применение вспомогательных способов, добиваясь самостоятельности животного.

Введение команды можно осуществить как на втором этапе, так и после отработки необходимого действия.

При оперантном научении подкреплению придается особое значение, так как оно определяет скорость и эффективность научения. При этом учитывают знак, величину, режим и время подкрепления.

С подкреплением связано несколько «золотых» правил дрессировки:
1. Закрепляется то, что подкрепляется.
2. Отмена положительного подкрепления несет информацию отрицательного подкрепления.
3. Вариабельный режим подкрепления способствует более быстрому закреплению действия и более медленному его угашению.

Многократное повторения действия, связанное с изменением режима подкрепления и сменой мотивации, обеспечивает автоматизацию поведенческого акта до навыка.

Из книги В.В. Гриценко. Теоретические основания дрессировки

Источник