ГЛАВА ПЕРВАЯ. Краткий экскурс в науку о дрессировке
ГЛАВА ПЕРВАЯ. Краткий экскурс в науку о дрессировке
Считается только то, что ты понял из того, что узнал.
Тренер Джон Вуден.
Когда наблюдаешь за работой хорошего тренера, вырабатывающего у собаки нужное поведение, кажется, что видишь некий танец. Дрессировщик вовремя и правильно подкрепляет действия собаки, плавно двигается, помогая ей натолкнуться на правильные движения. Собака делает, что хочет, но благодаря мастерству дрессировщика она делает именно то, что нужно ему. Собака работает увлеченно, внимательно и уверенно, потому что ее реакция на команду — ее собственный выбор. Правильный выбор приносит ей хорошее поощрение, так что она старается заслужить еще. Собаку никогда ни к чему не принуждали, и в то же время она четко выполняет то, что хочет от нее тренер. Это не фокус. Этот процесс направляется определенным набором принципов. «Отбор поведения» кардинально отличается от того, что многие считают «основной» или «традиционной» дрессировкой. Ниже приводится краткое введение в науку о дрессировке.
Два типа научения.
Две теории определяют научные принципы научения для всех животных (включая человека): обучение через выработку классического условного рефлекса (иногда также называемого павловским, или респондентным), и через выработку оперантного условного рефлекса (также называемого скиннеровским, или инструментальным).
Классический условный рефлекс.
Вы невольно испытываете действие классического условного рефлекса, когда у вас усиливается слюноотделение при виде шоколада или вы волнуетесь при звуке бормашины. Вы не контролируете эти реакции. Ваш прошлый опыт с шоколадом или бормашиной диктует эти условные реакции, даже если вы больше ни один из этих объектов в рот не возьмете. При действии классических условных рефлексов поведение автономно, отвечает на раздражитель, часто эмоционально зависимо, и неконтролируемо.
Павлов и его истекающие слюной собаки.
Классический условный рефлекс был впервые описан в начале 1900-х гг. русским ученым Иваном Павловым, который наткнулся на следующее открытие: когда он звонил в звонок, а потом показывал собаке пищу, через несколько повторений собака начинала выделять слюну при звуке звонка. Собака не контролировала этот рефлекс; он был вызван сочетанием ничего не значащего стимула с чем-то, на что у собаки была эмоциональная реакция, в данном случае с пищей.
Классический условный рефлекс также вступает в свою силу, когда некоторые собаки начинают испытывать стресс при звуке дождя или падении атмосферного давления. Собака, которая боится грома, быстро связывает этот страшный звук с его предвестниками (дождь и/или падение давления). Ученые доказали, что неприятные события гораздо быстрее выучиваются, чем приятные, так что собака может научиться пугаться после всего одного предъявления неприятного стимула. Однако выработка радостной реакции на более приятный стимул (напрмер, звон ключей от машины) может занять гораздо больше времени. После достаточного числа повторений собака будет радоваться предстоящей поездке в машине. Если же она боится машины, то может убежать и спрятаться. Важно помнить, что собака не может контролировать эти реакции. Они становятся условными рефлексами.
Оперантное научение.
По контрасту, оперантное научение основывается на принципе, что животное склонно повторять то поведение, которое получило подкрепление, и подавлять поведение, вызвавшее неприятные последствия. Животное подвергается простейшему оперантному научению, когда оно поощряется за правильный выбор действий при наличии альтернативы. Собака, которая сидит при встрече с гостями, например, получает подкрепление социальным контактом. Собака, которая прыгает на гостей, получает наказание в виде запирания в дальней комнате. Оперантное научение отличается от классического тем, что животное сознательно предлагает реакции, за которое его поощряют или наказывают. Животное учится на последствиях своих действий. В результате, при оперантном методе обучения, поведение намеренно, контролируемо и является продуктом сознания.
В начале 1900-х гг. американец Эдвард Торндайк в том, что было позже названо «Торндайковский закон эффекта», первым описал тот принцип, что поведение стимулируется его последствиями [стимульно-реактивная ассоциация или связь усиливается, когда за реакцией следует удовлетворитель].
Он указал, что поведение, которое поощряется, возрастает по частоте; поведение, приносящее неприятности, будет избегаться животным в будущем. Его идея, что поведение движимо последствиями, была подхвачена «дедушкой» оперантного научения Б.Ф.Скиннером. Известный тем, что с помощью поощрения он учил лабораторных крыс проходить сложные лабиринты, Скиннер существенно продвинул концепцию, что поощрение создает поведение. Наказание, напротив, не может построить поведение; оно может только подавить его. Это абсолютно логично. Животные, включая человека, повторяют то, что им выгодно — в своих интересах. Они обычно не склонны повторять то поведение, которое не дает им ничего хорошего. В конце концов, зачем тратить свое время впустую? В частности, зачем повторять поведение, которое приносит неприятные последствия (наказание)? Автолюбители предлагают доказательство. Если вас останавливает дорожная полиция и выписывает штраф за превышение скорости, наказание подавит ваше стремление гонять, но не изживет его. Часто вы опять жмете на газ, как только полицейская машина скроется из вида. Если бы однако, вы ехали по правилам, и полицейский остановил вас, чтобы дать премию в 10 000 долларов за примерное поведение, думаю, гораздо больше людей соблюдали бы скоростной режим.
Когда правят классические условные рефлексы.
Что происходит, если сталкиваются реакция, диктуемая классическим условным рефлексом, и реакция, выученная оперантным путем? Практически в любой ситуации классический условный рефлекс победит. Это означает, что как бы хорошо ни была выдрессирована ваша собака, в стрессовой ситуации, при страхе или возбуждении, классический условный рефлекс будет иметь большее влияние на ее поведение, чем все, что было выучено оперантным способом.
Представьте собаку, которая боится грома. Независимо от того, насколько вкусное лакомство вы предлагаете или насколько хорошо выдрессирована собака, если она действительно напугана, выученная реакция страха будет сильнее любой ранее закрепленной оперантной реакции. Парализованная страхом, она будет неспособна думать. Эта собака не в том состоянии, чтобы чему-то учиться.
Это же справедливо и для собак, слишком сильно стимулируемых окружающей средой. Возьмите ретривера, любящего купаться. Приведите его к пруду и попросите выполнить простейшую и хорошо освоенную команду — сесть или дать лапу. Если собака действительно помешана на плавании, вряд ли она сможет выполнить хоть одну самую простую команду. Вы можете сто раз повторить команду, все громче и громче, но ваша собака будет вести себя так, как будто вы с ней незнакомы. Классический условный рефлекс вынуждает собаку ассоциировать близость воды с чем-то, что она любит — плавать. Она не «упрямая» или «своенравная». С ней не происходит ничего странного или неправильного. Она не контролирует свои реакции, поскольку классический рефлекс взаимодействует с ее способностью выполнять ранее выученные команды. Понимание того, что это работает классический условный рефлекс, поможет вам разработать план выработки противоположной реакции.
С Павловым на плечах.
В период взросления Баз тоже очень часто бывал так сверхстимулирован, что не мог выполнять команды, выученные ранее с помощью оперантного метода. Как многие щенки бордер-колли, Баз был очень рад людям, другим щенкам, движению… список продолжите сами. Он часто просто не мог думать достаточно ясно, чтобы реагировать на меня. Знаменитый дрессировщик и эксперт по оперантному научению Боб Бэйли говорит: «Павлов сидит у него на плечах». В такой ситуации моей целью было снизить уровень возбуждения База перед тем, как начинать учить его чему-либо (например, посмотрите летопись нашей борьбы в группе воспитания щенков, глава…).
Стресс блокирует — или по крайней мере, ослабляет — способность учиться. Поэтому вы не всегда можете предсказать, как ваш щенок поведет себя в новой обстановке. Он может быть возбужден видом остальных щенков в группе или напуган детьми в парке. Независимо от причины, стресс может парализовать вашу собаку до того, что она становится неспособна отвечать на команды, которые она раньше «знала». Вы должны сначала уменьшить или снять стресс от окружения, прежде чем пытаться учить собаку. Пока вы не уменьшите или не снимете беспокойство собаки, любые попытки тренировать ее будут безуспешны.
Выработка противоположных условных рефлексов: борьба огня с огнем.
Есть два доступных варианта, с помощью которых можно попытаться преодолеть негативные эффекты классических условных рефлексов. Первый — погружение. Например, щенок боится плавать. Если вы возьмете этого зверька с выпученными от страха глазами и бросите в воду, он может быстро понять, что плавать — не так уж и страшно. Погружение, если оно имеет успех, может быть очень быстрым способом преодолеть боязнь. Оборотная сторона метода погружения в том, что если животное не смогло справиться со страхом, то, вместо того, чтобы уменьшиться, боязнь усилится. Щенок, который просто осторожничал при общении с водой, будет теперь впадать в панику при виде ее.
Менее рискованный, но и потенциально более продолжительный метод — десенситизация и выработка противоположного условного рефлекса. Десенситизация включает предъявление раздражителя или пугающей/возбуждающей среды на таком низком уровне, на котором собака его выдерживает и ведет себя как обычно. Постепенно вы можете увеличивать продолжительность или интенсивность раздражителя, по мере того, как собака привыкает к нему. Более активный процесс, чем десенситизация — выработка противоположного условного рефлекса, где используется поощрение для создания нового, более желательной реакции на возбуждающую или пугающую среду или раздражитель. Во время этого процесса вы наносите встречный удар страху или перевозбуждению, вырабатывая еще более сильную реакцию на приятный или успокаивающий раздражитель.
«Создавая успех» проведет вас через все этапы, которые я прошла, чтобы десенситизировать и перенаправить возбуждение и страхи База. Во время этих занятий я использовала условные рефлексы, чтобы победить эффекты ранее закрепленных реакций. Например, если во время прогулки на поводке Баз видел детей, он вопил и лаял, пытаясь подойти к ним, чтобы поздороваться и поиграть. Чтобы переучить его, я использовала помощь нескольких детей. Я просила одного из них пройти мимо открытой двери комнаты, в которой находился Баз. Каждый раз, когда ребенок проходил, я позволяла Базу поиграть в перетягивание игрушки. Он скоро выучил, что когда он видит детей, вместо того, чтобы скулить, он может рассчитывать на веселую игру со мной.
Как научиться учиться.
Все нормальные животные рождаются со способностью учиться на последствиях своего поведения; то есть, животное будет экспериментировать с предлагаемыми вариантами поведения, которые приносят ему желаемые результаты, чтобы увеличить количество получаемого поощрения. В общей практике мы называем такое животное «оперантным». Новорожденный щенок старается держаться поближе к матери или однопометникам, чтобы было теплее. Тепло их тел поощряет щенка за движение. По мере развития щенок становится все сообразительнее насчет потенциального поощрения от окружающей среды. Собаки могут научиться переворачивать мусорное ведро, чтобы получить поощрение от его содержимого. Животное методом проб и ошибок выясняет, что работает, а что нет.
Заблуждение о «неоперантной» собаке.
Многие верят, что собака должна научиться быть «оперантной» (в неправильном, но популярном выражении). При этом они имеют в виду, что собака должна быть выдрессирована свободно предлагать варианты поведения, без подсказки хозяина. Это не так. Правда в том, что это хозяева собак должны научиться сопротивляться искушению думать за собаку. Традиционно люди наталкивают собаку на нужные действия с помощью лакомства или нажатия на круп, чтобы собака села или легла. Если бы все владельцы понимали законы, по которым обучаются все животные, они бы умели позволить собаке предлагать варианты, из которых владелец мог бы выбирать, какие подкреплять, а какие нет. Если собака обучалась за кусочек лакомства выполнять все действия, что поощрялось? Пассивность: животное получало награду за безделье. Собака учится ждать и понимает, что отсутствие действий с ее стороны вызовет кусочек еды. Поскольку поощрение создает поведение, неудивительно, что собака не предлагает своих реакций, если вы пытаетесь дрессировать ее, позволяя ей проявить инициативу, а не просто следовать за куском. С чего бы она это стала делать? Она научилась, что сидеть и ждать, пока куском покажут, что сделать — самое поощряемое поведение, которое она может предложить. Хотя некоторые могут обвинить эту собаку в том, что она не «оперантна», правда в том, что она просто продолжает предлагать самое поощряемое поведение — не делать ничего!
«Оперантная» собака, таким образом, осознает потенциальное наличие награды за предложение поведения во время дрессировки. Ее ум участвует в процессе; она готова учиться; она охотно экспериментирует, предлагая варианты поведения. Такое животное поистине дрессируемо и являет собой именно то, о чем мечтает каждый дрессировщик. Успех дрессировки такого животного зависит от способности дрессировщика контролировать то, что является поощрением для собаки. Он должен постепенно усложнять задачу животного, в то же время сохраняя уровень поощрения, при котором животное продолжает попытки «заработать» его. Любой дрессировщик может создать такого внимательного студента, «подготовив почву» и «поднимая ставки».
Готовим почву.
Дрессировщики собак используют и классические, и оперантные условные рефлексы, формируя поведение собаки. Обычный пример классического условного рефлекса — сочетание звука кликера с поощрением, которое нравится собаке, т. е. лакомством или игрушкой (см. главу 4). Для начала, дрессировщик обычно кликает, потом кормит собаку, снова кликает и кормит (всегда в этом порядке). Клик должен идти первым, поскольку вы вырабатываете у собаки условную реакцию выжидания на звук кликера. Через несколько повторений (от 15 до 25 кликов и поощрений) у собаки появляется позитивная ассоциация между звуком щелчка и ценным поощрением. Когда эта связь установилась, собака будет радоваться щелчку, поскольку он предвещает любимое лакомство. Кликер (как и звонок Павлова) становится условным или вторичным подкреплением. Тем же способом можно сделать любое слово условным подкреплением, если вы свяжете для собаки это слово с чем-то, что нравится собаке (лакомством или игрушкой). Когда собака поймет, что ее поведение контролирует поощрение, вы можете использовать этот принцип для обучения.
Поднимаем ставки: механика создания поведения.
Когда собака свяжет свое поведение с вторичным подкреплением и всякими хорошими вещами, вы можете использовать оперантное научение, поощряя любые желательные действия собаки. Этот процесс называется «создание поведения». Если у вас реалистичные ожидания, и вы примените принципы Торндайка и Скиннера, вы можете добиться от собаки любого поведения, на которое она физически вообще способна. Потребуется некоторое терпение, пока вы сами не научитесь действовать правильно, но самому созданию поведения можно научиться очень быстро. Это результат ожидания от собаки чего-то большего или отличного от того, что она только что предложила.
Например, если ваш новый щенок смотрит на вас, кликните и поощрите его. Здесь клик одновременно и «отмечает», что щенок предложил правильное поведение, и предсказывает награду. Через несколько поощрений за это, задержите чуть-чуть щелчок (поднимите ставку). Вы больше не поощряете щенка просто за то, что он взглянул на вас; он должен постараться больше. Подождите, потом щелкните (отметьте) и наградите за следующее желательное действие, которое предложит щенок — сядет, ляжет, попятится. Если следующий вариант нежелателен (лай, прыжки или царапание), замрите и ничего не делайте. Нежелательное поведение, которое не поощряется, исчезнет само. Вы отбираете предлагаемые собакой варианты поведения. Вы дрессируете собаку, подкрепляя нужные действия и игнорируя нежелательные.
Обратный порядок предъявления раздражителей работает редко.
Для выработки классического условного рефлекса на нейтральный раздражитель, подкрепление (еда или игрушка) должны поступить после нейтрального раздражителя (звонка).
Звонок(щелчок) + пища = условный рефлекс на звонок или щелчок
Многие ученые пытались поменять последовательность действий, сначала предъявляя первичное подкрепление (пищу), а затем звоня в звонок. Но эти эксперименты с обратным порядком предъявления нейтрального раздражителя и приятного поощрения не имели успеха. Поэтому поймите, насколько важно сначала кликать, а потом поощрять собаку во время дрессировки. Когда некоторые тренеры используют еду или игрушку, чтобы провести собаку по трассе аджилити, это тоже в какой-то степени обратный порядок предъявления раздражителей. Если вы ведете собаку через препятствие, маня ее кусочком, вы теряете возможность выработать у собаки условный рефлекс на препятствие как на нечто приятное. Во время начального обучения База снарядам я предлагала ему поощрение после того, как он выполнял мое задание, например, проносился сквозь туннель, и таким образом вырабатывала условный рефлекс на сами препятствия. Дрессировка таким образом позволяет собаке связать поощрение с работой и перенести ценность. Возбуждение, которое собака испытывает от награды, переносится на само препятствие как таковое. В результате, только один вид снарядов аджилити волновал База, так как обещал возможность заслужить поощрение.
Препятствие аджилити + Подкрепление = Условная реакция на препятствие аджилити
Последствия поведения.
В оперантном научении каждое поведение влечет за собой один из четырех вариантов последствий, которые и влияют на обучение. Заметьте, что слова положительный и отрицательный, которые обычно ассоциируют с хорошим или плохим, просто описывают, что что-то прибавилось (положительный) или убавилось (отрицательный). Поощрение всегда увеличивает вероятность поведения, в то время как наказание подавляет поведение. Знание этих фактов поможет вам понять, что «положительная» дрессировка далеко не всегда хороша.
Положительное подкреплениеСобака получает что-то желаемое, что в дальнейшем увеличивает частоту данного поведения. Пример: дача собаке лакомства за выполнение команды «Сидеть» Положительное наказаниеДобавление чего-то нежелательного, чтобы подавить реакцию собаки. Пример: одергивание поводком собаки, которая тянет Отрицательное подкреплениеИзъятие чего-то нежелательного и таким образом, подкрепление поведения. Пример: дрессировщик, который щиплет собаку за ухо, пока она не откроет пасть, чтобы взять гантель (собака находит избавление от боли поощряющим) Отрицательное наказаниеЛишение чего-то желаемого, чтобы подавить реакцию собаки. Пример: закрыть собаку, которая прыгает на гостяМогучее сочетание.
Использование сочетания классических и оперантных условных рефлексов дает дрессировщику гибкие и надежные инструменты для обучения любого животного. Вы можете использовать классические условные рефлексы, чтобы связать любое ранее нейтральное поведение (слалом, выдержка сидя) с тем, что любит ваша собака (игра, мясо, плавание), чтобы создать драйв и возбуждение при выполнении этих действий.
Перенесение ценности: превращаем кротовый холмик в гору.
Эта книга описывает много примеров выработкиклассических условных рефлексов. Например, когда Баз впервые увидел короткий туннель, это был нейтральный раздражитель — он ничего не значил для него. Я кликала и поощряла его игрушкой, пока он не начал пробегать сквозь туннель. Используя положительное подкрепление, я вскоре выработала у База условную связь с туннелем, такую же, как и с поощрением, которое он получал за него. Мастерство в дрессировке требует понимания этого процесса. В этом случае высокая ценность подкрепления игрой перешла и на туннель. Поскольку туннель давал возможность поиграть, Баз очень скоро начал радоваться и заводиться, как только он его видел. Таким образом я использовала драйв, который был у База относительно игры, чтобы создать драйв к работе.
Принцип Примака.
Когда Баз выучил вид снарядов аджилити, он быстро стал одержим «бегать аджилити». Ценность препятствий стала огромной для него, так что он не мог дождаться тренировки. Он тянул и рыл землю лапами, идя на поводке к полю со снарядами.
Мне пришлось искать способ контролировать его при подходе к полю, так что я использовала принцип Примака. Дэвид Примак заметил, что доступ к высоковероятному поведению (в данном случае, преодоление препятствий) может поощрять низковероятное поведение (спокойный подход к полю со снарядами на провисшем поводке), или, простыми словами, чтобы получить то, что ты хочешь, сделай сначала то, что я хочу.
В сущности, то, что я делала, было просто еще одной задачей по перенесению ценности. Для База подход на провисшем поводке и спокойное ожидание того, пока я открою ворота на поле со снарядами, изначально не имели той притягательности, какой обладало аджилити. Если бы я физически или голосом корректировала База, то я бы подавила реакцию выхода из-под контроля, но не исключила бы ее окончательно; его пришлось бы поправлять всю жизнь. Я настаивала на том, чтобы он сел и обратил на меня внимание перед тем, как идти бегать, так что он понял, что спокойное ожидание — хорошо, поскольку оно дает возможность побегать аджилити.
Если бы я позволила Базу волочить меня к полю со снарядами, вместо того, чтобы настаивать на спокойном подходе, то он решил бы, что это является необходимой прелюдией к занятиям аджилити, и начал бы тянуть еще сильнее. Сейчас Баз — образцовая собака вблизи любого поля для аджилити. Он даже не смотрит на других собак, поскольку он знает, что его шанс побегать зависит от его хорошего поведения.
Когда Баз начал бегать связки снарядов, он настолько полюбил это, что игрушка потеряла для него былую ценность как поощрение в конце пробега. Снова я использовала Принцип Примака, чтобы повысить ее ценность и иметь возможность поощрять База за правильное выполнение (см. гл.22). Вы можете использовать Принцип Примака в повседневных отношениях с вашей собакой. Возьмите то, что любит ваша собака (играть в мяч, например), и попросите ее сначала выполнить какую-нибудь команду (сесть или лечь) перед тем, как вознаградить ее предложением любимой игры. С применением Принципа Примака вы сможете сделать так, чтобы собака полюбила простые действия (сесть, лечь или коснуться вашей руки). И это сделает выполнение команд более быстрым и точным.
Остерегайтесь самоподкрепляющегося поведения.
Имейте в виду, что вы можете не контролировать все виды поощрения, которые получает ваша собака. Некоторые реакции могут быть самоподкрепляющимися. Копание в отбросах, перелаивание с соседской собакой через забор, прыгание на гостей, копание ям в саду, охота на пылесос и жевание ваших тапочек — все это примеры самоподкрепляющегося поведения. Вы не можете просто игнорировать все нежелательные реакции в надежде, что они исчезнут сами собой, поскольку любая реакция, получающая поощрение, учащается. Игнорирование самоподкрепляющегося поведения — неэффективная и даже разрушительная тактика. Выискивайте такое поведение и делайте так, чтобы вы контролировали все поощрение, чтобы собака выучила, что вы намного интереснее всего окружающего.
Добиваемся точности.
Конечно, поощрение нужного поведения и игнорирование нежелательного — основа дрессировки собак с помощь положительного подкрепления. Но настоящая прелесть отбора поведения в том, что есть возможность ультраусовершенствования в обучении: 1) очень точному поведению (например, определенной позиции на контактной зоне в аджилити); и/или 2) цепочке поведения (например, набор действий, которые собака должна произвести для правильного и безопасного преодоления горки).
При отборе поведения дрессировщик ждет, пока собака предложит какие-то действия. Поощряя каждый подходящий вариант, он подводит собаку к намеченному поведению. Дрессировщик может управлять действиями собаки, пользуясь точным и своевременным подкреплением и приспосабливая требования к каждому конкретному действию к конечной цели. То, что дрессировщик начинает поощрять в начале пути, очень сильно отличается от конечного продукта.
Например, чтобы научить База правильно проходить бум (сложная цепь действий), сначала я научила его касаться носом моей ладони. Я показала ему руку примерно в 25 см от него. Баз мог и проигнорировать ее, но как только он на нее посмотрел, я кликнула и дала ему лакомство. В следующий раз я показала ему руку, но уже ждала, чтобы он не только посмотрел, но и понюхал ее.
Если вы создаете собаке простые условия для выбора, она в большинстве случаев будет выбирать правильно, будет часто получать поощрение, и, следовательно, нужное поведение будет появляться все чаще и чаще. Поощрение повышает вероятность повторения поведения. У База был выбор — заметить мою ладонь или проигнорировать ее. При этом я таким образом использовала его окружающую среду (исключив возможные отвлекающие факторы), что я была уверена, что он выберет ладонь. Было бы нечестно начать эту игру среди стада овец или на собачьей площадке, поскольку сильные отвлечения сделали бы выбор База очень трудным. Неверный выбор был всегда доступен Базу, но на ранних стадиях дрессировки я делала его очень сложным. Занятия таким образом сделают ваши тренировки наполненными поощрением, и ваша собака всегда будет с нетерпением ждать их (см. таблицу в приложении А).
Мастера создания поведения: Бэйли.
На мое понимание приложения принципов обучения собак огромное влияние оказали работы Боба Бэйли и его чудесной жены, покойной д-ра Мэрион Бэйли. Мэрион (Бреланд) Бэйли училась у великого Б.Ф.Скиннера. Бэйли использовали принципы Скиннера по отношению к целому Ноеву ковчегу.
Удивительный дрессировщик любых животных, Боб Бэйли начал свою профессиональную карьеру, дрессируя дельфинов на службе в ВМФ США. Затем они владели и управляли Центром поведения животных, который Мэрион создала вместе со своим покойным мужем д-ром Келлером Бреландом. Здесь Боб и Мэрион обучили тысячи животных, как для любительских целей, так и для особо секретных нужд вооруженных сил. Например, они научили воронов нести в клювах маленькие шпионские камеры, следуя за лазерным указателем, мягко прижать камеру к нужному окну и открыть затвор, чтобы сфотографировать происходящее внутри.
Бэйли дрессировали все, от рептилий до приматов и китов. Боб часто говорит, что он «не дрессировщик собак», поскольку он дрессировал всего несколько сотен их. Как ни огромно вам может показаться это количество, по сравнению с более чем десятью тысячами животных, выпущенных Центром, это действительно немного. Бэйли говорит о дрессировке: «Это просто, но не легко».
Сейчас дрессировщики морских животных, владельцы зоопарков и дрессировщики собак всего мира извлекают пользу из новаторских трудов супругов Бэйли о дрессировке животных без принуждения. Особенно мир дрессировки собак развернулся на 180 градусов после популяризации Бэйли принципов оперантного научения. Я польщена и благодарна возможности познакомиться и поработать с этими выдающимися людьми. Вы найдете афоризмы Бэйли там и сям в тексте. Они стали моими заклинаниями.
Решение проблем.
Если тренировка не получается, Боб Бэйли советует проверить одно из трех необходимых условий: ваш расчет времени, выбор критериев или уровень поощрения.
1. Расчет времени.
Любой, кто занимался спортом, испытал влияние верного или неверного расчета времени на успех игры. Если вы слишком поздно ударите по мячу в бейсболе, то теряете шансы успеть добежать до «базы». Если же ударите слишком рано, то тем более ничего не выйдет. То же самое справедливо и для дрессировки собак. Если вы пытаетесь научить собаку касаться носом вашей ладони и при этом постоянно кликаете слишком рано, вы отмечаете поведение за секунду до того, как собака действительно коснется руки. Через некоторое время собака начнет тоько подносить нос к ладони, не касаясь ее. Вы можете использовать кликер или словесный маркер (например, «Да!»), чтобы обозначить правильное поведение, или просто бросать лакомство в нужный момент. Если время подачи маркера неверно, вы создадите ненужное поведение. Помните: только собака точно знает, какую реакцию вы подкрепили!
Точно так же, и дача лакомства собаке тоже влияет на успех ваших занятий. Хотя щелчок выделяет реакцию собаки, поощрение беспорядочно подкрепляет все, что происходит между щелчком и попаданием лакомства к собаке. Убедитесь, что вы подкрепляете ту реакцию, которую собирались. Боб Бэйли рекомендует: «Кликайте за действие и поощряйте за позицию!». Например, если вы учите собаку двигаться от вас, если вы щелкнете за правильное действие, но позволите собаке подойти к вам за поощрением, чему на самом деле научится ваша собака? Уходить от вас и сразу возвращаться. Более эффективным будет щелкнуть за движение от вас и бросить награду вперед собаки, чтобы ей пришлось продолжить двигаться дальше, чтобы получить свое поощрение.
2. Выбор критериев.
Критерии — как правила игры. Критерий определяет, что вы должны увидеть перед тем, как подкрепить реакцию. Для сложного поведения вам нужно больше одного критерия, но вы должны заниматься каждым элементом отдельно (как касание носом в обучении прохождению зон). Вы можете добавлять следующий критерий только после того, как собака поняла предыдущие.
Собаки могут научиться вычислять критерии и играть по правилам. Эта идея жизненно важна для каждого щенка, так что вы можете очень рано начинать учить его правилам игры. Я учила маленького База, что в каждой игре есть правила, и что он должен следовать им, если хочет, чтобы игра продолжилась. Игра аджилити полна критериев для выступления: Если собака хочет стартовать, она сначала должна посидеть на стартовой линии; Если хочет правильно пройти слалом, надо войти так, чтобы первая стойка была слева. Вся жизнь будет наполнена этими правилами, так что лучше, чтобы щенок начал учиться им как можно раньше.
Критерии должны быть четкими — черное и белое. Собака либо сделала правильно, либо нет; не может быть серого цвета ни для вас, ни для собаки. Она должна ассоциировать поощрение только с правильным поведением. Вы никогда не должны поощрять собаку, если она не следовала вашим критериям. Если ваша собака научена касаться носом ладони, если ваш критерий — касание, вы не должны соглашаться на меньшее. Принятие чего-то еще (например, приближение к руке без касания или хватание за рукав) означает, что вы изменяете критерии поведения и вознаграждаете за меньшие усилия. В результате ваша собака научится делать это медленно (и возможно, она будет совсем сбита с толку). Мы все следуем определенным критериям в жизни. Вы сначала должны открыть холодильник, чтобы достать поесть. Стояние перед холодильником и плач дверь не откроют. Собака научится точно выполнять нужное поведение, если вы правильно сумеете подобрать реально выполнимые критерии и следовать им.
Чем больше критериев у вас для поведения, тем больше у вас контроля за ним. Например, чтобы преодолеть качели, собака А должна добежать до конца доски, поставить передние лапы на землю и коснуться поверхности земли носом. Собака В должна только взойти на доску и сойти с нее. Поскольку тренер собаки В только слегка наметил контуры поведения, у него будет меньше контроля за поведением собаки и, следовательно, меньше возможности улучшить его. Это пример последствий дрессировки с пропуском «шагов» поведения.
Вы можете намеренно заложить малое количество критериев для определенного поведения. Например, возможно, вы будете не так требовательны к выполнению команды «Сидеть» на старте в аджилити, чем к выдержке сидя в обидиенс. На аджилити я позволяю собаке лаять, пока она сидит на старте, но в обидиенс я бы потеряла за это много баллов. Заранее продумайте количество критериев, которое вам понадобится для каждого поведения. Чем больше их, тем больше контроль над поведением, но тем больше потребуется времени для обучения и поддержания навыка.
Заблуждение относительно поведения собаки в ринге.
Научить поведению — несложно, гораздо сложнее не снижать требования к этому поведению в дальнейшем. Иногда проблема в том, что люди тоже хотят делать то, что подкрепляется. В аджилити мы могли научить собаку оставаться на старте, но на соревнованиях, когда адреналин бушует, а собака срывается без команды, мы можем снизить требования и позволить ей бежать. Почему? Потому что для человека пробежать трассу аджилити — тоже поощрение! Собака, которая получает поощрение пробегом трассы, быстро учится, что есть разные критерии для аджилити — один для тренировок, другой для соревнований. Многие люди считают, что эта собака изменяет поведение из-за соревнований, а не из-за них самих. Это нечестно по отношению к собаке и снимает ответственность с дрессировщика, перекладывая ее на собаку. Нет таких собак. Есть только дрессировщики, которые не придерживаются одинаковых требований в ринге и дома. Помните: Собаки делают то, что поощряется. Любое животное быстро приспособится к новым правилам игры, если вы поощрите его неверное поведение (позволив сорваться со старта без команды или не настаивая на касании носом земли на зоновом препятствии).
3. Уровень поощрения.
Уровень поощрения, говоря просто, это количество поощрения, которое собака получает в каждый момент тренировки. Это количество может меняться в зависимости от того, какой вид подкрепления вы используете (использование игрушек занимает больше времени) или какое поведение вы отрабатываете. Работая с простым поведением, как касание носом руки, собака получит больше поощрения, чем во время работы над высылом на 15 метров.
Боб Бэйли указывает, что уровень поощрения должен быть таким, чтобы поддерживать возобновление поведения. Если вы подкрепляете слишком редко, вы можете вызвать у собаки стресс и замешательство. Если вы подкрепляете слишком часто, вы впустую тратите ресурс (количество еды, которое может съесть животное, ограничено!). Более того, ваше поощрение должно быть пропорционально реакции собаки. Если собака не понимает условия, при которых вы ее поощряете, то вы ее просто кормите, а не поощряете за поведение. Случалось ли вам, стоя за рингом перед выступлением, кормить собаку в надежде, что она хорошо выступит? Собака учится: лакомство ни за что (за рингом) и отсутствие лакомства за работу (в ринге). Поскольку подкрепление создает поведение, видите, насколько ваше поведение нелогично для собаки? Собаки так же легко учатся работать медленно и неуверенно при наличии непонятных критериев поощрения, как при использовании методов физической коррекции. В обоих случаях замешательство ведет к стрессу.
Ваш уровень подкрепления должен быть высок при начале обучения новому упражнению или введения нового критерия. Когда собака уверенно предлагает новую реакцию, вы можете снизить уровень подкрепления, поскольку правильный ответ — тоже подкрепление для собаки. Например, высокий уровень подкрепления поможет при обучения щенка сидеть. Когда он уже научился садиться по команде, щенку не требуется поощрение всю жизнь каждый раз, как он предложит этот вариант, поскольку посадка часто ведет к другому, также поощряемому поведению — подзыву, возможности прыгнуть барьер.
Диагностическая таблица дрессировки.
Понимание важности выбора времени, установления критериев и уровня поощрения может помочь вам выяснить слабые места ваших занятий. Таблица поможет вам понять, что нуждается в улучшении.
Проблема Диагноз Собака постоянно останавливается незадолго до выполнения требуемого действия Вы слишком рано отмечаете поведение Собака начинает предлагать поведение, но ваши тренировки заканчиваются тем, что она просто смотрит на вас Вы слишком поздно отмечаете поведение Ваши тренировки регулярно заканчиваются тем, что собака предлагает «неожиданные» варианты, которые вы, вроде бы, и не отбирали… Вы отмечаете поведение противоречиво Ваша собака регулярно «забывает» уже, казалось бы, хорошо выученные навыки Вы повысили критерии, установленные изначально, и поощряли собаку за другие варианты, так что теперь она не уверена, что принесет вознаграждение Собака предлагает и другие реакции вместе с желательными (например, касается мишени носом и лапой) Вам нужно больше критериев для тренируемого поведения. Вернитесь назад и измените окружающую среду собаки так, чтобы она смогла предложить только один вариант. Постепенно дайте ей больше возможности предложить больше одного варианта. Похоже, что даже самое простое поведение нужно тренировать целую вечность Вы недостаточно повышаете требования. Вашим критериям легко соответствовать Собака «скисает», отказывается предлагать варианты, пытается убежать Вы слишком резко повысили требования, проскочив несколько шагов. Разделите поведение на более мелкие элементы. Или слишком низок уровень подкрепления для этой конкретной собаки на данной конкретной стадии обучения Собака не очень любит тренировки Надо использовать более интересное для нее поощрение Собака очень любит работать, но прогрессирует медленно Возможно, вы поощряете один и тот же уровень прилагаемых собакой усилий (опять вопрос критериев)Когда вводить команду.
Перед тем, как вводить команду, ответьте себе на два вопроса:
1. Нужна ли она мне прямо сейчас? Есть ли другие сигналы, по которым собака ориентируется, что надо делать (положение руки для касания носом ладони, присутствие слалома)?
2. Полностью ли собака понимает критерии, которые я наметила для этого поведения в любом месте без подсказок и намеков с моей стороны?
Когда собака сначала учится проходить слалом, ее исполнение этого упражнения будет не таким хорошим, как через несколько месяцев занятий. Она может неправильно войти, или не дойти весь ряд до конца, или просто идти медленно. Если вы дадите название в виде команды этому несовершенному исполнению, каждый раз, когда вы будете командовать ей, вы будете побуждать ее к неточным или медленным действиям. То, что мы учим первым, мы помним лучше всего! В большинстве случаев собака будет справляться с этими сложностями, но они дадут о себе знать, когда она будет в состоянии стресса. Возможно, на ваших первых соревнованиях ваша собака вспомнит, что раньше команда «Слалом» ассоциировалась у нее с пробегом мимо ряда палок.
Более правильный подход — не называть поведение, пока оно не достигло совершенства. Когда вы готовы ввести команду, подождите, пока не убедитесь, что собака точно собирается выполнить упражнение. Прямо перед тем, как она начнет, тихо дайте ей команду, которой вы отныне хотите обозначать это действие. Если собака получала достаточно подкрепления этого поведения в прошлом, звук вашего голоса не помешает ей закончить действие, и вы сможете поощрить ее как обычно. Если же она остановится, как только вы заговорили, подождите. Не поддайтесь искушению повторить команду. Вам надо, чтобы собака знала, что одна команда требует одного действия. Если вы будете терпеливы, нескольких повторений упражнения хватит, чтобы собака уверенно выполняла ваше задание по первой команде. Гораздо больше времени потребуется, чтобы собака начала выполнять его в любой обстановке в любое время, но и это придет с терпением и практикой.
Если вы меняете команду или, например, переключаетесь с жеста на голос, используются те же принципы:
Добавьте новую команду перед прежней, которую собака уже знает. Например, при обучении собаки слалому, если вы сначала использовали команду «Змейка» для прохождения четырех стоек, а теперь ваша собака уже уверенно проходит полный слалом на скорости, вы можете решить, что пора сменить команду на «Слалом». Теперь ваша команда должна звучать так: «Слалом, змейка!» Через несколько успешных повторений вы сможете совсем убрать команду «Змейка».
Стимульный контроль.
Когда вы решаете, что настало время вводить команду, вы должны следить за тем, чтобы не подкреплять реакцию, не вызванную вашей командой. Когда поведение берется под стимульный контроль, животное получает подкрепление только в том случае, если оно предъявлено по команде. Видели ли вы когда-нибудь собаку, знающую несколько дежурных трюков? Каждый раз, когда владелец достает кусочек, собака не ждет команды; она демонстрирует весь репертуар. Это поведение не взято под стимульный контроль.
Точно так же, когда поведение находится под стимульным контролем, то по конкретной команде животное демонстрирует соответствующее поведение, и только его. Если вы попросите собаку сесть, она не ляжет. Если же собака все же ляжет, то это показывает, что ни одна из команд, «Сидеть» и «Лежать», не находится под стимульным контролем, поскольку собака не может их дифференцировать. Если собака стабильно отвечает на команду верно, вы контролируете стимул (команду) для каждой реакции. Чтобы получить этот контроль, не называйте поведение, пока вы не уверены, что собака понимает все критерии, установленные вами для этого действия. Если вы просите дать лапу, а собака кувыркается, ничего не говорите. Подождите, пока собака перестанет предлагать любые варианты и сфокусируется на вас, и потом еще раз попросите дать лапу. Важно не повторять команду сразу. Вы хотите научить собаку реагировать на первую команду. Если вы слишком быстро повторите ее, вы можете связать у собаки вместе нежелательный ответ (кувырок) с подкреплением, которое собака получит, когда в конце концов подаст лапу.
Миф о «желании работать».
Дрессировщики часто определяют собаку как имеющую или не имеющую «желание работать». Собака, выказывающая громадный энтузиазм к обучению и стремящаяся к деятельности, обычно называется «имеющей хорошее желание работать». На самом деле, то, что люди обозначают «желанием работать», является продуктом «истории поощрения», которое не только помогло вам научить собаку определенным навыкам, но и приучило ее любить занятия. Справедливо, что некоторым собакам от природы дан более активный темперамент (Баз очень рано начал это демонстрировать). Этот драйв, или желание работать, однако, можно выработать умелой дрессировкой так же легко, как и погубить неумелой. Называя это явление «желанием работать», мы намекаем, что у некоторых собак оно есть, а у других нет.
К сожалению, эта точка зрения побуждает многих дрессировщиков отказаться от работы с собакой и отдать ее, когда они решают, что у нее нет желания работать. Осознание того, что желание работать создается дрессировщиком с помощью правильного поощрения побудит тренеров заниматься каждой собакой, которую они покупают.
Желание работать и отношение к этому процессу собаки — индикатор того, насколько дрессировщик понимал, что именно он поощрял. Многие тренеры готовы навесить на собаку ярлык из-за того, что она не хочет работать в дождь или в жару, или в холод, но та же самая собака с энтузиазмом гоняется за белками в тех же самых условиях. Разница в ценности поощрения: бегущая белка возбуждает, так что собака очень мотивирована на погоню за ней. Если занятия послушанием или аджилити хоть немного менее захватывающи, чем дразнящаяся белка, то мельчайшее отвлечение или сложность могут побудить собаку отказаться от работы. Использование термина «желание работать» обвиняет собаку за неумелость дрессировщика. Если же определить эту проблему как «недостаточное внимание дрессировщика к поощрению», то обвинения попадут по адресу. Если у вас какая-то проблема в обучении, помните: проверьте свои расчет времени, отбор критериев и уровень поощрения. Не обвиняйте собаку!
Программа D.A.S.H.: организация тренировочных приоритетов.
В аджилити мы все хотим, чтобы наши собаки точно выполняли все указания на ненормальной скорости в любых условиях. Но над каким фактором работать сначала? D.A.S.H. - это акроним, который я использую со своими учениками, чтобы описать порядок дрессировочных приоритетов: желание, точность, скорость, условия.
Desire — Желание: Первое, что должна ваша собака, — иметь желание работать с вами. Это этап, где вы имеете дело со всеми подавляющими последствиями павловского научения (см. Выработка противоположных условных рефлексов: борьба огня с огнем). Некоторым собакам не хватает желания работать с вами из-за стресса, отвлечения или низкого уровня поощрения. Вместо того, чтобы пытаться учить незаинтересованную собаку сидеть или лежать, вашим приоритетом должно быть усилить это желание с помощью специальных игр (1-2-3 и «потягушки»). У База было полно «D», но поначалу оно не было направлено на меня. Моей задачей было сделать его заинтересованным во мне, а не в окружающем мире. Когда Баз высовывался из-за меня, чтобы посмотреть на соседнего щенка в группе, не имело смысла пытаться учить его сидеть или лежать.
Accuracy — Точность: Когда желание вашей собаки сфокусировано на вас, вы можете гораздо более успешно заниматься точностью поведения (например, сидеть или касаться ладони). Вам надо стараться создать один маленький фрагмент поведения за один раз, а не пытаться научить сразу всему комплексу действий.