Магический «бридж-сигнал». Небольшое отступление

Магический «бридж-сигнал». Небольшое отступление

В настоящее время в собаководстве все большей популярностью пользуется методика с условным подкреплением, когда в качестве инструмента, подающего условный сигнал (или «бридж-сигнал» – сигнал-мостик), используется щелчок, издаваемый прибором под названием кликер. Однако некоторые тренеры относятся к использованию условных подкреплений вообще и кликера как механизма, подающего этот самый сигнал, в частности, с непонятным предубеждением: дескать, зачем это нужно, нельзя ли просто вовремя хвалить собаку и т. д.

Описание этого метода применительно к дрессировке собак я вместе с доктором биологических наук Александром Кузнецовым публиковал еще в старом «Друге»[2] в начале 2000-х, еще до проникновения собственно кликера в нашу страну. Но, возможно, та статья слегка опередила свое время, поэтому особого отклика в сердцах практиков она не получила, ибо нет пророков в своем отечестве – надо было дождаться визита в Россию английских домохозяек, увлекшихся дрессировкой, чтобы этот метод овладел умами сограждан. Еще более удивительно, что примерно с 1988 года у нас в стране все же была группа энтузиастов, использующая в дрессировке «бридж-сигнал», а именно В.С. Варлаков и его последователи.

На самом деле подробнейшее описание дрессировки с использованием «бридж-сигнала» в нашей стране стало доступно самой широкой публике, когда в 1981 году вышел перевод замечательной книги Карен Прайор, выдающейся дрессировщицы дельфинов в частности и животных вообще, – «Несущие ветер». Тогда-то я впервые и узнал о существовании этой методики. Дело в том, что мой учитель и научный руководитель Всеволод Михайлович Белькович писал предисловие к этой книге – он же и подарил мне один из экземпляров.

Стоит напомнить, что тренеры дельфинов использовали так называемый оперантный метод обучения. В их исполнении ОПЕРАНТНЫЙ МЕТОД – это метод обучения, при котором из НЕЦЕЛЕНАПРАВЛЛЕННОГО (ОПЕРАНТНОГО), но высоко мотивированного поведения животного тренер при помощи условных подкреплений – то есть «бридж-сигналов», поданных в нужный момент, буквально выуживает необходимые элементы поведения, из которых формируется навык, под выполнение которого далее «подводится» команда. Подробнее об этом чуть позже.

Замечу, что тогда, в 80-е годы, дрессировка с «бридж-сигналом» буквально воспламенила умы крайне немногочисленных «посвященных». Остромодно было, используя оперантный метод, пытаться «дрессировать» своих знакомых и друзей. К примеру, я, заразившись этой игрой после прочтения книги Карен Прайор, в свою очередь «заразил» ею своих товарищей по Институту океанологии: играя в дрессировщиков со свистком, мы таким образом в свободное от вахт время развлекались во время довольно утомительной Антарктической экспедиции на НИС «Дмитрий Менделеев». Забавно было путем серии условных подкреплений, о которых мы договаривались заранее, заставить человека выполнить какое-нибудь дурацкое действие – забраться на лабораторный стол и топнуть ногой, снять с соседа ботинок и т. д.) Эта практика впоследствии пригодилась мне, когда пришлось работать с дельфинами (эпизодически), другими морскими млекопитающими и (регулярно) с собаками, используя «бридж-сигнал».

Тут следует заметить, что единственной (подчеркнем это слово) и господствующей идеологией дрессировки в нашей стране вплоть до 1980-х была дрессировка по методу выработки условных рефлексов, выражением которой был контрастный метод. Суть его заключалась в том, что с помощью механических воздействий собака выполняла прием, который затем подкреплялся лакомством. Например, для того чтобы объяснить собаке, что нужно делать по команде «Сидеть», ей подавали команду, затем дергали поводком вертикально наверх, другой рукой давили на круп и сразу давали лакомство. Считалось, что таким образом у собаки вырабатывается условный рефлекс на команду, подобно тому как у «собаки Павлова» вырабатывался условный рефлекс – слюноотделение – в тот момент, когда в лаборатории загоралась лампочка, потому что после того, как загоралась лампочка, собаку кормили.

Вы будете смеяться, но на самом деле контрастный метод – это один из вариантов оперантного научения, потому как тут не происходит в чистом виде замена безусловного рефлекса на условный, как того требует павловская методика, а формируются новые формы поведения! Но это к слову, и не об этом сейчас речь…

В результате довольно схематичных, «механистических» представлений о поведении собак вся дрессировка иногда выливалась в скрашиваемую лакомством, довольно жесткую систему принуждений. Вы удивитесь, дорогие читатели, но этот подход в практически девственном виде сохранился у ринговых и КНПВшных тренеров Западной Европы.

Таким образом, до 80-х большинство наших дрессировщиков не предпринимали никаких попыток гибкого решения проблемы, не допускали никакого отступления от методики. Нет, конечно, были среди них самородки, особенно среди любителей трюковой дрессировки, по наитию использовавшие многое из того, что потом шагнуло в массы, но в целом картина была такая: как я описал.

Пока поголовье собак позволяло работать таким образом (в качестве служебных, а о них в основном идет речь) – подобно тому как позволяет использовать такие методы современным западноевропейским ринговым тренерам, – все было нормально. Как только качество поголовья собак резко понизилось – как раз к 1980-м, – то «простые» методы обучения вдруг перестали работать.

О том, что поведение собак, да и вообще животных, гибко, пластично, многообразно и порой вполне осмысленно, а в чистом виде условный рефлекс – это скорее понятие физиологическое, знали лишь профессиональные биологи и в их числе только-только появившиеся в нашей стране этологи. И это несмотря на то, что в СССР работала и совершала интереснейшие открытия группа исследователей под руководством Л.В. Крушинского, пожалуй, впервые в мире, предложившего для описания поведения животных, решающих сложные задачи, термин «элементарная рассудочная деятельность».

Однако пока биологи спорили о том, как и в каких терминах правильно описывать поведение животных, пребывающая с начала XX века в «замороженном» методическом плане и, главное, чувствующая там себя весьма комфортно основная масса участников дрессировочного процесса при малейших попытках отступления от канонов крутила вслед новаторам пальцем у виска (в лучшем случае) или писала доносы в советскую прессу об отступлениях от «отечественных традиций» с легко читаемой между строк просьбой принять меры.

Молодому поколению тренеров наверняка странно будет это читать, они вовсю пользуются и «бридж-сигналами», и другими дрессировочными новациями как чем-то само собой разумеющимся, однако даже в начале 2000-го ситуация была иная.

…Одним осенним днем в конце 80-х годов в старом московском дворе одного из домов на Оружейном переулке я и В.С. Варлаков обсуждали прошедшее дрессировочное занятие. Вокруг нас крутилась юлой миттельшнауцер Санька, любимая собака Валеры, которую мы недавно водили на выставку. К слову, посещение этого мероприятия окончательно закрепило мою устойчивую неприязнь к подобного рода действам.

– Валер, угомони ее, поговорить не дает, – взмолился я.

– Да, шустрая собачонка, – с фирменным прищуром улыбнулся Варлаков.

– Чего-то делать с ней надо, на выставке меня в конец умотала, ни минуты покоя, – сказал я. На выставке я помогал Варлакову водить Саньку по кругу. Термина «хендлинг» тогда в лексиконе отечественных дрессировщиков и представителей шоу-кинологии еще не было. Вот я и водил.

– Ну да, надо, конечно, а то неудобно перед народом, – задумчиво сказал Валера.

– Сапожник без сапог, классика, – резюмировал я. При этих словах Санька оперлась передними лапами о ногу хозяина и, заложив назад уши, уставилась из-под челочки преданным взглядом в глаза Варлакову, энергично виляя при этом обрубком хвоста.

– Вот зараза, – добродушно сказал Валера, – вот что с ней делать?

– Может, просто взяться посистематичнее как-то, время выделить…

– Не, я с ней одну штуку пробовать начал, – сказал Варлаков, – думаю продолжить, посмотрю, что выйдет.

– Какую? – спросил я заинтересованно. Варлаков, к слову, был не только мэтром дрессировки, но и неплохим знатоком человеческой психологии. Он знал, что настоящий мастер должен быть загадочен. Рассказывать о придумках он не спешил, любил заинтриговать слушателя. Во время и после правильной подготовки аудитории продемонстрированный трюк способен увлечь последователей куда сильнее, нежели детальный и будничный разбор полетов.

Надо сказать, что искусством объяснять своим адептам, что только им доступна сокровенная истина и знание чудодейственных дрессировочных трюков Валерий Степанович владел в совершенстве. В поздние годы за ним постоянно ходила чуть ли не с блокнотиками небольшая толпа почитателей, записывающих откровения мэтра. Некоторые, впрочем, переросли этот этап и стали неплохими специалистами. Но в тот момент аудиторию Варлакова составлял только я, тогда еще аспирант, изучавший поведение животных профессионально и хорошо знакомый к тому времени со всеми особенностями фирменного подхода наставника к трансляции знаний. Как мне казалось, со мной играть в эти игры особого смысла не было, наоборот, учитывая мой извечный скепсис, продуктивнее было «размять» ситуацию. Может быть, поэтому, немного помявшись, Варлаков произнес:

– Буду дрессировать Саньку с условным подкреплением! – И деловито продолжил: – Немного начал пробовать.

– Валер, – нетерпеливо сказал я, – неужто ты, как Соловей-разбойник, будешь «дудеть» в милицейский свисток? А команды тогда как подавать? – напомню читателю, что издающий щелчки прибор под названием кликер тогда еще не был изобретен, и я очень сильно сомневаюсь, что кто-либо, кроме, может быть, самой Карен Прайор, использовал метод «бридж-сигнала» для дрессировки собак.

– Как буду, говоришь? – спросил Варлаков и хитро улыбнулся. Нет, так просто сдаваться он не собирался, поэтому решил подержать паузу.

– Да, интересно просто, каким, извиняюсь, местом, ты будешь издавать условный сигнал? – максимально ехидно спросил я.

– Ртом! – сдался Варлаков. – Вот так, – сказал он и незамедлительно издал языком щелкающий звук, тут же дав Саньке кусочек лакомства.

Все понятно. Это был небольшой, блистательно разыгранный спектакль маэстро. Типичный пример демонстрации использования оперантного метода в варианте дельфиньих тренеров. Крутившаяся вокруг нас Санька просто соображала, за что может получить подкрепление, предлагала тренеру (Варлакову) и «то» поведение, и «это», и когда наконец она села, то получила подкрепление – «бридж-сигнал» – щелчок и потом подкрепление лакомством.

– Ух ты, – сказал я. – Работает!

– Еще как, – довольно сказал Варлаков. – В субботу в Пушкино поеду, там группа юных дрессировщиков собралась. Попробую с группой новым методом поработать. Поедешь? Поможешь там, если что.

– Щелкать будете? – опять съехидничал я.

– Будем, – сказал Варлаков, – так ты едешь?

– А то, – ответил я.

Так, благодаря «озарению» В.С. Варлакова, у нас в стране появились первые «адепты» дрессировки с «бридж-сигналом», намного опередившие свое время.

Стоит подчеркнуть еще один момент: использование условного подкрепления, «бридж-сигнала» – щелчка кликера, или щелчка языком, кому как удобнее, – кроме всего прочего эффективно концентрирует внимание животного на тренере, от которого исходят эти сигналы и собственно подкрепление, а само обучение протекает на высоко положительном эмоциональном фоне. Высокая концентрация на тренере и выполнении его команд на положительном эмоциональном фоне – главные плюсы дрессировки с «бридж-сигналом»!

Однако очевидно, что использование этого метода для коррекции поведения (ведь вы не забыли, все эти рассуждения у нас крутятся вокруг темы «Как отучить собаку бояться громких звуков»), так вот, использование «бридж-сигнала» в коррекционной дрессировке требует предварительного обучения.

Думаю, тут стоит чуть подробнее описать «дельфинологический» вариант метода – тот, который использует Карен Прайор.

Этап первый. Сначала у собаки в «стерильных» условиях – то есть в тихом, укромном месте, где ничто не отвлекает от занятий, – вырабатывается так называемая положительная условная связь с «бридж-сигналом». Каждый раз давая собаке кусочек еды, тренер издает щелчок. Вырабатывается условная связь: щелчок – это хорошо, будет еда.

Этап второй. В классическом случае, опять же в тихом, знакомом собаке месте, – начинается этап формирования у собаки простейших навыков послушания. Тренер терпеливо ждет, когда собака выполнит то, что он от нее требует. Например, сядет. После того как собака садится, следуют щелчок и лакомство. После нескольких успешных повторений под разучиваемый навык «подводится» команда, которая подается непосредственно во время выполнения собакой навыка. Чуть позже, когда между командой, выполнением навыка и «бридж-сигналом» вырабатывается условная связь, команда подается непосредственно перед выполнением навыка. То есть в этом варианте собака «механически» не «наводится» на выполнение того или иного приема, тренер ждет, что ему «предложит» животное.

Высокая концентрация на тренере и выполнении его команд на положительном эмоциональном фоне – главные плюсы дрессировки с «бридж-сигналом»!

Для нас очень важно отметить, что «бридж-сигнал» обязательно раздается непосредственно в тот момент, когда собака выполняет то, что от нее потребовал тренер. Не мгновением раньше, не секундой позже. Именно в момент.

Таким образом, когда собака выполняет то, что от нее ждет тренер (садится, ложится, встает, идет рядом), непосредственно в момент правильного выполнения команды (не раньше и не позже) раздается щелчок. С этим щелчком на первом этапе была выработана условная связь. (Вот где работает павловский условный рефлекс!) То есть щелчок всегда на уровне условного рефлекса означает, что все правильно, все хорошо, сейчас будет еда и похвала. Это и есть «бридж-сигнал» (сигнал-мостик). В этом случае он вызывает – так уж устроена физиология живых организмов – положительную эмоцию.

Важно отметить еще один момент. Когда условная связь щелчок – еда выработана, навык (допустим, по команде «Сидеть») сформирован, кусочек лакомства собаке можно давать чуть позже – это, кстати, удержит ее в нужном положении, если сильно не тянуть, конечно.

Этап третий. Когда собака начинает уверенно выполнять команды, подкрепление дается не каждый раз, а в так называемом варьируемом, случайном режиме – так поддерживается и стимулируется желание собаки выполнять действия тренера. И вот когда собака начнет стабильно и уверенно выполнять команды тренера, можно начинать работать в условиях отвлекающих факторов. Отвлекающих, но НЕ СЛИШКОМ! Во всем нужна мера и последовательность.

Этап четвертый. Работа на фоне отвлекающих сигналов (стимулов) выполняться должна следующим образом. На всякий случай, во избежание непредвиденных вариантов развития ситуации, занятия нужно начинать так, как будто ваш пес вообще незнаком с условными подкреплениями. То есть, обратив внимание собаки на то, что в руках у вас лакомство, щелкните (кликером или языком) и дайте его питомцу. Когда собака «поймет», так сказать, правила игры, можно переходить к другим этапам.

Гениальная дрессировщица дельфинов и прочих живых существ Карен Прайор, открывшая для широкой общественности метод обучения с «бридж-сигналом», называла этот прием «возвращением в первый класс».

В результате «кликерные» собаки зачастую после двух-трех уроков прекращают обращать внимание на отвлекающие факторы, даже очень сильные. Впрочем, если правильно заниматься с собакой (как – я описал выше), то тот же эффект будет получен и при традиционной дрессировке.

Данный текст является ознакомительным фрагментом.