Не рычите на собаку

Конспект книги «Не рычите на собаку» Карен Прайор. В книге описаны способы воздействия на людей, домашних животных, дельфинов, кого угодно. Автор утверждает, что если вы обучитесь описанным приёмам, — у вас будет сильно меньше проблем с коммуникацией.

Блог компании LiteOrder, navff, habr.com 5 апреля 2015

1. Сила положительного подкрепления

У нас всегда есть выбор: мы можем обращать внимание на плохие или на хорошие вещи. Естественный для большинства из нас порядок действий такой: как только мы видим, что что-то пошло не так, мы обращаем на это внимание. Ребёнка ставим в угол, сотрудника лишаем премии, а собаку бьём по зубам. О.Г. Торсунов называет это сознанием мухи. С другой стороны, есть сознание пчелы, которая видит, как всё вокруг хорошо и приятно. Как раз об этом сегодня и речь.

Положительное подкрепление — это событие, совпадающее с каким-либо действием и ведущее к увеличению вероятности повторного совершения этого действия.

Есть два вида подкреплений: положительное и отрицательное. Положительное — это то, чего желает субъект: пища, ласка или похвала. Отрицательное подкрепление — это то, чего субъект не желает: шлепок, нахмуривание бровей, неприятный звук, некомфортная ситуация.

Возьмём ситуацию со звонками детей родителям. Родители хотят, чтобы их дети им звонили как можно чаще, но дети часто этого не делают. Есть два варианта подкрепления. Положительный будет в том, что как только дети позвонят, — нужно им сказать: «как здорово, что ты позвонил». Звонящий с большой вероятностью захочет это повторить. Отрицательное подкрепление будет таким: «Почему ты так долго не звонил? Почему я должен каждый раз сам тебе звонить?». Тут сын не захочет звонить повторно, чтобы избежать таких ситуаций. Фактически, вы обучите его не звонить.

На Хабре и Мегамозге примером положительного подкрепления является карма, рейтинг и ачивки-значки.

Написал хороший пост, — получил плюс к карме. Написал плохой пост — на тебе отрицательное подкрепление и, как следствие, нежелание писать в дальнейшем вообще. Так, в конечном итоге, фильтруются упёртые и упоротые пользователи.

Время подкрепления

Хорошо, когда подкрепление даётся вовремя. Если вы говорите своей жене что-то типа: «Вчера ты выглядела просто превосходно», — это будет не так хорошо, как если бы вы сказали это сразу. Если вы попросили собаку сеть и она села, нужно тут же дать ей подкрепление. Когда она встанет, будет точно поздно.

С дугой стороны, можно дать подкрепление слишком рано, и это тоже не поможет делу. Подкрепление попыток не обязательно приведёт к результату. Например, если вы хвалите нового сотрудника просто за попытки, он может привыкнуть, что достаточно хорошенько пытаться, но результат необязателен.

Величина подкрепления

Каким должно быть подкрепление? Чем меньше, тем лучше. Подкрепление должно быть легко перевариваемым и не должно превращаться во что-то очень значительное. Если вы тренируете животных — дайте им что-то, что они съедят за 5 секунд. У людей принято, что чем труднее работа, — тем сильнее и значительнее должно быть подкрепление.

А ещё бывает куш. Это в 100 раз больше обычного подкрепления и всегда неожиданно. Это может быть внезапный торт в офисе, принесённый руководителем без повода. Или это может быть спонтанная поездка в питерский ДивоОстров с детьми. Такое подкрепление (вроде как незаслуженное) тоже работает. Но оно должно быть внезапным и реально большим.

Условное подкрепление

Нам нравится новогодняя музыка, потому что это означает, что скоро Новый Год и будет интересный, и, я надеюсь, трезвый праздник. Мы не любим запах зубного кабинета, потому что за этим запахом следует зубосверление, иногда боль и куча потраченных денег и времени. Это, по сути, отложенные подкрепления: сначала идёт признак подкрепления, а потом само подкрепление. Деньги, за которые мы работаем, тоже являются условным подкреплением. Поработали → получили деньги → приобрели новый автомобиль.

Режимы подкреплений

Не нужно давать подкрепления вечно. Как только субъект научился нужному поведению, вы можете давать подкрепления в случайном и непредсказуемом порядке. Если вы один раз научили ребёнка кататься на велосипеде, — вы не будете хвалить его в течение всей дальнейшей жизни. Это будет как минимум странно. Но именно редкие и спонтанные подкрепления станут тем стимулирующим моментом, который сможет поддержать поведение.

Пример из личной практики: если дизайнер работает на постоянном среднем (или чуть ниже среднего) уровне, то всплески гениальности служат таким подкреплением с его стороны. Я в такие моменты думаю: «он, конечно, негодяй, но иногда выдаёт очень хорошие вещи, которые нравятся заказчикам. Так что увольнять его пока что не нужно».

2. Процесс выработки

Когда субъект уже делает то, что нужно и просто нужно подкрепить это поведение — всё более-менее понятно. Но что делать, если нужное поведение ещё нет и подкреплять, как будто, и нечего?

Выработка состоит в том, чтобы использовать малейшую тенденцию к нужному поведению и шаг за шагом сдвигать её к поставленной цели. Разбейте конечную цель на ряд последовательных, более мелких, целей. Найдите какое-то поведение, которое осуществляется уже сейчас, как первый шаг. Часто происходит так, что субъект может выполнить нужную задачу (или её часть) случайно. В этом случае вам нужно обязательно заметить это поведение и его подкрепить.

Ниже перечислены 10 правил выработки, которые подробно разбирает автор. В рамках этой статьи подробное описание не влезет, но можно поверхностно с ними ознакомиться.

Повышайте критерий понемногу, чтобы всегда была возможность выполнить требуемое и получить подкрепление.
Отрабатывайте что-нибудь одно в конкретный промежуток времени. Не пытайтесь отрабатывать несколько критериев одновременно.
Прежде, чем переходить к повышению уровня, подкрепите текущий.
Вводя новые критерии, временно ослабьте старые.
Планируйте программу обучения так, чтобы всегда быть готовыми к резкому прогрессу в обучении.
Не меняйте тренеров в процессе выработки конкретного навыка.
Если один путь выработки не приносит успеха, найдите другой способ. Их много.
Не заканчивайте обучение, не дав положительного подкрепления. Это равносильно наказанию.
Если навык ухудшается, — быстро пройдитесь по всему предыдущему процессу обучения, давая подкрепления.
Оканчивайте тренировку на высокой ноте. Конец обучения должен быть радостным, а не унылым.

3. Отучение

Карен Прайор также пишет и о процессе отучения. Т.е. когда есть какое-то нежелательное поведение, от которого вы хотите избавиться. Она приводит 8 принципов отучения. Первые четыре из них негативные, а вторые позитивные. Как вы можете догадаться, вторая половина принципов действует лучше и даёт сохраняющийся результат.

Убить, удалить, избавиться. Просто убрать источник или ограничить его так, чтобы он не смог физически выполнять нежелательное действие.
Наказание. Поставить ребёнка в угол, ударить собаку палкой, лишить программиста премии.
Отрицательное подкрепление.
Угашение. Не обращаете внимание на нежелательное поведение. Не подкрепляете его никак: ни отрицательно, ни положительно.
Выработка несовместимого поведения. Выработать такое новое поведение, которое будет несовместимо с нежелательным.
Добиться, чтобы данное поведение совершалось по сигналу, а потом постепенно убрать этот сигнал
Формирование отсутствия. Подкрепляется всё что угодно, кроме нежелательного поведения.
Смена мотивации. Определите, почему и зачем происходит нежелательное поведение и попробуйте заменить цель поведения на более нужную/правильную.

PS: Карен Прайор много пишет о дрессировке животных, но эти же принципы можно так же успешно применять в нашей повседневной жизни. Я лично в процессе чтения книги замечал, как хорошо на меня лично действуют положительные подкрепления. Могу сказать, что, овладев наукой, изложенной в книге, можно действительно получить +1 к общению, как это и объявлено на обложке книги.