При этом сам Скиннер предпочитал термин «подкрепление», и чуть позже я поясню почему.
Идея заключалась в следующем: если вы хотите усилить проявления определенного поведения, вам следует его подкрепить (вознаграждением). Если вы хотите ослабить проявления определенного поведения, вы подкрепляете желательное поведение и игнорируете нежелательное. Звучит вполне здраво, однако Скиннер решил выйти за пределы здравого смысла, чтобы подвести под свои наблюдения научную основу. Вот как выглядела базисная идея Скиннера:
Поведение → Подкрепление → Усиление поведения
Например:
Получение «пятерки» в школе → Получение пяти долларов → Получение большего количества «пятерок»
Или:
Нажатие на кнопку → Получение денег в игровом автомате → Многочисленные нажатия на кнопку
Или:
Своевременное предоставление отчета → Получение похвалы за отличную работу, сделанную в срок → Подготовка последующих отчетов к установленному сроку.
Скиннер пошел дальше, пытаясь выяснить, какими должны быть подкрепления, когда их следует делать, как часто и в каком объеме. Если вы хотите, чтобы люди делали то, что вам нужно, вам следует быть в курсе некоторых тонких, но важных нюансов человеческого поведения.
Задумайтесь: вы пытаетесь заставить кого-то, например, регулярно выносить мусор, вовремя сдавать отчеты или голосовать на выборах. Вы напрягаете свой мозг, пытаясь придумать, как это сделать. «Может быть, мне нужно его (или ее) как-то простимулировать? — думаете вы. — Деньгами или чем-то еще?»
В то же самое время тысячи людей сидят в казино и раз за разом жмут на кнопку, хотя им за нажатие кнопки никто не платит. Напротив, это они платят кому-то за право нажать на кнопку (и в большинстве случаев потерять при этом собственные деньги). Не хочется ли вам узнать «секрет казино», который, вполне возможно, пригодится и вам? Но сначала давайте поговорим о крысах.
Пять базовых режимов подкрепления
Допустим, вы поместили крыс в клетку с кнопкой. Каждый раз, когда крыса нажимает на эту кнопку, она получает порцию пищи. Еда служит подкреплением определенного поведения:
Поведение → Подкрепление → Усиление поведения
В нашем случае эта схема выглядит следующим образом:
Нажать кнопку → Получить порцию пищи → Чаще нажимать на кнопку
Но что будет, если вы сделаете так, что крыса перестанет получать еду каждый раз, когда она нажимает на кнопку?
Скиннер проверял различные сценарии и обнаружил, что может предсказывать и контролировать, как часто и как быстро крысы будут нажимать на кнопку, чтобы получить еду. В ходе эксперимента он менял необходимое для получения пищи условия (количество и частоту нажатий на кнопку) и наблюдал происходящие изменения.
Были использованы пять базовых режимов подкрепления:
— Непрерывное подкрепление. Вы выдаете порцию пищи каждый раз, когда крыса нажимает на кнопку.
— Фиксированный интервал. Вы выдаете порцию пищи в ответ на нажатие кнопки лишь в том случае, если после предыдущего нажатия прошло определенное количество времени, например пять минут. Крыса получает еду при первом нажатии, которое состоится после истечения пятиминутного перерыва.
— Переменный интервал. Вы также выдаете порции пищи с временными интервалами, но при этом продолжительность каждого интервала постоянно меняется. Иногда он составляет одну минуту, иногда пять, иногда три и т. д.
— Фиксированное количество нажатий. Выдача пищи зависит не от частоты, а от количества нажатий на кнопку. Например, крыса получала еду после каждого десятого нажатия. Необходимое количество нажатий оставалось постоянным.
— Переменное количество нажатий. В этом случае подкрепление также основано на количестве нажатий, но при этом необходимое количество постоянно меняется. Иногда требуется нажать на кнопку пять раз, в другой раз — десять, затем три и т. д.
Выяснилось, что в каждом из пяти случаев крысы (и люди) ведут себя предсказуемо. В следующих разделах вы узнаете, как использовать эти режимы для того, чтобы влиять на поведение людей.
СтратегииСтратегия 40: недостаточно просто дать человеку вознаграждение. Нужно правильно выбрать режим подкрепления, чтобы использование вознаграждения действительно помогло заставить человека делать то, что вам нужно.
Непрерывное подкрепление: как заставить людей сделать что-то новое
Если вы даете своей дочери деньги (подкрепление) каждый раз, когда она получает отличную оценку (желаемое поведение), вы тем самым используете режим непрерывного подкрепления. Если вы хвалите своих сотрудников (подкрепление) каждый раз, когда они своевременно предоставляют вам отчет (желаемое поведение), вы используете тот же режим. Непрерывное подкрепление лучше всего подходит для тех случаев, когда вы пытаетесь сформировать новое поведение. Когда оно уже сформировано, вы должны переключиться на один из других режимов.
Вначале использования режима непрерывного подкрепления вы получаете заметный результат обучения человека (или крысы, или собаки) новому поведению. Но с течением времени желаемое поведение станет неустойчивым. Кроме того, у этого режима есть и обратная сторона. Если вы исключите подкрепление (то есть прекратите платить деньги за каждую «пятерку» или не будете хвалить сотрудников за каждый своевременно предоставленный отчет), желаемое поведение, скорее всего, тоже прекратится.
СтратегииСтратегия 41: желая сформировать у человека новое поведение, вознаграждайте его всякий раз, когда он ведет себя так, как нужно (непрерывное подкрепление).
Стратегия 42: после того как желаемое поведение будет сформировано, перейдите с режима непрерывного подкрепления на другой режим для сохранения полученного результата.
Переменная норма: как заставить людей продолжать делать то, что вам нужно
Когда вы хвалите сотрудника не за каждое выполненное им поручение, действует режим подкрепления с переменной нормой.
Выигрыш в игровом автомате после 56 проигранных раундов — результат действия этого же режима. Большинство игр казино основаны именно на нем. Игрок жмет на кнопку 10 раз и получает награду, после чего играет еще 52 раза до следующего вознаграждения.
С точки зрения сотрудника или игрока, режим с переменной нормой выглядит непредсказуемым. Количество повторов правильного поведения, необходимых для получения награды, все время меняется. Человек не знает, поощрят ли его уже в следующий раз, когда он сделает требуемое, или же это произойдет лишь на тридцатый, пятый или даже сотый раз. Именно поэтому он повторяет необходимые действия снова и снова.
Режим с переменной нормой заставляет человека придерживаться выработанного поведения. Даже если вы исключите подкрепление, человек будет продолжать делать то, что вам нужно, в течение длительного времени. Психологи назвали бы такое поведение «устойчивым к ослаблению».
СтратегииСтратегия 43: если вы хотите, чтобы человек придерживался выработанного поведения, давайте ему вознаграждение в переменном режиме.
Переменный интервал: как сделать нужное поведение регулярным
Джордж работает в лаборатории, которую периодически проверяет надзирающее правительственное ведомство. Он знает, что проверяющий обязательно придет, но не знает когда. Возможно, визит состоится уже в этом месяце, или в течение трех ближайших месяцев, или в течение полугода. Инспектор любит приходить неожиданно.
Джордж приходит к выводу, что ему следует постоянно быть наготове, чтобы в любой момент продемонстрировать: лаборатория полностью соответствует всем действующим нормам. В данном случае желаемое поведение состоит в соблюдении всех правил и требований к лаборатории, а получение отличной оценки по результатам проверки служит подкреплением.
Инспектор приходит с непредсказуемыми интервалами. Соответственно, в данном случае используется режим с переменным интервалом:. Можно ожидать, что Джордж большую часть времени будет делать все необходимое для того, чтобы лаборатория удовлетворяла существующим требованиям, и такое (желаемое) поведение будет сохраняться довольно долго (то есть будет обладать устойчивостью к ослаблению).
Если ваша цель — заставить людей делать что-то регулярно, но не обязательно часто, то использование режима с переменным интервалом подкрепления вам подойдет.