недостаточно, можно последовательно перебрать несколько подсказок. При этом для принятия решения используется только одна подсказка (причина). Примерами эвристик последовательного поиска являются "быстрые и экономные деревья", "взять лучшее" и "дельта-интерференция".
Быстрые и экономные деревья
Врачи скорой помощи должны определить, нуждается ли пациент в немедленном лечении или его можно вылечить позже; солдаты контрольно-пропускного пункта должны определить, является ли приближающийся автомобиль дружественным или в нем заложена бомба смертника; а менеджерам нужно решить, стоит ли повышать сотрудника в должности или нет. Быстрые и экономные деревья - это инструменты для принятия таких классификационных решений. В отличие от сложных деревьев решений, быстрое и экономное дерево проверяет только несколько подсказок или вопросов и пытается принять решение после каждого из них.
Быстрое и экономное дерево: Простое дерево решений с n подсказками и n + 1 выходом.
Он состоит из трех строительных блоков:
Правило поиска: Поиск по подсказкам в заранее определенном порядке.
Правило остановки: Остановите поиск, если подсказка ведет к выходу.
Правило принятия решений: Действуйте в соответствии с тем, что указывает выход.
В ходе эксперимента мы попросили менеджеров принять решение о сохранении или увольнении продавца на основе его еженедельных показателей продаж. 8 Среднее значение, тенденция и вариации показателей были видны на графике, обобщающем данные о продажах. Правило, которое взяли на вооружение многие менеджеры, - это "дерево быстрых и экономных", показанное на рисунке 3.4 . Сначала посмотрите, превышает ли средний показатель продаж данного сотрудника. Если да, то человека не увольняют и не задают других вопросов . Если показатели ниже среднего, то следующий вопрос - есть ли тенденция к росту показателей. Если нет, то человека увольняют; в противном случае задается последний вопрос об изменении объема продаж, после чего принимается решение. В отличие от полного дерева решений, в деревьях быстрого и экономного принятия решений важен порядок следования подсказок. Первая подсказка может сразу привести к принятию решения, а остальные подсказки не могут его отменить. Например, человека с показателями выше среднего оставляют на работе, даже если тенденция к снижению и еженедельные продажи сильно колеблются.
Рисунок 3.4
Быстрое и экономное дерево, используемое менеджерами для принятия решения о том, оставить или уволить продавца. Если средние показатели продаж выше среднего, продавца оставляют. В противном случае задается второй вопрос о динамике показателей, который может привести или не привести к принятию решения. Третий вопрос об изменении показателей задается в тех случаях, когда первые два вопроса не приводят к принятию решения.
Наилучший и дельта-вывод
Быстрые и экономные деревья - это эвристики для принятия решения по одной цели (например, уволить ли сотрудника), в то время как take-the-best и delta-inference - эвристики для выбора между двумя альтернативами. В остальном их логика и структурные блоки аналогичны логике быстрых и экономных деревьев. Разница между ними заключается в том, что take-the-best обычно обрабатывает бинарные сигналы (например, имеет ли кандидат на работу высшее образование), тогда как delta-inference может обрабатывать все типы сигналов, непрерывные, категориальные и бинарные (например, баллы IQ кандидатов и уровень их образования). Дельта в дельта-инференции означает пороговое значение, при превышении которого альтернативы считаются достаточно разными по признаку; в этот момент поиск прекращается и принимается решение.
Рассмотрим Национальную футбольную лигу (НФЛ), лигу профессионального американского футбола. В США это самая популярная спортивная лига с точки зрения получаемых доходов, а игры НФЛ смотрят миллионы людей каждую неделю в течение всего игрового сезона. Журналист Грегг Истербрук писал колонку о футболе под названием "Tuesday Morning Quarterback" для ESPN. В 2007 году два читателя независимо друг от друга написали ему, предложив простую модель прогнозирования: побеждает команда с лучшим рекордом; если рекорды равны, то побеждает домашняя команда. 9 По сути, эта модель является примером дельта-инференции, в которой первым критерием является рекорд команд по победам и поражениям, а вторым - домашняя команда или гостевая (см. рисунок 3.5 ). Дельта в критериях "рекорд выигрыша-проигрыша" установлена на 0 (т. е. любая разница приведет к предсказанию), а кит "домашняя команда" является бинарным.
Рисунок 3.5
Эвристика дельта-инференции применяется для прогнозирования победителей матчей НФЛ. При игре между двумя командами прогнозируется, что в предстоящем матче победит команда с лучшим рекордом. Если рекорды двух команд равны, то победа прогнозируется за хозяевами.
Эта простая эвристика обошла всех экспертов, кроме одного, из десятков, чьи результаты отслеживал Истербрук в сезоне 2007-2008. Почти такого же результата она добилась в сезоне 2008-2009, обойдя всех экспертов, кроме двух. 10 Иногда Истербрук ставил под сомнение выбор, сделанный эвристикой, и заменял его своим собственным. Таким образом, точность прогноза снижалась! Используя эту эвристику, не нужно обладать инсайдерской информацией, тратить время на чтение отчетов и проведение сложных анализов, знать историю соревнующихся команд или даже разбираться в правилах американского футбола. Всю необходимую информацию можно легко найти на любом сайте, публикующем информацию об играх NFL.
Можно попытаться повысить точность дельта-умозаключений, пытаясь найти "оптимальные" дельты (то есть дельты, наилучшим образом соответствующие прошлым данным). В ходе исследования тридцати девяти реальных задач, таких как предсказание того, в какой из двух средних школ будет более высокий процент отсева и какой бриллиант из пары будет продан по более высокой цене, мы обнаружили, что простое установление дельт на 0 было столь же точным, как и использование оптимально подобранных пороговых значений. Эвристика также не уступает сложным моделям, таким как байесовская линейная регрессия. 11
Эвристика равенства
Эвристика одной причины хорошо работает при наличии мощной подсказки. Однако в ситуациях, когда подсказки одинаково информативны, эвристика равенства - лучший выбор. Они интегрируют подсказки простым способом, например, суммируя доводы "за" и "против". Это отличает эвристику равенства от оптимизационных моделей, которые оценивают веса различных причин и учитывают взаимозависимость и взаимодействие между подсказками.
Подсчеты
Подсчеты основаны на основной способности человека считать и сравнивать числа. Это инструмент, используемый для принятия решений о классификации, и он работает так же, как быстрые и экономные деревья, но основан на противоположной логике. Вместо того чтобы упорядочивать подсказки и искать их последовательно, подсчеты рассматривают все подсказки одинаково. Рассмотрим задачу с n бинарными подсказками, где положительное значение подсказки указывает на категорию X, а k (1 < k ≤ n) - порог классификации.
Подсчет: Задайте число k. Если цель имеет k положительных значений подсказки или больше, отнесите ее к категории X; в противном случае - нет.
По сути, подсчет голосов воплощает демократическое голосование среди