параллельны. (Можно сказать и иначе: левые точки почти совпадают, а правые сильно разнесены.) Если человек не столкнулся с травмирующим событием, влияние генов почти незаметно: каким бы ни был геном, вероятность пережить депрессивный эпизод не превышает 1 %. Но в присутствии стресса гены приобретают огромное значение: полный набор генетических признаков, связанных с устойчивостью к депрессии, удерживает риск заболеть на уровне 6 % (нижняя линия); полный набор генетических признаков, связанных с уязвимостью к депрессии, повышает риск более чем в два раза, до 14 % (верхняя линия). Взаимодействие сообщает нам не только о том, что свой вклад в развитие депрессии вносят как гены, так и среда, но и о том, что они, похоже, влияют на одну и ту же стрелку причинно-следственной цепи. Гены, в разной степени общие для этих близнецов, — это не гены депрессии как таковые, это гены уязвимости или устойчивости к травмирующему опыту.
Теперь давайте посмотрим, что там с гениями — становятся ими или рождаются? Следующий рисунок, также взятый из реального исследования, демонстрирует рейтинг шахматного мастерства для выборки шахматистов с многолетним опытом, которые отличаются друг от друга по показателю когнитивных способностей и числу игр в год [364]. Судя по графику, практика играет определенную роль: обе линии в целом идут вверх, подтверждая главный эффект настойчивых тренировок. Но и талант себя показывает: линии проходят на разной высоте, что подтверждает главный эффект способностей. Однако основное в этой истории — взаимодействие: линии не параллельны, а значит, чем умнее шахматист, тем больше пользы приносит ему каждая сыгранная игра. Другими словами, без практики когнитивные способности ничего не значат (левые точки графиков практически совпадают), но практика подчеркивает талант интеллектуально одаренных игроков (расстояние между правыми точками больше). Зная разницу между главными эффектами и взаимодействием, мы не просто не купимся на ложные дихотомии, но сможем глубже понять природу глубинных причин происходящего.
Люди и причинно-следственные сети
Как способ понять причинную насыщенность окружающего мира уравнение регрессии довольно бесхитростно: оно просто суммирует горстку взвешенных предикторов. Взаимодействия в нем тоже можно учесть, представив их в виде дополнительных предикторов, полученных путем перемножения взаимодействующих факторов. Уравнение регрессии устроено гораздо проще сетей глубокого обучения, с которыми мы познакомились в главе 3: те учитывают миллионы переменных, соединяя их в длинные, путаные цепочки формул, а не просто сваливают их в одну кучу и высчитывают сумму. Но, каким бы оно ни было простым, психология XX в. подарила нам ошеломительный факт: как правило, примитивное уравнение регрессии справляется с задачей лучше специалиста-человека. Это открытие, сделанное психологом Полом Милем, известно под названием «сравнение клинического и актуарного суждения» [365].
Предположим, вы хотите предсказать какой-нибудь измеримый исход: как долго протянет больной с онкологическим заболеванием; каким будет окончательный диагноз пациента психиатрической клиники — легкий невроз или тяжелый психоз; велика ли вероятность, что подсудимый сбежит из-под залога, нарушит требования условно-досрочного освобождения или совершит еще одно преступление; преуспеет ли студент в магистратуре; взлетит ли бизнес или всплывет брюхом вверх; какую прибыль принесут инвестиции. У вас есть кое-какие предикторы: перечень симптомов, набор демографических характеристик, информация о прошлом поведении, выписка из зачетной ведомости — все, что может иметь отношение к делу. Вы показываете данные эксперту — психиатру, судье, инвестиционному аналитику и так далее — и одновременно подвергаете их стандартному регрессионному анализу, чтобы получить прогностическое уравнение. Чье предсказание окажется точнее?
Побеждает — почти всегда — уравнение. Более того, эксперт, которому сообщают уравнение и разрешают им пользоваться для уточнения собственных прогнозов, зачастую справляется хуже, чем уравнение само по себе. Дело в том, что эксперты слишком торопятся учесть исключительные обстоятельства, которые, по их мнению, лишают формулу всякого смысла. Это так называемая проблема сломанной ноги: эксперт, в отличие от алгоритма, понимает, что человек, только что сломавший ногу, на танцы вечером не пойдет, что бы там ни предсказывала формула, утверждающая, что этот парень ходит на танцы каждую неделю. Но дело в том, что уравнение уже учло вероятность, что исключительные обстоятельства изменят исход, и суммировало ее с другими факторами, а специалист, слишком впечатленный притягивающей внимание частностью, поспешно отбрасывает базовую оценку. Более того, регрессионный анализ показывает, что некоторые из предикторов, на которые эксперты полагаются сильнее всего, например личная беседа, совершенно бесполезны.
Я не предлагаю исключить человека из процесса принятия решений. Человек по-прежнему необходим, чтобы разобраться с предикторами, требующими глубокого осмысления, например понимания речи или классификации поведения. Проблема в том, что человек не способен их должным образом объединить, а вот алгоритм регрессии делает это превосходно. Как замечает Миль, вы же не станете говорить кассиру в супермаркете: «Мне кажется, я должен вам где-то 76 долларов — пойдет?» Но именно так мы и поступаем, интуитивно комбинируя набор вероятностных причин.
Уравнение регрессии — мощный инструмент, но и оно не всесильно: самым сбивающим спесь открытием в сфере предсказания людского поведения стал масштаб его непредсказуемости. Легко сказать, что поведение человека обусловлено комбинацией факторов наследственности и среды. Но, взглянув на предикторы, которые, казалось, должны быть мощнее самого лучшего уравнения регрессии, — на однояйцевого близнеца с идентичными генами, семьей, районом проживания, образованием и культурой — мы видим, что корреляция черт двух близнецов, хотя и намного выше случайной, все же намного ниже единицы — как правило, она равна 0,6 [366]. Отсюда следует, что масса человеческих различий удивительным образом не находит объяснения: причины практически идентичны, но следствия совершенно разные. Один из близнецов может оказаться гетеросексуалом, а другой — геем, один — шизофреником, а второй — совершенно здоровым психически. На графике зависимости депрессии от факторов среды и наследственности видно, что даже для женщины, которая пережила травмирующее событие и имеет доказанную генетическую предрасположенность, шанс заболеть депрессией не 100 %, а всего около 14 %.
Недавно стало известно о потрясающем эксперименте, в очередной раз подтвердившем зловредную непредсказуемость человеческих существ [367]. 160 группам исследователей предоставили доступ к крупному массиву данных с информацией о тысячах неблагополучных семей: их доходы, образование, истории болезней и результаты множества опросов и обследований домашних хозяйств. Группам поставили задачу спрогнозировать будущее этих семей: школьные оценки детей, шансы на выселение из жилья, на трудоустройство или на успешное прохождение курсов повышения квалификации. Соревнующимся было разрешено применять для решения задачи любой алгоритм по своему вкусу: регрессию, глубокое обучение или какой угодно иной модный фокус искусственного интеллекта. И что в итоге? Выражаясь сдержанным языком аннотации к статье, «лучшие из прогнозов были не особенно точны».