Существует несколько теорий для объяснения того, как люди распознают речевые звуки. Согласно одной, акустическое представление связано с представлением артикуляторным: для распознаваемого звука подбирается комбинация артикуляторных движений, которая могла бы его произвести, причем эти комбинации у разных людей могут различаться59. Так же, через подбор артикуляторных движений, осуществляется нередко распознавание зрительных образов слов: это отчетливо видно на примере людей малограмотных или читающих на плохо знакомом языке — во время чтения они заметно шевелят губами (а иногда даже тихонько проговаривают каждое слово). Но даже у грамотных людей при чтении про себя отмечается усиление биотоков в мышцах, связанных с произнесением речевых звуков60 {6}. Как показали исследования основателя отечественной нейропсихологии Александра Романовича Лурии (в дальнейшем его результаты были подтверждены и дополнены), чем сложнее воспринимаемый текст, тем сильнее нарушается его понимание при искусственном затруднении артикуляции61. Согласно другой теории, в мозгу существуют акустические образы звуков речи — как должно выглядеть “прототипическое” а, как — б и т. д. Таких прототипов может быть более одного, поскольку в разном окружении звуки реализуются по-разному. Третья теория предполагает, что главную роль при распознавании речевых звуков играют имеющиеся в мозгу особые нейронные распознающие устройства — детекторы, — настроенные на отдельные смыслоразличительные признаки фонем. Поскольку каждая фонема обладает уникальным набором таких признаков, комбинация показаний детекторов определяет фонему однозначно. Вероятно, все эти теории в определенной мере справедливы и дополняют друг друга.
Анализатор речевых звуков работает у человека чрезвычайно быстро (быстрее, чем распознаются неречевые звуки) — до 20–30, а при искусственном ускорении речи — до 40–50 фонем в секунду62, поэтому вероятно, что минимальной единицей восприятия является не отдельная фонема, а слог целиком. Длительность типичного слога — примерно 250 миллисекунд — это как раз тот объем акустической информации, который человек может удерживать в так называемой “эхоической памяти” (т. е. помнить сразу после предъявления, пока еще не начался процесс распознавания). Показательно, что дети, начиная произносить свои первые похожие на речевые звуки, произносят их не по отдельности, а в составе слогов.
Уникально ли все это для человека? Ученые (среди них следует упомянуть в первую очередь психолога из университета Алабамы Джоан Синнотт) поставили огромное количество экспериментов, призванных выяснить, могут ли животные анализировать человеческую речь, и делают ли они это так, как мы, люди, или как-то иначе. Было показано, что крысы63и воробьи64 способны отличать один язык от другого по общей мелодике речи, что песчанки (Meriones unguiculatus)65 могут отличить гласный [u] от гласного [i], а обезьяны и вовсе распознают все человеческие фонемы. Есть, разумеется, и отличия. Например, шиншиллы, перепела, волнистые попугайчики, макаки и люди в разных местах ставят “границы” между разными фонемами66— если плавно менять характеристики звука, делая его всё менее похожим на одну фонему и всё более похожим на другую, момент, когда испытуемый начнет считать поступающий сигнал уже не первой фонемой, а второй, у разных видов наступает при разных значениях изменяемых параметров сигнала {7}. Животные не могут оперировать формантными переходами при различении согласных разного места образования67(например, отличать da от ba по тому влиянию, который согласный оказывает на звук a) или при отличении слога типа stay от слога типа say68. Внушительный список таких отличий приведен в статье Стивена Пинкера и Рея Джакендоффа69. Для них это служит аргументом в пользу уникальности человеческой способности к пониманию речи. “Люди, — пишут они, — не ограничиваются проведением однобитовых различий между парами фонем. Они могут обрабатывать непрерывный, насыщенный информацией поток речи. При этом они быстро выделяют отдельные слова из десятков тысяч шумов, несмотря на отсутствие акустических границ как между фонемами, так и между словами, компенсируя в режиме реального времени искажения, вносимые наложением артикуляций соседних звуков, а также вариативностью, связанной с возрастом, полом, особенностями произношения — как личными, так и диалектными, — и эмоциональным состоянием говорящего. И все это удается детям — причем не путем выработки условных рефлексов”70. В то время как Пинкер и Джакендофф писали эти строки, в Йерксовском приматологическом центре продолжались (и продолжаются по сей день) опыты с бонобо Канзи. Этот сообразительный антропоид, как однажды случайно выяснилось, понимает устную английскую речь — и даже без ситуационных подсказок. В 1988–1989 гг. был проведен масштабный эксперимент, в ходе которого Канзи должен был выполнить огромное количество (в общей сложности 600) команд, отданных на английском языке. Чтобы исключить возможность подсказки, экспериментатор мог надевать шлем или отдавать Канзи команды из другой комнаты по телефону. Команды могли отдавать разные люди и даже синтезатор речи. Среди команд встречались странные и даже абсурдные, например, налить кока-колу в молоко. Некоторые команды различались только порядком слов — “пусть собачка укусит змею” и “пусть змея укусит собачку”, “положи мяч на сосновую ветку” и “положи сосновую ветку на мяч” и т. д. Те же команды на таком же английском получала — для сравнения — девочка Аля (к началу эксперимента ей исполнилось два года). Она смогла правильно отреагировать на 64 % команд, Канзи — на 81 %. Правда, ему к этому времени было уже восемь лет. Описан случай, когда Канзи правильно понял предложение об обмене, выраженное условной конструкцией: “Канзи, если ты дашь эту маску Остину, я дам тебе его каши”. Канзи, которому очень хотелось получить кашу шимпанзе Остина, с готовностью отдал тому свою игрушку — маску монстра — и снова показал на его кашу72.
Таким образом, в том, что касается звучащей речи, главное отличие человека от его ближайших родственников — приматов — состоит в способности издавать членораздельные речевые звуки.
Но наличие членораздельных звуков нельзя считать определяющей характеристикой языка, поскольку жестовые языки глухонемых ни в коей мере не являются “менее человеческими”, чем языки устные.
Несомненно уникально количество слов, которые способны выучить люди: даже самый минимальный лексический запас человека насчитывает десятки тысяч единиц, тогда как “словарь” даже самых талантливых антропоидов исчисляется лишь сотнями знаков. Иногда встречаются упоминания о том, что Коко знает 1000 знаков, Канзи — 2000, а Панбаниша — 3000 (правда, в надежных источниках говорится лишь о сотнях знаков), но, даже если это и верно, все равно от человеческих возможностей это отличается на порядок. Впрочем, эта разница может осмысляться как скорее количественная, нежели качественная73.
Итак, остается грамматика. Люди обычно не разговаривают репликами типа “Пить чашка скорее пить скорее” или “Мама тыкву” {8}* — слова в наших высказываниях не набросаны беспорядочной кучей, их употребление (в том числе и в жестовых языках, таких, как амслен) подчиняется определенным законам. Слова могут изменять свою форму — как в зависимости от характеристик окружающей действительности (например яблоко — если оно одно, но яблоки — если их много, ем — если это делаю “я”, но едите — если это же действие делаете “вы”), так и в зависимости от других, связанных с ними, слов (как, например, в известной шутке: “если побежал — то заяц, а если побежала, то зайчиха”; другой пример: по-русски мы “спасаем” кого-то, а “помогаем” кому-то). В рамках высказывания слова следуют друг за другом в определенном порядке, существуют и правила, регулирующие, какие слова могут влиять на какие другие. Например, в русском языке подлежащее может влиять на форму глагола-сказуемого, а дополнение — нет. А, скажем, в абхазском языке на форму глагола-сказуемого влияет не только подлежащее и прямое дополнение, но и дополнение косвенное. Рассмотрим два предложения74: “Ахра отдал птицу кошке” и “Амра отдала Ахру медведю”. Ближайший к корню показатель указывает на деятеля (и — человек мужского пола, л — женского), следующий (влево) — на адресат действия (а — животное; и — человек мужского пола), и, наконец, самый левый — на объект (д — человек, нулевой показатель — животное). И таких правил огромное множество, для каждого языка — свои; в ходе истории одни правила сменяются другими, какие-то правила появляются, какие-то исчезают75. Существует гипотеза, что у людей есть врожденная Универсальная Грамматика (УГ) — генетически закодированный набор принципов, в соответствии с которыми могут быть устроены языки, — и усвоение языка сводится лишь к пониманию того, какие именно из всех этих колоссальных возможностей реализованы в том языке, которым человек овладевает, к чему-то, подобному установке переключателей на нужное значение тех или иных параметров {9}. Как пишет знаменитый американский лингвист Ноам Хомский, “УГ — это система универсальных принципов, некоторые из которых содержат параметры, точки выбора, которые можно фиксировать на одной из ограниченного числа позиций. Конкретная грамматика, таким образом, сразу же выводится из УГ путем установки параметров определенным образом: итальянский, французский, китайский и т. д. — это непосредственные выражения УГ при определенных и различных наборах значений параметров”76.