Цифровая беглость: за дело берется Вавилонская рыбка
Программы по обработке естественного языка еще далеки от совершенства, а компьютеры не так хороши в сложной коммуникации, как люди, однако дело стабильно идет на лад. А в таких областях, как перевод с одного языка на другой, уже были достигнуты серьезные достижения: хотя коммуникационные способности компьютеров не настолько глубоки, как у обычного человека, они намного шире.
Человек, говорящий более чем на одном языке, обычно способен перевести фразу с одного на другой с достаточно высокой точностью. С другой стороны, автоматические сервисы, хотя и производят некоторое впечатление, редко делают свою работу без ошибок. Даже если вы плохо владеете французским языком, то не исключено, что вы можете лучше справиться с переводом фразы Monty Python’s „Dirty Hungarian Phrasebook“ sketch is one of their funniest ones (Скетч „Монти Пайтон“ под названием „Сборник венгерских ругательств“ – один из самых смешных), чем Google Translate. Программа предложила вариант Sketch des Monty Python ‘Phrasebook sale hongrois’ est l’un desplus drôles les leurs. Хотя эта фраза и передает общий смысл, в ней имеются серьезные проблемы с грамматикой.
Скорее всего, вам не удастся столь же успешно перевести это (или любое другое) предложение на венгерский, арабский, китайский, русский, норвежский, малайский, идиш, суахили, эсперанто или любой другой из 63 языков, помимо французского, с которыми работает сервис Google Translate. Однако Google при этом все же попытается перевести текст с любого из этих языков на любой другой непосредственно в веб-интерфейсе, мгновенно и без каких-либо затрат.[31] Приложение Translate для смартфонов позволяет пользователям общаться с телефоном более чем на 15 из этих языков. В ответ они получают устный перевод на паре десятков других языков. Мы почти с полной уверенностью можем сказать, что на такое неспособен даже самый многоязычный человек в мире.
На протяжении многих лет различные способы моментального перевода обычно описывались только в научной фантастике (один из самых замечательных примеров – Вавилонская рыбка из книги «Автостопом по Галактике», странное создание, которое человек может запихнуть себе в ухо, после чего начинает понимать речь на любом языке).[32] Google Translate и другие аналогичные сервисы осуществляют эти мечты. Как минимум один из таких сервисов уже сейчас используется для обслуживания международных клиентов. Компания Lionbridge, предоставляющая переводческие услуги, разработала вместе с IBM онлайн-приложение GeoFluent, способное мгновенно переводить чаты между клиентами и специалистами по решению различных проблем, которые говорят на разных языках. В ходе первичных испытаний около 90 процентов пользователей GeoFluent сообщили, что качество перевода было достаточно хорошим для решения их задач.[33]
Преимущества человека в «Своей игре»!
Компьютеры настолько хорошо научились совмещать анализ закономерностей со сложной коммуникацией, что порой побеждают людей на их собственном поле. В 2011 году одним из участников игрового шоу Jeopardy! был не человек, а суперкомпьютер по имени Watson. Он был разработан компанией IBM специально для участия в этой игре (и получил свое имя в честь легендарного руководителя компании IBM Томаса Уотсона-старшего). Игра Jeopardy! (ее российский лицензионный аналог называется «Своя игра») дебютировала в 1964 году, а к 2012-му стала пятой по популярности синдицированной (то есть переданной для трансляции сразу нескольким вещателям) телепрограммой в Америке.[34]
Обычно каждый выпуск программы, в ходе которой ведущий Алекс Требек задает простые вопросы на различные темы, а участники стараются опередить других, дав правильный ответ, смотрит почти семь миллионов человек.[35]
Долговечность и популярность шоу связаны с тем, что его легко понять, но в него невероятно сложно играть. Почти каждый человек знает ответы на некоторые вопросы в каждом отдельно взятом эпизоде, однако мало кто знает ответы на почти все из них. Вопросы охватывают широкий диапазон тем, и участники заранее не знают, какие темы им достанутся. Им нужно быть одновременно быстрыми, дерзкими и точными: быстрыми – поскольку они соревнуются друг с другом за шанс ответить на каждый вопрос; дерзкими – поскольку им приходится отвечать на множество вопросов, причем довольно сложных, для того чтобы собрать достаточно денег для победы; и точными – поскольку у них вычитаются деньги за каждый неверный ответ.
Продюсеры Jeopardy! усложняют задачи участникам, используя шутки, стишки и другие виды словесных игр. К примеру, загадка может звучать так: «Выраженное в виде рифмы напоминание о прошлом родного города команды НБА „Кингз“».[36] Чтобы ответить на этот вопрос правильно, игрок должен знать, что означает аббревиатура НБА (в данном случае речь идет о Национальной баскетбольной ассоциации США, а не о Национальном законе о банках (National Bank Act) и не о химическом веществе н-бутиламин), в каком городе играет команда «Кингз» (Сакраменто) и что ответ должен выглядеть как рифма к названию города. Правильный вопрос будет звучать как «Что такое Sacramento memento?», а не «сувенир из Сакраменто» или любой другой фактически правильный ответ. Правильный ответ в таких случаях требует подлинного мастерства в поиске закономерностей и сложной коммуникации. А победа в Jeopardy! требует, чтобы обе эти связи находились неоднократно, точно и почти мгновенно.
Во время сезона 2011 года Watson выступал против Кена Дженнингса и Брэда Раттера, двух самых известных персонажей этой эзотерической индустрии. Дженнингс в 2004 году выиграл рекордное количество игр подряд – а именно 72, – заработал на этом более 3 170 000 долларов призовых денег и стал настоящим народным героем.[37] По сути, можно считать, что сам Watson отчасти возник благодаря Дженнингсу.[38] Согласно легенде, которая ходит по компании IBM, Чарльз Ликел, менеджер по исследовательским вопросам компании, интересовавшийся расширением границ искусственного интеллекта, как-то вечером осенью 2004 года ужинал в стейк-хаусе в Фишкилле, штат Нью-Йорк. В 7 часов вечера он заметил, что многие посетители оставили свой ужин, встали из-за столов и перешли в соседний бар. Он заинтересовался, что происходит, и последовал за ними. Оказалось, что все столпились у телевизора и принялись наблюдать за тем, как Дженнингс, выигравший уже 50 игр подряд, продолжает бить свой рекорд. Ликел подумал, что матч между Дженнингсом и суперкомпьютером, умеющим играть в Jeopardy!, может оказаться невероятно популярным, а кроме того, послужит отличным тестом способностей компьютера выявлять закономерности и участвовать в сложной коммуникации.
Поскольку Jeopardy! представляет собой соревнование между тремя участниками, идеальным третьим участником мог бы стать Брэд Раттер, который победил Дженнингса в 2005 году по итогам турнира чемпионов и выиграл более 3 400 000 долларов.[39] Оба участника обладали огромной эрудицией, были отлично знакомы с игрой и всеми ее тонкостями, а также хорошо знали, как противостоять давлению.
Выиграть у них было непросто, и первые версии Watson были совершенно к этому не готовы. Программисты могли настроить Watson так, чтобы он, отвечая на вопросы, вел себя более агрессивно (а, следовательно, чаще ошибался) или был более осторожным и точным. В декабре 2006 года, вскоре после начала проекта, когда Watson пытался отвечать на вопросы в течение 70 % времени передачи (сравнительно агрессивный подход), он давал правильные ответы лишь в течение 15 % времени. Дженнингс, напротив, правильно отвечал на 90 % вопросов в тех случаях, когда ему удавалось добиться права на ответ (также в течение примерно 70 % времени передачи).[40]
Однако оказалось, что Watson способен быстро учиться. Соотношение агрессивности и точности быстро улучшалось, и, к ноябрю 2010 года (когда машина стала достаточно агрессивной, чтобы добиться в ходе имитации турнира права на ответ в 70 % случаев), примерно 85 % ее ответов оказались верными. Это было впечатляющее достижение, однако компьютер все еще не играл в той же лиге, что и лучшие игроки-люди. Команда Watson продолжала свою работу до середины января 2011 года, когда должны были начаться съемки турнира для будущей трансляции, однако никто до конца не знал, насколько хорошо их создание сможет противостоять Дженнингсу и Раттеру.
Watson побил их обоих. Он правильно отвечал на вопросы на самые разные темы, от «Необычных происшествий на Олимпийских играх» до «Церкви и государства». И хотя суперкомпьютер не продемонстрировал полного совершенства – к примеру, он предложил слово chic, а не class как синоним выражения «стильная элегантность или же группа учеников, заканчивающих обучение в один и тот же год» (категория «Альтернативные значения»), – его результаты все равно были очень хорошими.