Мы в Numenta сейчас занимаемся проблемой распознавания образов. И вполне успешно. И мы используем стандартное железо, но вместо того, чтобы изобретать алгоритмы компьютерного зрения, мы построили модель запоминающего устройства коры головного мозга. Построенная нами система действительно работает, и я уже демонстрировал наши результаты в нескольких университетах.
Таким образом, за последний год в работе Numenta есть очевидный прогресс?
— Более чем. Я ведь пришел к идее решения проблемы ИИ со стороны биологии. Но когда я писал книгу, у меня еще не было понимания, как это все устроено математически. Я описывал некие структуры, но ничего не говорил о том, как их воссоздать, поскольку в тот момент и сам еще не знал, как это сделать. Но после того как книга была завершена, я и сооснователь Numenta Дилип Джордж (Dileep George; www.stanford.edu/~dil) разработали соответствующие математические модели и доказали их работоспособность. А затем мы основали компанию, чтобы привлечь к нашим разработкам как можно больше людей.
Доказали их работоспособность? Можно чуть поконкретнее?
— Пожалуйста. На сегодняшний день не существует ни одного алгоритма, ни одной системы, которые бы умели опознавать объекты. Вы не можете показать компьютеру картинку и «услышать» в ответ, что на ней изображено. Никто даже близко не подошел к решению этой проблемы.
Что сделали мы? На основе принципов, описанных в моей книге, и математического аппарата, который мы разработали после ее выхода, мы создали систему, научившуюся после определенной тренировки распознавать небольшие — 32х32 пиксела — изображения. Сейчас она умеет распознавать около восьмидесяти разных объектов. У этой системы пока нет практического применения — в конце концов, 32 пиксела это не очень-то много, — но любым другим способом задачу компьютерного зрения до последнего времени решить не удавалось (к тому же она довольно легко масштабируется). Люди, которые видели нашу систему в работе, вообще не могли понять, как мы это сделали.
Собственно, масштабируемость подобных решений и есть одна из задач Numenta. Мы работаем над инструментарием, который позволит создавать большие, хорошо масштабируемые практические приложения на базе технологии иерархической временной памяти (Hierarchical Temporal Memory, HTM). В центре нашего внимания находится инструментарий общего назначения, однако систему компьютерного зрения мы тоже совершенствуем, поскольку это хорошая демонстрация возможностей нашего подхода. Это не единственный тест, проведенный нами для проверки собственной правоты, но он очень эффектен и прекрасно работает.
А когда ожидаются практические приложения?
— Возможно, уже в нынешнем году. Сейчас в компании около десяти человек, а работа сделана процентов на 60—70. Конечно, мы не знаем, с какими проблемами еще придется столкнуться, поэтому точную дату выхода какого-то продукта я не назову. Но уже с февраля мы начинаем работать с несколькими исследовательскими лабораториями. Примерно в то же время к работе подключатся и наши бизнес-партнеры, которые будут создавать на базе нашей технологии собственные системы. Поэтому есть надежда, что о первых результатах вы услышите еще до конца года.
Стало быть, систему распознавания образов вы оставляете за собой?
— Да. Наш инструментарий очень гибок, поэтому партнеры будут применять его для решения собственных задач — например, для обработки информации или создания финансовых приложений. Мы же сосредоточимся на проблеме компьютерного зрения и еще паре направлений.
На чем сейчас работает софтверная модель, построенная в Numenta?
— Изначально она написана для работы в UNIX/Linux-окружении. Что касается железа — это система с большим объемом памяти, чтобы мы могли отобразить в памяти как можно больше неокортекса. Первая версия была рассчитана на однопроцессорные конфигурации, и я даже запускал систему компьютерного зрения на своем Маке. Но очевидно, что для практических приложений нужны системы помощнее, поэтому мы разрабатываем мультипроцессорную версию. А идеальное железо в нашем представлении — это многопроцессорная стойка с серверами.
В общем, об искусственном интеллекте на мобильных устройствах можно пока не думать?
— Хороший вопрос! Что касается КПК, то вряд ли в ближайшие четыре года мы увидим какие-то системы ИИ для мобильных компьютеров.
Хотя полностью исключать появление узкоспециализированных мобильных приложений тоже нельзя — удалось же нам запустить (пусть примитивную, но работающую!) систему распознавания образов на однопроцессорном Маке с весьма ограниченным, по нашим меркам, объемом ОЗУ. Да и кто, в конце концов, может предсказать будущее? Посмотрите, как быстро нарастали компьютерные мощности — кто десять лет назад мог сказать, что это произойдет?
Есть ли другие компании, работающие на этом же поле?
— В общем-то нет. Конечно, с кем-то мы пересекаемся, но это несущественные пересечения. Например, наше математическое представление во многом построено на байесовских сетях. В этой области работает немало компаний, включая исследовательские лаборатории Microsoft. Однако их разработки от наших довольно далеки.
Можно сказать, что мы не знаем никого, кто понимал бы все, что понимаем мы. Так что никакой конкуренции пока не ощущается. Это слишком новое направление. Дело не столько в сложности самой теории — в ней как раз ничего сложного нет, — сколько в том, что у многих еще руки до нее не дошли. В ближайшие несколько лет, думаю, интерес к этой теории вырастет, а значит, и конкуренты появятся.
Долгосрочная цель Numenta — максимальное распространение наших технологий. Поэтому мы строим платформу общего назначения, инструментарий для создания конкретных приложений. Кроме того, мы документируем как саму технологию, так и математический аппарат, на котором она построена. И надеюсь, что через несколько лет с этой платформой будут работать тысячи людей. Мы собираемся сделать инструментарий доступным для исследователей, которые смогут брать наш код и экспериментировать с ним.
Если говорить о деньгах, то наш бизнес можно назвать продажей лицензий. Мы будем продавать наши разработки, чтобы на их основе партнеры могли создавать полезные и интересные приложения. Но главная наша задача — дальнейшее развитие самой технологии, поэтому мы стараемся сформировать сообщество людей, которые могли бы улучшить нашу платформу.
Немного похоже на Linux…
— Лучше давайте вспомним, как все было устроено полвека назад. Люди начали делать первые цифровые компьютеры. Эти медлительные громадины создавались усилиями многих людей. Мы сейчас в похожей ситуации — у нас есть понимание неких общих принципов, однако нам предстоит справиться с множеством назойливых мелочей.
Рано или поздно потребуется новое железо, новые чипы памяти (наша система очень требовательна к ней). Конечно, мы можем использовать обычную компьютерную память — и вынуждены сегодня поступать именно так, — но это не самое эффективное решение. То же касается и процессоров. Поэтому нам потребуются не только ученые или программисты, но и производители микросхем.
Если вам кажется, что наша модель работы похожа на Linux, — пускай. Но я думаю, что происходящее гораздо больше напоминает создание первых компьютеров. Мы создаем новый тип компьютера — пока на том железе, что нам доступно, а со временем — на том, которые мы построим.
Разумеется, мы не смогли удержаться и спросили у Джеффа Хокинса, что он думает о перспективах рынка КПК. По словам Джеффа, в ближайшие несколько лет рынок карманных компьютеров (и без того чувствующий себя неважно) окончательно придет в упадок. Однако никакой трагедии в этом нет, потому что закат КПК будет вызван растущей популярностью смартфонов и коммуникаторов самых разных мастей — так что пользователи не потеряют, а скорее приобретут. Ну и компании-производители, конечно, тоже не останутся внакладе. Что придет на смену смартфонам? Что будет следующим killer application в мобильной связи? Джефф говорит, что у него есть некоторые предположение, но делиться он ими пока ни с кем не собирается, потому что компания Хокинса (уже третья, после Numenta и Palm) как раз сейчас работает в этом направлении
ТЕМА НОМЕРА: Вторжение электронных словарей
Автор: Владимир Гуриев
Я уверен, что через пятьдесят лет станет возможным программировать работу машин с емкостью памяти около 106 так, чтобы они могли играть в имитацию настолько успешно, что шансы среднего человека установить присутствие машины через пять минут после того, как он начнет задавать вопросы, не поднимались бы выше 70%. Первоначальный вопрос «могут ли машины мыслить?» я считаю слишком неосмысленным, чтобы он заслуживал рассмотрения. Тем не менее я убежден, что к концу нашего века употребление слов и мнения, разделяемые большинством образованных людей, изменятся настолько, что можно будет говорить о мыслящих машинах, не боясь, что тебя поймут неправильно.