Марвин Минский
Фреймы для представления знаний
Предисловие к русскому изданию
Развитие информационно-поисковых систем высокого уровня, диалоговых систем, базирующихся на естественном языке, интерактивных человеко-машинных систем, предназначенных для совместного решения задач управления, проектирования, научных исследований и т.п., то есть развитие так называемых интеллектуальных систем, а также роботов выдвинуло на первый план задачу представления знаний в подобных системах. Необходимо подчеркнуть, что проблема представления знаний является принципиально новой, не встречавшейся ранее при создании различных автоматических и автоматизированных систем переработки информации и управления. В относительно небольшом объеме памяти интеллектуальные системы должны хранить большое число данных о мире задач, решаемых системой в процессе ее функционирования. Решение этой проблемы возможно лишь при специальной организации баз данных, одним из видов которой является фреймовая организация.
М.Минский, книгу которого предваряет это предисловие, является создателем теории фреймов. Он рассматривает два вида фреймов, которые сейчас принято называть статическими (или просто фреймами) и динамическими (сценариями). Фрейм любого вида — это та минимально необходимая структурированная информация, которая однозначно определяет данный класс объектов. Наличие фрейма позволяет относить объект к тому классу, который им определяется. Простейшими примерами фреймов могут служить характеристические функции множеств в обычной математике. Однако в интеллектуальных системах в подавляющем большинстве случаев приходится иметь дело не с числовой, а с символьной информацией (например, текстами на естественном языке или зрительными изображениями). Для информации подобной природы определение фреймов представляет собой нелегкую проблему. В книге М.Минского описаны некоторые подходы, использование которых многообещающе.
Предлагаемая читателям книга является переводом первой публикации теории фреймов в 1974 г. Книга построена следующим образом.
В главе 1 излагается суть теории фреймов и рассматриваются вопросы, связанные с восприятием человеком зрительных образов. Подробно анализируются вопросы распознавания образов на базе системы фреймов. Обсуждаются трудности, возникающие при изменении места положения субъекта относительно рассматриваемых предметов.
Глава 2 посвящена проблеме понимания смысла в предложениях естественного языка, организации предназначенных для этих целей систем фреймов и сопоставлению ряда точек зрения относительно способов построения программ, понимающих естественный язык.
В главе 3 обсуждаются вопросы обучения и его роль в восприятии новой информации; структура памяти и поиск фреймов, наиболее подходящих для представления некоторой ситуации; методы представления в теории решения задач.
Глава 4 посвящена проблеме организации системы поиска информации и управления подбором значений для терминальных вершин, обсуждению процесса выдвижения гипотез и оценке их правдоподобия, а также вопросам иерархии в системах фреймов.
В главе 5 затрагивается ряд спорных вопросов, связанных с наличием у человека общей картины мира и необходимостью иметь нечто подобное в системах искусственного интеллекта. Автор предлагает использовать в этих целях глобальный пространственный фрейм (GSF), хотя и отмечает ограниченность данной модели.
В приложении дается критика подхода к решению проблемы представления и объяснению механизмов мышления на основе логики предикатов. Указывается, что без привлечения тщательно разработанного семантического (понятийного) аппарата формальная логика не способна стать средством для решения данных задач.
В книгу введено приложение к русскому изданию, написанное Ф.М.Кулаковым, в котором теория М.Минского иллюстрируется примерами практического приложения теории фреймов, взятыми из работ Р.Шенка (1975), Р.Абельсона (1973), Ч.Ригера (1975) и др.
Издавая эту работу в переводе на русский язык, мы надеемся, что специалисты, работающие в области разнообразных человеко-машинных систем в управлении, проектировании и научном эксперименте, получат возможность ознакомиться с идеями фреймовой организации информации, и это знакомство окажется полезным для их практической работы.
Председатель научного Совета
по проблеме «Искусственный интеллект»
Комитета по системному анализу при
Президиуме АН СССР
чл.кор. АН СССР Г.С.Поспелов
Мне представляется, что теоретические исследования, проводимые в области искусственного интеллекта (ИИ) и психологии в целом были недостаточно общими для того, чтобы объяснить либо с практической точки зрения, либо феноменологически эффективность человеческого мышления. Основные структурные элементы, образующие фундамент для развертывания процессов восприятия, хранения информации, мышления и разработки языковых форм общения, должны быть более крупными и иметь более четкую структуру; их фактическое и процедуральное содержание следует более тесно увязывать друг с другом с тем, чтобы получить возможность объяснить феномен силы и «быстродействия» человеческого мышления.
Аналогичной точки зрения придерживаются специалисты научных центров, работающие над решением проблем искусственного интеллекта. Хорошо известно, например, предложение А.Ньюэлла и Г.Саймона(1972) решать проблему представления в терминах «пространств задач» или предложение С. Пейперта и автора этих строк (М.Минский, С.Пейперт, 1972) разбить всю совокупность сведений, необходимых системе ИИ, на «микромиры». Иную форму те же взгляды принимают в работах известных теоретиков, таких как Р.Шенк(1973), Р.Абельсон(1973) и Д.Норман(1973), которые используют более крупные структуры для изучения механизмов понимания естественного языка. В этом проявляется стремление ученых выйти за рамки исследований чисто бихейвористического и формально-логического направлений и отказаться от попыток решать проблему представления с помощью наборов разрозненных простых структур данных. (Бихейворизм (от англ. behavior — поведение) — одно из направлений в психологии, в основе которого лежит утверждение о том, что предметом психологии является поведение, а не сознание. Основной задачей психологов, по мнению основоположника бихейворизма Дж.Уотсона(1914), является установление объективно наблюдаемых отношений в соответствии с известной схемой «стимул — реакция» и сведение к ним всех понятий о внутренних, психических процессах. (см. М.Г.Ярошевский,1976).)
В настоящей работе делается попытка связать воедино результаты некоторых из вышеупомянутых исследований и создать единую и стройную теорию. Отмечаются ее недостатки, поскольку здесь ставится больше вопросов, чем дается на них ответов.
Отправным моментом для данной теории служит тот факт, что человек, пытаясь познать новую для себя ситуацию или по-новому взглянуть на уже привычные вещи, выбирает из своей памяти некоторую структуру данных (образ), называемую нами фреймом, с таким расчетом, чтобы путем изменения в ней отдельных деталей сделать ее пригодной для понимания более широкого класса явлений или процессов.
Фрейм является структурой данных для представления стереотипной ситуации. С каждым фреймом ассоциирована информация разных видов. Одна ее часть указывает, каким образом следует использовать данный фрейм, другая — что предположительно может повлечь за собой его выполнение, третья — что следует предпринять, если эти ожидания не подтвердятся.
Фрейм можно представлять себе в виде сети, состоящей из узлов и связей между ними. «Верхние уровни» фрейма четко определены, поскольку образованы такими понятиями, которые всегда справедливы по отношению к предполагаемой ситуации. На более низких уровнях имеется много особых вершин-терминалов или «ячеек», которые должны быть заполнены характерными примерами или данными.
Каждым терминалом могут устанавливаться условия, которым должны удовлетворять его задания. Простые условия определяются маркерами, например, в виде требования, чтобы заданием терминала был какой-либо субъект, или предмет подходящих размеров, или указатель на субфрейм определенного типа. (Субфреймы, фреймы и суперфреймы — это иерархически упорядоченные элементы, образующие системы фреймов). Более сложными условиями задаются отношения между понятиями, включенными в различные терминальные вершины.
Группы семантически близких друг к другу фреймов объединены в систему фреймов. Результаты существенных действий представляются в виде трансформаций между фреймами системы. Это дает возможность моделировать такие понятия, как внимание и ценность информации, сделать более экономичными некоторые типы вычислений, а также показать эффективность использования фреймов в системах ИИ.