Ознакомительная версия.
Мы говорим о системе автоматического управления как о системе с установившейся структурой и предсказуемой формой поведения. Реакция таких систем определяется характером внешних воздействий и свойствами возможных возмущений. Однако в условиях изменяющихся факторов существования самой системы, в условиях частичной неопределённости среды, при которых механизмы действия системы неспособны подобрать нужную реакцию, возникает необходимость изменения структуры системы и форм её поведения. Процесс изменения свойств системы, позволяющий ей достигнуть приемлемого или даже оптимального состояния в условиях изменяющихся внешних или внутренних факторов, называется адаптацией. Яркий пример адаптации состоит в приспосабливаемости живых организмов к изменениям внешней среды или условий существования. Для технических или экономических систем адаптация выражается в виде изменения режима работы, вариаций структуры построения, смены управляющих воздействий. Одним из наиболее часто используемых приёмов при адаптации является поиск опасных воздействий или объектов, а также поиск оптимальных режимов работы.
Поиск, как правило, выполняется при определённых ограничениях. В живых организмах температура тела, артериальное давление, содержание глюкозы в крови должны находиться в заданных пределах. В технике, как и в экономике, основные параметры также ограничены по величине. В пространстве режимных параметров выделяется область, внутри которой должна находиться точка, изображающая текущий режим работы системы. Однако не все точки этой области адекватны по эффективности. Каждая система управления должна обеспечивать наибольшую эффективность по одному или нескольким критериям. Такими критериями, например, могут быть наибольшее быстродействие, минимальный расход топлива, минимальные потери сырья и т. п. В связи с этим перед системой ставится задача обеспечить наилучшее приближение к такой точке режимного пространства, в которой имеет место наибольшая эффективность по заданным критериям. Эта задача становится особенно актуальной в условиях непредсказуемого изменения значения максимальной эффективности, но при сохранении области режимных предпочтений. При поиске параметров, отвечающих наибольшей эффективности, самым простым является метод последовательного прохождения всех параметров в заданных границах. При этом вся область поиска разбивается на N ячеек, размер которых определяется точностью измерения параметров. Расчёт времени, необходимого для анализа и нахождения оптимальных значений параметров, должен проводиться с учётом того, что для установления режима следует предусматривать выдержку, конкретную для каждого параметра, Опыт показывает, что при анализе многоразмерной области параметров на последовательный поиск уходит слишком много времени, порой превышающего весь цикл работы системы. Несмотря на это, при малом числе параметров в условиях ускоренного прохождения области ввиду простоты метод последовательного анализа находит широкое применение. Для сокращения времени поиска используются многоходовые процедуры, основанные на измерении эффективности по заданному критерию и переходе к поиску по следующему параметру в критический момент начала снижения эффективности действия системы. Существуют и другие методы поиска, известные как метод градиента, метод наискорейшего спуска и т. д. Все эти методы уменьшают общее время поиска за счёт усложнения процедуры, а следовательно, и схемной реализации поиска.
Говоря о системах автоматического управления, нельзя не сказать о всё более расширяющемся классе автоматов. Автоматы выполняют целый ряд функций, но без непосредственного участия человека. Существует большая номенклатура разработанных автоматов, к которой относятся станки-автоматы, фасовочные автоматы, торговые автоматы, банкоматы и др. К автоматам можно причислить и образцы робототехники, беспилотных летательных аппаратов, самодвижущихся танков и т. д. Автоматы в своём большинстве основаны на использовании дискретной, в том числе цифровой, техники и отличаются следующими свойствами: на входах и выходах данные X и Y поступают в дискретные моменты времени и квантуются по величине, причём конечное число её фиксированных значений выбирается из входного и выходного алфавитов; промежуточные значения модели Z фиксированы и конечны, при этом они определяются как входной величиной Х в тот же момент времени, так и предыдущими значениями Z. Различают автоматы с конечной памятью и автоматы с бесконечной памятью. В основе действий автоматов лежит использование логических функций из арсенала математической логики. В последнее время получили развитие адаптирующиеся автоматы. Промежуточные состояния модели таких автоматов Z зависят от случайной среды и меняются с изменением выхода. С появлением ошибок назначаются штрафные санкции, подаваемые на вход. Вследствие этого вероятность наказания снижается, а модель как бы «приспосабливается» к изменениям среды. С началом развития моделирования стали создаваться модели автоматов, отражающих функционирование живых организмов. Моделирование нейронов, объединённых в нервные сети, основано на использовании дискретной техники, логических функций, реализующих взаимодействие отдельных нейронов и пороговых элементов, моделирующих процесс возбуждения нервных клеток. Наиболее удачными считаются вероятностные (стохастические) модели и среди них модели, называемые персептронами. Они обладают памятью и имеют случайную структуру связи между элементами. Персептрон оказался одним из первых автоматов, способных учиться распознаванию образов.
Обучение как вероятностный процесс обычно рассматривается в параллель с процессом адаптации[19]. Известны автоматы для обучения распознаванию образов, автоматы для обучения целесообразному поведению путём введения «оценок» при поощрении или наказании. В общем случае учитель (обучающий) передаёт знания ученику (обучаемому) в виде алгоритма решения задачи или сообщает эти знания при помощи примеров. Второй метод считается более эффективным. Мы им будем пользоваться в дальнейшем.
Когда на автоматическую систему воздействуют случайные нежелательные возмущения и она борется с ними, предполагается, что других влияющих на это систем нет. Нередки, однако, случаи функционирования двух систем, «интересы» которых противоположны. При этом управляющие воздействия, вырабатываемые каждой из систем, могут оказаться вредными для другой стороны. Это представляет собой пример так называемой конфликтной ситуации. Конфликты возникают в живой природе, в военной области, при экономической конкуренции. В этих условиях, при наличии признаков борьбы, управляемая система на основе выбранной стратегии вырабатывает реакцию наибольшего благоприятствования при самых неблагоприятных действиях оппонента. В теоретическом плане исследованиями возможных стратегий занимается теория игр. Наиболее продвинутой является теория парных игр с нулевой суммой, где выигрыш одного игрока равен проигрышу другого. Возможные выигрыши при такой игре определяются платёжной матрицей m x n, где m действиям игрока А (m строк матрицы) противопоставляются n действий игрока В (n столбцов матрицы). Оптимальная стратегия, называемая стратегией минимакса, для игрока А состоит в выборе максимального элемента матрицы по строкам из минимальных по столбцам, а для игрока В – минимального по столбцам из максимальных по строкам. Если в матрице имеется элемент, который является одновременно максимальным для игрока А и минимальным для игрока В, то говорят, что матрица содержит седловую точку, соответствующую чистой стратегии. При отсутствии седловой точки возможно случайное применение с заданными вероятностями тех или иных чистых стратегий. В этом случае имеет место смешанная стратегия. При такой стратегии возможно доминирование одного из игроков.
Перейдём теперь от обобщающих задач кибернетики к проблемам радиолокации и противорадиолокации. Здесь я должен заметить, что весь приведённый ниже материал имеется в открытых публикациях, и все непростые усилия автора были направлены на поиск и компоновку добытых сведений и представлении их в возможно более доступном виде для широкого читателя.
Начнём со свойств радиолокационных сигналов, в том числе сигналов, отражённых от радиолокационных целей. Вообще, сигнал является средством передачи информации от одного объекта к другому. Сигнал передаёт сообщения по каналу связи. Мера количества информации, передаваемых сигналом, зависит от вероятностей поступления сообщений. Если одно из n поступающих сообщений достоверно (с вероятностью единица), а вероятности поступления других (n – 1) сообщений соответственно равны 0 (т. к. р1 + р2 + … + рn = 1), то среднее количество информации равно нулю. Численно количество информации определяется суммой произведений вероятности сообщения на её логарифм. Основанием логарифма является число два, в физике часто используются натуральные логарифмы. При двух равновероятных событиях р1 = р2 = р = 0,5, количество информации
Ознакомительная версия.