Нейросетевая реализация системы автономного адаптивного управления
Рефераты >> Программирование и компьютеры >> Нейросетевая реализация системы автономного адаптивного управления

Работу блока формирования и распознавания образов (ФРО) можно представить следующим способом (подробное описание см. в работах [Жданов3, Жданов8]). В блоке ФРО на основании априорной информации о возможных функциональных свойствах среды заданы некоторые объекты, назовем их нейронами (например, нейроны специального вида, описанные в работе [Жданов8]), на которые отображаются некоторые классы пространственно-временных явлений, которые потенциально могут существовать в системе. Отображение задается топологией сети. В классе, отображаемом на нейрон, выделяется подкласс, который может восприниматься данным нейроном. Каждый нейрон может статистически анализировать воспринимаемый им подкласс. Накапливая статистическую информацию о воспринимаемом подклассе, нейрон может принять решение, является ли этот подкласс случайным или неслучайным явлением в системе. Если какой-либо нейрон принимает решение, что отображаемый на него подкласс является неслучайным событием, то он переходит в некоторое отличное от исходного ²обученное² состояние. Если нейрон обучен, то будем говорить также, что сформирован образ, этот образ идентифицируется номером данного нейрона. Подкласс явлений, воспринимаемый нейроном, и вызвавший его обучение, то есть пространственно-временные явления, статистически достоверно существующие в системе, называется прообразом данного образа. Сформированный образ может быть распознан блоком ФРО, когда прообраз данного образа наблюдается БД. Блок ФРО указывает, какие из сформированных образов распознаны в текущий момент. Одновременно с этим распознанные образы участвуют в формировании образов более высоких порядков, то есть имеет место агрегирование и абстрагирование образов.

Блок формирование базы знаний [Жданов4-6] (БЗ) предназначен для автоматического представления эмпирически найденных УС знаний о функциональных свойствах системы. Элементарной конструкцией базы знаний (БЗ) в методе ААУ является статистически достоверное сведение о том, как определенное действие Yj влияет на прообраз определенного сформированного образа. Действием Yj названо подмножество множества допустимых воздействий, элементы которого абсолютно идентичны для УС по их влиянию на сформированные образы. Непустое сведение может иметь одно из двух значений: либо действие Yj влечет распознавание образа Oi , либо действие Yj влечет вытеснение образа Oi. При помощи БЗ можно видеть, как конкретное действие влияет на всю совокупность сформированных образов.

Блок оценки состояния [Жданов7] (БОС) вырабатывает интегральную оценку качества состояния ОУ St. Оценка St используется для расчета оценки (веса) pi каждого из вновь сформированных образов некоторым статистическим способом. В свою очередь, St функционально зависит от оценок pi распознанных образов. Имеется некоторое множество изначально сформированных и оцененных образов. Оценка St используется также для расчета темпа принятия решений.

Блок выбор действия [Жданов4-6] или, в дальнейшем, блок принятия решений (БПР) реализует процедуру принятия решения, основанную на анализе текущей ситуации, целевых функций, содержимого БЗ, а также оценки текущего значения оценки St. Фактическая информация о текущей ситуации представлена множеством образов, распознанных в текущий момент блоком ФРО, а информация о качестве текущего состояния представлена оценкой St. Множество распознанных образов определяет в БЗ тот ее раздел, который адекватен текущей ситуации (те знания, которые истинны в текущих условиях). В соответствии с целевой функцией, предполагающей стремление УС к улучшению качества состояния ОУ, УС выбирает по БЗ то действие, которое имеет максимальную сумму оценок вызываемых и вытесняемых образов. Из множества выходных воздействий, соответствующего выбранному действию Yj, конкретное выходное воздействие выбирается случайным способом, что соответствует второй целевой функции, предусматривающей стремление к получению новых знаний.

Блок определение времени принятия решения определяет глубину просмотра БЗ в зависимости от текущей оценки St. Чем выше значение St, тем больше образов (в порядке убывания модуля их веса) может учесть УС при принятии решения, тем меньше темп принятия решений. При моделировании этот блок не использовался и в данной работе рассматриваться не будет.

В УС могут быть средства для априорного анализа последствий альтернативных выбираемых действий на несколько шагов вперед.

Таков в самых общих чертах алгоритм управления, реализуемый УС в методе ААУ. Основные свойства процесса управления состоят в том, что УС автоматически накапливает эмпирические знания о свойствах предъявленного ей объекта управления и принимает решения, опираясь на накопленные знания. Качество управления растет по мере увеличения объема накопленных знаний. Заметим также, что управление состоит не в том, что УС реагирует на входную информацию (в определенном смысле - отрицательная обратная связь), а в том, что УС постоянно активно ищет возможный в текущих условиях способ улучшить состояние ОУ (положительная обратная связь). Тем самым УС ААУ обладает внутренней активностью.

При создании приложений может быть целесообразным использование УС ААУ для управления только в тех областях пространства признаков, в которых ранее используемые методы неэффективны. Другими словами, полезно разделить признаковое пространство на две области: на область, для которой имеется априорная информация о свойствах ОУ, и в которой можно применить подходящую детерминированную систему управления, и на область, в которой нет априорной информации о свойствах ОУ, где требуется адаптация в реальном времени управления, в этой области целесообразно управление по методу ААУ.

1.4. Основные понятия и обозначения.

Каждый вход и выход блока среды U представляется в математической модели, вообще говоря, случайным вектором, а совокупность случайных векторов, параметризованных временем , образуют процесс. Кроме того, выделим вторую категорию процессов, в которую входят процессы, сформированные параметризованными СВ - выходами внутренних элементов блоков УС. Например, для ФРО и, вообще, всех блоков, состоящих из нейронов, это выходы всех нейронов. В полной математической модели среды U, процесс, представляющий выходы всех нейронов УС и выходы внутренних блоков среды W , назовем процессом среды U.

В дальнейшем мы будем пользоваться следующими обозначениями:

T – конечный временной интервал жизни системы;

- параметр времени;

- начальный момент времени работы УС;

– входной процесс, входной процесс для ФРО, а значит и для УС;

– i – ая компонента ;

- реализация входного процесса, или входной фильм, определенный на интервале времени ;


Страница: