Содержание
-
Интеллектуальные информационные системы
Лекция 5
-
-
Самообучающиеся системы
В основе самообучающихся систем лежат методы автоматической классификации примеров ситуаций реальной практики (обучения на примерах). Примеры реальных ситуаций накапливаются за некоторый исторический период и составляют обучающую выборку
-
Обучающая выборка может быть:
«с учителем» - для каждого примера задается в явном виде значение признака его принадлежности некоторому классу ситуаций (классообразующего признака); «без учителя» - по степени близости значений признаков классификации система сама выделяет классы ситуаций.
-
В результате обучения системы автоматически строятся обобщенные правила или функции, определяющие принадлежность ситуаций классам, которыми обученная система пользуется при интерпретации новых возникающих ситуаций – формируется база знаний (БЗ), используемая при решении задач классификации и прогнозирования. Эта БЗ периодически автоматически корректируется по мере накопления опыта реальных ситуаций, что позволяет сократить затраты на ее создание и обновление.
-
Недостатки самообучающихся систем:
Возможна неполнота и/или зашумленность (избыточность) обучающей выборки => относительная адекватность БЗ возникающим проблемам; Возникновение проблем, связанных с плохой смысловой ясностью зависимостей признаков => неспособность объяснения пользователем получаемых результатов; Ограничения в размерности признакового пространства вызывают неглубокое описание проблемной области и узкую направленность применения
-
Индуктивные системы
Обобщение примеров по принципу от частного к общему сводится к выявлению подмножеств примеров, относящихся к одним и тем же подклассам, и определению для них значимых признаков
-
Процесс классификации примеров осуществляется следующим образом:
Выбирается признак классификации из множества заданных (либо последовательно, либо по какому-либо правилу, например, в соответствии с максимальным числом получаемых подмножеств примеров);
-
2. По значению выбранного признака множество примеров разбивается на подмножества; 3. Выполняется проверка, принадлежит ли каждое образовавшееся подмножество примеров одному подклассу; 4. Если какое-то подмножество примеров принадлежит одному подклассу, т.е. у всех примеров подмножества совпадает значение классообразующего признака, то процесс классификации заканчивается (при этом остальные признаки классификации не рассматриваются);
-
5. Для подмножеств примеров с несовпадающим значением классообразующего признака процесс классификации продолжается, начиная с п.1. (Каждое подмножество примеров становится классифицируемым множеством).
-
Процесс классификации может быть представлен в виде дерева решений, в котором в промежуточных узлах находятся значения признаков последовательной классификации, а в конечных узлах – значения признака принадлежности определенному классу.
-
Таблица
-
Дерево решений
Каждая ветвь дерева соответствует одному правилу решения: Если Спрос = «низкий» и Издержки =«маленькие» То Цена = «низкая» Примеры инструментальных средств, поддерживающих индуктивный вывод знаний: 1st Class (Programs in Motion), Rulemaster (Radian Corp.), ИЛИС (ArgusSoft), KAD (ИПС Переяславль-Залесский) [Спрос] высокий низкий [цена.высокая] [издержки] высокий большие маленькие [цена.высокая] [цена.низкая]
-
Нейронные сети
В результате обучения на примерах строятся математические решающие функции (передаточные функции или функции активации), которые определяют зависимости между входными (Xi) и выходными (Yj) признаками (сигналами).
-
Решающая функция – «нейрон»
Каждая такая функция, называемая по аналогии с элементарной единицей человеческого мозга – нейроном, отображает зависимость значения выходного признака (Y) от взвешенной суммы (U) значений входных признаков (Xi), в которой вес входного признака (Wi) показывает степень влияния входного признака на выходной: X1 W1 X2 W2 X3 W3 Σ u f(u) ВЫХОД = f (Σ wi xi)
-
Решающие функции используются в задачах классификации на основе сопоставления их значений при различных комбинациях значений входных признаков с некоторым пороговым значением. В случае превышения порога считается, что нейрон сработал и распознал некоторый класс ситуаций. Нейроны используются и в задачах прогнозирования, когда по значениям входных признаков после их подстановки в выражение решающей функции получается прогнозное значение выходного признака.
-
Функциональная зависимость может быть линейной. Чаще используется сигмоидальная форма, которая позволяет вычленять более сложные пространства значений выходных признаков. Такая функция называется логистической.
-
Логистическая (сигмоидальная) функция
U нейрон «выкл» нейрон «вкл»
-
Нейронная сеть
Скрытый слой Входной слой Узлы Взвешенные связи Выходной слой
-
Алгоритм обратного распространения ошибки
Наиболее распространенный алгоритм обучений нейронной сети. Целевая функция по этому алгоритму должна обеспечить минимизацию квадрата ошибки в обучении по всем примерам: Ti – заданное значение выходного признака по i-му примеру Yi – вычисленное значение выходного признака по i-му примеру
-
Сущность алгоритма обратного распространения ошибки:
Задать произвольно небольшие начальные значения весов связей нейронов. Для всех обучающих пар «значения входных признаков – значение выходного признака» (примеров из обучающей выборки) вычислить выход сети (Y). Выполнить рекурсивный алгоритм, начиная с выходных узлов по направлению к первому скрытому слою, пока не будет достигнут минимальный уровень ошибки.
-
Вычислить веса на (t+1) шаге по формуле: Выполнить шаг 2.
-
Достоинство нейронных сетей(по сравнению с индуктивными)
Решение не только классифицирующих, но и прогнозных задач. Построение более точных классификаций при нелинейном характере функциональной зависимости выходных и входных признаков. Имитация параллельного процесса прохода по нейронной сети в отличие от последовательного
-
Примеры внедрения нейронных сетей:
Система прогнозирования динамики биржевых курсов для Chemical Bank (фирма Logica); Система прогнозирования для Лондонской фондовой биржи (фирма SearchSpace); Управление инвестициями для Mellon Bank (фирма NeuralWare)
-
Инструментальные средства разработки нейронных сетей
NeurOn-Line (фирма GENSYM) Neural Works Professional II/Plus (фирма Neural Ware) FOREX-94 (Уралвнешторгбанк)
-
Системы, основанные на прецедентах (Case-based reasoning)
В данных системах база знаний содержит сами ситуации или прецеденты. Поиск решения проблемы сводится к поиску по аналогии (абдуктивному выводу от частного к частному)
-
Абдуктивный выводу от частного к частному:
Получение подробной информации о текущей проблеме; Сопоставление полученной информации со значениями признаков прецедентов из базы знаний; Выбор прецедента из БЗ, наиболее близкого к рассматриваемой проблеме;
-
В случае необходимости выполняется адаптация выбранного прецедента к текущей проблеме; Проверка корректности каждого полученного решения; Занесение детальной информации о полученном решении в базу знаний.
-
Так же, как и для индуктивных систем, прецеденты описываются множеством признаков, по которым строятся индексы быстрого поиска. В отличие от индуктивных систем допускается нечеткий поиск с получением множества допустимых альтернатив, каждая из которых оценивается некоторым коэффициентом уверенности. Наиболее подходящие решения адаптируются по специальным алгоритмам к реальным ситуациям. Обучение системы сводится к запоминанию каждой новой обработанной ситуации с принятыми решениями в базе прецедентов
-
Системы, основанные на прецедентах, применяются как системы распространения знаний с расширенными возможностями или как в системах контекстной помощи. Описание ситуации (проблемы) Не печатает принтер Вопросы
-
Устранение неполадок печати
-
-
-
-
-
Пример инструментального средства поддержки баз знаний прецедентов – система CBR-Express (Inference, дистрибьютор фирма Метатехнология).
-
Информационные хранилища (Data Warehouse)
Хранилище извлеченной значимой информации из оперативной базы данных, которое предназначено для оперативного анализа данных (реализация OLAP-технологии). Извлечение знаний из БД осуществляется регулярно.
-
Типичные задачи оперативного ситуационного анализа:
Определение профиля потребителей конкретного товара; Предсказание изменений ситуации на рынке; Анализ зависимостей признаков ситуаций (корреляционный анализ)
-
Для извлечения значимой информации из БД используются специальные методы (Data Mining или Knowledge Discovery), основанные на применении многомерных статистических таблиц или индуктивных методов построения деревьев решений или нейронных сетей. Формулирование запроса осуществляется в результате применения интеллектуального интерфейса, позволяющего в диалоге гибко определить значимые признаки анализа
-
Применение информационных хранилищ на практике демонстрирует необходимость интеграции интеллектуальных и традиционных информационных технологий, комбинированное использование различных методов представления и вывода знаний, усложнение архитектуры информационных систем.
-
Разработкой и распространением информационных хранилищ занимаются:
IBM (Intelligent Miner) Silicon Graphics (MineSet) Intersolv (DataDirect, SmartData) Oracle (Express) SAS Institute (SAS/Assist)
-
Адаптивные информационные системы (ИС)
Требования к адаптивности ИС: ИС в каждый момент времени должна адекватно поддерживать организацию бизнес-процессов. Реконструкция ИС должна проводиться всякий раз, как возникает потребность в реорганизации бизнес-процессов. Реконструкция ИС должна проводиться быстро и с минимальными затратами.
-
Адаптивность ИС немыслима без интеллектуализации ее архитектуры. Ядром адаптивной ИС является постоянно развиваемая модель проблемной области (предприятия), поддерживаемая в специальной базе знаний – репозитории, на основе которого осуществляется генерация или конфигурация программного обеспечения.
-
Проектирование и адаптация ИС
Построение модели проблемной области Своевременная корректировка модели
-
При проектировании адаптивной ИС используются:
Оригинальное проектирование или Типовое проектирование
-
Оригинальное проектирование
Разработка ИС «с чистого листа» в соответствии с требованиями экономического объекта Реализуется на основе применения систем автоматизированного проектирования (САПР) ИС или CASE-технологий – Designer 2000 (Oracle), SilverRun (SilverRun Technology). Natural LightStorm (SoftWare AG) При возникновении изменения выполняется генерация (пересоздание) ПО
-
Типовое проектирование
Адаптация типовых разработок к особенностям экономического объекта Реализуется на основе применения систем компонентного (сборочного) проектирования ИС – R/3 (SAP), BAAN IV (Baan Corp), Prodis (Software AG), Галактика (Новый Атлант) При возникновении изменения выполняется конфигурация программ. В редких случаях их переработка спомощью CASE-средств
-
Достоинство применения модельно-ориентированных компонентных систем
Накапливание опыта проектирования ИС для различных отраслей и типов производства в виде типовых или референтных/ссылочных моделей, которые поставляются вместе с программным продуктом в форме наполненного репозитория. Т.е. вместе с программным продуктом пользователи приобретают БЗ «know-how» об эффективных методах организации и управления бизнес-процессами, которые можно адаптировать в соответствии со спецификой конкретного экономического объекта
-
Типовая модель Типовая модель Объекты Функции Правила Процессы Базовая модель Репозиторий Модель предприятия Объекты Функции Процессы Типовая модель Объекты Функции Процессы Конфигурация ИС ИС предприятия Конфигурация адаптивной информационной системы на основе компонентной технологии
-
Базовая модель репозитория
содержит описание объектов, функций (операций), процессов (совокупности операций), которые реализуются в программных модулях компонентной системы. Большое значение в базовой модели имеет задание правил (бизнес-правил) поддержания целостности ИС, которые устанавливают условия проверки корректности совместного применения операций бизнес-процессов и поддерживающих их программных модулей.
-
Типовые модели
соответствуют типовым конфигурациям ИС, выполненным для определенных отраслей (автомобильная, электронная, нефтегазовая) или типов производства (индивидуальное, серийное, массовое, непрерывное)
-
Модель предприятия (проблемной области)
Строится либо путем привязки или копирования фрагментов основной или типовой моделей в соответствии со специфическими особенностями предприятия либо в результате просмотра этих моделей и экспертного опроса. Сформированная модель предприятия в виде метаописания хранится в репозитории, при необходимости корректируется. По сформированной модели автоматически осуществляется конфигурация ИС, в ходе которой выполняется семантический контроль по соответствующим бизнес-правилам
-
Недостатки схемы
Отсутствие средств оценки модели предприятия. Для того, чтобы можно было выбирать оптимальные варианты конфигурации ИС, используют средства экспорта модели во внешние системы моделирования.
Нет комментариев для данной презентации
Помогите другим пользователям — будьте первым, кто поделится своим мнением об этой презентации.