Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информационные технологии и моделирование бизнес-процессов

Технология обнаружения знаний в базах данных (Knowledge Discovery in Databases)

Системы поддержки принятия решений, которые содержат базу знаний и разрабатываются с использованием методов искусственного интеллекта, называются системами поддержки принятия решений на базе знаний (Knowledge-based Decision Support Systems). Знания в этом смысле информации, которая хранится в памяти систем искусственного интеллекта, содержит в себе сведения об объектах и связи предметной области, процессы взаимодействия объектов во времени и пространстве, которая содержит правила, на основе которых выполняется логическое доказательство.

Выявление знаний в базах данных (Knowledge Discovery in Databases, KDD) - это последовательность действий, которую необходимо выполнить для построения модели (добыча знаний). Эта последовательность не описывает определенный алгоритм или математический аппарат, не зависит от предметной области. Это - набор операций, комбинируя которые, можно получить нужное решение.

KDD включает этапы подготовки данных, выбора информативных признаков, очистки данных, применения методов извлечения знаний, конечной обработки данных, интерпретации полученных результатов. Основой этого процесса являются методы, позволяющие находить закономерности и знания. Кратко рассмотрим шаги, выполняемые на каждом этапе KDD (рис.4.3).

Подготовка исходного набора данных, в том числе из различных источников, выбора значимых параметров, и тому подобное. Для этого должны существовать развитые инструменты доступа к различным источникам данных.

Предварительная обработка данных. Данные могут быть неполными, содержать шумы, аномальные значения и т.д. Кроме того, они могут быть в чрезмерный или недостаточном количестве.

Некоторые задачи потребует дополнения данных определенной априорной информации. Если представить данные на вход системы в существующем (начальном) виде, то на выходе не будут получены полезные знания. Входные данные должны быть качественными и корректными.

Этапы КDD

Рис.4.3. Этапы КDD

Трансформация, нормализация данных. Этот шаг необходим для тех методов, которые требуют представления исходных данных в определенном виде. Различные алгоритмы анализа требуют специальным образом подготовленные данные, например, для прогнозирования необходимо превратить временной ряд с помощью плавающего окна. В задачи трансформации данных относятся: плавающее окно, возведение типов, выделения временных интервалов, преобразования непрерывных значений в дискретные и наоборот, сортировки, группировки и прочее.

Добыча знаний. На этом этапе применяются различные алгоритмы для извлечения знаний. Это нейронные сети, деревья решений, алгоритмы кластеризации, выявления ассоциаций и тому подобное.

Окончательная обработка данных - интерпретация результатов и применение полученных знаний в бизнес-приложениях. Например, необходимо получить прогноз объемов продаж на следующий месяц. Есть сеть магазинов розничной торговли. Первым шагом будет сбор хронологии продаж в каждом магазине и объединения ее в общую выборку данных. Следующий шаг - предварительная обработка собранных данных: их группировки по месяцам, сглаживание кривой продаж, устранение факторов, мало влияют на объемы продаж.

Далее строится модель зависимости объемов продаж от выбранных факторов. Это можно сделать с помощью линейной регрессии или нейронных сетей. Так получается прогноз - на вход подается модель хронологии продаж. Зная прогнозное значение, его можно использовать, например, в приложениях оптимизации для лучшего размещения товара на складе.

Главное преимущество КDD в том, что полученные таким образом знания можно распространять. Построенную одним человеком модель могут использовать другие, без необходимости понимания методик, с помощью которой эти модели построены.

 
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 
Предметы
Агропромышленность
Банковское дело
БЖД
Бухучет и аудит
География
Документоведение
Естествознание
Журналистика
Инвестирование
Информатика
История
Культурология
Литература
Логика
Логистика
Маркетинг
Математика, химия, физика
Медицина
Менеджмент
Недвижимость
Педагогика
Политология
Политэкономия
Право
Психология
Региональная экономика
Религиоведение
Риторика
Социология
Статистика
Страховое дело
Техника
Товароведение
Туризм
Философия
Финансы
Экология
Экономика
Этика и эстетика
Прочее