Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информационные системы и технологии на предприятиях

Архитектура СППР

Архитектура СППР представляется различными авторами по-разному. Например, Г. Мара касс в 1999 г. предложил обобщенную архитектуру, состоящую из следующих частей: система управления данными (the Data Management System); система управления моделями(the Model Managementsystem); машина знаний (the Knowledge Engine); интерфейс пользователя (the User Interface); пользователи.

Основная задача СППР - предоставить аналитикам инструмент для выполнения анализа данных. По степени обработки данных при анализе данных выделяют следующие задачи:

o информационно-поисковые - СППР осуществляет поиск необходимых данных. Характерной чертой такого анализа является выполнение заранее заданных запросов;

o оперативно-аналитические - СППР осуществляет группировки и обобщения данных в виде, необходимом аналитику;

o интеллектуальные - СППР осуществляет поиск функциональных и логических закономерностей в накопленных данных, построение моделей и правил, которые объясняют найденные закономерности и с определенной вероятностью прогнозируют развитие процессов.

Итак, общую архитектуру СППР можно представить схематично (рис. 7.5).

С функциональной точки зрения СППР включает следующие компоненты: сервер хранилища данных, инструментарий OLAP, инструментарий Data Mining.

В подсистеме ввода данных OLTP (Online Transaction Processing) реализуется операционная (транзакционная) обработка данных. Для их реализации используют обычные системы управления базами данных (СУБД).

В подсистеме хранения информации используют современные СУБД и концепцию хранилищ данных. Концепция хранилища данных предусматривает раздел структур хранения данных для оперативной обработки данных и выполнения аналитических запросов.

Подсистема анализа может включать:

1) подсистему информационно-поискового анализа на базе ре-изоляционных СУБД и статических запросов с использованием языка SQL (Structured Query Language);

2) подсистему оперативного анализа. Для реализации таких подсистем применяется технология оперативной аналитической обработки данных OLAP (Online Analytical Processing), которая опирается на концепцию многомерного представления данных;

3) подсистему интеллектуального анализа. Эта подсистема реализует методы и алгоритмы получения данных Data Mining.

Эти компоненты СППР рассматривают следующие основные вопросы: накопление данных и их моделирования на концептуальном уровне, эффективной загрузки данных из нескольких независимых источников и анализа данных. Можно утверждать, что использование оперативной аналитической обработки (систем OLAP) се-

Общая архитектура поддержки принятия решений

не ограничивается обеспечением доступа к многомерных данных.

Технология Data Mining в СППР также задействована, потому что с ее помощью можно провести более глубокий и всесторонний анализ данных, принять наиболее обоснованные решения.

OLAP и Data Mining можно рассматривать как составные части процесса поддержки принятия решений. Однако эти технологии словно двигаются в разных направлениях: OLAP сосредоточивает внимание исключительно на обеспечении доступа к многомерным данным, а методы Data Mining в большинстве случаев работают с плоскими равно-мерными таблицами и реляционными данными.

Интеграция технологий OLAP и Data Mining расширяет их функциональность. Эти два вида анализа должны быть тесно соединены, чтобы интегрированная технология могла обеспечивать одновременно многомерный доступ и поиск закономерностей.

Средство многомерного интеллектуального анализа данных должен находить закономерности как в детализированных, так и в агрегова-них с разной степенью обобщения данных.

Итак, для реализации подсистем, выполняющих оперативно-аналитический анализ, используется концепция многомерного представления данных, а подсистема интеллектуального анализа данных реализует методы и алгоритмы Data Mining.

Основной недостаток реляционных БД заключается в невозможности обработки информации, которую нельзя представить в табличном виде. В связи с этим предлагается использовать пост-реляционные модели, например, объектно-ориентированные.

Для упрощения разработки прикладных программ, использующих БД, создаются системы управления базами данных программное обеспечение для управления данными, их хранения и безопасности данных.

В СУБД развит механизм управления транзакциями, что сделало их основным средством создания систем оперативной обработки транзакций. К таким системам относятся первые СППР и исполнительные управленческие системы. OLTP-системы не могут эффективно использоваться для решения задач оперативно-аналитического и интеллектуального анализа информации. Сейчас для объединения в рамках одной системы OLTP-подсистем и подсистем анализа используется концепция хранилищ данных. За

Подход, что используется в хранилищах данных с архитектурой CIF

бизнес-процессов. Атомарные данные остаются доступными через нормализованное хранилище данных. Как отличительные характеристики подхода Б. Інмона к архитектуре хранилищ данных можно назвать использование реляционной модели организации атомарных данных и пространственной - для организации суммарных данных; использование итеративного подхода при создании крупных хранилищ данных, что позволяет в случае необходимости вносить изменения в небольшие блоки данных или программных кодов и избавляет от необходимости перепрограммировать значительные объемы данных в хранилище; использование третьей нормальной формы для организации атомарных данных, что обеспечивает высокую степень детальности интегрированных данных и, соответственно, предоставляет корпорациям широкие возможности для манипулирования ими и изменения формата и способа представления данных по мере необходимости.

Типичные черты подхода Ральфа Кимболла такие: использование пространственной модели организации данных с архитектурой "звезда"; использование двухуровневой архитектуры, которая включает стадию подготовки данных, не доступную для конечных пользователей, и хранилище данных с архитектурой шины. В его состав входят несколько витрин атомарных данных, агрегированных данных и персональная витрина данных, но она не содержит одного физически целостного или централизованного хранилища данных. Хранилище данных с архитектурой шины имеет следующие характеристики: пространственное; включает как данные о транзакции, так и суммарные данные; включает витрины данных, посвященные только одной О и имеет только одну таблицу фактов; может содержать множество витрин данных в пределах одной базы данных. Хранилище данных не является единственным физическим репози-торием, поэтому это виртуальное хранилище.

При реализации в СППР концепции СД данные из разных ОДД переносятся в единое хранилище. Собранные данные приводятся к единому формату, согласовываются и обобщаются. Аналитические запросы адресуются к СД (рис. 7.7). Такая модель приводит к дублированию информации в ОДД и в СД. Однако утверждается, что избыточность данных, которые хранятся в СППР, не превышает

1 %. Это объясняется так:

1) при загрузке информации с ОДД в СД данные фильтруются;

2) информация в ОДД является оперативной, поэтому данные, потерявшие актуальность, удаляются. В СД, наоборот, сохраняется исто

Структура СППР с хранилищем данных

рична информация. Исходя из этого, дублирование содержимого СД данным ОДД оказывается незначительным;

3) в СД сохраняется обобщенная информация, которая в ОДД отсутствует;

4) во время загрузки в СД данные очищаются и приводятся к единому формату. После такой обработки данные занимают гораздо меньший объем.

Избыточность информации можно свести к нулю, используя виртуальное СД. В таком случае в отличие от физического СД данные с ОДД не копируются в единое хранилище. Они приобретаются, преобразуются и интегрируются непосредственно при выполнении аналитических запросов в оперативной памяти компьютера.

Хранилище данных имеет преимущества по сравнению с использованием оперативных систем или баз данных. В отличие от оперативных систем, хранилище данных содержит информацию за весь необходимый временной интервал в едином информационном пространстве, что делает такие хранилища идеальной основой для выявления трендов, сезонных зависимостей и других важных аналитических показателей.

Как правило, информационные системы предприятия сохраняют и представляют данные по-разному. Например, одни и те же показатели могут храниться в разных единицах измерения. Одна и та же продукция или одни и те же клиенты могут именоваться по-разному. В системах хранилищ несоответствия в данных устраняются на этапе сбора информации и загрузки ее в единую базу данных. Организуются единые справочники, все показатели в которых приводятся к одинаковым единицам измерения.

Хранилище данных предоставляет уникальную возможность получать любые отчеты о деятельности предприятия на основе одного источника информации. Это позволяет интегрировать данные, вводимые и накапливаемые в различных оперативных системах, без проблем сравнивать их. В процессе создания отчетов пользователь не связан различиями в доступе к данных оперативных систем.

Хранилище данных помогает решить эти проблемы. Во-первых, работа сервера хранилища не мешает работе операторов. По-

второе, в хранилище помимо детальной информации содержатся и заранее рассчитаны агрегированные значения. В-третьих, в хранилище архивная информация всегда доступна для включения в отчеты. Все это дает возможность значительно сократить время создания отчетов и избежать проблем в оперативной работе.

Информацию в хранилище данных недостаточно только централизовать и структурировать. Аналитику нужны средства візуаліза-ции этой информации, инструмент, при помощи которого легко получать данные, необходимые для принятия своевременных решений. В случае использования хранилища данных решение проблемы предоставляет технология OLAP. Эта технология обеспечивает доступ к данным в терминах, привычных для аналитика.

 
< Пред   СОДЕРЖАНИЕ   След >
 

Предметы
Агропромышленность
Банковское дело
БЖД
Бухучет и аудит
География
Документоведение
Естествознание
Журналистика
Инвестирование
Информатика
История
Культурология
Литература
Логика
Логистика
Маркетинг
Математика, химия, физика
Медицина
Менеджмент
Недвижимость
Педагогика
Политология
Политэкономия
Право
Психология
Региональная экономика
Религиоведение
Риторика
Социология
Статистика
Страховое дело
Техника
Товароведение
Туризм
Философия
Финансы
Экология
Экономика
Этика и эстетика
Прочее