Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информационные системы и технологии в управлении организацией

Хранилище данных

Разновидностью баз данных является хранилище данных, которое было определено в 1992г. Хранилище данных - это особая форма организации базы данных, предназначенной для хранения в согласованном виде агрегированной информации, получаемой на основе баз данных различных систем и внешних источников. Необходимость разработки новой концепции хранилищ данных обусловлена такими факторами [8, 9]:

1) развитие информационных технологий привело к системам нового типа, которые получили название систем поддержки принятия решений. Эти системы базируются на OLAP-технологии, основой которой является реализация аналитических запросов;

2) системы поддержки принятия решений, основанных на формировании аналитических запросов, начали конфликтовать с транзакционными системами оперативной обработки данных. Одновременное решение оперативных и аналитических запросов на одной базе данных часто приводит к недостатку ресурсов;

3) формирование аналитических отчетов на основе традиционных баз данных, содержащих оперативную информацию, занимает очень много времени. Причем затраты времени, необходимые для формирования аналитических отчетов, неуклонно растут с увеличением объемов оперативной информации в базе данных. Это приводит к тому, что менеджеры не успевают готовить соответствующие решения на основе полученных аналитических отчетов;

4) очень часто на предприятии или в организации работает несколько OLAP- систем, каждая из которых имеет свою отдельную базу данных, в которых используются различные структуры данных, способы кодирования, единицы измерения. Построение сводного аналитического запроса на основе нескольких баз данных является очень сложной проблемой, которая сначала требует решения проблемы согласованности данных, хранящихся в различных базах данных.

Решение вышеперечисленных проблем было найдено в разработке концепции хранилища данных. В хранилище данных хранятся не первичные данные, а определенным образом интегрированы данные, которые создают основу для решения аналитических задач и функционирования систем поддержки принятия решений [9].

Хранилище данных характеризуются:

1. Предметной ориентацией. Данные в хранилище данных организованы в соответствии с основными направлениями деятельности организации. В этом заключается отличие хранилищ данных от оперативной БД, в которой данные подаются в соответствии с процессами (отгрузка товара, выписка счетов и т.п.) Предметная организация данных не только упрощает анализ, но и значительно ускоряет проведение аналитических расчетов. То есть хранилища ориентированы на бизнес-понятия, а не на бизнес - процессы.

2. интегрированность. Первичные данные оперативных баз данных проверяются, определенным образом добираются, сводятся к одному виду, необходимой мерой агрегируются (то есть ведется суммарные показатели) и загружаются в хранилище данных. Такие интегрированные данные намного проще анализировать.

3. Поддержкой хронологии. Данные, которые выбираются из оперативных баз данных, накапливаются в хранилище данных в виде "исторических пластов", каждый из которых характеризует определенный период времени. Это позволяет проводить анализ изменения показателей во времени.

4. Неизменность. Данные хранилища данных, характеризующих каждый "исторический пласт", ни в коем случае не подлежат изменениям. Это тоже является существенным отличием данных, хранящихся в хранилища данных, от оперативных данных. Оперативные данные могут очень часто меняться, данным хранилища возможны только операции их первоначальной загрузки, поиска и их чтение.

5. Минимальной избыточностью. Несмотря на то, что информация в хранилища данных загружается с БД, это не приводит к избыточности данных. Сведение к минимуму избыточности данных обеспечивается тем, что прежде чем загружать данные в хранилища, их фильтруют и определенным образом очищают от таких данных, которые не нужны и не могут быть использованы в системах.

Хранилища данных могут включать следующие компоненты:

1. Виртуальное хранилище данных - это метаданные, описывающие источники поступления информации, структуру данных хранилища, методы агрегации и загрузки данных, сведения о структуре бизнес-понятий и другие данные о данных, хранящихся в хранилище.

2. Корпоративные хранилища данных - содержат информацию, собранную с определенного множества оперативных БД, которая характеризует всю корпорацию и необходима для выполнения консолидированного анализа деятельности в целом. Такие хранилища охватывают все многочисленные направления деятельности корпорации и используются для принятия как тактических, так и стратегических решений. Разработка корпоративного хранилища данных очень трудоемкий процесс, который может составлять от одного до нескольких лет, а объемы хранилища могут достигать от 50 Гбайт до нескольких терабайт.

3. Киоски или витрины данных - это определенная подмножество корпоративных данных, характеризующих конкретный аспект деятельности корпорации, например работу какого ее подразделения. Киоск может получать данные с корпоративного хранилища данных (зависимый киоск) или быть независимым, и тогда источником пополнения его данным будут оперативные БД. Разработка киоска данных требует значительно меньшего времени и в среднем длится около трех-четырех месяцев.

Корпоративные хранилища данных и киоски строятся за подобными принципами и используют практически одинаковые технологии.

В последнее время появилось понятие глобального хранилища данных, в котором хранилище данных рассматривается как единственный источник интегрированных данных для всех витрин данных.

Хранилища должны предоставлять возможность параметризации данных по различным признакам, например банковские операции во время их анализа необходимо группировать по времени их выполнения, за клиентами, по их объемам в стоимостном выражении, по контрагентам, видам валют и другим признакам. Данные должны быть представлены в хранилище таким образом, чтобы предоставлять возможность их многомерного анализа. Основы многомерного анализа были начаты Е.Ф. Коддом в 1993г.

Наиболее удачной формой представления данных, что позволит многомерной их параметризации и представления данных в виде многомерной модели. В основу OLAP-систем положено понятие гиперкуба, то есть многомерного куба, в ячейках которого хранятся необходимые для анализа данные.

Сейчас существует три варианта построения систем на основе хранилищ данных: MOLAP, ROLAP и HOLAP.

В MOLAP - системе гиперкуб реализуется как специальная модель нереляционные структуры, скорее обеспечивает доступ к данным, чем реляционные модели, но требует дополнительных затрат памяти.

В KOLAP - системах гиперкуб это лишь пользовательский интерфейс, который моделируется на традиционной реляционной базе данных. Данные в хранилище представляются в виде модели, получившей название "звезда". В этих системах хранятся агрегированные данные. Такой подход позволяет хранить большие объемы данных, но они недостаточно эффективны при выполнении аналитических операций.

HOLAP - системы - это комбинированный вариант хранения данных, который использует оба типа СУБД. В многомерной СУБД хранятся агрегаты данных, а данные, которые имеют небольшой объем, хранятся в реляционной СУБД.

 
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Предметы
Агропромышленность
Банковское дело
БЖД
Бухучет и аудит
География
Документоведение
Естествознание
Журналистика
Инвестирование
Информатика
История
Культурология
Литература
Логика
Логистика
Маркетинг
Математика, химия, физика
Медицина
Менеджмент
Недвижимость
Педагогика
Политология
Политэкономия
Право
Психология
Региональная экономика
Религиоведение
Риторика
Социология
Статистика
Страховое дело
Техника
Товароведение
Туризм
Философия
Финансы
Экология
Экономика
Этика и эстетика
Прочее