Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информационные системы и технологии в управлении организацией

Электронная организация баз данных

Основным местом хранения экономической информации и информационных системах являются базы данных. Элементы реального мира, информация о которых хранится и используется в БД называются объектами БД. База данных - это интегрированное хранилище взаимосвязанных данных конкретной предметной области.

Организация данных в внутримашинной сфере характеризуется двумя уровнями логическим и физическим.

Физическая организация данных определяет способ размещения данных непосредственно на машинном носителе. В современных прикладных программных средствах этот уровень организации обеспечивается автоматически без вмешательства пользователя.

Логическая организация данных зависит от программных средств, и связана с видом модели данных. Процесс хранения данных об экономическом объект с определенными их связями в современных компьютерах требует применения соответствующих моделей. Модель данных - это совокупность взаимосвязанных структур данных и проведения операций над этими структурами. В зависимости от вида модели и типа структур - находятся методы организации и обработки данных.

Метод логической организации данных отражает концепцию БД и является одним из признаков классификации БД. В теории систем управления базами данных выделяют следующие основные модели организации данных: файловую, иерархическую, сетевую и реляционную [15]. Информационные массивы БД, в соответствии с этих моделей, могут быть организованы: в виде отдельных независимых файлов или быть интегрированной совокупности взаимосвязанных массивов.

Тип отношений между объектами информации, хранящихся в БД определяет модель организации конкретной базы данных. Основными моделями таких отношений являются: один к одному (1: 1); один ко многим (1: N); многие ко многим (M: N).

В файловых системах реализуется модель типа "плоский файл". Такой подход используется в пакетных системах обработки информации. Модель внутримашинной информационной базы представляет собой совокупность независимых, не связанных между собой локальных информационных файлов, которые имеют линейную структуру. Информационные файлы проектируются отдельно для каждой конкретной задачи или комплекса задач. Файлы состоят из однотипных записей. Основные типы структур данных файловой модели - это поле, запись, файл. Запись является основной структурной единицей обработки данных в файловых моделях. При описании логической организации данных для каждого файла присваивается уникальное имя и дается описание структуры его записей. Данные вводятся и сохраняются без индексирования (доступ по ключу), а при поиске и создании выходных форм обрабатываются последовательно.

Преимущества файловой модели: относительная простота организации файловой модели, но эта модель имеет существенные недостатки, а именно:

1. Избыточность данных. Для решения различных задач управления используются одни и те же данные. Информация одного и того же объекта управления распределяется между многими файлами. Это приводит к дублированию данных в информационных массивах и расточительного использования памяти компьютера.

2. Несогласованность данных. Суть этого недостатка состоит в том, что одна и та же информация может размещаться в разных файлах. При этом технологически сложно проследить за внесением изменений одновременно во все файлы. Поэтому может возникнуть несогласованность данных - это когда одно и то же поле в разных файлах может иметь разные значения.

3. Зависимость структур данных и приложений. Суть этого состоит в том, что при файловой организации логическая и физическая структура файла должна иметь описание в приложении. При изменении логической или физической структуры файла приложение должно быть модифицирована. Но изменения в одной программе часто требуют внесения изменений в другие информационно связанных программ, что приводит к значительному увеличению стоимости сопровождения программных средств (иногда стоимость сопровождения программных средств достигает 70% стоимости их разработки).

Таким образом, файловые модели организации недостаточно гибкие при манипулировании данными.

В иерархической модели все объекты БД образуют структуру, где все элементы связаны отношениями подчиненности, (иерархически организованный набор). Иерархическая модель определяется двумя типами отношений: 1: 1 и 1: N и подается в виде древовидных структур. Преимуществом этой модели является простота моделирования предметных областей. Но не все связи можно учесть с помощью иерархической модели, создает определенные трудности при программной реализации.

Сетевая модель состоит из набора элементов (объектов) и набора связей между ними. Сетевой подход к организации данных является расширением иерархического. Использование его позволяет представления связей между реальными объектами, сложных по сравнению с иерархической моделью. С помощью сетевой модели можно моделировать отношение 1: 1, 1: N, N: l, N: N.

В иерархических и сетевых моделях возможен доступ по ключу к информационным элементов. Доступ к записям файла выполняется с помощью индексирования. При этом создается дополнительный индексный файл, содержащий в упорядоченном виде все значения ключа файла данных. При наличии индексного файла по заданному ключу осуществляется прямой доступ к нужной записи (можно быстро найти запись).

Таким образом, сетевая или иерархическая модели данных представляют совокупность взаимосвязанных объектов. Связь двух объектов отражает их подчиненность.

Преимущества иерархических и сетевых моделей: компактность и высокое быстродействие. Недостатки: универсальность и высокую степень зависимости от конкретных данных.

В реляционной модели объекты и взаимосвязи между ними представляются с помощью таблиц. Самая двумерная таблица определяется как отношение (relation). В реляционной модели действия над данными сведены к операциям реляционной алгебры. Эти операции выполняются над отношениями (объединение, пересечение, декартово произведение, проекция, выборка и другие). Кроме того, есть определенный набор формальных требований универсального характера к организации данных. Эти требования к состоянию таблиц данных получили название нормальных форм. Нормальные формы вводят ограничения и позволяют минимизировать дублирование данных.

Реляционные модели является попыткой избежать сложности реальных иерархических и сетевых БД на основе теоретико-множественной интерпретации структуры данных. Понятие сути и отношение в модели не разделяются, а рассматриваются вместе.

В основу реляционных моделей положено понятие отношение, которое подают в виде двумерной таблицы. Реляционная БД - это набор взаимосвязанных отношений. Каждое отношение (таблица) в электронном виде подается как файл. Отношение можно разделить на два класса: объектные и связные.

Объектные отношения сохраняют данные об информационных объектах предметной области. В объектном отношении один из атрибутов однозначно идентифицирует отдельный объект. Такой атрибут называется первичным ключом отношения. Ключ может содержать несколько атрибутов, то есть быть составным. В объектном отношении не должно быть строк с одинаковым ключом, то есть не допускается дублирование объектов. Это основное ограничение реляционной модели для обеспечения целостности данных.

Связное отношение сохраняет первичные ключи двух или более объектных отношений. Ключи связочного отношение имеют целью установления связей между объектными отношениями. В связном отношении могут дублироваться ключевые атрибуты. Кроме ключей, по которым устанавливают связь в связном отношении, могут быть еще и другие атрибуты, которые функционально зависят от этого составного ключа.

Ключи в связных отношениях называются вторичными, или внешними ключами, поскольку они являются первичными ключами объектов других отношений. Реляционная модель накладывает на внешние ключи ограничение, которое называют посылочной целостностью. Оно необходимо для обеспечения целостности данных.

Посылочная целостность - это соответствие между объектными и связными отношениями, которая заключается в том, что каждому внешнему ключевые связочного отношение должно соответствовать строка какого объектного отношения. Без такого ограничения может случиться так, что внешний ключ ссылается на объект, о котором ничего не известно.

В реляционной БД накладывается еще одно ограничение - отношение должны быть нормализована. Нормализация отношений - это итерационный обратный процесс декомпозиции исходного отношения на несколько более простых отношений меньшей размерности. Под обратимостью процесса понимают то, что операция объединения отношений, полученных в результате декомпозиции, должна дать начальное отношение. В результате нормализации состав атрибутов отношений БД должен соответствовать следующим требованиям:

- Между атрибутами должны исключаться нежелательные функциональные зависимости;

- Группировка атрибутов не должно иметь убыточного дублирования данных;

- Обеспечивать обработку и обновления атрибутов без осложнений.

Нормализована база данных требует значительно меньше памяти для ее хранения, чем ненормализованное база данных.

На современном рынке программных продуктов наиболее распространены БД на основе реляционных моделей [8].

К преимуществам реляционной модели можно отнести:

1) простоту представления данных (табличная форма) и инструментальных средств их поддержки;

2) простоту в разработке языка манипулирования данных, поскольку поиск данных сводится к применению различных операций над множествами;

3) минимальную избыточность данных;

4) универсальность процедур обработки данных;

5) независимость приложений пользователя от данных;

Недостатками реляционной модели являются:

1) нормализация данных реляционной модели приводит к значительному фрагментации данных;

2) жесткость структуры;

3) зависимость скорости работы от размера БД;

4) реляционная модель не охватывает весь диапазон известных структур данных.

Проектирование данных связано с многоуровневым их представлению: внешним, инфологическую, даталогичним, внутренним [15,19].

Внешний ривеньявляе собой требования к данным со стороны пользователей и приложений. Требования пользователей к внешнему представление охватывают совокупность данных, которые нужны для выполнения запросов пользователей. Требования со стороны приложений к внешнему уровня представления данных - это перечень данных, запись их взаимосвязей, которые необходимы для реализации определенных функциональных задач. Он представляет собой словесное описание данных. Иногда для описания внешнего уровня используются матричные или другие формализованные методы. Описание внешнего уровня не исключает наличия дублирования, избыточности, несогласованности и тому подобное. Для того чтобы спроектировать внешнюю модель БД, необходимо выполнить обследование программного обеспечения, изучить систему входящей и исходящей документации, исследовать и изучить все функциональные обязанности будущих пользователей БД.

Инфологическую ривеньявляе собой информационно-логическую модель предметной области, в которой исключена избыточность данных и отражены информационные особенности объекта управления, без учета особенностей и специфики конкретной БД. Он может быть самостоятельным или функционировать как составляющая внешнего уровня. Интеграция всех внешних представлений данных выполняется на инфологическую уровне. На этом уровне формируется инфологическую (каноническая) модель данных.

Цель инфологического проектирования - создать структурированную информационную модель, для которой будет разрабатываться БД. При проектировании на инфологическую уровне создается информационно логическая модель, которая должна соответствовать следующим требованиям:

- Корректности схемы БД;

- Простоте и удобству использования на следующих этапах проектирования;

- Описанию на языке, понятном проектировщикам БД, программистам, администратору и будущим пользователям.

Основной составляющей инфологической модели является атрибуты, которые нужно проанализировать и некоторым образом сгруппировать для дальнейшего хранения в БД.

Сущность инфологического моделирования заключается в отделении информационных объектов (файлов), которые подлежат хранению в БД, а также определении характеристик объектов и связей между ними. .Характеристикамы Объектов есть атрибуты.

Даталогичний (логический, концептуальный) уровень формируется с учетом специфики и особенностей конкретной БД. На этом уровне строится концептуальная модель данных, то есть специальным образом структурированная модель, которая соответствует особенностям и ограничением выбранной БД. Модель логического уровня, которая поддерживается средствами конкретной БД, называют даталогичною. В зависимости от типов моделей, поддерживаемых средствами БД, есть иерархические, сетевые и реляционные модели баз данных. Самыми распространенными на современном рынке программных продуктов является реляционные БД.

Внутренний уровень связан с физическим размещением данных в памяти ПК На этом уровне формируется физическая модель БД, которая содержит структуры хранения данных в памяти ПК, включая описание форматов данных, порядок их логического или физического упорядочения, размещения по типам устройств, а также характеристики и пути доступа к данным. От параметров физической модели зависят такие характеристики функционирования БД, как объем памяти и время реакции системы. Физические параметры БД можно изменять в процессе ее эксплуатации (не меняя при этом описания других уровней) с целью повышения эффективности функционирования системы.

Под оптимальной логической модели баз данных понимают модель, которая не имеет аномалий, связанных с модификацией БД, то есть проблем, которые могут возникнуть в связи с заменами, вставками и изъятиями данных из БД.

Для создания такой модели баз данных независимо от того, какая БД используется - иерархическая, сетевая или реляционная, применяется теория нормализации реляционных баз данных. Использование реляционного подхода позволяет спроектировать оптимальную логическую модель БД, которая потом достаточно просто трансформируется в иерархическую или сетевое модель.

 
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 
Предметы
Агропромышленность
Банковское дело
БЖД
Бухучет и аудит
География
Документоведение
Естествознание
Журналистика
Инвестирование
Информатика
История
Культурология
Литература
Логика
Логистика
Маркетинг
Математика, химия, физика
Медицина
Менеджмент
Недвижимость
Педагогика
Политология
Политэкономия
Право
Психология
Региональная экономика
Религиоведение
Риторика
Социология
Статистика
Страховое дело
Техника
Товароведение
Туризм
Философия
Финансы
Экология
Экономика
Этика и эстетика
Прочее