Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информационные технологии и моделирование бизнес-процессов

Технологии совместного использования ресурсов.

Технологии, реализующих модель процесса с распределенными ресурсами, позволяют всем пользователям сети совместно использовать данные и устройства: принтеры, дисковые накопители, модемы, и тому подобное.

Наиболее распространенными являются три технологии совместного использования информационных ресурсов:

o телеобработка;

o файл-серверная;

o клиент-серверная.

В режиме телеобработки используется один (центральный) компьютер и несколько терминалов. Их количество зависит от мощности центрального компьютера. Терминалы не имеют своих средств работы с данными (процессор, СУБД) и применяются только как приложения. Все операции выполняются на центральном компьютере и сетью передаются на терминалы.

В файл-серверной технологии центральный компьютер, файловый сервер (FS - File Server), используется в локальной сети как общий удаленный накопитель информации большой емкости. Он работает под управлением сетевой операционной системы и выполняет функции доступа к информационным ресурсам (файлов). Обработка данных осуществляется на клиентских компьютерах: система управления базами данных на каждой рабочей станции при решении задач направляет запросы по всем необходимым ей данным на файловый сервер.

Данная технология имеет ряд недостатков:

o большой объем данных передается сетью;

o на каждой станции должна находиться своя СУБД;

o возможность одновременного доступа нескольких пользователей усложняет управление доступом;

o контроль доступа к данным выполняется на уровне файлов.

При клиент-серверной технологии на сервере хранится база данных и СУБД, которая осуществляет управление этой базой. На рабочей станции формируется специальный запрос к базе данных, который обрабатывается средствами серверной СУБД, и передается на рабочую станцию.

На сегодняшний день в информационных системах используются две архитектуры технологий клиент-сервер - двухуровневая и трехуровневая. Первая более распространена и предусматривает сохранение данных и их обработку на сервере. Но в этом случае при решении сложных задач выдвигаются большие требования к мощности машин на рабочих местах.

Примером двухуровневой архитектуры является система доступа к удаленным данным (RDA - Remote Data Access). Доступ к информации поддерживается или операторами специального языка (например, SQL), или вызовами функций специальной библиотеки. Клиент посылает запросы к удаленному серверу для получения соответствующей информации. На сервере функционирует ядро СУБД, которое обрабатывает запросы и возвращает клиенту результат, оформленный как блок данных Компоненты реализуемых на компьютере клиента.

Другим вариантом двухуровневой архитектуры является сервер баз данных (DBS - Data Base Server). Его основой является механизм хранимых процедур и выполняются на сервере и могут распределяться между несколькими клиентами. Компонент представления данных функционирует на компьютере клиента, а прикладной компонент и доступа к данным - на сервере.

Недалеко двухуровневой архитектуры:

o с увеличением количества клиентов увеличивается загрузка сети;

o сочетание на компьютере клиента в одной программе различных по своей природе функций (представления и прикладные) не позволяет эффективно использовать приложения.

o дополнительные расходы средств для написания хранимых процедур на сервере

o процедуры имеют меньшие возможности, чем языки программирования третьего поколения (С, C ++, Pascal)

o не обеспечивается эффективное использование ресурсов из-за ограничений в ядре СУБД;

o при реализации прикладной системы могут понадобиться механизмы взаимодействия: сохранение очереди, асинхронные вызовы, и тому подобное.

Трехуровневая архитектура добавляет между сервером данных и ПК прикладной сервер (AS - Application Server), на котором выполняются необходимые вычисления, позволяет оптимизировать распределение ресурсов в системе. Эта архитектура предусматривает трехуровневую систему распределения функций:

o компьютер клиента (интерфейс пользователя), прикладной клиент (АС - Application Client)

o прикладной сервер (AS) - сохраняет и выполняет бизнес-правила. Дает возможность использовать языки программирования третьего поколения. Повышается независимость функциональных компонент одного уровня от компонент другое.

o сервер баз данных - обеспечивает хранение и поддержку данных, включая их согласованное преобразования, предотвращения несанкционированного или некорректном корректировке, создание резервных копий и т.д.

Преимущества AS- модели заключаются в следующем:

o обеспечивается доступ с удаленных рабочих мест до прикладного сервера в режиме "on-line" без применения дополнительных программных средств;

o эффективное использование мощной техники и систем обмена;

o повышается уровень защиты информации, поскольку рабочие станции взаимодействуют только с сервером AS.

В качестве основы архитектуры клиент-сервер используют реляционную систему управления базами данных, ориентированную на язык SQL. В группу таких СУБД-платформ относятся: Informix On line (фирмы Informix Software) Ingres Intelligent Database (корпорации "Ask Group) ORACLE (корпорации Oracle); Sybase Server (фирмы Sybase).

Благодаря внедрению децентрализованных технологий с распределенными базами данных повышается оперативность управления, сокращается трудоемкость обработки информации, обеспечивается контроль пользователем входных данных и результатов расчетов.

В среде распределенных вычислений может быть несколько серверов: файл-сервер, факс-сервер, сервер печати, прикладной сервер, сервер базы данных и тому подобное.

В неоднородном компьютерной среде при взаимодействии клиента и сервера возникает проблема трансляции кодов (разные кодовые таблицы). Решает эту задачу коммуникационный сервер. Для эффективной работы используют многопроцессорные или многопоточные коммуникационные серверы (MS SQL Server, Sybase SQL Server).

Сервер распределенных баз данных (DDS-Distributed Database Server), специальный компонент СУБД, решает следующие задачи:

o управления именами в распределенной среде (с помощью глобального словаря, который содержит информацию о распределены БД: расположение данных, возможности других СУБД, скорость передачи данных);

o оптимизация распределенных запросов;

o управления распределенными транзакциями.

Чтобы обеспечить надежный доступ пользователей и программ к отделенных данных в сети, объединяющей различные компьютеры и различную топологию, коммуникационный сервер должен поддерживать широкий диапазон сетевых протоколов (TCP / IP, SNA, SPX / TPX, NetBIOS, Apple, Talk и т. д.).

Важным свойством компьютерной сети является ее интеропарабельнисть - открытость системы, позволяющей встраивать ее как компонент в сложное, разнородное, распределенное на значительном расстоянии среду.

Использование открытого интерфейса (ODBS - Open Data Base Connectivity) позволяет поддерживать определенный стандарт обращения к базам данных различных СУБД (не только реляционных).

Гетерогенной называется информационная система, в которой несколько компьютеров различных моделей и производителей объединены в сеть и на каждом из них функционирует собственная СУБД. Унификация интерфейса с помощью языка SQL является важным преимуществом клиент-серверной технологии.

Перспективной является web-технология в связи с распространением Интернет-технологий, в частности web-браузеров (браузеров). Интернет может стать основным архитектурным решением корпоративных сетей для крупных компаний в течение следующих пяти лет. Компании-производители клиент-серверных приложений модифицируют браузеры и перестраивают свою клиентскую технологию для использования Java-технологий. Компания Oracle уже предлагает три бизнес-приложения: web-потребитель, web-поставщик, web-служащий. Использование web-технологий способна снизить стоимость и сложность программного обеспечения для пользователей.

Как было отмечено выше, большинство компьютерных сетей построено по принципу "клиент-сервер". Итак, связь между клиентами сети происходит с помощью сервера, и от него зависит существование и стабильность всей сети. Рассмотрим технологию равноправных (пиринговых) сетей, в которой реализовано подход взаимодействия клиентов без сервера.

Peer-to-peer (P2P) - технология построения распределенной сети, где каждый узел может одновременно выступать и в роли клиента (получателя информации), и в роли сервера (поставщика информации)

Любой обмен данными в равноправных сетях (от англ. Peer-уровня) осуществляется непосредственно между программами-клиентами, их работа не связана с работой центрального сервера, поскольку его физически нет.

В равноправных сетях есть одно значительное преимущество - их функционирования прекратить невозможно по причине отсутствия централизованного управления (сеть не в пиринговых технологии разрушается отключением центрального сервера от питания).

Однако, быстродействие равноправных сетей чрезвычайно низкой при обычном dial-up доступе. Это происходит потому, что каждый клиент сети при работе пропускает через свой компьютер поток информации, не имеет к нему никакого отношения - поисковые запросы других пользователей. Поэтому продуктивную работу в пиринговых сетей может обеспечить только выделенная линия связи. Тогда такая сеть открывает для пользователя практически неограниченные возможности доступа к любой информации.

Надо отметить, что равноправные сети также позволяют доступ и к информации пользователя, которая находится на его ПК. В этом заключается основная угроза информации при пользовании пиринговыми сетями.

Интерес пользователей к Р2Р-сетей продолжает неуклонно расти. Появляются новые программы, новые сети и новые возможности. Теперь для получения любого файла (электронную книгу, музыку, фильм, игру, и т.п.) достаточно загрузить на машину небольшую программку - и пользователь будет использовать архивы миллионов людей. В арсенале информационного охотника есть лучшие средства - Kazaa, eDonkey, eMule, iMesh, Gnutella, Soulseek и другие.

Grid-технологии. Современные компьютеры совершенствуются со значительной скоростью: примерно каждые 18 месяцев процессорная мощность удваивается. Но и такой прогресс не всегда обеспечивает потребности ученых и инженеров - часто для вычислений недостаточно одного компьютера или даже кластера персональных компьютеров. В результате достижения научных или инженерных целей может оказаться чрезвычайно сложным, очень дорогим, а иногда и невыполнимой задачей.

Если же на время выполнения задания или проекта можно будет использовать ресурсы многих персональных компьютеров, рабочих станций, кластеров, или даже суперкомпьютеров, а также хранилищ данных, расположенных в разных точках мира и принадлежат разным людям / учреждениям, то проблема может стать разрешимой.

Возможность распределения отдельных частей большого задачи по географически удаленным ресурсам (если сам характер задачи позволяет разделить его на части) именно предоставляет grid-среду.

Учредители grid-технологий - Ян Фостер (Ian Foster) с Аргоннской Национальной лаборатории и Чикагского университета и Карл Кессельман (Carl Kesselman) из Института информационных наук Университета Южной Калифорнии (США) определяют grid следующим образом:

Grid - открытая и стандартизованная среда, которая обеспечивает гибкое, безопасное, скоординированное разделение (общий доступ) ресурсов в рамках виртуальной организации

Термин "grid-технология" появился в середине 90-х годов как метафора, демонстрирует возможность простого доступа к вычислительным мощностям как к обычной электросети - от англ. "power grid" (электросеть). Подобно тому, как при использовании энергосистем пользователя не интересует, какой именно электрогенератор произвел ток, он потребляет, при использовании компьютерной grid не имеет значения компьютер (или устройство хранения / передачи данных) в grid-системы выполнил поставленную задачу .

Создание grid-среды предусматривает распределение вычислительных ресурсов по территориально разделенным сайтам, на которых установлено специализированное программное обеспечение для того, чтобы распределять задачи и возвращать результаты пользователю, контролировать права пользователей на доступ к тем или иным ресурсам, осуществлять мониторинг ресурсов и т.д.

Общедоступные ресурсы на основе сайта могут включать:

o вычислительные узлы и / или узлы хранения и передачи данных;

o собственно данные;

o прикладное программное обеспечение.

Вычислительными ресурсами могут быть как кластеры, так и отдельные рабочие станции. При всем разнообразии архитектур произвольная вычислительная система может рассматриваться как потенциальный вычислительный ресурс grid-системы. Необходимым условием для этого является наличие ПО, реализующее стандартный внешний интерфейс с ресурсом, который позволяет сделать ресурс доступным для grid-системы. Основной характеристикой вычислительного ресурса является его производительность.

Ресурсы хранения также используют ПО, реализующее унифицированный интерфейс управления и передачи данных. Как и в случае вычислительных ресурсов, физическая архитектура ресурса памяти не принципиальна для grid-системы - то жесткий диск на рабочей станции или система массового хранения данных. Основной характеристикой ресурсов хранения данных является их объем. В настоящее время характерен объем ресурсов хранения измеряется в терабайт (Тб).

Информационные ресурсы и каталоги являются особым видом ресурсов хранения данных. Они служат для хранения и предоставления метаданных и информации о других ресурсы grid-системы. Информационные ресурсы позволяют структурировано хранить огромный объем информации о текущем состоянии grid-системы и эффективно решать задачи поиска ресурсов.

Сетевой ресурс является связующим звеном между распределенными ресурсами grid-системы. Основной характеристикой сетевого ресурса является скорость передачи данных.

Основными задачами grid являются:

o создание с серийного оборудования широкомасштабных распределенных вычислительных систем и систем обработки, комплексного анализа и мониторинга данных, источники которых также могут быть (глобально) распределены;

o повышение эффективности вычислительной техники путем предоставления в grid ресурсов, временно простаивают.

Приоритет той или иной совместной задачи, которая решается с помощью grid, определяется типом grid-системы и характером прикладных областей, в которых он используется. Особенно эффективным такой подход проявляется, когда в рамках любого проекта (исследования или прикладной проблемы) надо выполнить огромный поток или набор однотипных задач. В англоязычной литературе такие прикладные задачи иногда называют "bag-of-tasks" (мешок заданий), где вычисления для каждой выполняются независимо, а в конце пользователь или программное обеспечение только объединяют результаты индивидуальных вычислений.

Другое общая задача, которую решают системы распределенных вычислений, является традиционным для любого производственного процесса: повышение эффективности использования оборудования (средств производства). Эта задача становится особенно актуальным, когда производительность средств производства становится выше, чем необходимо для обеспечения локальных потребностей.

Сегодня большинство ПК используются лишь на несколько процентов своей мощности, и свободные ресурсы могут предоставляться для глобальных вычислительных задач. Аналогичная ситуация характерна и для компьютерных центров, поскольку громоздкие задачи по появляются у пользователей не всегда, поэтому потребность в выполнении вычислительной работы имеет пиковый характер. Grid-технологии позволяют совместить эти мощности в единое, хотя и географически распределенное вычислительную среду. В результате пользователь получает возможность запуска своих задач на "глобальном кластере", что мощность, существенно превосходит его собственные ресурсы. Результат вычислений будет получен значительно быстрее, чем при последовательном запуске задач на отдельном ПК.

Но не все задачи лучше решать, используя распределены кластеры на основе grid-технологий. Суперкомпьютеры являются незаменимыми для некоторых научных проблем, например составление прогноза погоды, когда ряд процессоров часто обменивается данными. Очевидно, что такое частое общение невозможно обеспечить для географически распределенных и, возможно, аппаратно-неоднородных ресурсов в grid-среде. Иными словами, grid не очень подходит для параллельных вычислений с интенсивным межпроцессорного обменом.

Необходимо отметить различие grid-технологии от технологии параллельных вычислений. Основными препятствиями для осуществления нетривиальных параллельных вычислений в grid-среде является нестабильность, плохая предсказуемость времени отклика на запрос. Причем это связано не только с тем, что в компьютерных сетях информационные пакеты проходят через множество сетевых устройств, но и с различиями в протоколах свя связи, которые используются в "внешних" компьютерных сетях и для межпроцессорного обмена внутри суперкомпьютер обслуживание компьютеров. Это не позволяет эффективно организовать параллельные вычисления с интенсивным обменом информацией между процессорами, которые выполняют отдельные подзадачи в grid-среде.

Grid-технология не является технологией параллельных вычислений, она предназначена для удаленного запуска отдельных задач на территориально распределенных ресурсах. Поэтому если громоздкое задача может быть разбито на ряд маленьких, независимых (не обмениваются никакими данными) частей - grid-технология оказывается особенно эффективным и относительно дешевым решением. Напротив, суперкомпьютеры оказываются для таких вычислений неоправданно дорогими и неэффективными. Существуют и гибридные проекты, целью которых является достижение максимальной скорости вычислений за счет глобального распределения этих вычислений между суперкомпьютерами - при этом grid координирует использование различных суперкомпьютер компьютеров, а собственно нетривиальное распараллеливания происходит внутри суперкомпьютера.

Важнейшим для развития отрасли grid-вычислений является междисциплинарный характер работ - сегодня эти технологии применяются в самых разнообразных прикладных областях. В мире возникли сотни grid-форумов и проектов - в физике высоких энергий, космофизици, микробиологии, экологии, метеорологии, различных инженерных приложениях. Например, данные из общеизвестного Большого андронного коллайдера поступают на обработку в grid-систему ЦЕРНа (Conseil Europeen pour la Recherche Nucleaire -Международный исследовательский центр европейского сообщества, крупнейшая в мире лаборатория физики высоких энергий).

В Украине грид-кластеры (вычислительный кластер, который является перспективным для включения в grid-сеть) созданы в Харьковском физико-техническом институте, НТУ "Киевский политехнический институт", Институте теоретической физики НАН Украины, Киевском НУ им. Т. Г. Шевченко, Институте клеточной биологии и генной инженерии, Институте молекулярной биологии i генетики НАН Украины, Главной астрономической обсерватории, Институте физики конденсированных систем, Институте кибернетики НАН Украины, Институте космических исследований.

 
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 
Предметы
Агропромышленность
Банковское дело
БЖД
Бухучет и аудит
География
Документоведение
Естествознание
Журналистика
Инвестирование
Информатика
История
Культурология
Литература
Логика
Логистика
Маркетинг
Математика, химия, физика
Медицина
Менеджмент
Недвижимость
Педагогика
Политология
Политэкономия
Право
Психология
Региональная экономика
Религиоведение
Риторика
Социология
Статистика
Страховое дело
Техника
Товароведение
Туризм
Философия
Финансы
Экология
Экономика
Этика и эстетика
Прочее