Системы классификации информации

Объекты управления и процессы деятельности предприятия (организации), как правило, получают свои произвольные названия естественном языке. Такие названия слишком громоздки, различные по длине и форме представления. В основном они не обеспечивают полной характеристики объекта, отражают. Поэтому от таких случайных названий объектов при построении компьютерных технологий обработки данных приходится отказываться и вводить новые условные обозначения, которые соответствуют требованиям организации обработки данных с помощью технических средств. Этот процесс связан с классификацией и кодированием данных. К кодированию, как известно, привело стремление сократить описание хозяйственных процессов и явлений. С развитием вычислительной техники потребность в кодировке данных неуклонно возрастала. Использование кодовых обозначений позволяет уменьшить затраты на создание документов, перенос данных на машинные носители, передачи данных по каналам связи, ввода в ЭВМ и тому подобное. Процессу разработки кодовых обозначений предшествует работа по классификации экономических данных.

Классификация - это научный метод исследования природы объектов и явлений с использованием определенных правил их систематизации.

Совокупность правил и результаты распределения заданного множества объектов на подмножества в соответствии с установленными признаков их сходства или различия принято называть системами классификации, а сам процесс распределения объектов по данной системе - классификации.

Классификация - обязательный этап предварительной подготовки экономических данных в компьютерной обработки, а также предпосылка рациональной организации информационного фонда и моделирования информационных процессов. Классификацию можно характеризовать как составляющую информационного обеспечения любой компьютерной технологии.

Непременным условием проведения классификации является наличие множества взаимосвязанных объектов и их свойств, которые берутся за основу деления. Если в процессе разделения определенных объектов учитываются природные признаки, выходят из самой сути объектов, то в этом случае классификация отражает действующие свойства и приближена к естественной, содержательной систематизации данного множества.

Для конкретных сфер практического применения можно использовать искусственные (формальные) классификационные признаки, имеют вспомогательное значение для удобства упорядочение объектов. В связи с этим различают естественную и искусственную классификации. их еще называют, соответственно, содержательной и формальной. Наиболее совершенным способом систематизации является естественная классификация.

При любой классификации следует соблюдать следующие основные требования: полнота охвата объектов множества; возможность подключения в любой момент новых объектов; лаконичность, четкость и ясность классификационных признаков.

Известны два основных метода классификации объектов: иерархический и Фасетный. Эти методы отличаются разной стратегией использования классификационных признаков. Рассмотрим основные идеи этих методов для создания систем классификации.

Иерархическая система классификации устанавливает подчиненность (иерархию) объектов и строится по такому принципу: входное множество объектов классификации делится сначала по выбранному признаку на крупные группировки, затем каждое из этих группировок в соответствии с выбранной основы разделения разбивается на ряд последующих группировок, которые распадаются на еще более мелкие, постепенно конкретизируют объект или его свойства. Такую систему классификации можно представить как граф типа дерева (рис. 1.12).

Схема иерархической системы классификации

Рис. 1.12. Схема иерархической системы классификации

Исходное множество объекта классификации М сначала на основе признака классификации Р {делится па подмножества М] В М2, М .. Далее каждое подмножество по следующему признаку классификации разбивается на ряд более мелких подмножеств Мы ... М.К, составляющие соответствующий уровень классификации (в данном случае - второй). Аналогичным образом получают следующие уровни классификации.

Количество уровней классификации, соответствует количеству признаков, выбранных за основу разделения, характеризует глубину классификации. Наиболее значительными и сложными вопросами, возникающими при построении иерархической системы классификации, является выбор системы признаков, закладываются в основу разделения, а также порядок их следования. Основными преимуществами иерархической системы классификации является простота ее построения и удобство для ручной обработки. Однако эта система отмечается жесткостью структуры, поскольку признаки классификации и их последовательность твердо зафиксированы. Понятно, что изменение хотя бы одного из признаков приводит к изменению всех классификационным группам.

Фасетная система классификации, в отличие от иерархической, позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания объекта классифицируется. Признаки классификации называются фасетами (facet - рамка). Каждый фасет (Фи) содержит совокупность однородных значений определенной классификационной признаки. Причем значение в фасете могут располагаться в произвольном порядке, хотя надо отдавать предпочтение их упорядочению. В табл. 1.1 приведена классификация швейных изделий по пяти относительно независимыми признаками.

Таблица 1.1

Классификация швейных изделий

Назначения (фасета 1)

Вид (фасета 2)

Материал (фасета 3)

Сезон (фасета 4)

Пол (фасета 5)

Бытовые

Пальто

Ткани

Зимние

Мужские

Спортивные

Полупальто

Трикотаж

Летние

Женские

Ведомственные

Плащи

Натуральная кожа

Детские

Специальные

Куртки

Искусственная кожа

Костюмы

Мех натуральный

Рубашки

Искусственный мех

и т.п.

и т.п.

Далее можно создать различные группировки и последовательности, определяются структурной формуле, которая зависит от решаемой задачи. Допустим, что первое группировка выявить среди бытового одежды плащи женские, а второе - спортивные куртки деми из искусственной кожи. Третье группировка выявить мужские швейные изделия из ткани. Тогда можно построить схему фасетной классификации как решетку, вертикальные линии которой - фасеты, а горизонтальные - группировки (рис. 1.13).

Схема фасетной системы классификации

Рис. 1.13. Схема фасетной системы классификации

Применение фасетной системы классификации предполагает соблюдение следующих требований: признаки, которые используются в различных фасетах, не должны повторяться; из всех возможных признаков, характеризующих множество объектов классификации, отбираются и фиксируются лишь существенные, обеспечивающих решение конкретной задачи.

Фасетная система классификации отличается большой гибкостью и удобством использования. Она дает возможность строить группировки по любым вариантом сочетания выбранных признаков. Причем при построении классификационных группировок из разных фасет ненужные фасеты можно обходить, что недопустимо для иерархической системы. Поскольку по этой системе классификации образуются независимые группировки (их можно менять, дополнять с учетом изменений характера задач), они наиболее приспособлены для автоматизированных СПД. Недостатками фасетной системы классификации является сложность ее построения и большая длина кода.

 
< Пред   СОДЕРЖАНИЕ   След >