Кодирование информации

Как уже отмечалось, классификация информации является основой ее кодирования.

Кодирование - это образование и предоставление кодового обозначения объектам классификации и классификационным группировкам. Условное

обозначения объектов с помощью знака или совокупности знаков называют кодом. Система кодирования - это совокупность правил образования кода.

Система кодирования используется для замены названия объекта на условные обозначения (коды) в целях обеспечения удобной и более эффективной обработки информации. Для каждого кода устанавливается: алфавит кода - система знаков, принятая для образования кода (цифровой, буквенный, буквенно-цифровой) основа кода - количество знаков в алфавите кода разряд кода - позиция знака в коде длина кода - количество знаков в коде. Процедура предоставления объекту кодового обозначения называется кодированием. В зависимости от того, предшествует кодированию классификации объектов, все известные системы кодирования разделяют на регистрационные и классификационные системы, каждая из этих систем использует определенные методы кодирования (рис. 1.14).

Системы кодирования информации

Рис. 1.14. Системы кодирования информации

Классификационные системы кодирования предназначены для предоставления кодов объектам, предварительно систематизированы по определенным классификационным признакам. Различают последовательное и параллельное кодирование.

Последовательное кодирование используется для кодирования объектов, образованных иерархической классификации. Суть метода заключается в следующем: сначала записывают код группировки 1-го уровня, затем код группировки 2-го уровня, далее код группировки 3-го уровня и т. Д. В результате образуется кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательной системе кодирования присущи те же преимущества и недостатки, и иерархической системе классификации. Последовательное кодирование широко используется в практической работе. В качестве примера, приведем систему кодирования узлов (хостов) электронной почты НБУ (табл. 1.2).

Таблица 1.2

Коды узлов электронной почты НБУ

1

UAHO

Винницкий

2

UBHO

Волынский

3

UCHO

Днепропетровский

4

UDHO

Донецкий

5

UEHO

Житомирский

6

UFHO

Закарпатский

7

UGHO

Запорожский

8

UHHO

Ивано-Франковский

9

UJHO

Киевский

10

UKHO

Кировоградский

11

ULHO

Республиканский узел банка Крыма

12

UMHO

Луганский

13

UNHO

Львовский

14

UOHO

Николаевский

15

UPHO

Одесский

16

UQHO

Полтавский

17

URHO

Ровенский

18

USHO

Сумской

19

UTHO

Тернопольский

20

UUHO

Харьковский

21

UVHO

Херсонский

22

UWHO

Хмельницкий

23

UXHO

Черкасский

24

UYHO

Черниговский

25

UZHO

Черновицкий

26

UJHO

Киевский

27

UOHO

Узел Оперу НБУ

По алфавит кодирования принято латинский, длина кода - четыре разряда. Структура кода, начиная со старшего разряда, такова: 1-й старший разряд выделен для классификационного признака "государство" - U (Украина); 2-й - "территория" (область) 3 и 4 - "хост".

Кодирование расчетных палат в системе электронных платежей осуществляется по аналогичному принципу, с той разницей, что первый (старший) разряд (буква U) заменяется на букву региона (логическая привязка участника платежной системы в палату), третий и четвертый символы отличные от НО и соответствуют HP (расчетная палата). Например, код электронного адреса Львовской расчетной палаты - NNHP, Тернопольской - ТТНР, Черновицкой - ZZHP т. Кодирование банковских учреждений, как участников электронных платежей, осуществляется по следующему принципу: первым разрядом является буква территории, обслуживающей банковское учреждение; второй - буква территории, где расположена банковское учреждение; третий и четвертый знаки являются уникальным идентификатором банковского учреждения в пределах территории расположения. Например, код электронного адреса Львовского филиала Трансбанка - NNKA.

Такое построение кодов региональных палат и банков дает возможность кодировать банки, которые расположены на территории одного региона, а обслуживает их расчетная палата иного региона. Например, код филиала львовского банка, размещена в Донецкой области и обслуживается Львовской региональной расчетной палатой, будет иметь код NDIA.

Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждой фасеты выделяется определенное количество разрядов кода (в этом случае для всех фасет выделен один разряд, так как количество значений в фасетах не превышает числа десять). Параллельной системе кодирования присущи те же преимущества и недостатки, ее фасетной системе классификации.

Проведем кодирование информации, классифицированной по домогою фасетной схемы (см. Табл. 1.1). Количество кодовых группировок определено количеством фасет и составляет пять. Выберем десятичную систему счисления в качестве алфавита кодирования, для значений фасет - один разряд, что позволит получить длину кода, равную четырем. В отличие от последовательного кодирования для иерархической системы классификации в данном методе не имеет значения порядок кодирования фасет. В общем виде код можно записать как ХХХХХ, где X - значение кода фасеты. Рассмотрим структуру кода, начиная со старшего разряда:

1-й (старший) разряд выделен для фасета "Назначение швейного изделия" и имеет следующие значения: 1 - бытовые; 2 - спортивные; 3 - ведомственные; 4 - специальные; 2-й разряд выделен для фасета "Вид" и имеет следующие значения: 1 - пальто; 2 - полупальто; 3 - плащи; 4 - куртки 5 - костюмы; 6 - рубашки и тому подобное;

3-й разряд выделен для фасета "Материал" и имеет значение: 1 - ткань; 2 - трикотаж; 3 - натуральная кожа; 4 - искусственная кожа; 5 - натуральный мех; 6 - искусственный мех и тому подобное;

4-й разряд выделен для фасета "Сезон" и имеет значение: 1 - зимние; 2 - летние;

4-й разряд выделен для фасета "Пол" и имеет значение: 1 - мужские; 2 - женские; 3 - детские.

Принятая система кодирования позволяет легко расшифровать любой код группировки, например: 13123 - детские летние тканевые плащи бытовые; 21211 - мужские зимние из трикотажа пальто спортивные. Процедура кодирования заключается в предоставлении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты. Для каждого объекта задается конкретное группировки фасет структурной формуле, в которой отражается их порядок расположения: Ks = (Ф1, Ф2, ..., Ф и.,. .., Ф n). Так, для структурной формулы К = [Вид (Ф2), Материал (Ф3), Сезон (Ф4)] получим код 351 - плащи из искусственной кожи зимние.

 
< Пред   СОДЕРЖАНИЕ   След >