Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информационные технологии в агрономии

Теоретические сведения

Организация доступа к информационным ресурсам является одной из важных задач информационной поддержки современной науки, производства. Для получения нужной информации в сети Интернет необходимо обратить внимание на информационно-поисковые системы. Информационно-поисковая язык выступает основой поиска необходимой информации.

Информационно-поисковая система - разновидность автоматизированных информационных систем, которые обрабатывают запрос пользователя и предназначены для поиска текстов (документов, их частей, фактографических записей) в хранилищах (базах данных) по формальным характеристикам.

Информационно-поисковая язык (ШМ) - искусственный язык, предназначенный для выражения семантических аспектов информационных источников (чаще всего - документов) и запросов в форме, пригодной для осуществления поиска информации.

Основным назначением поисковых систем является поиск информации. Документов, получение метаданных из документов, поиск текста, изображений, видео и звука в локальных реляционных базах данных, в гипертекстовых базах данных, таких как Интернет и локальные Интранет.

Информационный поиск (ИП) (англ. Information retrieval) - наука о поиске неструктурированной документальной информации. Объектом информационного поиска является текстовая информация, изображения, аудио, видео информация.

Задания для информационного поиска задается в виде информационного запроса (information query), который может содержать слова, фразы или предложения или их комбинацию. Подавляющее большинство поисковых систем ориентировано на работу с поисковыми терминами - ключевым словам (словам или словосочетаниям).

Во всемирной сети Интернет для организованного поиска информации используют поисковые системы.

Поисковая система онлайн-служба (программно-аппаратный комплекс с веб-интерфейсом), предоставляющий возможность поиска информации в сети Интернет [15].

Таким образом, процесс поиска информации предусматривает взаимодействие в режиме "запрос - ответ" пользователя и информационно-поисковой системы через посредство заранее согласованной ИПМ.

Запрос это ключевое слово или фраза, которую вводит пользователь в строку поиска.

Осуществление информационного поиска предусматривает некоторые принципы работы:

- с использованием векторно-пространственного представления (vector space model);

- поиск вероятности появления поискового термина в документе (probabilistic retrieval);

- с построением языковой модели для каждого документа (language models);

- с построением сети предположений, которая используется для установления соответствия документа к поисковому запросу (inference network);

- с Булевим индексированием, когда каждому поисковому термину присваивается своя "вес", что потом учитывается при построении упорядоченных списков документов (Boolean indexing);

- с использованием не проявленного семантического индексирования (latent semantic indexing);

- с построением нейросетей (neural networks);

- с использованием продуктивных алгоритмов, когда начальный поисковый запрос "эволюционно" видоизменяется (genetic algorithms);

- с использованием нечетких множеств, когда документу ставится в соответствие нечеткое множество (fuzzy set retrieval).

Каждая поисковая система использует собственный принцип поиска информации. Поисковые системы Yandex, Rambler и Google имеют разные алгоритмы, то есть различная тематическая выборка по определенному поисковому запросу. Кроме того, каждая компания (предприятие), определяя круг ключевых слов, под которые оптимизируется сайт, движется по собственному маршруту. Таким образом получается, что в реальной жизни идентичны относительно предложенной продукции компании могут и не встречаться в какой-то поисковой выборке. Обычно компании, идущие в ногу со временем, как правило, пытаются охватить как можно больше ключевых слов и тем более добиться первых мест в поисковой выдачи - ТОП10, то есть первой страницы поисковика.

Большинство поисковых инструментов предлагают два способа поиска - simple search (простой поиск) и advanced search (расширенный поиск) с использованием специальной формы запроса и без нее.

Информационно-поисковые языки делятся на два основных типа:

o ЩМ классификационного типа. К языкам этого типа относятся иерархические, алфавитно-предметные и фасетні классификации. Например, классификаторы ББК и УДК.

o ЩМ дескрипторного типа. Словарь такого языка (контролируемый словарь) состоит из фиксированного набора слов и словосочетаний (дескрипторов, ключевых слов) одного или нескольких естественных языков. Таким образом, индексирования информационного источника предполагает создание его поискового образа как определенного набора слов и словосочетаний (с его текста), которые характеризуют его ключевые содержательные признаки.

ИПС могут использоваться для хранения и поиска нормативных, плановых, отчетных и других документов, данных для научных исследований. Такие системы отличаются друг от друга по многим признакам, но при решении задач сбора, хранения и выдачи информации имеют общие процедуры. Г. Тесленко определяет следующие:

- анализ документов и их отбор;

- создание поискового образа документов (ПОД);

- запись документов и поисковых образов на принимаемые носители;

- хранения документов и ПР;

- анализ запросов;

- выдача документов пользователям.

Для получения доступа к веб-страниц необходимо установить браузер, который позволяет просматривать содержимое гипертекстовых документов.

Веб-браузер (от англ. Web browser) - программное обеспечение для просмотра веб-сайтов, то есть для запроса веб-страниц, их обработки, вывода и перехода от одной страницы к другой.

Приведем перечень браузеров:

список браузеров

Наиболее эффективным способом решения получения достоверных информационных ресурсов является организация информации в информационные системы, электронные публикации и коллекции, отражены в форму электронных библиотек.

Электронные библиотеки это распределенные каталогизированы информационные системы, позволяющие хранить, обрабатывать, распространять, анализировать, а также организовывать поиск в разнообразных коллекциях электронных документов через глобальные сети передачи данных.

Электронные публикации научных коллекций - это одна из форм хранения и обмена информацией. Для нее характерны прежде всего динамичность (возможность обновления) и глобальный доступ (через компьютерные сети).

 
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 
Предметы
Агропромышленность
Банковское дело
БЖД
Бухучет и аудит
География
Документоведение
Естествознание
Журналистика
Инвестирование
Информатика
История
Культурология
Литература
Логика
Логистика
Маркетинг
Математика, химия, физика
Медицина
Менеджмент
Недвижимость
Педагогика
Политология
Политэкономия
Право
Психология
Региональная экономика
Религиоведение
Риторика
Социология
Статистика
Страховое дело
Техника
Товароведение
Туризм
Философия
Финансы
Экология
Экономика
Этика и эстетика
Прочее