Реферат Данная дипломная работа посвящена разработке и реализации электронного учебного пособия на основе Web-технологий на примере дисциплины «Документальные информационно-поисковые системы»




НазваниеРеферат Данная дипломная работа посвящена разработке и реализации электронного учебного пособия на основе Web-технологий на примере дисциплины «Документальные информационно-поисковые системы»
страница9/11
Дата23.10.2012
Размер1.19 Mb.
ТипРеферат
1   2   3   4   5   6   7   8   9   10   11

ПРИЛОЖЕНИЕ 3


Учебные материалы по дисциплине


Структура каждой темы включает:

  • Заголовок

  • Список ключевых терминов

  • Основное содержание

  • Список ключевых вопросов


П.3 1. Лингвистическое обеспечение АИПС

Структурно-логическая модель знаний представлена на рис.П.3.1



Рис. П.3.1. Структурно-логическая модель знаний


П.3.1.1. Средства и методы выражения информационной потребности

Ключевые слова: запрос поисковый, термин поисковый, лексика, морфология, нормализация, словарь.

Фактически в ИПС всегда происходит преобразование содержательного пользовательского запроса, сформулированного на естественном языке, в поисковое предписание для осуществления системой поиска по формальным критериям.

Поисковое предписание, помимо терминов, описывающих содержательную сторону запроса, содержит также набор операторов, управляющих поиском, и другие формальные характеристики. Обработка запроса включает как формальные, так и семантические операции.

Процесс анализа и преобразования запроса на естественном языке в формализованное поисковое предписание, соответствующее выше описанной структурной схеме, в общем случае сводится к следующим операциям:

  • минимизация текста запроса (удаление неинформативных и избыточных терминов);

  • лексикографическая обработка терминов в системах с фиксированным ИПЯ (замена терминов дескрипторами или кодами классификатора);

  • морфологическая нормализация оставшихся терминов запроса в системах без лексического (лексикографического, словарного) контроля;




  • пополнение набора лексических единиц поискового предписания синонимами и нижестоящими лексемами (дескрипторами) при поиске на точность, а также ассоциативными терминами (дескрипторами) при поиске на полноту;

  • определение структуры запроса и расстановка в явном виде поисковых операторов;

  • дополнение поискового предписания требованиями на оформление выдачи.

Определение структуры запроса заключается в выделении основных аспектов запроса (подтем) и формулировании логики поиска. Аспекты запроса представляют собой основные и вспомогательные понятия, выраженные в формулировке запроса. В дескрипторных ИПС эти понятия выражаются с помощью дескрипторов, в классификационных - посредством индексов. В системах бестезаурусного типа содержание запросов, так же как и документов, выражается с помощью слов естественного языка. При этом говорят о ключевых словах, т. е. таких лексических единицах, использование которых существенно с точки зрения содержания документа и запроса. Слова, несущественные с этой точки зрения, в запрос не включаются.К ним относятся служебные части речи: предлоги, союзы, местоимения, а также незнаменательная лексика, задаваемая списком.

Кроме того, имеется класс полнозначных слов, которые встречаются в слишком большом количестве документов и которые в определенных случаях также могут быть отнесены к стоп-словам (например, «компьютер», «Web», «Интернет» в тематической ИПС по новым технологиям, слово «аналог» в базе данных по патентам и т. п.). При подборе ключевых слов желательно также знать и учитывать их частотные характеристики - как в языке (подъязыке), так и в конкретном поисковом массиве. В качестве поисковых синонимов используются также ассоциативно связанные термины.


П.3.1.2. Языки запросов

Ключевые слова: информационно-поисковая система (ИПС), естественный язык, информационно-поисковый язык (ИПЯ), предкоординированный язык, посткоординированный язык, каталог, реферат, ключевое слово, дескриптор, язык RX-кодов, вербальные ИПЯ, полисемия, семантический язык, иерархическая классификация, алфавитно-предметная классификация, предметная рубрика, фасетная классификация, индексирование, нормализация

Важнейшей компонентой информационно-поисковых систем является информационно-поисковый язык. Человек, чтобы отобрать из массива документов нужные, должен прочитать или просмотреть их содержимое. Для ускорения и упрощения этой процедуры появились различные формы сокращенной записи содержания документов - аннотации, рефераты, каталоги. Но во всех этих случаях при отборе документов по их сокращенным описаниям используется естественный язык.

Информационно-поисковые языки представляют собой знаковые системы, со своим алфавитом, лексикой, грамматикой и правилами пользования. Заметим лишь, что все искусственные языки так или иначе создавались и создаются на основе естественных языков. Основные требования к информационно-поисковым языкам следующие:

  • однозначность между планом выражения и планом содержания (каждая лексическая единица соотносится с одним понятием, и наоборот - каждое понятие имеет уникальное имя, и, как следствие, каждая запись на ИПЯ имеет только один смысл);

  • достаточная семантическая сила (способность фиксировать с достаточными полнотой и точностью все существенное в содержании документов и запросов

Информационно-поисковый язык – искусственный язык, созданный в целях лучшей реализации функции передачи информации. Информационными языками являются, например, патентные классификации, универсальная десятичная система, язык ключевых слов.

Типы информационно-поисковых языков

Предкоординированные [pre-coordination language] -ИПЯ, построенные на принципах предкоординации. Эти языки представлены известными классификационными системами вида: УДК, МКИ, ГРНТИ, ББК, ТБК и др.

Посткоординированные [post-coordination language] - координатный (посткоординатный, дескрипторный) ИПЯ [post-coordination language, descriptor language] -ИПЯ, построенный на принципах посткоординации, лексическими единицами которого являются дескрипторы. Основными словарными средствами, реализующими эти языки являются тезаурусы, представляющие так называемую нормированную лексику, и ключевые слова - ненормированную лексику.


П.3.1.2. Формирование поискового запроса

Ключевые слова: информационный запрос, потребность информационная, информационный поиск, язык запросов, термин поисковый, структура запроса.

Информационный запрос - это словесное выражение определенной информационной потребности. Запросы анализируются по своему предметному содержанию и описываются в терминах, отобранных из словаря конкретного ИПЯ.

Как известно, процедура собственно поиска состоит из поочередного сопоставления поискового образа запроса с поисковыми образами документов и вычисления (по установленным правилам) их соответствия (степени соответствия). Если такое соответствие имеется, то документ, соответствующий данному поисковому предписанию, считается релевантным и подлежит выдаче.

Языки запросов, служащие для построения ПП, объединяют собственно ИПЯ и критерий смыслового соответствия, а также могут содержать в себе требования к интерфейсу выдачи. Обобщенная структурная модель языка запросов включает следующие элементы:

  • собственно поисковые элементы (термины, выражающие информационную потребность, и т. п.);

  • средства морфологической нормализации текстовых элементовзапроса;

  • поисковые (булевы) операторы;

  • средства линейной грамматики (операторы расстояния, позиционные операторы);

  • дополнительные условия поиска:

  • поиск в определенных полях (частях) документа

  • ограничение области поиска по языку, региону, дате создания документа

  • средства управления критерием смыслового соответствия;

  • требование на сортировку (ранжирование) выдаваемых результатов поиска;

  • требования к форме представления результатов поиска

  • вид выдаваемых результатов

  • количество выдаваемых документов



П. 3.1.4.Поисковые операторы и структура запроса

Ключевые слова: запрос поисковый, модель поиска, логическая модель поиска, предложение запроса, логическая операция.

Большинство систем сегодня базируется на булевой (логической) модели поиска. Запрос в этих системах представляет собой булево выражение - набор поисковых терминов, объединенных логическими операторами с учетом правил поискового синтаксиса. Булево выражение в результате сравнения его с документом всегда получает значение «истина» или «ложь». Если «истина» - документ признается релевантным запросу, если «ложь» - нерелевантным.

Во всех системах обработка булевых выражений ведется слева направо с учетом иерархии булевых операторов: первым выполняется оператор NOT, затем AND, затем OR.

В нотациях Бэкуса –Наура Предложение запроса имеет следующий синтаксис:

<Предложение запроса> ::= <Условие поиска>|
<Предложение запроса>< Логическая операция>
<Предложение запроса>|
(<Предложение запроса><Логическая операция>
<Предложение запроса>) 
<Логическая операция> ::= И | AND | ИЛИ | OR | , | НЕ | NOT | ^

 Например, поисковое предписание по теме «Исследование и анализ информационных потоков» может выглядеть следующим образом:
Пример
[Исследование OR Анализ OR Модель OR (Количественная and мера) OR Критерий OR (Ранговое and распределение) OR (Закон and Ципфа) OR (Закон and, Бредфорда) OR Параметр OR Цитируемость OR (Частотное and распределение) OR (Распределение and Лотки) OR (Показатель and рассеяния) OR (Частота and терминов)]
AND
[(Информационный and поток) OR (Документальный and поток) OR (Периодическое and издание) OR (Продолжающееся and издание) OR (Рассеяние and информации) OR (Распределение and публикаций) OR (Поток and публикаций) OR (Массив and публикаций)]

Пример упрощенный: словосочетания, заключенные в круглые скобки, представляют собой не простые AND-выражения внутри OR-групп, а устойчивые словосочетания, задаваемые контекстными операторами (условно показаны как «and» строчными буквами).

Описание основных логических операций (см.Приложение 1)


П. 3.1.5. Средства морфологической нормализации

Ключевые слова: нормализация, ключевое слово, лексическая единица, усечение, маскирование, индексирование.

Задача морфологической нормализации лексических единиц (словоформ) в поисковых предписаниях может решаться следующими путями:

  • отказ от морфологической нормализации;

  • автоматический морфологический анализ и последующая генерация стандартной (канонической) формы (лемматизация) по тем же правилам, что и в документах;

  • то же самое, но по более упрощенным правилам - замена словоформ некоторым унифицированным кодом.

Приведение словоформ к каноническому виду необязательно. Его можно избежать, если рассматривать каждую словоформу как отдельную лексическую единицу- на уровне текста и входа в инвертированный файл.

При этом формальное отождествление разных словоформ одной лексемы обычно обеспечивается на этапе составления поискового предписания и поиска механизмом, получившим название «маскирования» (wild cards) или «усечения» (truncation). Этот метод применяется в большинстве систем. Заключается он в следующем: в поисковом предписании указывается лишь часть слова, а механизм поиска находит в документах все слова, имеющие точно такую же часть. Как правило, это начальная часть слова - основа или квазиоснова, в этом случае говорят о правом усечении. Часть слова, которая в поисковом предписании опускается, отбрасывается, обычно обозначается специальным символом (чаще всего звездочкой (*)).

Например: если требуется найти документы со словами «sing», «singer», «singers», «singing», то в запросе задается sing*.Но есть системы, которые поддерживают и левое усечение, и внутреннее (маскирование).

Например, на запрос *хлоран будут выданы все документы по химии, содержащие сложные слова со второй частью «хлоран» («гексахлоран», «метилхлоран» и т. п.). Маскирование с точностью до количества символов, которые опускаются, может задаваться с помощью знаков вопроса (одного или нескольких).
Использование словоформ в качестве самостоятельных ЛЕ не только ведет к значительному увеличению объема машинных массивов (инверсных файлов), но и вызывает определенные неудобства и сложности для пользователей, связанные с необходимостью выделения основ на уровне поискового предписания и проистекающими из этого возможными ошибками. Поэтому целесообразно иметь в ИПС механизм морфологической нормализации. Алгоритмы автоматического морфологического анализа сегодня реализованы во многих системах и описаны в литературе.


П. 3.2. Модели механизмов информационного поиска в документальных БД

Структурно-логическая модель знаний представлена на рис.П.3.2.




Рис. П.3.2. Структурно-логическая модель знаний


П. 3.2.1. Модель механизма поиска по совпадению терминов

Ключевые слова: документ, релевантность, поисковое условие, термин, ключевое слово, маскирование.

При поиске по условию совпадения терминов в паре запрос-документ задается требование полного и/или частичного совпадения терминов ( ключевых слов) для отбора документов, содержащих эти ключевые слова.

Условие частичного совпадения можно задать, используя символ- символ маскирования (используются знаки "$", "%","?", "*") Такие символы могут начинать термин или заканчивать его или находиться в середине , причем их может быть фиксированное или переменное число.

Окончательный поисковый результат может быть сформирован по двум правилам: документ считается формально релевантным, если содержит все k-терминов , или документ считается формально релевантным запросу, если содержит хотя бы часть из k-терминов


П. 3.2.2. Модель механизма поиска по логическому выражению

Ключевые слова: поисковое условие, документ, операнд, логическая операция.

Логическое выражение поискового условия – это синтаксическая конструкция языка, задающая порядок и способ вычисления величины, принимающей значение "0" или "1". В соответствии с правилами выражение представляет собой последовательность операндов, соединенных друг с другом знаками операции.

В качестве операнда в поисковом выражении обычно выступают термины ( дескрипторы) , а в качестве операции – одна из логических операций И(AND), ИЛИ(OR), НЕ(NOT)


П. 3.2.3. Модель механизма поиска документов-аналогов

Ключевые слова: аналог, документ, словарь, релевантность, словник.

Аналогами некоторого документа называются такие документы информационного массива, которые имеют заданное количество общих терминов с исходным, т.е функция «похожести» реализуется простой количественной оценкой документов с точки зрения наличия в них терминов из некоторого подмножества словаря.

Источником для поиска аналогов служит некоторый отдельный документ информационного массива. Задача функции - отыскать «похожие» на него документы


П. 3.2.4. Модель механизма эвристического поиска

Ключевые слова: аналог, документ, поисковый запрос, коэффициент пороговой близости

Эвристический поиск работает по принципу отыскания документов, «похожих» на усредненный «тематический» образ некоторого множества релевантных документов, указанных пользователем и реализуется следующей последовательностью шагов:

1. Построение словника по массиву релевантных документов

2. оценка терминов словника и построение поискового образа темы

3. построение матрицы «термин-документ для функции поиска аналогов

4. Выполнение функции поиска аналогов с пороговым значением М ( коэффициент близости).


П.3.2.5. Модель механизма поиска с использованием обратной связи по релевантности терминов

Ключевые слова: ранжирование, запрос, релевантность.

Обратная связь по релевантности на уровне отдельных терминов должна обеспечить пользователю возможность целенаправленно изменять запрос поисковый путем повышения роли одних и понижения роли других терминов, не вникая в тонкости составления запроса.

В рамках модели существуют различные стратегии изменения весовых коэффициентов терминов, предлагаемых системой для расширения запроса, на основании информации о релевантности документов. Последовательность шагов:

  • построение и ранжирование словника релевантных документов

  • формирование матрицы поисковых результатов


П. 3.3. Оценка эффективности АИПС

Структурно-логическая модель знаний представлена на рис. П.3.3.




Рис.П.3.3. Структурно-логическая модель знаний


П.3.3.1. Экономическая оценка эффективности АИПС

Ключевые слова: экономическая эффективность, соотношение затраты-выигрыш, затраты на разработку, операционные затраты.

Принято различать анализ экономической эффективности затрат и анализ соотношения затраты-выигрыш. Экономическая эффективность затрат: требуется найти самые недорогие методы выполнения заданного набора операций или получить максимальные результаты при данных затратах. Затраты-выигрыш: требуется систематическое сравнение стоимости выполнения отдельных операций и выигрыша, получаемого в результате их выполнения. Стоимость системы включает:

  • первоначальные затраты, необходимые на разработку, испытания, оценку

  • операционные затраты, которые являются переменными и зависят отрешаемых задач, участвующего персонала и количества требуемого оборудования

  • фиксированные затраты на аренду, налоги и другие стандартные расходы Выигрыш, получаемый от усовершенствования ИС, может быть связан с:

  • уменьшением затрат

  • увеличением экономической эффективности

Анализ эффективности затрат основывается на следующих положениях:

  • Должны быть четко определены цели системы

  • Для достижения целей должны быть предусмотрены альтернативы

  • Должна быть определена стоимость реализации альтернатив

  • Должна быть создана модель, связывающая стоимость реализации альтернатив с целями, которые должны быть достигнуты

В случае информационного поиска основные альтернативы и выбор вариантов относятся к операциям индексирования и ввода документов, а также к процессам поиска и вывода информации. Даже если различные альтернативы можно надежно оценить количественно, может оказаться трудным принятие оперативного решения, так как большие фиксированные затраты, связанные с реализацией, бывает нелегко возместить путем введения оплаты за предоставляемые услуги. До тех пор, пока не будет достигнуто согласие о ценности и выигрыше, которые дают ИС, анализ затрат не дает полного ответа, требуемого для принятия решений.


П. 3.3.2. Техническая оценка эффективности

Ключевые слова: техническая эффективность, поисковый запрос, полнота, релевантность, точность, документ.

Техническая эффективность ИС рассматривается с двух точек зрения: администраторов системы и пользователей. Вопросы эффективности, интересующие администраторов системы:

  • Удовлетворяет ли система основным требованиям пользователей?

  • Каковы основные причины невыдачи релевантных документов?
    и т.д.

С точки зрения пользователей, принято выделять шесть основных показателей:

  • Полнота поиска, т. е. способность системы выдавать все релевантные документы

  • Точность поиска, т.е. способность системы отфильтровывать все нерелевантные документы

  • Усилия (интеллектуальные и физические), затрачиваемые пользователями на формулирование запросов и просмотр выдаваемой информации

  • Время с момента поступления запроса в систему до выдачи ответа

  • Форма представления выдачи

  • Полнота информационного массива в целом, т.е.степень охвата всех релевантных документов, которые могут быть интересны пользователям.

П.3.3.3. Математические модели оценки технической эффективности

Ключевые слова: поисковый запрос, документ, диаграмма Эйлера-Венна, таблица сопряженности, первичные координаты, релевантность, полнота, точность.

Проблема оценки эффективности информационного поиска формально сходна с задачей сопоставления множеств документов и множеств терминов.

Для измерения эффективности системы используются разностные меры множеств истинно релевантных (с точки конечного потребителя) и выданных (формально, с точки зрения системы, релевантных) документов.

Рассмотрим первичные координаты описания выхода ИПС, представлябющие соотношение множеств выданных и невыданных документов, наиболее очевидные с точки зрения потребителя информации:

  • диаграмма или диаграмма Эйлера-Венна

  • таблица сопряженности или диаграмма

  • диаграмма

Диаграмма представляет собой соотношение множеств L(0) - всего информационного потока, L(u)- множества истинно релевантных документов, L(c) - множество документов, выданных системой в ответ на поисковый запрос.

Таблица сопряженности отображает количественное соотношение выданных системой множеств релевантных и нерелевантных документов к невыданным

Координаты - x- выданные релевантные, n- множество всех документов.


П.4.4. Поисковые механизмы сети Internet

Структурно-логическая модель знаний представлена на рис.П.3.4.



Рис.П.3.4. Структурно-логическая модель знаний


П.4.4.1. Поиск информации в сети Internet

Ключевые слова: Internet, сеть, сетевые ресурсы, классификация, поисковая машина, каталог, библиотека.

Интернет является одним из наиболее ярких феноменов, вошедших в жизнь человечества в конце второго тысячелетия н.э. Значительная часть сетевых ресурсов содержит информацию, используемую в деловых целях (официальные документы, научные публикации, справочные материалы и т.п.). Ввиду этого каталогизация и описание информационных ресурсов сети, а также выработка технологий построения Интернет-сайтов, максимально облегчающей получение нужной информации, представляют собой весьма важную научную проблему.

Следует отметить, что развитие Интернета изначально носит децентрализованный характер, поэтому выработка общих стандартов в сети – не более чем благое пожелание. Тем самым необходимо комплексное изучение интернет-ресурсов, обсуждение ее методологических проблем.

Классификация информационных ресурсов сети Internet
1.1 Поисковые системы и каталоги 
1.2 Библиотеки, библиотечные организации и информационные центры 
1.3 Подписные ресурсы (доступ для читателей РНБ) 
1.4 Архивы электронных текстов и виртуальные библиотеки 
1.5 Общедоступные базы данных 
1.6 Словари, энциклопедии, справочники 
1.7 Издательства 
1.8 Онлайновые книжные магазины 
1.9 Специальные виды научной и технической документации (патенты, стандарты и т.д.)


П.4.4.2. Средства поиска информации

Ключевые слова: каталог, справочник, поисковая машина.

По принципу организации и использования средства поиска можно разделить на каталоги (справочники, директории) и поисковые машины.

Каталоги являются справочниками, содержащими списки адресов Интернет, сгруппированные по определенным признакам. Как правило, они объединяются по тематике (наука, искусство, новости и т.д.), где каждая тема разветвляется на несколько подуровней. Особенность этих средств поиска информации состоит в том, что создание структуры, базы данных и их постоянное обновление осуществляется "вручную", коллективом редакторов и программистов, и сам процесс поиска требует непосредственного участия пользователя, самостоятельно переходящего от ссылки к ссылке.

Действие поисковых машин заключается в постоянном последовательном исследовании всех узлов Интернет, доступных данной системе поиска, со всеми их связями и ответвлениями. В связи с постоянным обновлением информации машина поиска регулярно возвращается через определенный срок (порядка месяца) к уже изученным узлам, чтобы обнаружить и зарегистрировать изменения. Вся прочитанная информация индексируется, то есть создается специализированная база данных, в которой закодированы все исследованные системой страницы Интернет. При поступлении запроса от пользователя машина поиска рассматривает всю индексированную информацию и выдает список документов, соответствующих задаче поиска. Найденные документы ранжируются в зависимости от местоположения ключевых слов (в заголовке, в начале текста, в первых параграфах) и частоты их появления в тексте. Несмотря на схожий принцип работы, машины поиска различаются по языкам запроса, зонам поиска, глубине поиска внутри документа, методам ранжирования и приоритетов, поэтому применение разных поисковых машин дает различные результаты.


П.4.4.3. Тенденции развития средств поиска

Ключевыеслова: поисковый запрос, полнота, достоверность, релевантность, точность.

Для того чтобы найденная Вами информация действительно отражала реальное положение дел, поиск должен удовлетворять следующим критериям:

  • полнота охвата ресурсов;

  • достоверность информации;

  • высокая скорость проведения поиска.

Почему важна полнота охвата и достоверность информации, объяснять не нужно. По поводу скорости проведения поиска можно сказать лишь то, что чем меньше времени Вы затратите на проведение поисковых мероприятий, тем меньшими будут Ваши издержки. Гораздо сложнее вопрос проверки: насколько Вам удается достигнуть полноты охвата и достоверности информации. Контроль полноты охвата ресурсов - достаточно серьезная проблема, в том случае если Вам необходимо не просто найти любую информацию об интересующем Вас предмете, а Вы хотите иметь полное представление о предмете поиска и состоянии дел по данному вопросу. 

В этом случае лучше не ограничиваться использованием только одной поисковой машины или просмотром одного каталога. Для того чтобы провести полномасштабный сбор информации необходимо работать со всеми известными Вам каталогами, поисковыми машинами, базами данных, региональными телеконференциями, электронными досками объявлений и листами рассылок. Только в этом случае Вы будете уверены, что нашли если не всю, то хотя бы большую часть существующей информации. 

В силу своей специфики, Internet содержит достаточное количество устаревшей либо не достоверной информации. Во многом это объясняется возможностью анонимного размещения материалов, особенно на бесплатных сервисах. В основном, контроль достоверности информации - это аналитическая работа. При этом важно произвести сверку найденного Вами фактического материала, выяснить статус документов, получить информацию о компетентности автора материала и т.д. Результаты поиска. При поиске в Internet важны:

  • полнота охвата - ничего не потеряно из имеющейся информации

  • точность - не найдено лишней или недостоверной информации.

Получив нужную информацию по сети, постарайтесь для начала ее проверить. Аналитическую информацию проверяют, сравнивая данные, полученные из нескольких источников. Таким же способом проверяют разнообразные статистические данные. Если Вы предполагаете использовать полученную информацию для публичного обозрения, не сочтите за труд точно записать источник (адрес в сети), имя автора (или название организации) и дату публикации используемых Вами сведений. Обратите внимание на возможное наличие особых указаний относительно соблюдения авторских прав. Скорость проведения поиска в Сети, если не принимать во внимание технические характеристики подключения пользователя, зависит в основном от двух факторов:

грамотного планирования поисковой процедуры;

опыта работы с ресурсом выбранного типа

К основным тенденциям развития средств поиска относят:

  • увеличение зоны охвата и глубины просмотра информационных ресурсов

  • совершенствование интерфейса поисковых систем.


П.4.4.4. Методы информационного поиска в сети Internet

Ключевые слова: методы поиска, механизм поиска, каталог, поисковая машина.

Существует два основных метода поиска информации в Internet - с использованием поисковой машины или с использованием каталога. При этом сам механизм поиска в обоих случаях практически одинаков. Различия возникают на этапе 2 (составление списка ключевых слов). Для поисковой машины - это составление списка ключевых слов, а для каталога на этом этапе производится определение тематики разделов, в которых может находиться необходимая Вам информация.

Этапы информационного поиска:

  1. Определитесь с предметом поиска

  2. Подбор ключевых слов

  3. Выбор информационного пространства. Четкое представление, где может находиться запрашиваемая Вами информация, в одних случаях избавит Вас от необходимости просматривать большое количество лишней информации, в других позволит найти те сведения, которые при заданных по умолчанию в поисковой машине условиях поиска, вообще не отыскиваются.

  4. Выбор поисковых инструментов. Этот этап определяет всю дальнейшую технологию поиска - переходить к нему стоит только после анализа предварительно полученной на предыдущих этапах информации.

  5. Предварительный поиск и анализ полученных результатов.


П.4.4.5. Проблемы поиска информации в сети

Ключевые слова поиск информационный, информация, фильтрация, поисковая машина, язык запросов.

К основным проблемам поиска информации в Сети относят:

1. Неструктурированные информационные ресурсы без должного управления

2. Наполнение базы данных.

Отсечение, фильтрация информации от оригинала свойственны всем без исключения ИПС, в том числе и полнотекстовым системам глобального охвата и самого общего назначения. Фильтрация может регламентироваться как на техническом, так и на лингвистическом уровне, однако задача у нее одна -при минимальных материальных затратах добиться реальной эффективности поиска.

В связи с этим на практике часто возникает вопрос - что становится причиной неудачного поиска: отсутствие ли в Сети с высокой вероятностью на данный момент времени информации, релевантной запросу, или то, что эта информация потенциально не доступна для рассматриваемой поисковой системы

3.Экспоненциальный рост объема информации

4.Интернет- средство массовой информации, используемое людьми без соотвествующего образования

5. Сложность проверки и оценки источников информации

6. Сложность в определении пользователем информационной потребности

7.Отсутствие навыков работы с языками запросов поисковых машин
1   2   3   4   5   6   7   8   9   10   11

Похожие:

Реферат Данная дипломная работа посвящена разработке и реализации электронного учебного пособия на основе Web-технологий на примере дисциплины «Документальные информационно-поисковые системы» iconВыводы
Данная дипломная работа посвящена разработке комплекса маркетинговых коммуникаций в сфере туризма. Имеет объём 84 страницы, 2 схемы,...
Реферат Данная дипломная работа посвящена разработке и реализации электронного учебного пособия на основе Web-технологий на примере дисциплины «Документальные информационно-поисковые системы» iconВ. П. Захаров Информационно-поисковые системы
З-38 Информационно-поисковые системы: Учебно-метод пособие. — Спб., 2005. — 48 с
Реферат Данная дипломная работа посвящена разработке и реализации электронного учебного пособия на основе Web-технологий на примере дисциплины «Документальные информационно-поисковые системы» iconК вопросу о разработке системы информационной поддержки деятельности полиграфического отдела
Данная статья посвящена разработке информационной системы, ориентированной на решение задач ведения документации и подготовки отчётов...
Реферат Данная дипломная работа посвящена разработке и реализации электронного учебного пособия на основе Web-технологий на примере дисциплины «Документальные информационно-поисковые системы» iconДипломная работа выполнена в цехе цифровой фотограмметрии фгуп урпцг «Уралгеоинформ»
Дипломная работа посвящена исследованию возможностей цифровой фотограмметрической системы photomod, предназначенной для решения полного...
Реферат Данная дипломная работа посвящена разработке и реализации электронного учебного пособия на основе Web-технологий на примере дисциплины «Документальные информационно-поисковые системы» iconДипломная работа: выполнение и защита
Методические рекомендации составлены на основе учебно-методического пособия: Дипломная работа: выполнение и защита. Учебно-методическое...
Реферат Данная дипломная работа посвящена разработке и реализации электронного учебного пособия на основе Web-технологий на примере дисциплины «Документальные информационно-поисковые системы» iconРеферат Дипломная работа 43 с., 23 рис., 8 источников, 3 прил. Цель работы создание системы управления проектами для компании ООО «Битворкс»
На ее основе было необходимо создать систему управления проектами. В качестве подготовки к реализации нужно было изучить язык программирования...
Реферат Данная дипломная работа посвящена разработке и реализации электронного учебного пособия на основе Web-технологий на примере дисциплины «Документальные информационно-поисковые системы» iconРеферат Работа посвящена разработке набора тестов для проверки соответствия модуля в составе системы oss техническому заданию
Пояснительная записка к дипломной работе содержит 113 листов из них: 13 рисунков, 19 таблиц, 1 приложение
Реферат Данная дипломная работа посвящена разработке и реализации электронного учебного пособия на основе Web-технологий на примере дисциплины «Документальные информационно-поисковые системы» iconРеферат компьютеризация процессов геологической съемки
Данная работа посвящена изучению обоснованность применения информационных технологий для решения вопросов осуществления качественной...
Реферат Данная дипломная работа посвящена разработке и реализации электронного учебного пособия на основе Web-технологий на примере дисциплины «Документальные информационно-поисковые системы» iconБаза данных по учёту электрооборудования и материалов Дипломная работа
Данная работа включает в себя содержание, введение, литературный обзор, практическую часть: описание создания базы данных и web-интерфейса...
Реферат Данная дипломная работа посвящена разработке и реализации электронного учебного пособия на основе Web-технологий на примере дисциплины «Документальные информационно-поисковые системы» iconНастоящая дипломная работа посвящена фольклору русским и чешским народным танцам. Дипломная работа состоит из теоретической части, залоключения, резюме и
В русской части дипломной работы обращено особое внимание на развитие народного танца у восточных славян. Настоящая дипломная работа...
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница