Лабораторная работа №2 по дисциплине: «Информационно-поисковые системы»




Скачать 269.8 Kb.
НазваниеЛабораторная работа №2 по дисциплине: «Информационно-поисковые системы»
страница1/2
Дата23.09.2012
Размер269.8 Kb.
ТипЛабораторная работа
  1   2
ПГУТИ


Лабораторная работа № 2

по дисциплине: «Информационно-поисковые системы»




Выполнила:

Студентка гр. ИСТ-71

Сердюк Ирина

Проверил:

Захаров С.В.


Самара

2010

  1. Перешла на сайт поисковой системы Апорт (Яндекс, Рамблер. Нашла в каждой системе ссылки на ее описание в целом, на описание языка запросов, интерфейсов («Справка», «Помощь», «Расширенный поиск» и т.п.). Перейдя по ссылкам, изучила справочную.

  1. Апорт



  1. Поисковая форма с закладами для переключения между различными видами поиска;

  2. Рекламные ссылки, соответствующие запросу (контекстная реклама);

  3. Количество результатов поиска по запросу;

  4. Заголовок и ссылка на страницу результата поиска;

  5. Ссылка на сохраненный текст документа (полезно, если сам сайт не доступен через Интернет);

  6. URL сайта или документа;

  7. Цитата из полного текста документа с выделенными словами запроса;

  8. Список релевантных запросу документов сайта;

  9. Регион, к которому принадлежит найденный сайт (если сайт опубликован в каталоге). При клике по ссылке будет произведен поиск по запросу с ограничением области поиска сайтами из этого региона;

  10. Ссылка на рубрику Апорт-каталога, к которой относится найденный сайт (если сайт опубликован в каталоге);

  11. Картинка, наиболее соответствующая запросу;

  12. Видео, наиболее соответствующие запросу;

  13. Рубрики из каталога на тему запроса;

  14. Регион, к которому относится IP-адрес вашего компьютера. При клике по ссылке будет произведен поиск по запросу с ограничением области поиска сайтами из этого региона;

  15. Постраничная навигация;

  16. Список поисковых систем.

  17. Первое, что мы видим - кроме числа найденных документов, Апорт выдает число найденных сайтов. Это не просто формальная процедура, дальше вся выдача разбита именно на сайты, а не на документы. Это вовсе не означает, что вы не можете теперь искать отдельные документы - результаты поиска устроены так, чтобы совместить общую информацию и детальные данные. 




Критерии ранжирования

  • частота и взаимное расположение слов запроса в тексте документа;

  • размер документа;

  • присутствие и взаимное расположение слов запроса в выделенном (размером шрифта или html-тегами , ,

    ...

    ) тексте;

  • присутствие и расположение слов запроса в заголовке документа;

  • присутствие и расположение слов запроса в мета-тегах "keywords" и "description";

  • присутствие и расположение слов запроса в ссылках на ранжируемый документ и авторитетность этих ссылок;

  • присутствие и взаимное расположение слов запроса в названии и описании сайта в каталоге Апорта (учитывается при вычислении веса главной страницы сайта);

  • взвешенный индекс цитирования документа;

  • количество страниц сайта, имеющих высокую релевантность запросу.

Результирующий вес документа рассчитывается по специальному алгоритму, различным образом учитывающему сочетания разных критериев.


Логические операторы: 

Оператор

Синонимы

Описание

И

AND
&
+


Оператор логическое И подразумевается, его можно опускать: запрос быстрый поискполностью эквивалентен запросу быстрый И поиск. По любому из этих запросов будут найдены документы, содержащие оба слова.

ИЛИ

OR
|


Оператор логическое ИЛИ позволяет искать документы, содержащие хотя бы один из операндов. По запросу быстрый ИЛИ поиск будут найдены документы, содержащие любое из указанных слов или оба слова одновременно.

НЕ

NOT
~


Оператор логическое НЕ ограничивает поиск документами, не содержащими слово, указанное после оператора. По запросу фрукты НЕ яблоки будут найдены документы, содержащие слово "фрукты", но не содержащие слово "яблоки".

()

 

Круглые скобки задают порядок действия логических операторов. По запросу быстрый ИЛИ качественный поиск будут выданы документы, содержащие либо слово "быстрый", либо одновременно слова "качественный" и "поиск"(оператор И действует первым). По запросу(быстрый ИЛИ качественный) поиск будут выданы документы, где встречаются одновременно слова "быстрый" "поиск", либо "качественный" и "поиск".


Операторы расстояния: 

Оператор

Синонимы

Описание



' '

Двойные или одинарные кавычки позволяют находить словосочетание, указанное в них, или близкое к нему. Последняя оговорка связана с двумя обстоятельствами. Во-первых, стоп-слова в кавычках игнорируются, как и в обычном запросе. Во-вторых, грамматическая форма слов также кавычками не фиксируется. Пример: по запросу "яблоки на снегу" будут найдены документы, содержащие следующие фрагменты: "яблоки на снегу", "яблоки и снег", "яблокам под снегом", "яблоко снег" и т.п.

сл2
(...)


с2(...)
w2(...)
[2,...]


Ограничение расстояния в словах (двойка указана как пример). Если вы хотите потребовать, чтобы заданные вами слова встречались, скажем, в пределах 5 слов, то надо написать: сл5(папа мама сын). При этом будут найдены документы, где между словами "папа", "мама" и "сын" стоит не более двух других слов (то есть общее число слов во фрагменте не более 5). Порядок, в котором встречаются заданные слова, не важен.


Поиск по адресам: 

Оператор

Синонимы

Описание

url=

url:

Данный оператор позволяет получить список документов, проиндексированных Апортом на заданном сайте. Например, по запросу url=www.rol.ru будут выданы все документы, проиндексированные Апортом на сайте www.rol.ru.


Поиск по полям:

Оператор

Описание

title=

Указанное после равенства слово или конструкция в круглых скобках должны искаться в заголовках документов (перед круглыми скобками знак равенства можно опускать). По запросу title=(папа или мама) будут найдены документы, содержащие в заголовке слово папа или слово мама, или оба слова одновременно.

keywords=

Указанное после равенства слово или конструкция в круглых скобках должны искаться в поле META KEYWORDS документов (перед круглыми скобками знак равенства можно опускать). По запросуkeywords(папа и мама) будут найдены документы, для которых автор в ключевых словах указал оба слова: папа и мама.

alt=

Указанное после равенства слово или конструкция в круглых скобках должны искаться в полях ALT (комментарии к картинкам). По запросу alt(Билл Гейтс) будут найдены документы, в которых есть картинка с комментарием, содержащим как минимум два слова: Билл и Гейтс.

anchor=

Указанное после равенства слово или конструкция в круглых скобках должны искаться в тексте ссылок. По запросу anchor=(ненавижу Интернет) будут найдены документы, в тексте ссылок на которые, встречаются оба слова: ненавидеть и Интернет.

description=

Указанное после равенства слово или конструкция в круглых скобках должны искаться в тексте описаний сайтов каталога Апорта и в поле META DESCRIPTION документов. По запросу description=(уксусная кислота") будут найдены корневые документы сайтов, в тексте описаний которых встречается словосочетание уксусная кислота, а также документы, в которых это словосочетание встречается в поле META DESCRIPTION.

text=

Указанное после равенства слово или конструкция в круглых скобках должны искаться только в обычном тексте. По умолчанию слова запроса ищутся как в тексте, так и во всех указанных выше полях. Чтобы искать только по тексту, выдаваемому в основное окно браузера, следует использовать данный оператор. По запросу text=(оглавление или содержание) будут найдены документы, в которых любое из указанных слов встречается в пределах основного текста документа.




  1. Яндекс



Специальные виды поиска:

— поиск по зарубежному интернету

— семейный

— для слабовидящих

— дзен

— аскетичный (Ya.ru)

— расширенный


Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Это называется учет морфологии слов. При необходимости вы всегда можете его отключить.

По ссылке «Настройка поиска», вы сможете изменить вид страницы с результатами поиска по своему вкусу, включить фильтрацию страниц и отключить показ графической рекламы.

Статистика слов в базе Яндекса показывается, только если вы указали это в настройках. Она говорит о том, сколько раз встретилось каждое из слов запроса на всех страницах, известных Яндексу. Этот показатель примерный и может меняться.

Пример:

Запросов за месяц: шерше - 3 040, ля - 105 236, фам - 6 362.

Если в поиске по запросу участвовали не все проиндексированные страницы, в области поиска показываются эти ограничения. В их число входят ограничение по региону, сайту, языку, формату документа, страницы, похожие на заданную, включенный семейный фильтр.



Яндекс умеет искать не только сайты, но и новости, товары, картинки и т.д. Когда вы задаете запрос, поиск ведется одновременно по всем «параллельным» базам, и если что-либо найдено, Яндекс покажет информацию среди результатов поиска. В правой колонке — товары и картинки, внизу или вверху страницы — новостисловарикартыафишапогода. И все это — одним запросом!

Многие службы Яндекса «понимают», когда они могут дать хороший ответ на запрос, и показывают соответствующую информацию в прологе результатов поиска. Также когда поиск принес мало документов, Яндекс анализирует запрос и предлагает способ, которым можно улучшить результаты.

Если Яндекс подозревает, что в запросе есть опечатка, он может предложить возможный вариант написания слов. Например, по запросу [мама мылв раму] появится подсказка:



В тех случаях, когда с большой вероятностью можно сказать, что в запросе есть опечатка, он будет автоматически исправлен. Примером может служить запрос [стикло]:



Ссылка на фразе без кавычек ведет на результаты поиска по тому же запросу, но уже без кавычек: люблю грозу в конце апреля.


Расширенный поиск

Яндекс позволяет решать сложные поисковые задачи, не пользуясь языком запросов. Для этого воспользуйтесь формой расширенного поиска, где сложные поисковые условия задаются в простой и наглядной форме.



Обратите внимание, что при заполнении нескольких полей Яндекс учтет все заданные вами условия одновременно. Например, указав язык документа как «русский» и введя в поле находятся на сайтеадрес какого-либо сайта, вы в результате поиска получите список документов с заданного сайта, написанных на русском языке.


Поиск на сайте

Есть два варианта:

где угодно - поиск слов идет везде на странице;

в заголовке - поиск ведется в заголовке страницы (title);

Яндекс понимает морфологию слов и ищет по запросу все их формы.

Если вы хотите найти слова в определенной форме, выберите один из вариантов:

в любой форме - в любой форме

точно так, как в запросе - слово будет искаться только в той форме, которую вы указали. Например, если вы задаете в запросе слово день, то выбрав ограничение по форме слова, вы избежите страниц с формами слова девать; в то же время вы упустите страницы, где упоминается дня, дню и т. д.;

Яндекс может отбирать для вас страницы только на определенном языке. Если вам интересны несколько языков, удерживая клавишу Shift, выберите нужные.

Если вы хотите составить ретроспективу определенных событий, вы можете делать это, как добавляя к тексту запроса даты, так и сделав по запросу выборку документов, созданных в определенный период. Вы можете либо выбрать из списка срок давности документа, либо указать точный диапазон дат.

К сожалению, далеко не все серверы выдают правильную дату документа; поэтому, ограничивая документы датами, вы сильно сужаете область поиска.

Яндекс понимает документы, созданные в нескольких форматах: HTML, PDF (Adobe Acrobat Reader), RTF, DOC (Microsoft Word), XLS (Microsoft Excel), PPT (PowerPoint), SWF (Macromedia Flash). Если вам интересны определенные форматы, удерживая клавишу Shift, выберите нужные.

Ограничение по формату полезно, когда вы ищете научные статьи или инструкции — подобные документы редко выкладываются в HTML из-за большого количества формул и графики.




Памятка по использованию языка запросов

Пример

Значение

"К нам на утренний рассол"

Слова идут подряд в точной форме

"Прибыл * посол"

Пропущено слово в цитате

полгорбушки & мосол

Слова в пределах одного предложения

снаряжайся && добудь

Слова в пределах одного документа

глухаря | куропатку | кого-нибудь

Поиск любого из слов

не смогешь << винить

Неранжирующее "и": выражение после оператора не влияет на позицию документа в выдаче

я должон /2 казнить

Расстояние в пределах двух слов в любую сторону

государственное дело &&/3 улавливаешь нить

Расстояние в 3 предложения в любую сторону

нешто я ~~ пойму

Исключение слова пойму из поиска

при моем /+2 уму

Расстояние в пределах двух слов в прямом порядке

чай ~ лаптем

Поиск предложения, где слово чай встречается без словалаптем

щи /(-1 +2) хлебаю

Расстояние от одного слова в обратном порядке до двух слов в прямом

!Соображаю !что !чему

Слова в точной форме с заданным регистром

получается && (+на | !мне)

Скобки формируют группы в сложных запросах

!!политика

Словарная форма слова

title:(в стране)

Поиск по заголовкам документов

url:ptici.narod.ru/ptici/kuropatka.htm

Поиск по URL

беспременно inurl:vojne

Поиск с учетом фрагмента URL

host:lib.ru

Поиск по хосту

rhost:ru.lib.*

Поиск по хосту в обратной записи

site:http://www.lib.ru/PXESY/FILATOW

Поиск по всем поддоменам и страницам заданного сайта

mime:pdf

Поиск по одному типу файлов

lang:en

Поиск с ограничением по языку

domain:ru

Поиск с ограничением по домену

date:200712*

Поиск с ограничением по дате

date:20071215..20080101, date:>20091231

Поиск с ограничением по интервалу дат

cat:11000051

Поиск по рубрике Яндекс.Каталога
  1   2

Похожие:

Лабораторная работа №2 по дисциплине: «Информационно-поисковые системы» iconЛабораторная работа №2 по дисциплине: «Информационно-поисковые системы»
Перешла на сайт поисковой системы Апорт (затем Яндекс и Рамблер). Нашла в каждой системе ссылки на ее описание в целом, на описание...
Лабораторная работа №2 по дисциплине: «Информационно-поисковые системы» iconВ. П. Захаров Информационно-поисковые системы
З-38 Информационно-поисковые системы: Учебно-метод пособие. — Спб., 2005. — 48 с
Лабораторная работа №2 по дисциплине: «Информационно-поисковые системы» iconРеферат Данная дипломная работа посвящена разработке и реализации электронного учебного пособия на основе Web-технологий на примере дисциплины «Документальные информационно-поисковые системы»
Данная дипломная работа посвящена разработке и реализации электронного учебного пособия на основе Web-технологий (на примере дисциплины...
Лабораторная работа №2 по дисциплине: «Информационно-поисковые системы» iconЛандэ Дмитрий Владимирович, Дармохвал
Извлечение сущностей [1] является важным этапом автоматизированной обработки текстов в таких приложениях, как информационно-поисковые...
Лабораторная работа №2 по дисциплине: «Информационно-поисковые системы» iconИнформационные правовые системы
Информационное общество: основные черты. Государство и право в информационном обществе. Информация в правовой системе. Информация...
Лабораторная работа №2 по дисциплине: «Информационно-поисковые системы» iconЛитература к экзамену по дисциплине
Гост 74-96 Информационно-поисковые языки. Термины и определения. – Москва, 1997
Лабораторная работа №2 по дисциплине: «Информационно-поисковые системы» iconРабочая программа Наименование
Информационно-поисковые системы правового назначения в профессиональной деятельности
Лабораторная работа №2 по дисциплине: «Информационно-поисковые системы» iconЛабораторная работа №4 по дисциплине “Системы искусственного интеллекта
Целью лабораторных работ является освоение технологии и методики построения экспертных систем на примере разработанной учебной экспертной...
Лабораторная работа №2 по дисциплине: «Информационно-поисковые системы» iconЛабораторная работа №2 по дисциплине «ТСиСА» на тему: «Структурное моделирование системный анализ структуры сложной системы»
Целью данной работы является изучение программы структурного моделирования систем сдкмс (Системы Декомпозоции Композиции и Модификации...
Лабораторная работа №2 по дисциплине: «Информационно-поисковые системы» iconЛабораторная работа №2 по дисциплине “Системы искусственного интеллекта
Дедуктивные и индуктивные рассуждения. Задачи на поиск доказательства методом резолюций
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница