на тему рефераты Информационно-образоательный портал
Рефераты, курсовые, дипломы, научные работы,
на тему рефераты
на тему рефераты
МЕНЮ|
на тему рефераты
поиск
Работа в Windows
p align="left">Второй этап работы поисковой системы - это выдача накопленной и отобранной, отсортированной и классифицированной информации по запросам пользователей. Рассмотрим эту работу с наиболее популярной поисковой системой Яндекс.

4.2 Поиск по ключевым словам

Наиболее простым и результативным поиском является поиск по ключевым словам. Разберемся с правилами поиска по ключевым словам в поисковой системе Яндекс (рис. 15).

В других системах эти правила могут отличаться, но основные положения будут идентичны. Основной алгоритм поиска следующий: введите ключевые слова в поле запроса (например, расписание поездов), нажмите кнопку Найти. После нажатия кнопки Найти, Поисковая система выведет список ссылок на документы, наиболее точно соответствующие запросу.

Рисунок 15 - Заглавная страница поисковой системы Яндекс

1. Поисковая форма. Главный ее элемент - поле запроса.

2. Статистика поиска: число найденных документов и частота заданных в запросе слов.

3. Рубрики каталога. По нажатию на ссылку происходит переход в соответствующий раздел каталога (выводится только при точном соответствии запросу).

4. Результаты поиска - список найденных ссылок. Для каждого документа выдается следующая информация: заголовок - ссылка на ресурс, краткая аннотации ресурса (страницы), найденные слова, похожие документы, еще с сайта, и, если найденный сайт описан в каталоге, переход в соответствующую рубрику каталога. Кроме этого, информация о размере, дате документа, URL документа.

5. Переход на следующие страницы результата (нужно щелкнуть по номерам страниц). Сортировка по убыванию дат (первоначально список сортируется по ревалентности, то есть по степени соответствия результата запросу).

6. «Колдунщик запросов». Здесь даются советы и предложения по уточнению вашего запроса. Можно сузить поиск по рубрике каталога или по региону.

7. Популярные находки наших пользователей - ссылки на документы, выбранные пользователями по этому запросу (выводится только при точном соответствии).

8. Возможность поискать в других русскоязычных поисковых машинах.

9. Результат поиска в новостных лентах информационных агентств (выводится только при точном соответствии запросу). При высоком соответствии и актуальности эта секция может оказаться над результатами поиска.

10. Ссылки на прочие службы поисковой системе.

11. Результат поиска в энциклопедических статьях (выводится только при точном соответствии запросу).

12. Результат поиска в базе товарных предложений магазинов (выводится только при точном соответствии запросу).

13. Метками R1_R5 на рисунке помечены различные рекламные блоки.

Поскольку в поисковой системе очень много различной информации, то результат поиска по фразе «расписание поездов» очень обширен, для облегчения нахождения нужной информации его следует уточнить, для этого давайте рассмотрим, что для этого предусмотрено в поисковой форме (рис. 16).

Рисунок 16 - Поисковая форма системы Яндекс

Флажок «в найденном» позволяет искать в результатах предыдущего запроса. Например, по запросу расписание поездов система выдала 300 тыс. страниц, мы вводим следующий запрос дальнего следования и устанавливаем флажок «в найденном» - теперь поиск будет вестись среди этих 300 тыс. страниц. Ограничить область поиска можно, щелкнув по ссылкам Каталог, Новости, Маркет, Энциклопедии, Картинки. Щелчок по нужной ссылке заменяет нажатие кнопки Найти. Удобно сужать область поиска для нахождения картинок, например, введите в поисковое поле Путин и щелкните по ссылке Картинки. Для поиска картинки можно также указать желаемый размер картинки от значения «Мелочь» до «Огромные». Ограничивая область поиска, тем самым отсекаем часть заведомо ненужной нам информации. Но часто бывает необходимость вести поиск во всей базе, но для отсечения ненужной информации приходится вводить различные дополнительные сведения. Для этого служит Расширенный поиск. Он включается щелчком по ссылке «расширенный поиск», либо по значку «+» (рис. 17).

Эта страница позволяет Вам более тонко указать условия поиска. Важно то, что найденные в результате документы будут соответствовать сразу всем условиям, поставленным Вами. Давайте разберемся с особенностями ввода условий расширенного поиска.

Рисунок 17 - Страница ввода условий расширенного поиска

1. Поле запроса - введите слова, которые обязательно должны быть в найденных документах, перед словами, которых не должно быть в документах поставьте знак минус (пробел ставьте до знака, но не после), например, - электричка.

2. Расположение слов относительно друг друга - подряд, в одном предложении, не очень далеко (в пределах нескольких строк), на одной странице.

3. Расположение слов на странице - где угодно (в любом месте страницы), в заголовке (заголовок страницы отображается в заголовке окна программы Internet Explorer, то есть в синей полосе), в тексте ссылки (слово является гиперссылкой), также можно указать адрес, куда ведет данная ссылка - таким образом, удобно искать те страницы, которые ссылаются на данную.

4. Форма употребления слов. Поисковая система умеет склонять (спрягать) введенное слово и по умолчанию находит документы, в которых встречаются все формы слова. Если Вы выберите «точно так, как в запросе», то поисковая система будет искать только введенную Вами форму слова. Это удобно при поиске цитат.

5. Язык страницы - укажите язык, на котором должна быть выполнена страница. Язык содержится в невидимом пользователю заголовке страницы. В базу поисковой системы вносятся документы русскоязычного Интернета, находящиеся в доменах su, ru, am, az, by, ge, kg, kz, md, tj, ua, uz, а также зарубежные сайты, представляющие интерес для русскоязычного поиска.

6. Дата страницы - укажите любой из предложенных вариантов, либо введите период (даты начала и конца), в пределах которого должна находиться дата документа.

7. Формат документа. Все Web_страницы имеют формат HTML, то есть выполнены с использованием языка разметки гипертекста, однако, в сети Internet присутствуют документы и другого формата, которые также можно просматривать с помощью программы Internet Explorer: PDF - файл публикации, DOC - документ, созданный в программе Microsoft Word, RTF - форматированный текст (универсальный формат).

8. Страницы содержат ссылку - укажите URL этой ссылки.

9. Страницы находятся на сайте - укажите доменное имя сайта.

10. Страницы похожи на страницу - укажите URL страницы-образца.

В нижней желтой панели «Итого:» полностью сформулирован запрос. Поскольку мы ищем «свежее» расписание движения поездов, то можно воспользоваться условием Дата страницы.

4.3 Язык запросов

Синтаксис языка запросов. В поисковой системе существует специальный язык запросов, использовать который более сложно, чем форму расширенного поиска, но при его использовании можно получить наилучший результат. Поисковый запрос вводится в поисковое поле, он может содержать ключевые слова и специальные символы, позволяющие установить взаимосвязи между этими словами и ввести дополнительные параметры. Большинство этих символов представлено в табл. 1.

Таблица 1 - Синтаксис языка запросов системы Яндекс

Символ¨Назначение

Пример¨¨«»

поиск фразы

«красная шапочка»
(эквивалентно красная /+1 шапочка)

+

обязательное наличие слова в найденном документе

+быть или +не быть

~~ или -

не должно быть слова в пределах документа (И НЕ)

путеводитель по парижу ~~ (агентство | тур)

~

не должно быть слова в пределах предложения (И НЕ)

банки ~ закон

!

искать только указанную форму слова

! Путин

пробел или &

логическое И (в пределах предложения)

фабрика звезд

&&

логическое И (в пределах документа)

музыка && (фабрика звезд)

|

логическое ИЛИ

рисунок | картинка | фото | коллаж

/(n m)

расстояние между словами (-назад +вперед)

поставщики /2 кофе
музыкальное /(-2 4) образование
вакансии ~ /+1 студентов

&&/(n m)

расстояние в предложениях (-назад +вперед)

банк && /1 налоги

()

группировка слов

(технология | изготовление) (сыра | творога)

Основные положения языка запросов.

1. Если ключевые слова являются устойчивым словосочетанием или единой фразой, то заключите их в кавычки.

2. Если слова не объединены кавычками, то каждое слово будет само по себе и перед каждым их них можно поставить знак плюс «+», если слово обязательно должно быть в найденных документах, минус «-», если слово не должно быть в найденных документах (пробел ставится перед знаком, но не после). Если перед словом поставить знак ~ (тильда), то этого слова не должно быть в пределах предложения в совокупности с рядом стоящим в запросе словом. По умолчанию будут найдены и те документы, которые удовлетворяют хотя бы одному из ключевых слов. Такие ссылки будут иметь низкую ревалентность и будут находиться в конце результатов запроса.

3. Независимо от того, в какой форме вы употребили слово в запросе, поисковая система учитывает все формы этого слова по правилам русского языка. Чтобы этого не происходило, поставьте знак восклицания перед неизменяемым словом.

4. Все слова, написанные через пробел или знак & (логическое И) должны одновременно находиться в найденных документах в пределах предложения. Все слова, написанные через && должны одновременно находиться в найденных документах, но расстояние между ними не оговаривается.

5. Слова, написанные через символ | (логическое ИЛИ) являются заменяющими друг друга (синонимами), и будут найдены документы, удовлетворяющие хотя бы одному из этих слов.

6. Можно указать расстояние между словами. Если пронумеровать слова в предложении, то расстояние между словами - это разность номеров слов. Например, если между двумя словами может находиться только одно слово, то расстояние между ними равно 2 (3 минус 1). Число указывается после знака /, например региональный /2 центр. В этом случае будут найдены документы, в которых эти слова находятся либо вместе, либо между ними есть еще одно слово. Запись /2 эквивалентна записи /(-2 +2), в такой форме можно указать максимальное и минимальное количество слов, например, от 3 до 5 записывается /(3 5). Минус и плюс указывают на порядок слов: минус - обратный порядок. Если перед символом / указать &&, то расстояние будет вычисляться в предложениях.

7. Для группировки отдельных частей запроса используйте круглые скобки.

Поиск в зонах и элементах web_страницы. Web_страница состоит из определенных зон и элементов. Соответственно можно осуществлять поиск в зонах и в элементах. Например, для поиска в заголовке страницы (заголовок отображается в заголовке окна обозревателя) указывают: $title (выражение), поиск в тексте ссылок аналогичен (см. следующую таблицу), а общий синтаксис таков: $имя_зоны (выражение)

Для поиска в элементах используется синтаксис: #имя_элемента=(выражение)

Элементы отличаются от зон тем, что в большинстве своем не видны пользователю, просматривающему страницу. Так, например, ключевые слова указываются в невидимом заголовке Web_страницы и не выводятся в обозревателе. Их можно увидеть только выполнив Вид ® В виде HTML. Большинство документов имеют описание (abstract), которое также не выводится на страницу. Подписи рисунков видны только в том случае, если загрузка рисунков отключена, либо если навести мышь на рисунок, то подпись появится в виде подсказки.

Таблица 2 - Синтаксис поиска в элементах и зонах

Синтаксис

Назначение

Пример

$title (выражение)

поиск в заголовке

$title (Яндекс)

$anchor (выражение)

поиск в тексте ссылок

$anchor (Яндекс | Апорт)

#keywords=(выражение)

поиск в ключевых словах

#keywords=(поисковая система)

#abstract=(выражение)

поиск в описании

#abstract=(искалка | поиск)

#image= «значение»

поиск файла изображения

#image= «tort*»

#hint=(выражение)

поиск в подписях к изображениям

#hint=(lenin | ленин)

#url= «значение»

поиск на заданном сайте (странице)

#url= «www.comptek.ru*»

#link= «значение»

поиск ссылок на заданный URL

#link= «www.yandex.ru*»

#mime= «значение»

поиск в документах данного (pdf или rtf) типа

#mime= «pdf»

Сортировка результатов запроса. После того, как поисковая система выберет страницы, удовлетворяющие запросу, она сортирует ссылки на эти страницы в порядке убывания их ревалентности. Ревалентность - это степень соответствия содержания документа поисковому запросу. Релевантность документа зависит от ряда факторов, в том числе от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т.д.

Можно повлиять на порядок сортировки, используя операторы веса и уточнения запроса. Вес указывается для того, чтобы увеличить ревалентность документов, содержащих слово или выражение, вес которого указан. Чем больший вес указан у слова (или выражения), тем выше ревалентность документов его содержащих.

Синтаксис: слово: число или (поисковое_выражение):число Уточняющее слово или выражение применяется для того, чтобы увеличить релеватность документов, их cодержащих.

Синтаксис: < - слово или < -точняющее_выражение) Кроме сортировки по ревалентности можно выбрать сортировку по дате документов, щелкнув по соответствующей ссылке.

4.4 Поиск по каталогам

Когда сетевой робот поисковой системы сканирует Internet и автоматически вносит описания и адреса страниц в свой поисковый индекс, то вместе с полезными и адекватными ссылками в базе данных оказывается много поискового
спама. Это и некоторые другие обстоятельства вынуждают создателей поисковых систем кроме автоматического индекса вести также каталоги ресурсов, составленные вручную. Каталог позволяет классифицировать ресурсы и сгруппировать их по тематике. Тематическое дерево каталога Яндекса сделано максимально простым. На первом уровне в нем всего восемь тем: Бизнес и экономика, Общество и политика, Наука и образование, Компьютеры и связь, Справки, Дом и семья, Развлечения и отдых, Культура и искусство. Если щелкнуть по названию темы, то откроются подтемы (рубрики). При дальнейшем движении вглубь будут открываться следующие уровни (подрубрики), и в итоге откроется список ресурсов (сайтов) выбранной тематики. Число уровней в глубину не превышает 4_х.

Ресурсы в системе четко структурированы по тематике, однако, помимо темы, в каталоге имеется ряд дополнительных признаков (фасет), позволяющих уточнить характер ресурсов, которые пользователь хочет увидеть в тематических категориях. Эти нетематические признаки характеризуют ресурсы по региону, сектору экономики, степени достоверности (источнику) информации, ее потенциальной аудитории (адресату информации), жанру (художественная литература, научно-техническая литература, и т.д.), цели (предложение товаров и услуг, интернет-представительство) и т.д.

Сайты в рубриках расположены по убыванию их тематического индекса цитирования (тИЦ). Тематический индекс цитирования - это показатель, который показывает количество ссылок на данный ресурс с других ресурсов. При расчете этого индекса ссылкам придается разный «вес» (значимость) в зависимости от авторитетности ссылающегося сайта. Таким образом, в первых позициях каталога будут именно признанные ресурсы, ресурсы - источники информации, ресурсы, которые цитируют, на которые ссылаются.

В каталоге можно также осуществлять поиск по ключевым словам, как и во всем поисковом индексе, для этого необходимо после ввода ключевых слов в поисковой форме щелкнуть по ссылке Каталог.

Поиск в каталоге ведется по текстам заголовков и описаний, составленных редакторами поисковой системы. Поскольку заголовки отражают основной профиль сайта, сайты, найденные по заголовку, стоят в результатах поиска выше, чем сайты, найденные по описанию.

Использование знаков «+» и» -». Чтобы исключить документы, где встречается определенное слово, поставьте перед ним знак минуса. И наоборот, чтобы определенное слово обязательно присутствовало в документе, поставьте перед ним плюс. Обратите внимание, что между словом и знаком плюс-минус не должно быть пробела. Например, если вам нужно описание Парижа, а не предложения многочисленных турагентств, имеет смысл задать такой запрос «путеводитель по парижу - агентство - тур». Плюс стоит использовать в том случае, когда нужно найти так называемые стоп-слова (наиболее частотные слова русского языка, в основном это местоимения, предлоги, частицы). Чтобы найти цитату из Гамлета, надо задать запрос «+быть или +не быть».

Если использование поисковых серверов не приводит к нужному результату, целесообразно использовать сервера организаций, работающих в данной области.

Список использованных источников

1. Microsoft Excel: шаг за шагом / Коллектив авторов. - М.: Издательство Эком, 2003. - 472 с.

2. Microsoft Office 2003 / пер. с англ. Р. Джекобсон. - М.: Русская редакция, 2003. - 448 с.

3. Батищев, П.С. Основы Интернет: электронный учебник - 2004. - [Электронный ресурс]. - Режим доступа: http://psbatishev.narod.ru/internet, свободный

4. Интернет энциклопедия / Под ред. Л. Мелиховой. - СПб.: Питер, 2000. - 528 с.

5. Информатика. Базовый курс / под ред. С.В. Симоновича. - СПб.: Питер, 2001. - 640 с.

6. Калугина, О.Б. Основы компьютерной грамотности / О.Б. Калугина, В.С. Люцарев. - М.: Интернет-университет, 2005. - 152 с.

7. Крейнак, Д. Microsoft Office XP / Д.Крейнак. - М.: АСТ, 2004. - 383 с.

8. Левкович, О.А. Работа с текстовой информацией. Microsoft Office Word 2003 / О.А. Левкович, Е.С. Шелкоплясов, Т.Н. Шелкоплясова. - М.: ТетраСистемс, 2006. - 528 с.

9. Леонтьев, В.П. Новейшая энциклопедия персонального компьютера / В.П. Леонтьев. - М.: Олма-Пресс, 2001. - 847 с.

10. Острейковский, В.А. Информатика: учебник для вузов / В.А. Острейковский. - М.: Высшая школа, 2000. - 511 с.

11. Струнин, А В. Компьютер для тех, кому некогда. - М.: Издательство ТРИУМФ, 2001 - 384 с.

12. Хэлворсон, М.Х. Эффективная работа с Microsoft Office / М.Х. Хэлворсон. - СПб.: Питер, 2001. - 1232 с.

Страницы: 1, 2, 3, 4



© 2003-2013
Рефераты бесплатно, курсовые, рефераты биология, большая бибилиотека рефератов, дипломы, научные работы, рефераты право, рефераты, рефераты скачать, рефераты литература, курсовые работы, реферат, доклады, рефераты медицина, рефераты на тему, сочинения, реферат бесплатно, рефераты авиация, рефераты психология, рефераты математика, рефераты кулинария, рефераты логистика, рефераты анатомия, рефераты маркетинг, рефераты релиния, рефераты социология, рефераты менеджемент.