пользователей: 30398
предметов: 12406
вопросов: 234839
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

25. Поисковые системы. Стратегии поиска, рекомендации по поиску.

Поиско́вая систе́ма — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в интернете. Под поисковой системой обычно подразумевается сайт, на котором размещён интерфейс (фронт-энд) системы. Программной частью поисковой системы является поисковая машина (поисковый движок) — комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы.

Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.

Улучшение поиска — это одна из приоритетных задач современного интернета

Одним из первых инструментов поиска в интернете (до Всемирной паутины) был Archie.

Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор. Первой полнотекстовой поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.

Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность. В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины «Рамблер» и «Апорт».23 сентября 1997 была открыта поисковая машина Яндекс.

В последнее время завоёвывает всё большую популярность практика применения методов кластерного анализа и поиска по метаданным. Из международных машин такого плана наибольшую известность получила «Clusty». В 2005 году на российских просторах при поддержке МГУ запущен поисковик «Нигма», поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака тегов. «Нигма» тоже экспериментировала с визуальной кластеризацией.

Помимо поисковых машин для Всемирной паутины, существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным FTP-серверам и «Veronica» для поиска в Gopher.

Популярные поисковые системы:

Всеязычные: Google (24,9 %); Bing (0,8 %); Yahoo! (0,2 %) и принадлежащие этой компании поисковые машины: Inktomi; AltaVista; Alltheweb

Англоязычные и международные: AskJeeves.

Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском, татарском и др. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами.

·                                Яндекс (61,3 %)

·                                Mail.ru (8,5 %)

·                                Рамблер (1,9 %)

·                                Нигма (0,3 %)

Некоторые из поисковых систем используют внешние алгоритмы поиска. Так, Qip.ru использует поисковый механизм Яндекса, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков.

Необычные поисковые системы:

·                    DuckDuckGo — гибридная поисковая система с политикой конфиденциальности пользователя и его поисковых запросов.

·                    Koogle (с его помощью ортодоксальные иудеи могли найти контент, признанный раввинами удовлетворяющим религиозным требованиям).

·                    Yauba (индийский поиск «для параноиков» — в отличие от привычных поисковиков, за пользователями не следят, а все записи о его действиях удаляются с сервера).

·                    TinEye — поисковая система, специализирующаяся на поиске изображений в Интернете.

·                    Генон — поисковая система, собирающая и создающая контент у себя на сайте.

·                    ImHalal — первый исламский поисковик. Новый поисковик может отличить разрешённые для мусульман (халяльные) результаты поиска от запретных (харамных). Был открыт в 2009 году. Ориентировочно с начала сентября 2011 прекратил функционирование в связи с недостатком финансирования.

 

Стратегии поиска.

Необходимо разобраться, как устроены и по каким принципам работают главные инструменты для поиска информации во Всемирной сети: поисковые системы и каталоги. Прежде всего, надо изучить язык поисковых машин. Для любого человека важно знать, как именно нужно искать, какими приемами пользоваться, какие языки запросов нужно применять в том или ином случае. Существуют способы быстрого и эффективного поиска информации в интернете, которые сэкономят Ваше время и силы.

Для поиска нужно использовать различные поисковые системы. Для каждого случая подойдет свой поисковик. К примеру, наиболее вероятно найти максимум информации об Австралийских командах по регби в австралийской поисковой машине Web Wombat , городском Сиднейском портале, австралийских каталогах. Не стоит увлекаться только крупными поисковиками. Например, российская поисковая система "Яндекс" находит гораздо больше документов на русском, чем "Google". Стоит отметить и то, что разные поисковые системы по одним и тем же поисковым запросам выдают различные лидирующие списки. Если вам нужно найти информацию , связанную с каким-либо регионом, городом полезно будет поискать в местных каталогах, порталах. Адреса таких ресурсов часто выходят одними из первых по названию своего региона или города. Если нет, можно найти по ссылкам с найденных региональных сайтов. Многие неплохие сайты создаются для локального пользования и практически не раскручиваются в поисковых системах.

Некоторую специализированную информацию стоит поискать в специализированных каталогах, просматривая нужные вам тематические разделы. Увидев качественный, подходящий вам по тематике поиска сайт, не спешите покидать его не просмотрев страницы ссылок. Обычно на серьезных сайтах ссылки подобраны хорошо, и вполне возможно вы найдете что-то там.

Глобальная сеть Интернет объединяет миллионы компьютеров и локальных сетей, к ее услугам прибегают сотни миллионов человек. Но сеть Интернет — это лишь средство связи компьютеров и локальных сетей между собой. Для хранения и передачи информации по сети Интернет созданы специальные информационные службы, иногда называемые сервисами Интернет. Этих служб несколько, наиболее часто используемыми являются электронная почта, электронные библиотеки, телеконференции. Но самой популярной службой является World Wide Web (WWW ) — всемирная паутина. Служба WWW имеет свои особенности, благодаря которым она и стала такой популярной. Вся информация в этой службе хранится на WWW-серверах в виде гипертекстовых документов, называемых Web-странщами. Эти документы пишутся на языке HTML (Hyper Text Markup Language ) и могут содержать информацию различного вида: текст, рисунки, аудио и видео, что делает эту информацию чрезвычайно привлекательной для пользователей. Гиперссылки в HTML-документах могут указывать как на другую часть этого документа, так и на другой документ, расположенный на любом сервере сети Интернет. Это позволяет легко отыскивать требуемую информацию, переходя посредством гиперссылок от документа к документу. А вообще-то для поиска информации в сети Интернет используются специальные поисковые серверы.

Рекомендации по поиску

·                    Определитесь с инструментами поиска.

Для обнаружения в текстах фрагментов, аналогичных заданному, используются инструменты линейного поиска информации. К таким инструментам относятся прежде всего общедоступные поисковые машины. Для нахождения данных о связях между объектами используйте системы, позволяющие запрос по связям.

·                    Проверяйте орфографию.

Если поиск не нашел ни одного документа, то вы, возможно, допустили орфографическую ошибку в написании слова. Проверьте правильность написания. Если вы использовали при поиске несколько слов, то посмотрите на количество каждого из слов в найденных документах (перед их списком после фразы "Результат поиска"). Какое-то из слов не встречается ни разу? Скорее всего, его вы и написали неверно.

·                    Используйте синонимы.

Если список найденных страниц слишком мал или не содержит полезных страниц, попробуйте изменить слово. Например, вместо "рефераты" возможно больше подойдет "курсовые работы" или "сочинения". Попробуйте задать для поиска три-четыре слова-синонима сразу. Для этого перечислите их через вертикальную черту (|). Тогда будут найдены страницы, где встречается хотя бы одно из них. Например, вместо "фотографии" попробуйте "фотографии | фото | фотоснимки".

·                    Ищите больше, чем по одному слову.

Слово "психология" или "продукты" дадут при поиске поодиночке большое число бессмысленных ссылок. Добавьте одно или два ключевых слова, связанных с искомой темой. Например, "психология Юнга" или "продажа и покупка продовольствия". Рекомендуем также сужать область вашего вопроса. Если вы интересуетесь автомобилями ВАЗа, то запросы "автомобиль Волга" или "автомобиль ВАЗ" выдадут более подходящие документы, чем "легковые автомобили".

·                    Не пишите большими буквами

Начиная слово с большой буквы, вы не найдете слов, написанных с маленькой буквы, если это слово не первое в предложении. Поэтому не набирайте обычные слова с Большой Буквы, даже если с них начинается ваш вопрос Яндексу. Заглавные буквы в запросе рекомендуется использовать только в именах собственных. Например, "группа Черный кофе", "телепередача Здоровье".

·                    Найти похожие документы

Если один из найденных документов ближе к искомой теме, чем остальные, нажмите на ссылку "найти похожие документы". Ссылка расположена под краткими описаниями найденных документов. Яndex проанализирует страницу и найдёт документы, похожие на тот, что вы указали. Но если эта страница была стерта с сервера, а Яндекс еще не успел удалить ее из базы, то вы получите сообщение "Запрошенный документ не найден".

·                    Используйте знаки "+" и "-"

Чтобы исключить документы, где встречается определенное слово, поставьте перед ним знак минуса. И наоборот, чтобы определенное слово обязательно присутствовало в документе, поставьте перед ним плюс. Обратите внимание, что между словом и знаком плюс-минус не должно быть пробела. Например, если вам нужно описание Парижа, а не предложения многочисленных турагентств, имеет смысл задать такой запрос "путеводитель по парижу -агентство -тур". Плюс стоит использовать в том случае, когда нужно найти так называемые стоп-слова (наиболее частотные слова русского языка, в основном это местоимения, предлоги, частицы). Чтобы найти цитату из Гамлета, надо задать запрос "+быть или +не быть".

·                    использовать язык запросов

С помощью специальных знаков вы сможете сделать запрос более точным. Например, укажите, каких слов не должно быть в документе, или что два слова должны идти подряд, а не просто оба встречаться в документе. (Описание синтаксиса языка запросов)

·                    Искать без морфологии

Вы можете указать Яндексу не перебирать все словоформы слов из запроса при поиске. Например, !лукоморья найдет только страницы, цитирующие строчку из стихотворенияПушкина ("У лукоморья дуб зеленый").

·                    Поиск картинок и фотографий

Яндекс умеет искать не только в тексте документа, но и отыскивать картинки по названию файла или подписи. Для этого перейдите в "расширенный поиск". Для поиска картинки предусмотрены два поля. В поле "Название картинки" вписываются слова для поиска по названиям картинок, обычно появляющихся, когда к картинке подводится курсор. Например, название картинки "Венера" выдаст все страницы с картинками Венеры (всего, что можно понимать под этим словом).

В поле "Подпись к картинке" вписывается название файла, содержащего картинку. Например, запрос dog найдет в Интернете все картинки, в имени файла которых встречается слово "dog". С большой вероятностью эти картинки связаны с собаками.


30.12.2014; 23:48
хиты: 154
рейтинг:0
Точные науки
информатика
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2024. All Rights Reserved. помощь