Поиск информации в Internet

Современные средства поиска можно разделить на две категории: тематический каталог и средства "чистого" поиска. Тематический каталог можно представить как огромный bookmark, находящийся на другом компьютере. Каталог содержит огромное количество ссылок, отсортированных и квалифицированных по тематике. Чистые поисковики ведут поиск введенного словосочетания в Internet, хотя нередко и они имеют собственные каталоги.

Принцип поиска в тематических каталогах очень прост: вместо того, чтобы переходить от одного узла к другому, вы следуете по иерархическому дереву, щелкая мышью на интересующей вас ссылке, приближаясь к тому узлу, который вас интересует. Можно также найти информацию и по "ключевым словам": на основной странице введите ваше поисковое словосочетание в текстовом окне (поиск информации будет произведен только в архивах каталога).

Наиболее популярен на сегодня в Internet тематический каталог Yahoo!, основанный в апреле 1994 года двумя аспирантами - Дэвидом Филом и Джери Янгом из Стенфордского университета.

Каталог Magelan, предлагает список из более чем миллиона узлов, 30000 из которых просмотрены и квалифицированы. В Magelan более детально даны описания и рекомендации для узлов.

Каталог Point является справочником по узлам Internet. Он просматривает 5% лучших сайтов в Internet и содержит ссылки на высококачественные сайты и рецензии на каждую из них.

Кроме того, существуют еще специализированные каталоги. Каталог World Wide Arts Resources создан для тех, кто интересуется искусством. Он содержит базу данных по античному искусству и цифровой каталог произведений более 2000 художников. World Wide Web Servers содержит большой список серверов Web, входящих в образовательную организацию CERN.

Наряду с каталогами в сети существуют сайты, позволяющие осуществлять "чистый" поиск в Internet. В основном эти поисковые средства предназначены для поиска страницы по ключевыми словам. Каждая из систем организует поиск по части документа (заголовок, название и др.), некоторые проходят по собственным ссылкам, содержащимся в страницах.

Чаще всего система состоит из трех частей, соединенных между собой. Первая представляет собой группу программ, названных "сетевыми пауками", которые каждый день просматривают узлы Web, FTP и Gopher. Результаты поиска помещаются во вторую часть - индексную базу данных, в которой содержатся списки адресов с информацией о документе. Последний элемент - сама система поиска. Система перебирает каталог и, в зависимости от вашего критерия поиска, составляет список совпадающих слов и предложений.

Поисковая система Lycos имеет каталог с более 34 миллионами URL. Lycos была разработана в Университете Carnegie-Mellon в Питсбурге. Поисковая система Infoseek выдает не только результаты поиска, но и несколько первых строк из отображаемых страниц.

Предлагаемый America Online поисковик WebCrawler - наиболее простая система поиска. Он проверяет только названия страниц, а не весь текст.

Alta Vista - система поиска, приобретенная корпорацией Digital Equipment. Отличается огромной базой данных и развитым языком запросов.

Существуют также другие поисковые системы. Excite предоставляет поиск среди более чем миллиона документов Web. W3 является интерфейсом для многих различных поисковых систем во всем мире. Deja News Research Service производит поиск по группам телеконференций UseNet, содержит базу данных размером более 4 гигабайта, обновляется каждые два дня. Configurable United Search Interface разработан Мартином Костером и поддерживается фирмой Nexor. Позволяет быстро находить ресурсы сети без повторного набора ключевых слов.

Николай ЛАПУШКО

Версия для печатиВерсия для печати

Номер: 

14 за 1998 год

Рубрика: 

Internet
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!