Поиск
 
Поисковая система - это система, которая занимается сбором информации о ресурсах Internet и ее систематизацией для того, чтобы упростить пользователю доступ к интересующей его информации. Информационно-поисковые системы классифицируют прежде всего по особенностям функционирования на
  • каталоги(directories),
  • поисковые машины(search engines);
также по охвату информационных ресурсов на
  • глобальные,
  • локальные;
по типу и тематике информационных ресурсов на
  • универсальные;
  • специализированные.
Остановимся подробней на классификации первого типа.

Каталоги — это, по сути, большие электронные энциклопедии, тематически структурированные и тем самым обеспечивающие возможность сужать круг поиска. При вызове в своем браузере каталога на экран выводится общий список тем, озаглавленных, например, следующим образом: «Наука и образование», «Люди и общество», «Компьютеры и Интернет», «Бизнес и коммерция», «Средства массовой информации»...

Здесь, вместо того чтобы сразу загрузить в строку поиска слово "мама", мы движемся вглубь, например, по следующей схеме: люди и общество — здравоохранение — советы молодым мамам. И только там либо "перелистываем" собранные по данной теме сайты, либо вводим искомое определение в строку поиска в данном разделе. Существуют и тематические каталоги, коллекционирующие сайты лишь определенной направленности.

Поисковые же машины определяют всю паутину Сети как огромную базу данных. Здесь при вводе какого-либо термина программа выдает перечень документов, содержащих искомое определение. И чем опытнее и умнее сёрфер (специалист по поиску в Сети), чем конкретнее вводимое им определение (лучше, если это будет словосочетание), тем меньший объем результатов или перечень сайтов, содержащих введенные слова, выдаст машина. Круг сузится, но уже посредством включения в работу более сложных мыслительных процессов, нежели выбор тем и разделов.

На первый взгляд работать с каталогами значительно проще. Но здесь есть одно существенное «но». Большинство каталогов создаются путем добавления авторами своих сайтов к уже существующему списку вручную. А как быть, если крайне важная для вас информация лежит на сайте, автор которого пока не успел или просто не захотел вносить его в базу открытого вами каталога?..
Потому-то поисковые машины более популярны среди пользователей, хотя и требуют некоторых навыков. Ведь, как мы уже поняли, ввод единичного термина в поисковую строку успеха не приносит.

Поисковые машины — огромные склады слов, постоянно пополняемые путем периодического автоматического сканирования виртуального информационного пространства и индексирования его содержания. Тут тоже существуют свои, изобретенные программистами, законы виртуальной логистики. С помощью хитроумных программ типа «пауков» и «червей» поисковые системы с разной периодичностью «ворошат» содержимое WWW-паутины, «отмечая галочкой» старые запасы, занося в память свежую «добычу» и удаляя уже не существующие или вышедшие из употребления данные.

Все это добро с указанием ссылок на «полки» — хост-серверы, сайты, отдельные страницы, строки и предложения бережно хранится в виде огромных индекс-файлов, к которым вы и обращаетесь при каждом запросе.

Чтобы определить, хороша поисковая машина или нет, нужно ее хорошенько «прощупать». Основными критериями при этом, на мой взгляд, можно считать,
  • охват лексической базы (все ли слова запоминаются системой, или только названия, заголовки, составные первых двух страниц текста, или вообще лишь ключевые термины, запрограммированные создателями сайтов).
  • как часто система перепроверяет содержимое сети.
  • "понимает" ли поисковая машина морфологические особенности.
  • практичность самого интерфейса, возможность использовать дополнительные функции.

Вообще говоря, деление поисковых средств на каталоги и поисковые машины весьма условное. Ведь фактически все веб-справочники снабжены поисковым модулем той или иной конфигурации, в то же время многие поисковые системы оборудованы справочными разделами.

Различия в мощности и чисто поисковых принципах разных систем порой приводят к тому, что разные поисковые средства дают разные, порой противоречащие друг другу ответы на один и тот же запрос. Этим воспользовались разработчики поисковых орудий особого рода - так называемых метапоисковых машин. К ним, например, относится "Meta Crawler" (http://www.metacrawler.com/), главное достоинство которого заключаются в умении рассылать вводимые в него запросы по другим системам, а затем суммировать результаты. Таким образом, пользователь, вводя поисковое предписание в MetaCrawler, фактически одновременно обращается к десятку различных поисковых систем. Этим гарантируется "объективность" полученных результатов, однако, учитывая уже упоминавшиеся различия в подходах к обработке терминов разными системами, результат может оказаться не всегда релевантным запросу.



Используемая литература:
  • Краснянский М.Н., Кузьмина Н.В., Лагутин А.В., Орлова Л.П., Пунина Т.Г. "Основы работы в Интернет" (http://www.tambov.fio.ru)
  • Андрей Кобяков. "Приступим к работе?"(http://www.mediasprut.ru)

Если у вас возникли какие-то вопросы конкретно по нашим работам, обращайтесь сюда mailto..

Счетчик посетителей Тамбовский поисковый сервер
Copyright © 2004-2006, ТамбовЦНИТ, сектор РИТ ДО. All right reserved.
webmaster©des.tstu.ru