Анализ Internet-ресурсов по вопросам
Рефераты >> Программирование и компьютеры >> Анализ Internet-ресурсов по вопросам

Как и большинство систем, Lycos дает возможность применять простой запрос и более изощренный метод поиска. В простом запросе в качестве поискового критерия вводится предложение на естественном языке, после чего Lycos производит нормализацию запроса, удаляя из него так называемые stop-слова, и только после этого приступает к его выполнению. Почти сразу выдается информация о количестве документов на каждое слово, а позже и список ссылок на формально релевантные документы. В списке против каждого документа указывается его мера близости запросу, количество слов из запроса, попавших в документ, и оценочная мера близости, которая может быть больше или меньше формально вычисленной. Пока нельзя вводить логические операторы в строке вместе с терминами, но использовать логику через систему меню Lycos позволяет. Такая возможность применяется для построения расширенной формы запроса, предназначенной для искушенных пользователей, уже научившихся работать с этим механизмом. Таким образом, видно, что Lycos относится к системе с языком запросов типа "Like this", но намечается его расширение и на другие способы организации поисковых предписаний.

4. Yahoo!

http://www.yahoo.com/

Данная система появилась в Сети одной из первых, и сегодня Yahoo сотрудничает со многими производителями средств информационного поиска, а на различных ее серверах используется различное программное обеспечение. Язык Yahoo достаточно прост: все слова следует вводить через пробел, они соединяются связкой AND либо OR. При выдаче не указывается степень соответствия документа запросу, а только подчеркиваются слова из запроса, которые встретились в документе. При этом не производится нормализация лексики и не проводится анализ на "общие" слова. Хорошие результаты поиска получаются только тогда, когда пользователь знает, что в базе данных Yahoo информация есть наверняка. Ранжирование производится по числу терминов запроса в документе. Yahoo относится к классу простых традиционных систем с ограниченными возможностями поиска.

5. Рамблер

http://www.rambler.ru/

Поисковая система Рамблер начала свое существование с 1996 года. На сегодняшний день она является одной из самых популярных в РуНете, уступая лишь Яндексу (по популярности). По оценкам SpyLog на Рамблер приходится 20-25% от всех поисковых запросов РуНета. Поисковая система Рамблер при поиске учитывает морфологию русского языка, что дает больше возможностей для эффективного поиска информации. Реализована также система так называемых "перевязок", которая позволяет выдавать в результатах поиска не только страницы содержащие запрос, но и слова, которые являются синонимами запроса. Еще одной функцией "перевязок", думаю более значимой, является выдача контекстной рекламы не только по конкретному запросу, но и по запросам, которые тесно связаны с исходным, это позволяет перекрыть большее количество целевой аудитроии.

Новый поиск - новые возможности

С лета 2000 года у нас в Рамблере кипела работа: большая команда программистов и лингвистов создавала новую поисковую машину. (Старый, заслуженный, любимый очень многими в Сети поиск Рамблера был запущен еще в 1996 году и несколько "отстал от жизни".) И вот результат:

Рамблер стал искать значительно лучше!

Увеличилась точность поиска

Рамблер находит именно то, что Вам нужно, результаты поиска максимально соответствуют запросу. Вам не придется искать нужные документы среди множества ссылок.

Результаты поиска стали удобнее

Важно не только найти нужные страницы, но и расположить их в удобном для Вас порядке. Для этого сделано очень многое. Например, новая поисковая машина учитывает место слов в тексте и расстояние между ними.

Рамблер объединяет документы по сайтам

Теперь по соответствию запросу оцениваются не только отдельные документы, но и целые сайты. Результаты поиска стали более "емкими" - благодаря объединению по сайтам за одним ответом на Ваш запрос могут стоять десятки найденных документов.

Увеличилась полнота и, главное, актуальность поиска

Робот Рамблера, индексирующий российский Интернет, обходит его теперь значительно чаще. Новые страницы быстрее попадают в результаты поиска, "мертвые" - уходят.

При поиске учитывается морфология

Поисковая машина понимает, что "идет" и "шёл" - формы одного и того же слова. То же и с английскими словами - например, "go" и "went". И даже совсем новые, незнакомые ей слова машина умеет склонять и спрягать: поищите, например, "виндозные сидюки".

Рамблер находит самые свежие новости

На популярные новостные сайты (Рамблер-Медиа, Лента.ру, Газета.ру, НТВ и другие) робот Рамблера заходит по несколько раз в сутки. Переключившись на поиск "по новостям", Вы найдете информацию о последних событиях почти сразу после ее появления на сайтах агентств и онлайновых СМИ.

Скорость обработки запроса не ухудшилась

Поисковая машина Рамблера теперь выполняет гораздо более сложную работу, нагрузка на нее значительно возросла. И все-таки скорость обработки запросов не только не снизилась, но и несколько выросла. Рамблер по-прежнему остается самой быстрой поисковой системой!

Рамблер-Поиск - эффективная рекламная площадка

Новая поисковая машина сама определяет тематику запросов (например, запрос, в котором упомянут "амидопирин" или "клиника", автоматически распознается как "медицинский").

6. TELA

http://tela.dux.ru/

Поисковая система TELA, созданная петербургским Интернет-провайдером DUX, ориентирована на поиск русскоязычных страниц в WWW, а также англоязычных страниц на российских серверах. Сбором страниц занимается подсистема-робот, сделанная на базе робота MOM spider, а поисковая часть сервера TELA сделана на базе системы поиска freeWAIS-sf с использованием русской версии системы поддержки морфологии языка ILIAS. Возможно использование метасимволов, задание слов в любой словоформе, поиск документов, содержащих все ключевые слова или лишь одно из них. Проиндексированные документы полностью хранятся на поисковом сервере и могут быть просмотрены, даже если сервер, с которого они получены, недоступен или документ удален.

Система TELA имеет часть, предназначенную для поиска по ключевым словам в русскоязычных телеконференциях: иерархии relcom, fido7, медицинские телеконференции medlux, петербургские телеконференции группы spb и др. Предусмотрен отдельный поиск в каждой из коммерческих телеконференций "Релком" (группы relcom.commerce.*).

7. WAIS

WAIS является одной из наиболее изощренных поисковых систем Internet. В ней не реализованы лишь поиск по нечетким множествам и вероятностный поиск. В отличие от многих поисковых машин, система позволяет строить не только вложенные булевые запросы, считать формальную релевантность по различным мерам близости, взвешивать термины запроса и документа, но и осуществлять коррекцию запроса по релевантности. Система также позволяет использовать усечения терминов, разбиение документов на поля и ведение распределенных индексов. Не случайно именно эта система была выбрана в качестве основной поисковой машины для реализации энциклопедии "Британика" на Internet.


Страница: