Яндекс - основные сведения по популярному индексу
Рефераты >> Коммуникации и связь >> Яндекс - основные сведения по популярному индексу

Если порядок слов и расстояние точно известны, можно воспользоваться пунктуацией '/+n'. Так, например, задается поиск слов, стоящих подряд.

Запрос 'синяя /+1 борода' означает, что слово 'борода' должно следовать непосредственно за словом 'синяя'. (К тому же результату приведет запрос "синяя борода")

В общем виде ограничение по расстоянию задается при помощи пунктуации вида '/(n m)', где 'n' минимальное, а 'm' максимально допустимое расстояние. Отсюда следует, что запись '/n' эквивалентна '/(-n +n)', а запись '/+n' эквивалентна '/(+n +n)'.

Запрос 'музыкальное /(-2 4) образование' означает, что 'музыкальное' должна находиться от 'образование' в интервале расстояний от 2 слов слева до 4 слов справа.

Практически все знаки можно комбинировать с ограничением расстояния.

Например, результатом поиска по запросу 'вакансии ~ /+1 студентов' будут документы, содержащие слово 'вакансии', причем в этих документах слово 'студентов' не следует непосредственно за словом 'вакансии'.

Когда знаки ограничения по расстоянию стоят после двойных операторов, то употребленные там числа - это расстояние не в словах, а в предложениях. Расстояние в абзацах определяется аналогично расстоянию в словах.

Запрос 'банк && /1 налоги' означает, что слово 'налоги' должно находиться в том же самом, либо в соседнем со словом 'банк' предложении.

Скобки

Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки.

Например, запрос '(история | технология | изготовление) /+1 (сыра | творога)' задает поиск документов, которые содержат любую из фраз 'история сыра', 'технология творога', 'изготовление сыра', 'история творога'.

Поиск в зонах

Можно искать информацию в "зонах" - заголовках (имя "зоны": Title), ссылках (имя "зоны": Anchor) и адресе (имя "зоны": Address).

Синтаксис: $имя_зоны (поисковое выражение).

Запрос '$title CompTek' ищет в заголовках документов слово 'CompTek'.

Запрос '$anchor (CompTek | Dialogic)' находит документы, в cсылках внутри которых есть одно из слов 'CompTek' или 'Dialogic'.

Поиск в определенных элементах

Можно ограничить поиск информации списком серверов или наоборот исключить сервера из поиска (url). Можно также искать документы, содержащие ссылки на определенные URL (link), и файлы картинок (image). Если вы хотите работать не с конкретным URL (image), а со всеми, начинающимися с данной последовательности символов, используйте "*".

Синтаксис: #имя_элемента="имя_файла (URL)".

По запросу 'CompTek ~~ #url="www.comptek.ru*"' будут искаться упоминания компании 'CompTek' везде, кроме ее собственного сервера (www.comptek.ru). А запрос '#link="www.comptek.ru*"' покажет все документы, которые сослались на сервер компании.

Запрос ' #image="tort*"' даст ссылки на документы с изображениями тортов (хотя, возможно, найдется и портрет черепахи Тортиллы).

Можно также искать по ключевым словам (keywords), аннотациям (abstract) и подписям под изображениями (hint).

Синтаксис: #имя_элемента=(поисковое выражение).

Запросу '#keywords=(поисковая система) | #abstract=(поисковая система)' будут искаться все страницы, в meta тегах которых есть эти слова.

По запросу '#hint=(кино)' будут найдены документы, содержащие изображение с такой подписью.

Ранжирование результата поиска

При поиске для каждого найденного документа Яндекс вычисляет величину релевантности (соответствия) содержания этого документа поисковому запросу. Список найденных документов перед выдачей пользователю сортируется по этой величине в порядке убывания. Релевантность документа зависит от ряда факторов, в том числе от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т.д.

Пользователь может повлиять на порядок сортировки, используя операторы веса и уточнения запроса.

Задание веса слова или выражения применяется для того, чтобы увеличить релевантность документов, cодержащих "взвешенное" выражение.

Синтаксис: слово:число или (поисковое_выражение):число

По запросу 'поисковые механизмы:5' будут найдены те же документы, что и по запросу 'поисковые механизмы'. Разница состоит в том, что наверху списка найденного окажутся документы, где чаще встречается именно слово 'механизмы'.

Запрос 'поисковые (механизмы | машины | аппараты):5 ' равнозначен запросу 'поисковые (механизмы:5 | машины:5 | аппараты:5)'.

Задание уточняющего слова или выражения применяется для того, чтобы увеличить релеватность документов, cодержащих уточняющее выражение.

Синтаксис: <- слово или <- (уточняющее_выражение)

По запросу 'компьютер <- телефон' будут найдены все документы, содержащие слово 'компьютер', при этом первыми будут выданы документы, содержащие слово 'телефон'.

Если ни в одном документе со словом 'компьютер' нет слова 'телефон', результат запроса будет эквивалентен запросу 'компьютер'.

12. Добавление страниц

Яндекс ежедневно просматривает сотни тысяч Web-страниц в поисках изменений или новых ссылок. Поэтому вполне возможно, что ваша страница уже находится в базе. В поисковую машину Яндекс вносятся только русскоязычные сайты.

ВНИМАНИЕ! Если при попытке добавить свой сайт вы получили сообщение: запрещен к индексированию, это могло произойти из-за того, что ваш сайт является «зеркалом» другого сайта. Например, вы пытаетесь добавить сайт в домене четвертого уровня (скажем, www.gazeta.narod.ru), который является «зеркалом» этого же сайта в домене третьего уровня (без префикса www, то есть gazeta.narod.ru). В этом случае добавьте, пожалуйста, сайт третьего уровня.

Внесите свой сайт в Яндекс

Советы по добавлению URL в поисковую машину Яндекс

Добавляйте верхнюю страницу вашего сервера — остальные Яндекс найдет сам по ссылкам.

ВНИМАНИЕ! Настоятельно рекомендуем НЕ добавлять недоработанные, «пустые» страницы (без содержания, без дальнейших ссылок, under construction). Страницы такого вида имеют низкий приоритет в очереди робота, следовательно, придется ждать, когда робот наконец посетит этот адрес снова и узнает, что там наконец-то появилось наполнение. Таким образом, добавление подобной страницы не ускорит, а замедлит появление вашего содержания в нашей базе.

Добавляйте истинный адрес вашей страницы, а не псевдоним (например, http://chat.ru/~verylongname вместо перенаправляющего адреса http://v.da.ru) — Яндекс все равно «отловит» redirect.

Создайте файл robots.txt, если вы хотите закрыть какие-то разделы от индексирования (например, из соображений секретности).

Смотрите на ответ, который выдает вам программа AddURL. Если вы ошиблись (например, в адресе, и такой страницы не существует), то AddURL сообщит вам об этом.

Конфигурируйте сервер так, чтобы он корректно выдавал даты файлов и кодировки русского языка.

Если ваша страница была проиндексирована, а затем вы изменили ее содержание или удалили ее, не беспокойтесь — робот автоматически обойдет ее снова и обновит индекс (в случае, если страница больше не существует, она будет исключена из базы и, следовательно, из поиска).


Страница: