Поисковые системы - реферат

1. Введение

Главные протоколы, применяемые в Веб (в предстоящем также Сеть), не обеспечены достаточными встроенными функциями поиска, не говоря уже о миллионах серверах, находящихся в ней. Протокол HTTP, применяемый в Веб, неплох только в отношении навигации, которая рассматривается только как средство просмотра страничек, но не их поиска. То же самое относится Поисковые системы - реферат и к протоколу FTP, который даже более примитивен, чем HTTP. Из-за резвого роста инфы, доступной в Сети, навигационные способы просмотра стремительно добиваются предела их многофункциональных способностей, не говоря уже о пределе их эффективности. Не указывая определенных цифр, можно сказать, что подходящую информацию уже не представляется вероятным получить Поисковые системы - реферат сходу, потому что в Сети на данный момент находятся млрд документов и они все в распоряжении юзеров Веб, к тому же сейчас их количество увеличивается согласно экспоненциальной зависимости. Количество конфигураций, которым эта информация предана, громадно и, самое главное, они произошли за очень маленький период времени. Основная неувязка состоит в том, что Поисковые системы - реферат единой полной многофункциональной системы обновления и занесения подобного объема инфы, сразу доступного всем юзерам Веб в мире, никогда не было. Для того, чтоб структурировать информацию, скопленную в сети Веб, и обеспечить ее юзеров комфортными средствами поиска нужных им данных, были сделаны поисковые машины.

2. Поисковые машины

Поисковые cистемы обычно Поисковые системы - реферат состоят из 3-х компонент:

2.1. Как работают механизмы поиска

Cредства поиска и структурирования, время от времени именуемые поисковыми механизмами, употребляются Поисковые системы - реферат для того, чтоб посодействовать людям отыскать информацию, в какой они нуждаются. Cредства поиска типа агентов, пауков, кроулеров и ботов употребляются для сбора инфы о документах, находящихся в Сети Веб. Это особые программки, которые занимаются поиском страничек в Сети, извлекают гипертекстовые ссылки на этих страничках и автоматом индексируют информацию Поисковые системы - реферат, которую они находят для построения базы данных. Каждый поисковый механизм имеет свой набор правил, определяющих, как cобирать документы. Некие следуют за каждой ссылкой на каждой отысканной страничке и потом, в свою очередь, изучат каждую ссылку на каждой из новых страничек, и т.д.. Некие игнорируют ссылки, которые ведут к графическим Поисковые системы - реферат и звуковым файлам, файлам мультипликации; другие игнорируют cсылки к ресурсам типа баз данных WAIS; другие проинструктирова-ны, что необходимо просматривать сначала более пользующиеся популярностью странички.

Агенты извлекают и индексируют разные виды инфы. Некие, к примеру, индексируют каждое отдельное слово во встречающемся документе, в то время как другие индексируют только более принципиальных 100 слов в каждом, индексируют размер документа и число Поисковые системы - реферат слов в нем, заглавие, заглавия и подзаголовки и т.д.. Вид построенного индекса определяет, какой поиск может быть изготовлен поисковым механизмом и как приобретенная информация будет интерпретирована.

Агенты могут также передвигаться по Веб и отыскивать информацию, после этого помещать ее в базу данных поискового механизма. Админы поисковых машин Поисковые системы - реферат могут найти, какие веб-сайты либо типы веб-сайтов агенты должны посетить и проиндексировать. Проиндексированная информация отсылается базе данных поискового механизма так же, как было описано выше.

Люди могут помещать информацию прямо в индекс, заполняя необыкновенную форму для того раздела, в который они желали бы поместить свою информацию. Эти данные передаются базе Поисковые системы - реферат данных.

Когда кто-нибудь желает отыскать информацию, доступную в Веб, он посещает страничку поисковой машины и заполняет форму, детализирующую информацию, которая ему нужна. Тут могут употребляться ключевики, даты и другие аспекты. Аспекты в форме поиска должны соответствовать аспектам, применяемым агентами при индексации инфы, которую они отыскали при перемещении Поисковые системы - реферат по Сети.

База данных ищет предмет запроса, основанный на инфы, обозначенной в заполненной форме, и выводит надлежащие документы, приготовленные базой данных. Чтоб найти порядок, в каком перечень документов будет показан, база данных применяет метод ранжирования. В безупречном случае, документы, более релевантные пользовательскому запросу будут помещены первыми в перечне Поисковые системы - реферат. Разные поисковые машины употребляют разные методы ранжирования, но главные принципы определения релевантности последующие:

1. Количество слов запроса в текстовом содержимом документа (т.е. в html-коде).

2. Тэги, в каких эти слова размещаются.

3. Положение разыскиваемых слов в документе.

4. Удельный вес слов, относительно которых определяется релевантность, в полном количестве слов документа.

База данных Поисковые системы - реферат выводит ранжированный схожим образом перечень документов с HTML и возвращает его человеку, сделавшему запрос. Разные поисковые механизмы также выбирают разные методы показа приобретенного перечня - некие демонстрируют только ссылки; другие выводят cсылки c первыми несколькими предложениями, содержащимися в документе либо заголовок документа совместно с ccылкой.

Когда Вы щелкаете на ссылке к Поисковые системы - реферат одному из документов, который вас интересует, этот документ запрашивается у того сервера, на котором он находится.

2.2 Сравнительный обзор поисковых машин

2.2.1 Поисковая машина Rambler

Поисковая машина содержит информацию о более чем 12 миллионах документов, расположенных на серверах Рф и государств СНГ. Rambler обрабатывает ежесуточно более 500 тыщ запросов в Поисковые системы - реферат поисковике (в среднем - 5 запросов за секунду), сканируя 48 тыщ web-серверов и используя несколько сразу работающих программ-роботов.

Поисковые слова

Запрос может состоять из 1-го либо нескольких слов, разбитых пробелами. Могут быть применены как российские, так и английские слова и словосочетания. По дефлоту находятся только те документы, в каких повстречались все Поисковые системы - реферат введенные Вами слова. Чтоб отыскать документы, содержащие хотя бы одно слово из запроса, используйте логическую связку Or (см. ниже) либо изберите на страничке детализированного запроса: "Слова запроса: хоть какое". Чтоб исключить документы, содержащие те либо другие слова, укажите на страничке детализированного запроса: "Исключить документы, содержащие последующие слова ...".

Регистр

Все равно Поисковые системы - реферат, с какой буковкы написаны слова запроса: с большой либо с малеханькой. И при построении индекса, и при поиске по запросу все большие (огромные) буковкы "снижаются".

Логические связки

Слова запроса могут быть соединены логическими связками And ("и"), Or ("либо"). Заместо связок (либо в купе с ними) могут употребляться Поисковые системы - реферат также знаки '&', '|'.

Логические группы

Части запроса могут быть сгруппированы при помощи круглых скобок ( ). Вероятна неоднократная вложенность скобок в купе с логическими операторами.

Словоформы

Rambler умеет находить слова во всех формах (к примеру, аминокислота, аминокислоты, аминокислотой и т. д.). Чтоб слово находилось во всех формах, перед ним нужно поставить служебный знак '#'. В меню Поисковые системы - реферат детализированного запроса таковой режим может быть включен для всех слов: "Расширение запроса: все формы слов". Служебный знак '@' перед словом позволяет отыскивать не только лишь само это слово, да и однокоренные слова. В меню детализированного запроса символу '@' соответствует режим "Расширение запроса: все однокоренные".

Усечение слов

По дефлоту наша Поисковые системы - реферат система отыскивает слова запроса так, как Вы их ввели, чтоб уменьшить "шум" в отысканных документах. Если Вы не помните, как пишется слово, либо желаете расширить запрос, можно использовать метасимволы '*' и '?' для обозначения случайной части слова и случайного знака.

Поиск в части документа

Ограничить поиск частями документов, такими как заглавие документа Поисковые системы - реферат, его заголовок, URL и т.п., можно через меню детализированного запроса "Находить в...".

Язык документов

Можно ограничить поиск документами лишь на российском либо лишь на британском языке. Для этого нужно избрать соответственный режим в меню детализированного запроса "Язык документа...". По дефлоту поиск производится по документам на всех языках.

Сортировка Поисковые системы - реферат результатов

По дефлоту отысканные документы сортируются по релевантности (соответствию запросу). Но Вы сможете востребовать, чтоб заместо этого в начало перечня были помещены самые свежайшие (либо, напротив, самые старенькые документы). Для этого нужно избрать подобающую установку в меню "Сортировать по..." на страничке детализированного запроса.

Вы сможете также ограничить Поисковые системы - реферат поиск документами, сделанными в определенный период времени: для этого нужно на страничке детализированного запроса указать "От даты ... до даты ...".

Расстояние меж словами

Можно востребовать, чтоб Rambler возвращал только те документы, где слова из запроса находятся на наименьшем расстоянии друг от друга. Режим "Ограничить расстояние меж словами" может быть включен в детализированном Поисковые системы - реферат запросе. Все вышеперечисленные правила могут быть применены вместе вместе в нужной Вам последовательности.

Выдача результатов

По дефлоту поисковые результаты выдаются порциями по 15 документов. Меню "Выдавать по..." на страничке детализированного запроса позволяет прирастить это число до 30 либо 50. Меню "Форма вывода..." позволяет получать описания документов с увеличенной либо уменьшенной подробностью.

2.2.2. Поисковая Поисковые системы - реферат машина Yandex

Yandex раз в день просматривает сотки тыщ Web-страниц в поисках конфигураций либо новых ссылок. Коллекция ссылок повсевременно вырастает.

Yandex не просит от вас познания особых команд для поиска. Довольно набрать вопрос ("где отыскать дешевенькие компы" либо "необходимы телефоны москвы и столичной области"), и вы получите итог Поисковые системы - реферат - перечень страничек, где встречаются эти слова.

Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам российского языка. К примеру, если задан запрос 'идти', то в поисковом результате будут найдены ссылки на документы, содержащие слова 'идти', 'идет', 'шел', 'шла' и т Поисковые системы - реферат.д. На запрос 'окно' будет выдана информация, содержащая и слово 'окон', а на запрос 'отзывали' - документы, содержащие слово 'отозвали'.

При всем этом поиск не ограничен только словами либо фразами. Yandex найдет по наименованию web-страницу компании либо файл с подходящей картинкой.

2.2.3. Поисковая машина Aport

Примеры обычных запросов

Обычно Поисковые системы - реферат запрос представляет из себя просто одно либо несколько слов, к примеру:

процессоры компании Intel

По такому запросу находятся документы, в каких встречаются все слова запроса. Есть, правда, ограниченное число слов (союзы, предлоги и т.п.), которые в запросе игнорируются, потому что не несут сами по для себя смысловой нагрузки. К примеру Поисковые системы - реферат, по запросу:

яблоки на снегу

будут найдены все документы, в каких встречаются сразу два слова: "яблоко" и "снег". Где в границах документа размещены слова, в какой грамматической форме они находятся — не принципиально

Стоит снова выделить принципиальное и очень полезное свойство Апорта: независимо от того, в какой грамматической форме вы Поисковые системы - реферат пишите в запросе слово, оно находится в документах во всех собственных формах. К примеру, по запросу:

человек шел

будут найдены посреди иных и документы, содержащие текст "люди идут". Определение всех форм работает для обыденных слов российского языка. Для экзотичных слов, неологизмов и т.п. оно не проходит. В Поисковые системы - реферат данном случае может понадобиться оператор "*" (звездочка). К примеру, вы желаете отыскать все, касающееся деятельности президента Рф, в том числе и документы, содержащие слово "ельцинизм". Воспользуйтесь запросом:

ельцин*

Он позволит вам отыскать то, что вы желаете (также документы со словами Ельцинище , ельцинцы , ельциненок и т.п), так как звездочка подменяет Поисковые системы - реферат собой хоть какое число всех букв

Поиск по адресам (по URL)

Вы сможете находить документы не только лишь по всему русскому Вебу, да и по его части. Самый обычный случай — поиск по определенному серверу. К примеру

url=www.intel.ru собака

По данному запросу будут найдены все документы на сервере www Поисковые системы - реферат.intel.ru, содержащие слово "собака". Может быть, вам любопытно, а что будет, если написать просто:

url=www.intel.ru

В данном случае вы получите перечень всех документов, расположенных на обозначенном вами сервере

Вы сможете ограничивать поиск и посильнее — одним из каталогов сервера. К примеру:

url=www.intel.ru/sobaki Поисковые системы - реферат/ сенбернар

По данному запросу документы, содержащие слово "сенбернар", будут искаться исключительно в каталоге /sobaki (и его подкаталогах) столичного сервера компании Intel.

2.2.4. List . ru

На главной страничке в верхней ее части размещены ссылки на более пользующиеся популярностью проекты. Ниже, под логотипом каталога, поисковая форма. В правой колонке и нижней части странички Поисковые системы - реферат - блоки самых животрепещущих новостей. Перечень ссылок на главные категории каталога занимает центральную часть. Числа рядом с заглавием категории демонстрируют количество веб-сайтов, содержащихся в ней. Записанные маленьким шрифтом заглавия отсылают при нажатиии на подкатегории раздела. Щелкнув по хоть какому из заглавий, Вы попадете в подобающую рубрику и под логотипом Поисковые системы - реферат List.ru увидите полный путь до нее, начиная с главной странички. Каждый промежный уровень структуры доступен по отдельной ссылке.Поиск в каталоге реализован таким макаром, что в итоге запроса могут быть найдены как отдельные веб-сайты, так и рубрики. Поиск будет удачным URL, заглавие, описание, ключевики. Допускается внедрением языка запросов Yandex Поисковые системы - реферат. Расположенная рядом с поисковой формой ссылка "Структура каталога" открывает в отдельном окне полный рубрикатор каталога. Реализована возможность перехода из рубрикатора в всякую избранную подкатегорию. Более детализированное направленное на определенную тематику деление текущей рубрики представлено перечнем ссылок. Помеченные эмблемой @ приведут в подкатегории, структурно входящие в другие разделы Поисковые системы - реферат, но содержащие близкую по содержанию информацию. Если Вы отлично представляете, в какой рубрике содержатся нужные ресурсы, лучше перейти в подходящую подкатегорию, воспользовавшись хоть каким из предоставляемых средств навигации по каталогу. В неприятном случае можно находить их в полном перечне. Каталог организован таким макаром, что все веб-сайты, содержащиеся на Поисковые системы - реферат нижних уровнях структуры, представлены и в рубриках.Показываемый ниже перечень ресурсов упорядочен в алфавитном порядке, но, выбрав подобающую сортировку ("По времени прибавления" либо "По переходам"), можно просмотреть их по порядку прибавления в каталог (начиная с самых "новых") либо зависимо от популярности посреди гостей каталога. Ссылка с наименования веб-сайта Поисковые системы - реферат открывает в отдельном окне его зарегистрированную в данной рубрике страничку. Пометки RUS и ENG означают наличие на веб-сайте страничек, соответственно на российском и британском языках. В бардовых скобках (Заходов: ххх.хх) показано среднесуточное количество переходов на ресурс со страничек List.ru.

2 .2.5. Поисковая машина AltaVista

Индексирование в этой системе осуществляется Поисковые системы - реферат с помощью бота. При всем этом бот имеет последующие ценности:

Если тэгов на страничке нет, употребляет 1-ые 30 слов, которые Поисковые системы - реферат регистрирует и указывает заместо описания (tag description)

Более увлекательная возможность AltaVista - это расширенный поиск. Тут стоит сходу обмолвиться, что, в отличие от многих других систем AltaVista поддерживает одноместный оператор NOT. Не считая этого, имеется к тому же оператор NEAR, который реализует возможность контекстного поиска, когда определения должны размещаться рядом в тексте документа Поисковые системы - реферат. AltaVista разрешает поиск по главным фразам, при всем этом она имеет достаточно большой фразеологический словарь. Не считая всего остального, при поиске в AltaVista можно задать имя поля, где должно повстречаться слово: гипертекстовая ссылка, applet, заглавие вида, заголовок и ряд других полей. К огорчению, тщательно процедура ранжирования Поисковые системы - реферат в документации по системе не описана, но видно, что ранжирование применяется как при ординарном поиске, так и при расширенном запросе. Реально эту систему можно отнести к системе с расширенным булевым поиском.

3. Примеры запросов

В системе Aport был изготовлен запрос «вакуум-испарительный кристаллизатор».Система сказала последующие результаты (1-ые три):

Aport

1

Тамбовский муниципальный технический институт

http Поисковые системы - реферат://www.tstu.ru

О институте - история; перечень факультетов, специальностей; персоналии ведущих ученых и др. Рассказ о Тамбовском региональном центре информатизации высшей школы: утомившись, многообещающие проекты, результаты. О Тамбове и области: история, культура, ссылки на странички образовательных учреждений, туризм.

Похожие веб-сайты 36 0000

http://www.tstu.ru/win/katalog Поисковые системы - реферат/okp/36.htm, 04.11.1998 (испытано 08.12.2000), 104 kb, Windows 1251 ... 36 1428 4 - комбинированные 36 1429 5 - остальные 36 1430 5 Кристаллизаторы / 36 1431 0 - с вращающимися барабанами 36 1432 6 - емкостные 36 1433 ... сосудов и аппаратов 36 1600 9 Фильтры жидкостные 36 1610 3 Вакуум-фильтры / 36 1611 9 - барабанные внешние 36 1612 4 - барабанные внешние ...

Реконструкция текста

Другие отысканные на веб-сайте странички (1)

2

Институт тепло- и массообмена им. А.В. Лыкова АН Беларуси

http://www.itmo.by

Информация об институте и его лабораториях. Анонсы Поисковые системы - реферат и действия. Новости проводимых конференций и семинаров. Материалы "Инженерно-физического журнальчика".

Похожие веб-сайты IFZh, 1984

http://www.itmo.by/jepter/SODER/461984r/contr46.html, (испытано 10.11.2000), 41 kb, koi8-r ... Майоров В. А. , Васильев Л. Л. Физические особенности испарительного жидкостного остывания пористого металлокерамического тепловыделяющего элемента ... ...

... Бодров В. В Поисковые системы - реферат. Определение термических характеристик тонкостенных кристаллизаторов барабанного типа ...622 Новиков Н. П. , Игнатенко К. И. , Михайлова Г. ... примеси в кремнии n типа при высокотемпературном нагреве в вакууме ...693 Булгак И. А. , Скоропанов А. С. , Вечер А. А. , Проценко Г. ... ...

... А. А. Эффективность геттерирования при массопереносе в вакууме ...949 Агеенко И. С. , Ильясов С. Г. , Красников Поисковые системы - реферат В. В. , Тюрев Е. ...

Реконструкция текста

Другие отысканные на веб-сайте странички (1)

3

WWW server of Tambov state technical university

http://www.tixm.tambov.su

36 0000

http://www.tixm.tambov.su/win/katalog/okp/36.htm, 04.11.1998 (испытано 18.12.2000), 104 kb, Windows 1251 ... 36 1428 4 - комбинированные 36 1429 5 - остальные 36 1430 5 Кристаллизаторы / 36 1431 0 - с вращающимися барабанами 36 1432 6 - емкостные 36 1433 ... сосудов и аппаратов 36 1600 9 Фильтры жидкостные 36 1610 3 Вакуум-фильтры Поисковые системы - реферат / 36 1611 9 - барабанные внешние 36 1612 4 - барабанные внешние ...

Реконструкция текста

Другие отысканные на веб-сайте странички (1)

В системе Yandex был изготовлен то т же запрос, система ответила, что ничего не найдено.

3. Перечень использованной литературы

Павел Храмцов "Поиск и навигация в Internet".
http://www.osp.ru/cw/1996/20/31.htm

Обучение Интернет-профессиям. Search Поисковые системы - реферат engine Expert.
http://searchengine.narod.ru/archiv/se_2_250500.htm

Андрей Аликберов "Несколько слов о том, как работают боты поисковых систем".
http://www.citforum.ru/internet/search/art_1.shtml



pokazateli-dolgovechnosti.html
pokazateli-dvizheniya-i-tehnicheskogo-sostoyaniya.html
pokazateli-effekta-i-resursov-transportnogo-proizvodstva.html