- Поиск информации в сети Интернет
- Что такое поисковые системы, и для чего они нужны
- Наиболее популярные поисковые системы
- Поиск по ключевым словам. Язык запросов поисковой системы
- Типы поисковых систем. Какой поисковой системой воспользоваться
- Как заявить о своем WWW-сайте (WWW-странице) в Интернет
- Какие бывают типы поисковых систем?
- Что такое поисковая машина?
- Почему поисковые системы важны?
- Различные типы поисковых систем
- 1. Поисковые системы на основе краулеров
- 1.1. ползком
- 1.2. индексирование
- 1.3. Расчет релевантности
- 1.4. Получение результатов
- Примеры поисковых систем на основе сканеров
- 2. Справочники, созданные человеком
- 3. Гибридные поисковые системы
- 4. Другие типы поисковых систем
- Заключение
Поиск информации в сети Интернет
Что такое поисковые системы, и для чего они нужны
В глобальной сети Интернет можно найти информацию по любой интересующей теме. Но самое трудное в работе с сетью Интернет — найти нужную информацию. Т. к. Интернет не имеет четкой централизованной структуры, развивается хаотично, и в мире появляются все новые и новые серверы, вопросы поиска информации становятся очень актуальными.
Каждая из поисковых систем имеет какие-то свои достоинства и недостатки, которые определяются принципом работы поисковой машины, удобством использования, ее оформлением, сложностью языка запросов, наличием различных расширенных функций (управление форматом и ранжированием выводимой информации, исправление орфографических ошибок и ошибочной раскладки клавиатуры при вводе ключевых слов, перевод страницы на др. языки т. д.), скоростью работы, и др. параметрами. Выбор поисковой системы для конкретного применения определяется целью поиска, характером искомой информации, желаемым форматом выводимых данных и шириной охвата отслеживаемых адресов серверов в мире Интернет.
Наиболее популярные поисковые системы
- Яндекс (Компания «Яндекс») — средство полнотекстового поиска информации с учетом морфологии русского языка; поиск по сайтам, своему каталогу, новостям, товарам, географическим картам, словарям, блогам, картинкам, документам Microsoft Office и Adobe Acrobat PDF
- Яндекс: Расширенный поиск
- Яндекс — краткий вариант страницы поиска
- Все сервисы Яндекса
- Rambler (ОАО «Рамблер Интернет Холдинг») — поиск по сайтам с учетом морфологии русского и английского языков; имеет и каталоговую систему поиска.
- Rambler Lite: поисковая система — краткий вариант страницы поиска
- Все проекты Рамблера
- NIGMA — интеллектуальная поисковая система (МГУ им. М. В. Ломоносова и Stanford University) — поиск документов, картинок, книг, новостей через Google, Yahoo, MSN, Yandex, Rambler, Altavista, Апорт; также система предоставляет уникальный поиск по химическим формулам и реакциям
- Google — поиск по сайтам (есть возможность поиска по русскоязычным сайтам); поиск документов в форматах Adobe Acrobat PDF, Microsoft Office, postScript, Corel Wordperfect, Lotus 1-2-3 и др.; поиск картинок, видео, новостей, поиск по картам; возможность поиска по русскоязычным и российским сайтам; есть система перевода текста на др. языки (49 языков)
- Google Расширенный поиск
- Все Продукты Google
- bing (Microsoft Corp.) — поиск по сайтам, изображений и видео; возможность поиска по русскоязычным и российским сайтам; есть система перевода текста на др. языки (22 языка)
- Yahoo! (Yahoo) — поиск по сайтам, адресам E-mail и др.
Список наиболее популярных поисковых серверов в России и СНГ в порядке убывания количества поисковых запросов по статистике SEO-AUDITOR на конец 2018г. выглядит следующим образом:
- Google — 53,52 %,
- Яндекс — 42,77 %,
- Mail.Ru — 2,25 %,
- Bing — 0,5 %,
- Rambler — 0,35 %,
- Yahoo! — 0,17 %
За пределами России рейтинг поисковых систем также возглавляет Google, далее следуют bing и Yahoo!.
Поиск по ключевым словам. Язык запросов поисковой системы
Поисковая система обычно имеет поле для ввода ключевых слов, по которым она находит документы, содержащие эти ключевые слова. Чем лучше (качественнее) составлен запрос к поисковой машине, тем меньше общее количество найденных документов, и больше из них документов, соответствующих тому, что Вам требуется. Если запрос очень простой или составлен неграмотно, то поисковая машина может Вам выдать несколько миллионов документов, которые Вам не просмотреть за всю жизнь.
Используя язык запроса, содержащий логические операции (логические операторы AND, OR, NOT, скобки и др.), префиксы обязательности присутствия ключевых слов в документе «+» и «-» (при поиске по узкоспециализированным терминам — предпочтительней использовать), расположения ключевых слов в документе рядом или на определенном расстоянии и т. д.) и др. элементы, и большее количество связанных ими ключевых слов, можно значительно сузить область поиска и более качественно составить запрос к поисковому серверу. Следует учитывать, что разные поисковые системы могут иметь как различающиеся языки запросов, так и очень похожие.
На сайтах поисковых систем обычно есть ссылки на справочную информацию по использованию поисковых сервисов, языков запросов, рекомендации по поиску и т. д.
Некоторые поисковые системы дополнительно имеют функцию расширенного поиска, позволяющую пользователю более точно описать то, что ему конкретно нужно и без знания языка запроса. Функцию расширенного поиска имеют, например, поисковые системы Яндекс и Google.
Типы поисковых систем. Какой поисковой системой воспользоваться
Существует 2 основных типа поисковых систем Интернет: индексные и классификационные (каталоговые). Индексные поисковые системы (например, Яндекс, Google, Rambler и др.), работая в автоматическом режиме обновления своей информации, просматривают в Интернет содержимое серверов, индексируя информацию, содержащуюся в них и внося информацию о расположении слов на страницах сайтов в свои базы данных. Каталоговые системы поиска (например, Rambler, Yahoo! и др.) содержат тематически структурированный каталог серверов, и чаще всего пополняются вручную. Обычно на WWW-странице классификационной поисковой системы содержится и поле для ввода ключевых слов для поиска в собственной базе данных. В каталоговой системе поиска можно, начав с более крупной тематической рубрики, и постепенно спускаясь дальше по рубрикам, прийти к ссылке на нужный Вам сайт. В одних случаях бывает удобней воспользоваться первым типом поисковых систем, в других — вторым. Есть поисковые системы, сочетающие в себе оба принципа работы. В частности, большинство индексных поисковых систем имеют и каталоговую систему поиска. Также поисковые машины могут использовать и какие-то другие принципы методы поиска.
Многие поисковые системы преобразовались в Интернет-порталы, объединяющие в себе большое количество ресурсов и сервисов. На страницах таких порталов можно прочитать новости, ознакомиться с программой телепередач, узнать о погоде, курсах валют, воспользоваться картографическим сервисом и мн. др.
Для поиска по российским ресурсам Интернет рекомендуется пользоваться российскими поисковыми системами (например, Яндекс), ввиду наличия русскоязычного интерфейса, возможности поиска по русским словам, учета особенностей русского языка, близости расположения сервера и т. д. Для поиска по зарубежным ресурсам можно воспользоваться многоязычными поисковыми машинами, имеющими в т. ч. и русскоязычный пользовательский интерфейс, а также возможность перевода найденных страниц на русский язык (например, Google).
Для поиска одновременно в нескольких поисковых системах можно воспользоваться так называемыми поисковыми метамашинами, обращающимися сразу к нескольким поисковым средствам, например, MetaCrawler.
Как известно, поисковых систем в Интернете много и найти нужную информацию крайне непросто. Отсутствие единого стандарта на спецификацию задачи поиска в Сети приводит к тому, что на каждом узле предлагается собственный способ решения поставленной задачи. В результате пользователь, не искушенный в премудростях синтаксических конструкций запросов к поисковой системе, либо не полностью использует возможности поисковика, либо, изучив функции конкретной системы, постоянно обращается лишь к одной.
Мета-поисковая система имеет единый язык запросов, иногда даже возможность перевода ключевых слов на др. языки. Такие поисковые системы, получая результаты запросов от др. поисковых систем, фильтруют полученные материалы, убирая дублирующиеся ссылки, и сортируют их по релевантности (степени нужности). Для поиска зарубежных ресурсов можно пользоваться российскими поисковыми метамашинами, обращающимися к другим поисковым средствам (в том числе зарубежным). Это удобно, ввиду наличия русскоязычного интерфейса, возможности поиска по русским словам, учета особенностей русского языка, близости расположения сервера, имеющего в большинстве случаев доступ к скоростному каналу за рубеж и т. д. Для этого и существуют поисковые метамашины. Но в последнее время качество поиска наиболее популярных поисковиков Яндекс и Google существенно улучшилось, и надобность в метапоисковых машинах отпадает, и они проигрывают в конкуренции с популярными поисковиками, вследствие чего почти все метапоисковики прекратили свое существование.
Существуют также поисковые системы, специализирующиеся по поиску по одной какой-либо теме (например, по информационным технологиям, по музыке, по ресурсам, посвященные природе и т. д.)
В некоторых случаях можно обойтись и без применения поисковых систем. Так, например, большинство крупных зарубежных фирм имеют адреса типа http://www.название_фирмы.com (например, официальный сайт Microsoft Corporation — http://www.microsoft.com), а большинство крупных российских фирм — http://www.название_фирмы.ru, (например, сайт компании «Лукоил» — http://www.lukoil.ru).
Можно также найти нужный Вам WWW-сервер в так называемых «Желтых страницах Интернет» (Yellow pages), выпускаемых в печатном виде или размещаемых в сети Интернет (Yellowpages.com, Желтые страницы интернет и мн. др.) В «Желтых страницах» ссылки на WWW-сервера располагаются по рубрикам. Каждому серверу дается краткое описание и иногда небольшой снимок первой страницы.
Также, собираясь посетить какой-то зарубежный сервер (например, официальный WWW-сервер какой-либо зарубежной фирмы), можно учитывать и такие возможные варианты, как наличие зеркальных серверов на территории России (копии зарубежного сайта) или наличие официального российского сайта зарубежной компании (на русском языке), наряду со своим главным официальным сайтом (например, официальный российский сайт компании Intel Corporation — http://www.intel.ru). Конечно же, лучше воспользоваться именно этими вариантами.
Как заявить о своем WWW-сайте (WWW-странице) в Интернет
Если у Вас есть своя страничка в Интернет, и Вы хотите показать ее всему миру, можно добавить свой URL к списку обслуживаемых страниц в выбранных Вами поисковых системах и каталогах, нажимая на соответствующие ссылки на страницах поисковых серверов и заполняя соответствующие формы. Можно также воспользоваться сервисом, позволяющим добавить Ваш адрес сразу в несколько поисковых систем и каталогов. Среди них можно назвать, например, Студия Артемия Лебедева: Система TAU (регистрация в 12-х зарубежных и 8-и российских поисковых системах), Регистратура РУ (регистрация в 13-и российских и 15-и зарубежных поисковых машинах и в 13-и российских каталогах линков, а также регистрация 5-и счетчиков), NET-ADS Submission Station (регистрация в 24-х зарубежных поисковых системах) и др.
Для просмотра параметров своей страницы в наиболее известных поисковых системах и каталогах можно обратиться к сайту Инструмент оптимизатора.
Источник
Какие бывают типы поисковых систем?
Что такое поисковая машина?
Цель поисковой системы — извлечь запрашиваемую информацию из огромной базы данных ресурсов, доступных в Интернете. Поисковые системы становятся важным повседневным инструментом для поиска необходимой информации, даже не зная, где именно она хранится. Использование Интернета в последние дни значительно возросло с появлением простых в использовании поисковых систем, таких как Google, Bing и Yahoo! Существуют разные типы поисковых систем, которые могут получить нужную информацию. В этой статье мы объясним различные типы поисковых систем и их назначение.
Популярные поисковые системы
Почему поисковые системы важны?
Поисковые системы являются частью повседневной жизни двух типов людей.
- Пользователи, которые ищут и получают информацию
- Владельцы сайтов, которые пытаются оптимизировать свои сайты для получения высшего ранга в результатах поиска.
Пользователь выполняет более миллиардов поисков только в Google, чтобы найти релевантную информацию. Это открывает перед предприятиями и издателями онлайн-контента огромные возможности для бесплатного привлечения людей на свои веб-сайты. Поисковые системы следуют рекомендациям и имеют собственный алгоритм определения рейтинга веб-сайтов в результатах поиска. Оптимизация веб-сайтов для Google и других поисковых систем является неотъемлемой частью любого владельца веб-сайта для охвата большой аудитории. Посетители могут приносить доход владельцам сайтов либо за счет рекламы, отображаемой на сайте, либо за счет покупки продуктов.
Различные типы поисковых систем
Поисковые системы делятся на следующие три категории в зависимости от того, как они работают.
- Поисковые системы на основе сканера
- Справочники, управляемые человеком
- Гибридные поисковые системы
- Другие специальные поисковые системы
Давайте подробно обсудим все типы поисковых систем в следующих разделах.
1. Поисковые системы на основе краулеров
Все поисковые системы на основе краулеров используют краулеров, ботов или пауков для сканирования и индексации нового контента в базе данных поиска. Есть четыре основных шага, которым следуют все поисковые системы на основе краулера, прежде чем отображать какие-либо сайты в результатах поиска.
- ползком
- индексирование
- Расчет релевантности
- Получение результата
1.1. ползком
Поисковые системы ползать всю сеть, чтобы получить доступные веб-страницы. Часть программного обеспечения под названием гусеничный трактор или бот или паук выполняет сканирование всей сети. Частота сканирования зависит от поисковой системы, и между сканированиями может пройти несколько дней. Это причина, по которой иногда вы можете видеть, что содержимое вашей старой или удаленной страницы отображается в результатах поиска. В результатах поиска будет отображаться новое обновленное содержание, как только поисковые системы снова просканируют ваш сайт.
1.2. индексирование
индексирование — это следующий шаг после сканирования, который представляет собой процесс определения слов и выражений, которые лучше всего описывают страницу. Идентифицированные слова называются ключевыми словами, и страница назначается идентифицированным ключевым словам. Иногда, когда сканер не понимает смысла вашей страницы, ваш сайт может занимать более низкую позицию в результатах поиска. Здесь вам нужно оптимизировать свои страницы для роботов поисковых систем, чтобы контент был легко понятен. Как только сканеры подберут правильные ключевые слова, ваша страница будет назначена этим ключевым словам и будет занимать высокие позиции в результатах поиска.
1.3. Расчет релевантности
Поисковая система сравнивает строку поиска в поисковом запросе с проиндексированными страницами из базы данных. Так как строка поиска может содержаться более чем на одной странице, поисковая система запускает расчет релевантности каждой страницы в своем индексе со строкой поиска.
Существуют различные алгоритмы расчета релевантности. Каждый из этих алгоритмов имеет разные относительные веса для общих факторов, таких как плотность ключевых слов, ссылки или метатеги. Вот почему разные поисковые системы предоставляют разные страницы результатов для одной и той же поисковой строки. Как известно, все основные поисковые системы периодически меняют свои алгоритмы. Если вы хотите, чтобы ваш сайт оставался на вершине, вам также необходимо адаптировать свои страницы к последним изменениям. Это одна из причин посвятить постоянные усилия SEO, если вы хотите быть на вершине.
1.4. Получение результатов
Последний шаг в деятельности поисковых систем — получение результаты. По сути, он просто отображает их в браузере по порядку. Поисковые системы сортируют бесконечные страницы результатов поиска в порядке от наиболее релевантных до наименее релевантных сайтов.
Примеры поисковых систем на основе сканеров
Большинство популярных поисковых систем основаны на поисковых машинах, использующих краулеры, и используют вышеуказанную технологию для отображения результатов поиска. Пример поисковых систем на основе сканера:
- Bing
- Yahoo!
- Baidu
- Яндекс
Помимо этих популярных поисковых систем, есть много других поисковых систем, основанных на гусеницах, таких как DuckDuckGo, AOL и Ask.
2. Справочники, созданные человеком
Справочники, управляемые человеком, также называемые открытой системой каталогов, зависят от действий человека для списков. Ниже показано, как работает индексация в каталогах, управляемых человеком:
- Владелец сайта отправляет в каталог краткое описание сайта вместе с категорией, в которой он должен быть указан.
- Отправленный сайт затем проверяется вручную и добавляется в соответствующую категорию или отклоняется для включения в список.
- Ключевые слова, введенные в поле поиска, будут сопоставлены с описанием сайтов. Это означает, что изменения, внесенные в содержание веб-страниц, не принимаются во внимание, поскольку имеет значение только описание.
- Хороший сайт с хорошим содержанием с большей вероятностью получит бесплатную рецензию, чем сайт с плохим содержанием.
Yahoo! Directory и DMOZ были прекрасными примерами каталогов, управляемых человеком. К сожалению, автоматизированные поисковые системы, такие как Google, вытеснили из Интернета все эти поисковые системы в стиле каталогов, управляемые людьми.
3. Гибридные поисковые системы
Гибридные поисковые системы используют индексирование как на основе сканера, так и вручную для включения сайтов в результаты поиска. Большинство поисковых систем на основе сканеров, таких как Google, в основном используют сканеры в качестве основного механизма, а каталоги, управляемые людьми, в качестве вторичного механизма. Например, Google может взять описание веб-страницы из справочников, управляемых человеком, и отобразить его в результатах поиска. По мере того, как каталоги, управляемые людьми, исчезают, гибридные типы становятся все более и более поисковыми системами на основе поисковых роботов.
Но все же есть ручная фильтрация результатов поиска, чтобы удалить скопированные и спамерские сайты. Когда сайт идентифицируется на предмет рассылки спама, владелец сайта должен предпринять корректирующие действия и повторно отправить сайт в поисковые системы. Эксперты вручную проверяют представленный сайт, прежде чем снова включить его в результаты поиска. Таким образом, хотя поисковые роботы управляют процессами, управление осуществляется вручную для отслеживания и естественного отображения результатов поиска.
4. Другие типы поисковых систем
Помимо трех вышеупомянутых основных типов, поисковые системы можно разделить на многие другие категории в зависимости от использования. Ниже приведены некоторые из примеров:
- В поисковых системах есть разные типы ботов для исключительно отображения изображений, видео, новостей, продуктов и местных списков. Например, Новости Google страницу можно использовать для поиска только новостей из разных газет.
- Некоторым поисковым системам нравится Dogpile собирает метаинформацию о страницах из других поисковых систем и каталогов для отображения в результатах поиска. Этот тип поисковых систем называется метапоисковыми.
- Семантические поисковые системы, такие как Swoogle предоставлять точные результаты поиска в определенной области, понимая контекстное значение поисковых запросов.
Заключение
В первые дни Интернета поисковые машины, работающие на людях, были популярным и важным источником информации. Технологический мир очень быстро движется в сторону автоматизации и искусственного интеллекта. Крупные технологические компании, такие как Google и Microsoft, которым принадлежат популярные поисковые системы, продвигают эти изменения и извлекают из них выгоду. Ни одна из поисковых систем, управляемых людьми, не смогла пережить этот быстрый сдвиг. Хотя люди используют специальные поисковые системы в очень малых масштабах, в этот момент искусственные поисковые машины или поисковые машины на основе поисковых роботов действуют как основной источник информации с минимальным вмешательством человека.
Источник