Как раскрутить и разрекламировать Web-сайт в сети Интернет Загуменов Александр

Введение

Настоящее издание заинтересует всех, кто разместил в Internet Web-страницу или целый сайт и стремится привлечь к ним посетителей или своих клиентов. В книге рассматриваются подготовка и проведение рекламной кампании Web-ресурсов, анализ ее результатов. Особое внимание уделено оценке популярности Internet-страниц, исправлению ошибок и поддержке посещаемости на высоком уровне. Указанные задачи вполне поддаются автоматизации при помощи программного обеспечения, а также средствами Internet, чему и посвящена большая часть страниц издания.

В главе 1 рассказывается обо всех аспектах раскрутки сайтов, выборе доменного имени, разработке семантического ядра запросов, о том, как управлять индексированием страниц в поисковых системах, о пользе регистрации в каталогах и обмена ссылками с партнерами, о почтовых рассылках, о влиянии баннерной и контекстной рекламы на посещаемость сайта. Большое внимание уделено описанию метаданных, применяемых для оптимизации Web-сайтов под поисковые системы Internet. Описаны различные методы обнаружения технических ошибок при размещении сайтов в Сети, – неверных ссылок, погрешностей HTML-кода, ошибок правописания. Предлагаются разнообразные способы всесторонней проверки страниц.

Глава 2 посвящена автоматизации всех этапов работы над сайтом по его продвижению в Internet. То, о чем написано в главе 1, здесь подкреплено описанием возможностей ресурсов Internet и таких программ, как Linkbot Developer Edition, Domain Name Checker, Retrieve, CyberSpyder Link Test, HTML Link Validator, CSE HTML Validator, A Real Validator, MetaTag ToolKit, MetaMan, WebQA.

В главе 3 рассмотрены методы и средства анонсирования сайта в поисковых системах, благодаря которому сайт при поиске по ключевым словам попадает в первую десятку найденных. Подробно описываются наиболее популярные отечественные и зарубежные поисковые машины. Поиск в каталогах часто обеспечивает лучшие результаты, нежели в автоматических поисковых системах, поэтому и они не обойдены вниманием, описаны способы добавления сайта в разнообразные каталоги, приведены методы работы с соответствующим программным обеспечением: AI RoboForm, WebPosition, Page Promoter, Web-Регистратор.

Прочитав первую главу книги и воспользовавшись какими-либо средствами, представленными во второй и третьей ее главах, вы можете и не читать книгу дальше, так как у вас будет информация и инструменты для практической работы. Однако если вы хотите увидеть не только направление, в котором движетесь, но и результаты своей работы, вам потребуется ознакомиться с главой 4, которая повествует о том, какую важную и интересную информацию можно узнать из журнальных файлов сервера, и посвящена методам их обработки с помощью соответствующего программного обеспечения.

В приложении к книге приводится список полезных ссылок на сайты, рекомендуемые к посещению.

Книга предназначена для лиц, столкнувшихся с вопросами размещения и продвижения Web-ресурсов независимо от их уровня: будь то домашняя страничка или корпоративный сайт.

Вопросы к автору присылайте по электронному адресу: [email protected], посетите его сайт http://promote.inotec.ru.

Глава 1

Этапы большого пути

Хороший web-сайт – это не просто набор страниц, связанных гиперссылками, и далеко не только то, что видит пользователь на экране монитора. Его внутреннее устройство довольно сложно. Ведь требуется обеспечить максимум удобств, как для посетителей, так и для его владельцев, которые будут управлять сайтом. Поэтому при его создании должны быть учтены тысячи мелочей, что, собственно, и отличает хороший web-сайт от плохого.

Но самое главное – сайт должны найти люди, он не должен затеряться на бескрайних просторах Сети. А иначе, какой от него толк, если сайт никто не увидит? Пусть он даже фантастически красив.

Грамотно построенный web-сайт – довольно сложная конструкция, пронизанная многочисленными внутренними и внешними связями, с четкой и жесткой логикой. Уже в процессе разработки сайта должны быть заложены механизмы, работающие на его будущую популярность.

Internet – мощный и стремительно развивающийся канал для продвижения информации, товаров и услуг. Однако чтобы добиться успеха, недостаточно лишь разместить в Сети свой сайт. Его необходимо разрекламировать или, как говорят, «раскрутить». Вот этим мы с вами и займемся.

Чтобы сайт работал, и с его помощью появлялись новые клиенты, его следует правильно спроектировать, учтя все детали, которые важны для поисковых систем, ведь основной поток целевых посетителей идет именно через них. Если считать основной задачей сайта привлечение новых клиентов или читателей, следует начинать работу с анализа ключевых слов, по которым будут искать сайт. На его основе строится так называемое семантическое ядро возможных запросов, с учетом которого проводится разработка страниц и подготовка исходных данных.

Далее выполняются следующие работы по оптимизации сайта для поисковых систем:

• формируются заголовки HTML-страниц, которые видны в заголовочной части окна браузера;

• создаются метатэги с описаниями и ключевыми словами. Их не видят посетители сайта, но учитывают многие поисковые системы;

• изготавливается карта сайта, которая очень важна для поисковых машин, так как она позволяет быстрее и с большим весом проиндексировать страницы сайта. Иногда карта сайта не виднапосетителям;

• вырабатываются альтернативные подписи ко всем иллюстрациям. Альтернативная подпись возникает на экране при наведении мыши на изображение. Так как эти подписи также индексируются поисковыми системами, их следует насыщать ключевыми словами;

• создаются дублирующие переходы. Многие поисковые системы не понимают переходов по формам с выпадающими списками, поэтому нужно сделать дополнительные переходы в виде обычных ссылок;

• специальным образом организуется архив новостей. Появление новой информации должно приводить к обновлению всех страниц архива, что очень привлекательно для поисковых машин;

• формируется дублирующая навигация в виде цепочки гиперссылок, если дизайн сайта допускает такой подход, что не только улучшает удобство пользования сайтом, но и позволяет увеличить количество ключевых слов;

• навигационные элементы сайта по возможности делаются текстовыми. При этом используются слова из семантического ядра запросов;

• новости выводятся на главную страницу, в результате чего информация на главной странице постоянно обновляется, а это благоприятно сказывается на результатах поиска;

• на всех страницах, включая главную, организуются информационные блоки. Они не являются обязательными, но заполнение их информацией и периодическая ее смена очень полезна для повышения рейтинга в результатах поиска;

• организуются места для баннеров каталогов и счетчиков. При продвижении сайта обязательно придется прописывать его в различных каталогах. Чтобы не пришлось делать крупных доработок, заранее следует закладывать эту возможность;

• ссылки с сайта делаются такими, чтобы в них присутствовали ключевые слова.

Конечно, это не все приемы, которые используются при оптимизации сайта для того, чтобы он занимал первые места в результатах поиска. Поэтому, рассматривая вышеназванные приемы, мы поговорим и о других.

Собственное доменное имя

Доменное имя наряду с логотипом и торговой маркой является частью бизнес-идентичности компании. При правильном выборе оно ассоциируется у покупателей именно с вашей компанией, ее продуктами, услугами и т. д. Часто доменные имена используются для нескольких целей, включая имя web-сайта, адрес электронной почты, имя FTP– или другого сервера. Собственное доменное имя придаст вам дополнительную солидность и доверие. Доверие – это одна из основ вашего сайта.

Если доменное имя легко запоминается, вы сможете привлечь больше покупателей. Люди будут использовать сайт или адрес электронной почты для быстрого и удобного доступа к информации или услуге, которую вы предлагаете.

Доменные имена мобильны. Вы можете сменить адрес, номера телефонов, провайдера Internet-услуг, но доменное имя не изменится. Это дает возможность постоянно поддерживать контакты с клиентами и пользователями ваших услуг.

Полная длина доменного имени, как правило, составляет от 2 до 67 символов, включая точку и имя домена первого уровня. Имя может состоять из следующих символов:

• латинские буквы (от a до z);

• арабские цифры (от 0 до 9);

• дефис (-), если доменное имя не начинается и не оканчивается этим символом.

Доменные имена не чувствительны к регистру букв, так что часто удобно использовать в рекламе прописные буквы. Например, www.ShoppingWorld.com. В настоящее время можно регистрировать и многоязычные доменные имена.

При выборе имени ориентируйтесь на свою целевую аудиторию. В зависимости от этого имя может быть популярным, веселым, строгим, составляться из профессиональных терминов и т. д.

Доменное имя должно быть простым и коротким. Как правило, чем оно короче, тем легче его запомнить или записать, и тем меньше вероятность того, что его воспроизведут неправильно. При остальных равных условиях отдавайте предпочтение словам с меньшим количеством слогов и словам, которые легко произносить. Не используйте сложные для запоминания акронимы, такие как qmxf.

Чтобы получить более высокий рейтинг у некоторых поисковых машин, регистрируйте доменные имена, составленные из ключевых слов вашего web-сайта. В этом случае лучше разделять слова дефисами. Можно создать и зарегистрировать отдельную страницу с таким длинным именем и автоматически переводить посетителей на основной сайт.

Употребляйте подходящие слова во множественном числе. Например, searchengines.com (поисковые машины) лучше, чем searchengine.com (поисковая машина), если только web-сайт не имеет отношения к какой-то отдельной поисковой машине.

Не забывайте о перспективе. Если в будущем вы планируете выпускать новые продукты, позаботьтесь, чтобы доменное имя соответствовало как новым, так и первоначальным продуктам и услугам. Эксперты по Internet-маркетингу утверждают, что web-сайт должен иметь только одну тематику. Сайт широкого профиля не очень привлекает посетителей, которые ищут конкретную информацию.

Регистрируйте доменное имя в правильном домене – глобальном или региональном. Для глобальных сайтов используйте домены. com, org или. net. Для региональных – соответствующие домены страны, для России – .ru или. org.ru. Расширения. com и. net предпочтительны для бизнес-сайтов. Доменные имена. org традиционно используются некоммерческими организациями. Обратите внимание, что многие домены имеют ограничения по выбору имен. В некоторых доменах можно использовать только имя, производное от названия организации или зарегистрированной торговой марки. Можно зарегистрировать несколько доменных имен в разных доменах и направлять их на один и тот же сайт.

Проверяйте, не посягаете ли вы на торговую марку или имя, которое по праву принадлежит другой компании или отдельному человеку. Не всякое доступное доменное имя следует регистрировать и использовать.

По возможности не используйте доменные имена, похожие на другие. Ведь нужно, чтобы посещали именно ваш сайт, а не конкурента! Исключением из этого правила будет ситуация, когда с целью привлечения дополнительных покупателей вы регистрируете доменное имя, состоящее из слов с распространенными орфографическими ошибками.

Чтобы проверить доступность конкретного доменного имени, можно воспользоваться сетевыми сервисами или специализированными программами, которые мы рассмотрим в следующей главе.

Разработка семантического ядра

Процедура проработки семантического ядра запросов не вполне технологична и зиждется, скорее, на интуитивных догадках исследователя, чем на строгих выкладках. Существуют способы получения данных о популярности того или иного слова, но нет четкого механизма определения, являются ли люди, воспользовавшиеся им, вашими целевыми посетителями. Кроме того, далеко не всегда ясно, а какие, собственно, слова нужно рассмотреть. То, что кажется очевидным продавцу, может совсем иначе представляться покупателю.

При анализе семантического ядра особое внимание следует уделить запросам с низкой частотой появления. Очень часто практически невозможно позиционировать сайт по запросам, имеющим высокую популярность, зато это достаточно просто делается по большому количеству запросов низкочастотных. А по общей сумме удачных запросов результат продвижения может оказаться и лучше.

В итоге работы над семантическим ядром должна быть составлена таблица, в которой отражается:

• запрос (слово или выражение);

• частота запроса (его популярность);

• количество сайтов, найденных по запросу;

• место в результатах поиска первого реального конкурента.

Такие таблицы составляются на основании данных, по крайней мере, трех основных российских поисковых систем Яndex, Рамблер и Апорт, а также Google и Yahoo!. После этого отбираются те ключевые слова, по которым имеет смысл бороться за место на первых трех страницах результатов поиска: многочисленные исследования показывают, что пользователи редко заглядывают дальше.

Старайтесь использовать эти слова, где только возможно (но не злоупотребляйте). Этот прием действенен и очень важен. Лучше уделить больше внимания продумыванию ключевых слов на начальной стадии разработки сайта, чем исправлять их позже, теряя гораздо больше драгоценного времени.

Обновление информации

Устаревшая информация – это очень серьезная проблема для владельца сайта. Ведь множество сайтов, сходных по тематике с вашим, продолжают постоянно обновляться. Сейчас же, с развитием электронной торговли, особенно важно не потерять доверия посетителей, а показать им устаревшую информацию – верный способ дать понять, чего стоят ваш сайт и ваши услуги. Обратите внимание на то, что архивы и информация о старом товаре или продукте – как раз достоинство сайта, а не недостаток, и они очень сильно отличаются от устаревшей информации.

Если вы описываете в документе некую сложную часть системы или чувствуете, что читатели рады иметь хоть какие-то сведения о данном предмете, нет смысла в детальной проверке такого документа. Если есть люди, действительно нуждающиеся в этой информации, они могут смириться с некоторыми недочетами и просмотреть весь материал, чтобы понять ваши идеи. Такой путь может быть весьма эффективным. Обратите на это внимание, потому что существует определенный слой информации, предназначенной для быстрого ознакомления или создания новых файлов на ее основе, и она важна для будущих читателей. Лучше, чтобы эта информация была доступна хотя бы в незаконченной форме, чем отсутствовала вовсе. До появления электронных технологий усилия на публикацию «сырого» материала приводили к браку и могли быть приняты за оскорбление читателя, так как выглядели как издание низкого качества. В настоящее время публикации идут на всех уровнях, и имеют свою ценность, как документы высокого качества, так и недоработанные. Поэтому обратите внимание читателей на текущий уровень подготовки документа, дабы избежать разочарования.

Заголовки

Корректные заголовки, кратко отражающие общую тематику, облегчают поиск Internet-ресурсов. Использование каждого слова в названиях страниц следует тщательно обдумать. Очень важно грамотно составить начальные фразы; это требование особенно касается текста внутри тэгов <HEAD><TITLE>. </TITLE >. </HEAD>, так поисковые системы, отвечающие на запросы пользователей, работают в первую очередь с этой лексикой. У всех документов может быть только один заголовок – он должен идентифицировать содержание в довольно широком контексте. Обычно именно эти фразеологические единицы видны в результатах запросов, и именно по ним читатели будут определять, стоит ли щелкнуть по ссылке или продолжить поиск.

Заголовок не является частью текста документа. Он не может содержать ссылок, знаков параграфа или подчеркивания. Идеальная длина заголовка – не более 64 символов. Как и прочие смысловые элементы текста Web-страницы, заголовки должны быть написаны иначе, нежели для других средств массовой информации: ведь это часть пользовательского интерфейса и навигационный элемент сервера. Если вы учитываете данный фактор, то многие приложения могут показать заголовки ваших документов в соответствующем окне, в меню, закладках, – другими словами, там, где место ограничено. Специальных ограничений на длину заголовков не существует, они легко генерируются автоматически, но слишком длинные могут быть обрезаны.

Заголовок страницы должен содержать как можно больше ключевых слов и в то же время не выглядеть тяжеловесным.

Часто заголовки вырезают из контекста, чтобы составить оглавление, краткий обзор сервера и т. п. Кроме того, именно эти элементы в первую очередь считываются роботами поисковых машин. В любом случае писать заголовки текстов для Internet нужно, ставя перед собой две задачи:

• дать пользователю точную информация о содержании документа, чтобы ему не приходилось строить догадки;

• не ввести пользователя в заблуждение привлекательным, но дезинформирующим заголовком. Сиюминутный успех обернется в дальнейшем резким снижением посещаемости вашего сайта из-за подрыва доверия.

Метаданные

Метаданными (от греч. met6 – после, за; между, среди) называют информацию о документе, служащую дополнением к его содержимому.

Язык гипертекстовой разметки HTML позволяет авторам указывать подобные сведения множеством способов. С этой целью используют метатэги – данные, размещаемые за словом <META … >. Если обычные тэги языка HTML применяются для разметки страниц, то есть для придания им определенного внешнего вида, то назначение метатэгов совсем другое. Они несут в себе справочную и управляющую информацию, которая предназначена для различных агентов (клиентских приложений, поисковых роботов). Включение метатэгов в документ, как правило, обусловливает следующие основные цели:

• управление процессом индексации документа или всего сайта в целом поисковыми роботами;

• описание содержимого документа (также для поисковых роботов);

• управление некоторыми функциями браузеров.

Многие из метатэгов довольно абстрактны, то есть не содержат никаких полезных сведений и не заслуживают внимания с точки зрения агентов. Сами метатэги и их содержание скрыты от посетителя сайта. Однако поисковые машины их находят, а содержащиеся там данные играют не последнюю роль при определении рейтинга страницы. Однако не следует забывать, что некоторые поисковые машины не придают им значения.

Метатэги не несут никакой визуальной информации и располагаются в заголовочной части HTML-документа между тэгами <HEAD> и </HEAD>. В любом другом месте они будут проигнорированы. Особенно важны они для страниц, использующих фреймы.

Существует два вида метатэгов:

• метатэги – эквиваленты HTTP-заголовков, имеющие формат записи: <META HTTP-EQUIV="свойство" CONTENT="значение">

• информационно-указательные, записываемые следующим образом: <META NAME = "свойство" CONTENT="значение">

Элементом META задается свойство, которому присваивается значение. Метатэги первого вида эквивалентны HTTP-заголовкам и обычно управляют действиями браузеров. Они используются, чтобы оптимизировать информацию, которую содержат обычные заголовки, и особенно важны, если документы загружаются по протоколу HTTP (протоколу передачи гипертекста – ftp://ftp.nsc.ru/pub/rfc/rfc2068.txt). Серверы HTTP могут использовать имя свойства, указанное в атрибуте HTTP-EQUIV, для создания заголовка в ответе HTTP. Мета-тэги второго вида чрезвычайно важны для работы поисковых машин.

Элемент META лежит в основе механизма введения метаданных. Существуют, однако, некоторые тэги и атрибуты тэгов языка HTML, которые обрабатывают часть метаданных и могут использоваться авторами вместо элементов META: тэги TITLE, ADDRESS, INS и DEL, атрибуты тэгов TITLE и CITE.

Метатэги – эквиваленты HTTP-заголовков

Для метатэгов этого вида могут быть использованы следующие свойства:

• Expires;

• Pragma;

• Content-Type;

• Content-language;

• Refresh;

• Window-target;

• Content-Script-Type;

• Content-Style-Type.

Рассмотрим их применение.

Свойство Expires

В примере ниже показано, как выглядит формат метатэга со свойством Expires (Дата устаревания):

<META HTTP-EQUIV="Expires" C0NTENT="Mon, 29 Nov 2004 08:21:57 GMT">

Клиенту будет возвращен такой заголовок HTTP:

Expires: Mon, 29 Nov 2004 08:21:57 GMT

Заголовок данного вида используется для управления кэшированием. Если указанный в метатэге срок устаревания истек, то при запросе документа он будет доставлен по сети, а не загружен из кэша.

Нулевое значение даты (C0NTENT="0") приводит к тому, что браузер проверяет при каждом запросе, не изменился ли документ. Поисковые роботы могут либо совсем не индексировать его, либо постоянно отслеживать изменения в документе.

Формат даты описан в стандарте RFC850 (ftp://ftp.nsc.ru/pub/rfc/rfc850.txt).

Для решения ряда задач требуется, чтобы при каждом запросе документ загружался не из кэша браузера, а с сервера. Обычно это необходимо для сайтов, которые поставляют динамически изменяющееся содержание. В качестве примера можно привести результат какого-либо поиска (информация о курсе доллара в реальном режиме, электронный магазин или обычный чат). В таких случаях страница в кэше не обязательно соответствует реальной.

В подобной ситуации можно запретить браузеру кэшировать страницы при помощи свойства метатэга Expires, которое указывает дату устаревания содержимого страницы. Для того чтобы она не кэшировалась, достаточно установить прошедшую дату – например, вот так:

<META HTTP-EQUIV="Expires" CONTENT="Mon, 01 Jan 2000 00:00:00 GMT">

Если страница содержит постоянные данные и не требует регенерации при каждом запросе, то вам не следует отключать кэширование для браузера. Это позволит браузерам использовать сохраненную в кэше копию страницы в течение некоторого отрезка времени, которым вы можете управлять. Кэширование может значительно снизить нагрузку на вашем сервере.

Обычно имеет смысл отключать кэширование лишь для динамических страниц, которые содержат информацию, изменяющуюся со временем. И то далеко не всегда. Какие же из динамических страниц могут быть кандидатами на кэширование? Например, страница с прогнозом погоды, где информация обновляется каждые 5 минут. Или начальная страница сайта, которая содержит список материалов на сервере или официальные сообщения для печати, которые модифицируются два раза в день. Другие подобные страницы, где обновления происходят раз в несколько часов.

Заметьте, что с кэшированием в браузере вы получите меньшее количество посетителей, зарегистрированных на вашем сервере. Поэтому, если вы хотите точно измерять количество просмотров страниц или показов баннеров, то, скорее всего, вы откажетесь от кэширования.

Свойство Pragma

Свойство Pragma (Контроль кэширования) применяется для отказа от кэширования и задается следующим образом:

<META HTTP-EQUIV="Pragma" C0NTENT="no-cache">

Отказ от кэширования означает, что при запросе документа он будет доставлен по сети, а не загружен из кэша. Обратите внимание, что неразумное запрещение кэширования усложняет навигацию по сайту и увеличивает время ожидания. Так, при нажатии в браузере кнопки Back (Назад) происходит новый запрос сервера и приходится ждать загрузки страницы, которая минутой ранее была отправлена клиенту и уже есть у него в компьютере.

Свойство Content-Type

Свойство Content-type (Тип содержимого) служит для указания типов содержимого (типов MIME), к которым относятся «text/html», «i/png», «i/gif», «video/mpeg», «audio/basic», «text/tcl», «text/javascript» и «text/vbscript» (с учетом регистра). Текущий список зарегистрированных типов MIME можно найти по адресу ftp://ftp.isi.edu/in-notes/iana/assignments/media-types/. Тип содержимого «text/css», хотя он и не зарегистрирован, используется для иерархических, или каскадных, таблиц стилей (CSS).

Тип документа "text/html" дополнительно расширяется указанием кодировки страницы charset (набор символов) – тогда браузер выводит ее сразу в заданной кодировке. Однако обратите внимание: если текст документа написан в windows-1251, а значение указано charset=K0I8-r, то изменить кодировку в браузере невозможно и текст совершенно не читается.

Формат метатэга следующий (для типа содержимого "text/html" и набора символов windows-1251):

<META HTTP-EQUIV="Content-type" C0NTENT="text/html; charset= windows-1251">

Немного о кодировках

Кодировка представляет собой таблицу, где каждому символу – буквам алфавита, цифрам и специальным знакам – соответствует свой уникальный номер, код символа.

Полностью стандартизирована лишь первая часть таблицы, так называемый ASCII-код – первые 128 символов, включающих цифры и буквы латинского алфавита. Поэтому с ними никогда не бывает проблем. Вторая же часть таблицы (всего в ней 256 символов – по числу состояний, которые может принять один байт) отведена под специальные символы. Она используется для кодировки символов национальных алфавитов, причем для каждого языка и в каждой стране она различна. При этом для букв русского языка создано пять различных кодировок, то есть одному символу соответствуют разные цифровые коды. Таким образом, при неправильной кодировке мы получим совершенно нечитаемый текст.

На заре развития вычислительной техники очень широко использовалась кодировка с кириллицей KOI-8. Она появилась в семидесятые годы при адаптации операционной системы UNIX к русскому языку – персональных компьютеров тогда еще не было. KOI-8 – до сих пор основная кодировка в UNIX. Потом началось победное шествие персональных компьютеров IBM, а с ними – операционных систем MS DOS, имевших DOS-кодировку (или кодовую страницу 866). Параллельно развивались компьютеры Macintosh, и, разумеется, была придумана еще одна кодировка – MAC. Наконец, с появлением операционной системы Microsoft Windows появилась и новая windows-кодировка (кодовая страница 1251). Она-то и стала самой распространенной в России.

Еще один вариант связан с попытками стандартизации кодировок на уровне всей планеты. Разработчики из ISO, международной организации по стандартам, создали еще одну кодировку и назвали ее ISO-8859-5. В настоящее время она практически не применяется (по-видимому, ее используют лишь в базе данных Oracle), однако поддержка данной кодировки предусмотрена во всех браузерах.

В настоящее время создана универсальная кодировка UNICODE, в которую вошли все языки мира, поэтому на каждый символ в ней отведено по два байта. Таким образом, максимальное число знаков в таблице расширилось до 65 535. Сейчас UNICODE находит свое применение, но пока не слишком широкое.

Правильное отображение символов национальных алфавитов касается как Web-серверов, так и браузеров. Они должны осуществлять информационный обмен на одном языке и в одной кодировке, и только в этом случае сообщения будут доступны.

Сервер должен иметь эффективную систему предварительного оповещения о том, в какой кодировке будет прислана страница. Клиентской программе (браузеру) необходимо принять такое сообщение и, соответственно, настроиться на нужное отображение. Если все сделать правильно, то никаких трудностей не возникнет. Однако при некорректной настройке Web-сервера он сообщает об одной кодировке (например, windows-1251), а страницу пересылает в другой (например, в KOI-8). Пользуясь указаниями сервера, браузер, естественно, ошибается и отображает страницу неверно.

Как показано выше, можно задать кодировку документа не на сервере, а непосредственно в HTML-коде – с помощью метатэга со свойством Content-type. Но не все так просто. В России распространен способ, при котором сервер автоматически определяет, в какой кодировке приходит запрос от клиента, и пересылает страницу Web-браузеру уже перекодированной. Вот тут-то использование указанного метатэга и может сыграть с вами злую шутку. Дело в том, что указания на странице имеют приоритет над командами, присылаемыми Web-сервером, и, правильно перекодировав страницу, сервер не может изменить содержимое метатэга. Происходит несовпадение реальной кодировки, в которой пришел документ, и указаний в тэге META. Такую страницу нельзя будет нормально просмотреть и перекодировать средствами браузера. Выбор кодировки вручную в данном случае не поможет, так как метатэг имеет приоритет и над установками браузера. Единственный способ прочитать документ – это сохранить страницу и удалить злосчастный тэг.

Учитывая все вышесказанное, данный тэг можно вообще не применять. Тогда просмотр будет вестись в той кодировке, на которую настроен браузер, если сервер не пришлет уведомление о другой кодировке документа. В этом случае клиент сможет легко ее переключить. У подавляющего большинства ваших посетителей из России по умолчанию выставлена кодировка windows-1251, поэтому у них страница сразу же будет показана правильно.

Свойство Content-language

Язык документа, указанный в метатэге со свойством Content-language (Язык содержимого), может использоваться поисковыми машинами при индексировании страниц.

Метатэг имеет следующий формат:

<META HTTP-EQUIV="Content-language" C0NTENT="en-GB">

Язык задается комбинацией двух значений язык-диалект (при этом значение диалект может отсутствовать), в данном примере – английский-Великобритания. Язык представляет собой двухбуквенный код, зарезервированный для сокращений типа fr – французский, de – немецкий, ru – русский.

Спецификация HTML 4.0 допускает явное указание автором языка в самом документе:

<HTML LANG="en">

Подобная информация может пригодиться:

• поисковым машинам;

• синтезаторам речи;

• агентам пользователей (клиентским программам) при выборе вариантов глифов для типографской печати высокого качества;

• агенту пользователя при выборе набора кавычек;

• агенту пользователя при настройке переноса, лигатур и интервалов;

• программам проверки грамматики и орфографии.

Все коды языков, которые должны использоваться в документах на языке HTML, определены и описаны в стандарте RFC1766 (ftp://ftp.nsc.ru/pub/rfc/rfc1766.txt).

Реализовывать рассмотренную возможность следует крайне осторожно, поскольку могут возникнуть проблемы, из-за которых текст на странице станет нечитаемым.

Свойство Refresh

Свойством Refresh (Период обновления) определяется время задержки, после которой браузер автоматически обновляет документ. Метатэг часто используется для автоматической загрузки другого документа (или, как говорят, переадресации, перенаправления).

Формат метатэга таков:

<META HTTP-EQUIV="Refresh" C0NTENT="3, URL=http://www.name.ru/page.html">

C0NTENT – число, указывающее время задержки в секундах; далее следует адрес, который нужно загрузить по прошествии этого времени. Подобный способ широко используется для создания кратковременных заставок. Но, поскольку некоторые браузеры его не поддерживают, в заставке, чтобы она не «зависала», необходимо предусмотреть возможность перехода на следующую страницу. Кроме того, применение данного способа затрудняет возврат на предыдущие страницы стандартными средствами. При переадресации (то есть при значении 0) пользователь не может вернуться на предыдущую страницу с помощью кнопки Назад (Back), так как его в ту же секунду пересылают на страницу, с которой он пытается уйти.

Как известно, изменение адреса сайта влечет за собой потерю его посетителей. Поэтому обычно по старому адресу размещают информацию, которая поможет найти сайт. Но можно сделать и так, чтобы в дополнение к этому браузер сам перешел на использование нового адреса – благодаря метатэгу со свойством Refresh.

Свойство Window-target

Свойство Window-target (Окно текущей страницы) служит для определения окна текущей страницы. Его можно использовать, чтобы исключить появление новых окон во время применения фреймовых структур.

Вид метатэга может быть, например, таким:

<META HTTP-EQUIV="Window-target" C0NTENT="_top">

Свойство Content-Script-Type

Поскольку в документах HTML не предполагается использовать определенный язык сценариев, авторы должны указывать его непосредственно в каждом фрагменте кода. Это можно сделать с помощью объявления скрипта по умолчанию для всего документа или с помощью локального объявления.

Чтобы объявить скрипт по умолчанию, в текст HTML-документа необходимо включить следующий метатэг:

<META HTTP-EQUIV="Content-Script-Type" C0NTENT="type">

Здесь «type» – тип содержимого, указывающий язык скрипта. Примеры значений – "text/tcl", "text/javascript", "text/vbscript".

Свойство Content-Style-Type

Чтобы установить для документа язык таблицы стилей по умолчанию, надо использовать следующую строку:

<META HTTP-EQUIV="Content-Style-Type" C0NTENT="text/css">

Документы, в которых применен тэг STYLE, но не определен язык таблиц стилей по умолчанию, являются некорректными.

Метатэги для поисковых машин

Метатэги, которые помогают поисковым машинам индексировать сайт, делают документы для них более доступными.

Представители большинства поисковых систем уже сошлись во мнении, что применение метатэгов способствует повышению релевантности отклика при обработке запросов. Но есть и прямо противоположная точка зрения, которой придерживаются, например, эксперты российской поисковой машины Rambler.

Если ваша компания широко известна и связана с производством уникальной продукции или оказанием услуг повышенного спроса, то проблем с локализацией ваших узлов в Internet у пользователя, скорее всего, не возникнет.

Другое дело, если вы пытаетесь предоставить клиентам или читателям сервис или материал, не отличающийся оригинальностью, например, связанный с разработкой Web-страниц. В этом случае даже в первую сотню ссылок из списка отклика в глобальной поисковой системе попасть не просто. Способов повышения доступности узла из поисковых машин – и оправданных, и сомнительных с точки зрения этики – немало. Важно помнить о том, что универсальных рецептов пока не существует: слишком многое зависит от специфики работы отдельного поискового сервиса. Проблема заключается еще и в том, что фактически существует два подхода к решению рассматриваемого вопроса. Один предлагается в рекомендациях по созданию документов экспертами самой поисковой системы, другой используется разработчиками, чтобы достичь высокого рейтинга.

По-видимому, самый полезный совет заключается в следующем: анализируйте HTML-код тех документов, которые добились в интересующей вас сфере деятельности и поисковой системе наивысших рейтинговых результатов. Это относится и к метатэгам, и к остальному содержимому страниц. Естественно, такой анализ требует специальных навыков и отличается трудоемкостью, что может послужить веским доводом для обращения к профессионалу.

Оптимальный результат обеспечила бы компания-посредник, имеющая прямой контакт с разработчиками поисковых систем. Если нечто подобное и существует, информация об этом по понятным причинам вряд ли когда-либо будет предана огласке. Есть, однако, косвенные, хотя и медленно действующие приемы, которые позволяют провести анализ работы поисковых систем и доступны каждому: речь идет о тестировании. Известны примеры создания целых тестовых Web-узлов, единственная задача которых – определить, насколько чувствительна работа алгоритма отдельной поисковой машины к тому, как размещена информация на Web-страницах. Широкое распространение в Internet получила и разработка так называемых страниц-мостиков, которые оптимально нацелены на конкретную поисковую систему. Добраться с них до основной страницы узла адресатам информации позволяют гиперссылки.

В целом ситуация, когда материалы сайта в первую очередь ориентированы на поискового робота, а не на конечного пользователя, не может не вызывать опасений. Так, например, одно время AltaVista особенно высоко оценивала содержимое заголовка страницы, помещаемое в контейнер TITLE. В результате список отклика этого индекса возглавили сотни документов, имеющих вместо связного заголовка набор ключевых слов и фраз. Именно этот набор становился по умолчанию именем закладки на документ при работе с большинством браузеров.

Как оказалось, даже такая «прецизионная» настройка на систему не дает долговременных гарантий: после того как AltaVista изменила характер ранжирования документов, рейтинг многих фаворитов катастрофически снизился.

Ключевые слова и описания

Чтобы получить высокий рейтинг в поисковых системах, требуется выбрать для передачи им основные ключевые слова и фразы сайта. В общей сложности их должно быть не меньше десяти (желательно – несколько десятков), и они должны соответствовать содержанию сайта. Кроме того, требуется составить краткое описание сайта – абзац длиной не более 1 000 знаков (для некоторых поисковых машин – не более 700).

Ваш сайт для поисковых систем – один из многих, поэтому текст описания, который обычно появляется на страницах с результатами поиска, должен быть интересным, привлекающим внимание, чтобы у читателя возникло сразу желание посетить сайт. Ключевые слова в нем необходимо использовать как можно чаще – от этого зависит высота рейтинга.

Вообще, к подбору ключевых слов следует подойти очень серьезно. Правильный их выбор позволяет сильно повысить позицию сайта при запросах.

Какие же слова следует выбирать? Разумеется, те, которые наиболее точно отражают специфику именно вашего проекта. При этом следует избегать случайных и общих фраз. Представьте себя на месте человека, который пытается найти ваш сайт. С каких слов вы начнете поиск? Что наберете в поле запроса поисковой системы?

Каждый вариант следует проверить в какой-либо поисковой системе (лучше – в нескольких). Оцените, насколько список найденных сайтов связан с тематикой вашего. Если такая связь не вызывает сомнений, то выбранные вами слова подходят на роль ключевых; в противном случае стоит поискать другие. Для наглядности не мешает посмотреть, какие ключевые слова используются на первых страницах результата поиска.

Многие индексирующие машины проводят поиск элементов тэга META, в которых задан разделенный запятыми список ключевых слов и фраз или дается краткое описание. Поисковые машины могут представлять их как итог поиска или использовать для улучшения его результатов.

Формат указанных метатэгов иллюстрируют следующие примеры:

<META NAME="keywords" C0NTENT="отпуск, Греция, солнце">

<META NAME="description" C0NTENT="Идилличеcкий отпуск в Европе">

В поле C0NTENT не должно быть знаков конца строки, кавычек и других специальных символов; регистр символов значения не имеет.

Не рекомендуется повторять несколько раз одни и те же ключевые слова, так как это может быть воспринято как спам, в результате чего страница может быть удалена из индекса поисковой машины. Обычно спамом называют несанкционированную рассылку электронной почты. К ней зачастую прибегают недобросовестные рекламодатели, распространители вирусов и т. д. Однако здесь и далее по тексту под спамом будет подразумеваться намеренное злоупотребление ключевыми словами в заголовках, комментариях и тексте самого документа.

Не стоит использовать одинаковые списки ключевых слов для разных страниц сайта. Конечно, так проще, но содержимое документов различное, да и поиск ведется по-разному. Если вам хочется автоматизировать эту работу (действительно, довольно трудоемкую, ведь общий объем ключевых слов одного документа может достигать 50 % от его объема), напишите программу, которая выбирала бы текст из определенных блоков документа, например, из контейнеров, заключенных в тэгах H, I и B. Задача не кажется сложной, да и можно найти подобную программу в архивах программного обеспечения в Internet.

Если строка в поле C0NTENT получается слишком длинной, не возбраняется разбить ее на несколько конструкций этого вида.

Указание ключевых слов – это основной способ использования тэга META. Информация о документе, составленном с использованием различных языков, может быть представлена в нескольких таких тэгах. Тогда поисковые машины могут фильтровать атрибут LANG и отображать результаты поиска с применением выбранного пользователем языка – например, так:

<– Для говорящих на английском в американской версии->

<META NAME="keywords" LANG="en-us" C0NTENT="vacation, Greece, sunshine">

<– Для говорящих на британском английском ->

<META NAME="keywords" LANG="en" C0NTENT="holiday, Greece, sunshine">

<– для русскоязычных пользователей ->

<META NAME="keywords" LANG="ru" C0NTENT="oтпycк, Греция, солнце">

Эффективность обращения к поисковым машинам можно повысить также за счет использования тэга LINK для создания ссылок на разноязычные переводы страницы, на версии документа для другого носителя (например, PDF) и, если документ является частью набора, ссылок на соответствующую начальную точку для просмотра набора.

Метатэг NAME="keywords" позволяет автору документа самостоятельно создать адекватный содержанию набор ключевых слов и фраз. Допустимая для восприятия роботом длина перечня варьируется от 874 до 1 000 символов. При отсутствии указанного метатэга робот формирует набор автоматически на основе своего алгоритма. Если индексируется все содержимое документа, то он будет участвовать в отклике и по тем терминам, которые входят в текст страницы, но отсутствуют в метатэге. Автоматический индекс при создании поискового образа документа может комбинировать содержимое метатэгов и текста, должным образом взвешивая термины из разных полей Web-страницы. При этом далеко не все системы, которые поддерживают метатэги, отдают явное предпочтение входящим в них терминам.

Отметим также, что метатэг ключевых слов стоит размещать в одну строку, поскольку некоторые роботы не умеют переходить к новой строке.

Ключевые слова лучше не повторять более двух раз, иначе поисковая система может расценить это как спам. Нежелательно, например, задавать последовательности вида «free, free, free, free, free, free», но вполне допустимы такие, как «free, free web, free stuff, internet for free».

Большего успеха можно добиться, если использовать не ключевые слова, а ключевые фразы. Если вы подберете их удачно, то, возможно, при запросе ваша ссылка окажется одной из первых. Есть еще один, не вполне серьезный прием, основанный на известной ошибке. Многие забывают переключать языковую раскладку клавиатуры, и тогда, допустим, вместо запроса «free» возникает запрос: «акуу», то есть английское слово, введенное буквами кириллицы, расположенными на соответствующих клавишах. Как ни странно, результат бывает положительным: поисковая система выдает ссылку на ваш сайт!

Для хорошего индексирования документа поисковыми системами рекомендуется в первом абзаце текста на каждой странице использовать как можно больше отобранных для нее ключевых слов.

Как известно, основную смысловую нагрузку несут в языке имена существительные. Поэтому именно они составляют большую часть ключевых поисковых слов. Значительно реже используются прилагательные, совсем редко – глаголы, наречия, предлоги, союзы. Имена прилагательные просто незаменимы, если требуется индексировать «голландский сыр» с «баварским пивом» в «ночном клубе».

Очень эффективно использование редких слов. К таковым можно отнести специальные термины, названия местностей, организаций, имена людей и т. п. Применение подобной лексики позволяет максимально конкретизировать тематику.

Существует целый ряд слов, которые поисковая система будет игнорировать при запросе; их поиск невозможен. Это так называемые стоп-слова, например: на, что, это, для и др. Они настолько часто встречаются в текстах, что искать по ним что-либо крайне затруднительно. Интересно, что в списки стоп-слов для некоторых поисковых машин уже входят такие, как Internet, компьютер, Сеть. Они стали настолько распространенными, что утратили свое значение (с точки зрения поиска, конечно). Очевидно, что использовать стоп-слова в качестве ключевых нет смысла.

Метатэг NAME="description" позволяет включить в поле C0NTENT краткое описание документа. В зависимости от робота воспринимаемая длина текста составляет от 150 до 250 символов. После индексирования поисковой машиной описание должно появиться рядом со ссылкой на документ при попадании его в список отклика.

Страницы: 12 »»

Читать бесплатно другие книги:

Центральный персонаж этой истории – хоббит Бильбо Бэггинс – рядовой обыватель, превыше всего ценящий...
Повести, вошедшие в книгу, принадлежат перу одного из самых известных и читаемых детских писателей с...
Спасатель Тейлор Макэден слишком хорошо знает, как хрупка человеческая жизнь.Снова и снова он убежда...
В этой книге автор рассказывает нам о жизни в гармонии с собой, о простом способе найти тропинку к с...
«Отношения и Закон Притяжения» – новая книга Эстер и Джерри Хикс. Она поможет вам осмыслить все взаи...
Какое удовольствие наблюдать за любимым человеком, читающим "валентинку", или за другом, буквально р...