Семантический веб и микроформаты
20.5. Дополнительная тема: использование служб статистики
20.5.1. Общие сведения
Веб-аналитика (Web analytics) – это измерение, сбор, анализ, представление и интерпретация информации о посетителях веб-сайтов с целью их улучшения и оптимизации [36]. Основной задачей веб-аналитики является мониторинг работы веб-сайтов, на основании которого определяется веб-аудитория и изучается поведение веб-посетителей для принятия решений по развитию и расширению функциональных возможностей веб-ресурса.
Веб-аналитика помогает во многих аспектах развития сайта. Вот основные из них:
- развитие функционала сайта, на основании тенденций в поведении посетителей;
- оценка эффективности рекламных кампаний любого типа;
- выявление проблемных мест в навигации сайта.
К основным методам веб-аналитики можно отнести:
- Анализ посещаемости сайта: статистика, тенденции, абсолютные и относительные показатели.
- Анализ юзабилити (анализ плотности щелчков, путей по сайту)
- Бенчмаркинг. Сравнение с общими тенденциями и с конкурентами с помощью независимых исследователей (Alexa, GemiusAudience, Google Trends)
Основными инструментами веб-аналитики можно считать:
- Анализаторы логов (WebTrends, Webalizer, AWStats).
- Счетчики-рейтинги – дают количество посетителей за день, неделю, месяц, за всю историю (Rambler's TOP 100, Рейтинг@mail.ru).
- Системы интернет-статистики – дают суммарную информацию по посещениям, выбранным по некоторому срезу, заданному пользователем ( Google Analytics, SpyLog, Liveinternet, Яндекс.Метрика, stat24).
- Системы интернет-статистики с детализацией по просмотрам страниц – кроме суммарной информации, дают информацию по просмотрам страниц внутри каждого посещения (Woopra, Yahoo Web Analytics).
- Системы интернет-аналитики с детализацией поведения посетителя на странице – дают максимально возможную детализацию с возможностью просмотра всех действий посетителей: движений мыши, кликов, нажатий клавиш и т.д. (ClickTale, WebVisor).
Рассмотрим более подробно два сервиса веб-аналитики: Google Analytics и Яндекс.Метрика.
Google Analytics . Инструмент профессионального уровня, функционирующий на хорошо зарекомендовавшем себя движке компании Urchin, приобретенной Google в 2005 году (рис. 20.9). С тех пор услуги системы стали бесплатными, а сам сервис обзавелся множеством дополнительных возможностей. Google Analytics можно использовать для любого количества сайтов любого масштаба. При этом исследовать статистику ресурсов можно не только посредством стандартных отчетов, но и при помощи так называемых пользовательских отчетов, отображающих информацию в соответствии с заранее заданными правилами. Интерфейс системы выполнен с использованием технологий Flash и Ajax, прост и переведен на множество языков, включая русский. Для работы с сервисом необходима учетная запись Google.
Основными плюсами Google Analytics можно считать [37]:
- невидимый счетчик;
- интеграция с рекламными сетями Google AdWords и AdSense;
- возможность предоставления доступа к статистике другим пользователям Google;
- наличие средств администрирования;
- доставки отчетов по электронной почте и их экспорта в другие форматы;
- справочная документация на русском языке;
- открытый API, позволяющий встраивать Google Analytics в другие программные продукты.
Яндекс.Метрика. Бесплатный инструмент компании "Яндекс" для оценки посещаемости сайта, анализа поведения пользователей и эффективности рекламных усилий (рис. 20.10). Сервис постоянно совершенствуется и в настоящий момент осуществляет формирование восьми групп отчетов (трафик, источники, возвраты, содержание, география, демография, карта путей, компьютеры посетителей), каждый из которых состоит из временного фильтра, интерактивного флэш-графика и таблицы с данными. Сродни Google Analytics, в " Яндекс.Метрике " также предусмотрен механизм разграничения доступа к собираемым счетчиком данным. Все отчеты в системе обновляются с периодичностью раз в 5 минут.
Основными плюсами Яндекс.Метрики можно считать [37]:
- интеграция с "Яндекс.Директом" и "Яндекс.Маркетом";
- наличие функции мониторинга доступности сайтов с возможностью рассылки SMS-уведомлений;
- справочная документация на русском языке;
- невидимый счетчик.
Недостатком " Яндекс.Метрики " можно считать отсутствие механизмов экспорта статистических данных.
В табл. 15.1 приведено сравнение Google Analytics и " Яндекс.Метрика " [38].
" Яндекс.Метрика " как отечественный сервис лучше адаптирована к реалиям Рунета, предупреждает о проблемах с сайтом, поддерживает три системы контекстной рекламы в отчетах, предоставляет доступ к демографическим данным пользователей.
Google Analytics предоставляет, в сравнении с " Яндекс.Метрикой ", практически безграничные возможности для анализа сайта. Но сложность интерфейса, как показывает практика, многих пользователей останавливает в освоении системы на начальной стадии.
Оба инструмента быстро развиваются, в них добавляются новые возможности, и нет сомнений, что критические пробелы в функционале " Яндекс.Метрики " в недалеком будущем заполнятся. Имеет смысл использовать обе системы: " Яндекс.Метрику " – для экспрессанализа, Google Analytics – для глубокого "разбора полетов" и стратегического планирования.
20.5.2. Ключевые термины
Веб-аналитика, Анализ посещаемости сайта, Анализ юзабилити, Бенчмаркинг, Анализаторы логов, Счетчики-рейтинги, Системы интернет-статистики, Google Analytics, Яндекс.Метрика.
20.6. Краткие итоги
Семантическая паутина – часть глобальной концепции развития сети Интернет, целью которой является реализация возможности машинной обработки информации, доступной во Всемирной паутине.
Semantic Web в математической форме представляет собой разновидность графа – набора вершин, соединенных дугами. В Semantic Web роль вершин выполняют понятия
Машинная обработка возможна в семантической паутине благодаря двум ее важнейшим характеристикам:
- Повсеместное использование универсальных идентификаторов ресурсов ( URI );
- Повсеместное использование онтологий и языков описания метаданных ;
Поисковые агенты получат возможность взаимодействовать не только с информацией, хранимой в сети и доступной ей для обработки, но еще и между собой.
Техническую часть Semantic Web составляет семейство стандартов на языки описания:
Также стоит выделить технологии.
Критика Semantic Web заключается в следующем:
- Практическая реализуемость;
- Дублирование информации;
- Проблемы для бизнеса;
- Анонимность и сохранение авторских прав.
Микроформаты – это способ семантически размечать сведения о разнообразных сущностях на веб-страницах, используя стандартные элементы языка HTML (или XHTML).
Каждый микроформат решает определенную, отдельную задачу. Вот наиболее известные из них [20]:
Микроформаты используются в Internet Explorer 8 в виде технологии веб-фрагментов.
Поисковая система – веб-сайт, предоставляющий возможность поиска информации в Интернете.
Поисковые cистемы обычно состоят из трех компонент:
- агент (паук или кроулер), который перемещается по Сети и собирает информацию;
- база данных, которая содержит всю информацию, собираемую пауками;
- поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных.
Основополагающими характеристиками информационно- поисковых систем является полнота и релевантность результатов поиска. Для пользователя пертинетность, соотношение объема полезной для него информации к общему объему полученной информации, имеет решающее значение.
OpenSearch – набор технологий, позволяющих веб-сайтам и поисковым системам публиковать результаты поиска в форматах, удобных для распространения и сбора.
Поисковая оптимизация – комплекс мер для поднятия позиций сайта в результатах выдачи поисковых систем по определенным запросам пользователей.
Поисковая оптимизация делится на:
Веб-аналитика – это измерение, сбор, анализ, представление и интерпретация информации о посетителях веб-сайтов с целью их улучшения и оптимизации.