Россия, Санкт Петербург |
Микроформаты
Презентацию к данной лекции Вы можете скачать здесь.
Информация в "чистом виде" имеет не очень большую ценность. Например, что для вас значит выражение "54.45N56.0E"? Если добавить, что это - географические координаты города Уфы, выражение приобретает совсем другой смысл. Окружающие нас вещи и явления воспринимаются через призму личного опыта и оценок людей, которым мы доверяем. Информация воспринимается нами в контексте метаданных - неких, ярлычков, характеризующих тот или иной объект. Например, в адресной книге сотового телефона телефонному номеру соответствует некое словесное описание абонента, в прайс-листе названию товара соответствуют дополнительные описания и так далее.
Для людей не составляет труда понять смысл текста, заключенного в HTML-документ, однако, компьютерам это сделать гораздо сложнее. Для распознавания смысла текста используются так называемые парсеры, анализирующие соответствующим образом структурированный документ по определенным критериям. Для того, чтобы парсеры могли анализировать HTML-документ, в нем размещаются особые блоки - микроформаты.
Микроформаты (англ. microformats; иногда сокращённо F или uF) позволяют наделять информацию смыслом, понятным для программ, обрабатывающих web-страницы. Микроформаты структурируют информацию согласно определенным соглашениям.
Принципы построения микроформатов
При использовании микроформатов к существующей HTML-разметке добавляются новые составляющие, наполненные особым, заранее определённым смыслом. Например, с помощью атрибута class можно обозначить смысл того или иного HTML-элемента на странице (этот атрибут определён для всех элементов). Таким образом, люди приходят к соглашению об использовании определённых значений атрибутов (в том числе class ) для разметки определённых фрагментов информации. В дальнейшем такую разметку можно обрабатывать машинными средствами [1].
Для разметки микроформатами подходят любые элементы HTML, но особое значение придаётся элементам, которые не имеют собственного, стандартного семантического значения - div и span.
Рассмотрим некоторые распространенные микроформаты.
hCard - организации и люди
hCard (сокращение для HTML vCard) - микроформат для публикации контактной информации людей, компаний, организаций и мест [2].
<div class="vcard"> <div class="fn org">Башкирский государственный педагогический университет им. М Акмуллы</div> <div class="adr"> <div class="street-address">Октябрьской революции, 3А</div> <div> <span class="locality">Уфа</span>, <span class="region">Республика Башкортостан</span> <span class="postal-code">450000</span> </div> <div class="country-name">Россия</div> </div> <div>Телефон: <span class="tel">+7-347-272-9127</span></div> <div>E-mail: <span class="email">info@bspu.ru</span></div> <div> <span class="tel"><span class="type">Факс</span>: <span class="value">+7-347-272-9127</span></span> </div> </div>
hCalendar - события в форме календаря
hCalendar (сокращённо от HTML iCalendar) - микроформат для представления семантической информации о событиях в формате календаря.
Он позволяет инструментам для парсинга (например, другим сайтам или расширениям Operator и Tails для Firefox) извлекать информацию о событии и отображать её на сайтах, индексировать, искать её или загрузить её в программу календаря или дневника и прочее [3].
<span class="vevent"> <span class="summary">Вечеринка</span> пройдет <span class="dtstart"> <span class="value">2010-02-26</span>, с <span class="value">19:00</span></span> до <span class="dtend"><span class="value">22:00</span></span>. </span>
hAtom - ленты новостей
hAtom - ленты новостей (как аналог RSS и Atom) в обычном HTML или XHTML;
<span class="hentry"> <span class="entry-summary">Образец короткого блога</span> был опубликован <span class="published"> <span class="value">2010-08-01</span> в <span class="value">12:06</span></span> и обновлен в <span class="updated"><span class="value">12:10</span></span>. </span>
XFN - Социальные сети
Использование
Необходимо сообщить браузерам и поисковикам что страница поддерживает XFN.
Для этого в тэге <head> веб-страницы надо добавить атрибут profile:
<head profile="http://gmpg.org/xfn/11">
Для каждой гиперссылки на странице нужно добавить атрибут rel. Значений атрибута rel может быть несколько, в таком случае они перечисляются через пробел.
Пример:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" > <head runat="server"> <title>Социальные сети</title> <head profile="http://gmpg.org/xfn/11"> </head> <body> <form id="form1" runat="server"> <a href="http://myfriends.org" rel="contact colleague co-resident">Друзья</a> </form> </body> </html>
Geo - широта и долгота
Geo - микроформат, используемый для пометки географических координат в формате WGS84 (широта;долгота) на (X)HTML-страницах.
<div class="geo">Уфа: <span class="latitude">54.45</span>; <span class="longitude">56.0</span></div>
hReview - отзывы (о товарах, услугах, событиях и тому подобном)
<div class="hreview"> <span><span class="rating">5</span> звезд из 5</span> <h4 class="summary">Ашхана Гузель</h4> <span class="reviewer vcard">Рецензент: <span class="fn">Марат</span> - <abbr class="dtreviewed" title="20100418T2300-0700">April 18, 2010</abbr></span> <div class="description item vcard"><p> <span class="fn org">Гузель</span>Один из лучших ресторанов <span class="adr"><span class="locality">Уфа</span></span>. Отличное питание и обслуживание </p></div> <p>Дата посещения: <span> Апрель 2010</span></p> <p>Съеденное блюдо: <span> Бишбармак</span></p> </div>
Веб-фрагменты в IE8
Одной из разновидностей микроформатов являются веб-фрагменты. Например, такой микроформат, как hAtom (лента новостей) часто реализуется в виде веб-фрагментов, с помощью которых можно постоянно быть в курсе событий. Для MS IE8 создано большое количество веб-фрагментов. Познакомиться с ними можно, например, по адресу: http://ieaddons.com/ru/webslices/.
Хотелось бы упомянуть следующие популярные веб-фрагменты, созданные для IE8:
Vesti.ru
Содержит информацию о наиболее важных событиях в России и за рубежом.
Новости@Mail.Ru
Подписавшись на этот веб-фрагмент, можно ознакомиться с самыми последними новостями политики, экономики, культуры и спорта.
Яндекс.Новости
Служба новостей обновляется в режиме реального времени 7 дней в неделю и 24 часа в сутки и беспристрастно отображает информационную картину дня. Данные для обработки поступают от партнеров службы - ведущих российских и зарубежных СМИ [4].
MSN Россия - Видео
Данный веб-фрагмент обеспечит мгновенное информирование о новых видеороликах на русскоязычном портале MSN Видео [4].
Новые микроформаты
Разработка новых микроформатов происходит в открытом режиме.
Среди множества предлагаемых микроформатов наиболее близки к завершению микроформаты для разметки цитат и валют.
Краткие итоги
На этом занятии мы познакомились с инструментами ( микроформатами ), позволяющими структурировать информацию по определенным критериям. Микроформаты делают информацию понятной для программ, обрабатывающих web-страницы.
Набор для практики
Вопросы:
- Что такое метаданные? Приведите примеры.
- Что такое парсер?
- Что такое микроформаты? Назовите известные вам микроформаты.
Упражнения:
- Разработайте микроформат, описывающий прогноз погоды
- Разработайте микроформат, описывающий рецепт приготовления блюда