Опубликован: 05.08.2010 | Доступ: платный | Студентов: 35 / 1 | Оценка: 4.12 / 4.02 | Длительность: 10:07:00
Лекция 10:

Микроформаты

Аннотация: Ценность информации значительно повышается, если к ней добавить метаданные. Метаданные определенным образом характеризуют информацию (географические координаты, цена, отзывы покупателей и т.д.), структурируют ее, облегчают поиск. В качестве таких метаданных мы рассмотрим микроформаты.

Презентацию к данной лекции Вы можете скачать здесь.

Информация в "чистом виде" имеет не очень большую ценность. Например, что для вас значит выражение "54.45N56.0E"? Если добавить, что это - географические координаты города Уфы, выражение приобретает совсем другой смысл. Окружающие нас вещи и явления воспринимаются через призму личного опыта и оценок людей, которым мы доверяем. Информация воспринимается нами в контексте метаданных - неких, ярлычков, характеризующих тот или иной объект. Например, в адресной книге сотового телефона телефонному номеру соответствует некое словесное описание абонента, в прайс-листе названию товара соответствуют дополнительные описания и так далее.

Для людей не составляет труда понять смысл текста, заключенного в HTML-документ, однако, компьютерам это сделать гораздо сложнее. Для распознавания смысла текста используются так называемые парсеры, анализирующие соответствующим образом структурированный документ по определенным критериям. Для того, чтобы парсеры могли анализировать HTML-документ, в нем размещаются особые блоки - микроформаты.

Микроформаты (англ. microformats; иногда сокращённо \mu F или uF) позволяют наделять информацию смыслом, понятным для программ, обрабатывающих web-страницы. Микроформаты структурируют информацию согласно определенным соглашениям.

Принципы построения микроформатов

При использовании микроформатов к существующей HTML-разметке добавляются новые составляющие, наполненные особым, заранее определённым смыслом. Например, с помощью атрибута class можно обозначить смысл того или иного HTML-элемента на странице (этот атрибут определён для всех элементов). Таким образом, люди приходят к соглашению об использовании определённых значений атрибутов (в том числе class ) для разметки определённых фрагментов информации. В дальнейшем такую разметку можно обрабатывать машинными средствами [1].

Для разметки микроформатами подходят любые элементы HTML, но особое значение придаётся элементам, которые не имеют собственного, стандартного семантического значения - div и span.

Рассмотрим некоторые распространенные микроформаты.

hCard - организации и люди

hCard (сокращение для HTML vCard) - микроформат для публикации контактной информации людей, компаний, организаций и мест [2].

<div class="vcard">
   <div class="fn org">Башкирский государственный педагогический университет им. М Акмуллы</div>
   <div class="adr">
     <div class="street-address">Октябрьской революции, 3А</div>
     <div>
       <span class="locality">Уфа</span>, 
       <span class="region">Республика Башкортостан</span> <span class="postal-code">450000</span>
     </div>
     <div class="country-name">Россия</div>
   </div>
   <div>Телефон: <span class="tel">+7-347-272-9127</span></div>
   <div>E-mail: <span class="email">info@bspu.ru</span></div>
   <div>
     <span class="tel"><span class="type">Факс</span>: 
     <span class="value">+7-347-272-9127</span></span>
   </div>
 </div>
Микроформат hCard

Рис. 12.1. Микроформат hCard

hCalendar - события в форме календаря

hCalendar (сокращённо от HTML iCalendar) - микроформат для представления семантической информации о событиях в формате календаря.

Он позволяет инструментам для парсинга (например, другим сайтам или расширениям Operator и Tails для Firefox) извлекать информацию о событии и отображать её на сайтах, индексировать, искать её или загрузить её в программу календаря или дневника и прочее [3].

<span class="vevent">
 <span class="summary">Вечеринка</span> пройдет
 <span class="dtstart">
  <span class="value">2010-02-26</span>, с
  <span class="value">19:00</span></span> до 
 <span class="dtend"><span class="value">22:00</span></span>.
</span>

Рис. 12.2.

hAtom - ленты новостей

hAtom - ленты новостей (как аналог RSS и Atom) в обычном HTML или XHTML;

<span class="hentry">
 <span class="entry-summary">Образец короткого блога</span>
был опубликован <span class="published">
  <span class="value">2010-08-01</span> в <span class="value">12:06</span></span>
 и обновлен в <span class="updated"><span class="value">12:10</span></span>.
</span>

Рис. 12.3.

XFN - Социальные сети

Использование

Необходимо сообщить браузерам и поисковикам что страница поддерживает XFN.

Для этого в тэге <head> веб-страницы надо добавить атрибут profile:

<head profile="http://gmpg.org/xfn/11">

Для каждой гиперссылки на странице нужно добавить атрибут rel. Значений атрибута rel может быть несколько, в таком случае они перечисляются через пробел.

Пример:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" >
<head runat="server">
    <title>Социальные сети</title>
<head profile="http://gmpg.org/xfn/11">
</head>
<body>
    <form id="form1" runat="server">
<a href="http://myfriends.org" rel="contact colleague co-resident">Друзья</a>
    </form>
</body>
</html>

Рис. 12.4.
Возможные значения атрибута rel
Категория Значения Комментарии
Друзья friend друг
acquaintance знакомый
contact кто-либо, кого вы знаете как найти (обычно тоже знает как найти вас)
Лично встречались met кто-либо, с кем вы встречались лично
Работа / учёба co-worker кто-либо, работающий вместе с вами
colleague коллега (общие интересы)
Географически co-resident кто-либо, живущий с вами на одной улице
neighbor более широкое значение
Семья child ребёнок (или подопечный)
parent родитель (или опекун)
sibling брат / сестра
spouse супруг / супруга
kin родственник
Романтика muse кто-либо, вдохновляющий вас
crush кто-либо, к кому вы испытываете страстное увлечение
date кто-либо, с кем вы встречаетесь
sweetheart возлюбленная / возлюбленный
Вы me ваш альтернативный веб-адрес

Geo - широта и долгота

Geo - микроформат, используемый для пометки географических координат в формате WGS84 (широта;долгота) на (X)HTML-страницах.

<div class="geo">Уфа: <span class="latitude">54.45</span>; <span class="longitude">56.0</span></div>

Рис. 12.5.

hReview - отзывы (о товарах, услугах, событиях и тому подобном)

<div class="hreview">
 <span><span class="rating">5</span> звезд из 5</span>
 <h4 class="summary">Ашхана Гузель</h4>
 <span class="reviewer vcard">Рецензент: <span class="fn">Марат</span> - 
 <abbr class="dtreviewed" title="20100418T2300-0700">April 18, 2010</abbr></span>
 <div class="description item vcard"><p>
  <span class="fn org">Гузель</span>Один из лучших ресторанов
<span class="adr"><span class="locality">Уфа</span></span>.
  Отличное питание и обслуживание
 </p></div>
 <p>Дата посещения: <span> Апрель 2010</span></p>
 <p>Съеденное блюдо: <span> Бишбармак</span></p>
</div>

Рис. 12.6.

Веб-фрагменты в IE8

Одной из разновидностей микроформатов являются веб-фрагменты. Например, такой микроформат, как hAtom (лента новостей) часто реализуется в виде веб-фрагментов, с помощью которых можно постоянно быть в курсе событий. Для MS IE8 создано большое количество веб-фрагментов. Познакомиться с ними можно, например, по адресу: http://ieaddons.com/ru/webslices/.

Хотелось бы упомянуть следующие популярные веб-фрагменты, созданные для IE8:

Vesti.ru

Содержит информацию о наиболее важных событиях в России и за рубежом.

Новости@Mail.Ru

Подписавшись на этот веб-фрагмент, можно ознакомиться с самыми последними новостями политики, экономики, культуры и спорта.

Яндекс.Новости

Служба новостей обновляется в режиме реального времени 7 дней в неделю и 24 часа в сутки и беспристрастно отображает информационную картину дня. Данные для обработки поступают от партнеров службы - ведущих российских и зарубежных СМИ [4].

MSN Россия - Видео

Данный веб-фрагмент обеспечит мгновенное информирование о новых видеороликах на русскоязычном портале MSN Видео [4].

Новые микроформаты

Разработка новых микроформатов происходит в открытом режиме.

Среди множества предлагаемых микроформатов наиболее близки к завершению микроформаты для разметки цитат и валют.

Краткие итоги

На этом занятии мы познакомились с инструментами ( микроформатами ), позволяющими структурировать информацию по определенным критериям. Микроформаты делают информацию понятной для программ, обрабатывающих web-страницы.

Набор для практики

Вопросы:

  1. Что такое метаданные? Приведите примеры.
  2. Что такое парсер?
  3. Что такое микроформаты? Назовите известные вам микроформаты.

Упражнения:

  1. Разработайте микроформат, описывающий прогноз погоды
  2. Разработайте микроформат, описывающий рецепт приготовления блюда