Internet/Intranet-технологии
Развитие Internet/Intranet технологий
Internet в настоящее время является самым большим и популярным межсетевым объединением в мире. Он соединяет десятки тысяч компьютерных сетей и миллионы пользователей во всем мире. При этом объединены компьютеры тысяч различных типов, оснащенные самым разным программным обеспечением. Пользователи Internet могут не обращать внимания на все эти различия.
Internet и реализующие его технологии являются неотъемлемым атрибутом информационного общества и его базовым основанием. Эти технологии, о которых не слышали в конце прошлого века, работают практически во всех областях экономики, науки, культуры, социальных преобразований. Internet в настоящее время соединяет десятки тысяч компьютерных локальных, региональных, федеральных сетей и миллионы пользователей во всем мире. При этом сетью объединены компьютеры тысяч различных типов, оснащенных самым разным программным обеспечением.
Существует достаточно много толкований термина Internet, однако он имеет два основных качественных значения:
- глобальное сообщество произвольно объединяемых мировых сетей, которые используются для свободного обмена данными, информацией и знаниями;
- совокупность технологий, которые реализуют обмен данными на основе использования семейства протоколов TCP/IP (Transmission Control Protocol / Internet Protocol), называемых Internet-технологиями или технологиями Internet.
В основе создания Internet лежит история развития сети ARPAnet - первой экспериментальной компьютерной сети национального масштаба. Она была создана в конце 1960-х годов в целях поддержки научных исследований Министерства обороны США (Advanced Research Project Agency - ARPA) и объединила сотни компьютеров нескольких крупных научных и университетских центров. Узлы сети были связаны физическими выделенными линиями, а передача и прием данных обеспечивалась специальными программами, работающими на узловых компьютерах.
Сеть изначально предполагалась ненадежной - исследовалась возможность передачи данных в сети, отдельные фрагменты которой могут перестать функционировать в любой произвольный момент. Программные системы, в которые были заложены принципы искусственного интеллекта, должны были отыскивать работающие сегменты сети и "прокладывать" новые маршруты передачи данных. Выход из строя любого канала связи не должен был вывести такую сеть из строя. При этом общий алгоритм был основан на допущении, что любой компьютер мог связаться с любым "ответившим" компьютером как "равный с равным". Реально сеть стала использоваться для обмена сообщениями (E-mail) и файлового обмена (File-oriented Interchange).
Примерно в это же время появились локальные вычислительные сети (Local Area Network - LAN) и компьютеры с операционной системой UNIX, которые, помимо чисто вычислительных задач, стали обслуживать эти сети. Они получили название рабочие станции. OC UNIX была выбрана потому, что в нее была заложена возможность работать с IP-протоколами, которые содержали:
- правила инициализации и поддержания работы в сети;
- описание информационных сетевых пакетов (пакетов данных) семейства IP;
- правила обращения с IP-пакетами (идентификация, проверка целостности, обработка, пересылка, прием и т. д.).
Эти решения оказались успешными, стандартизация протоколов позволила подключать к сети компьютеры с различным базовым программным обеспечением. Появилось понятие "трафик", трактуемое в единицах обмена информацией, которым стали измерять реальную загрузку сети. Технология передачи данных IP-пакетами оказалась чрезвычайно перспективной в техническом отношении, однако в чисто пользовательском плане ее необходимо было дорабатывать, так как скорость передачи данных не могла компенсировать значительные затраты времени на поиск нужной информации в огромных массивах данных.
В марте 1989 года Тим Бернерс-Ли (Tim Berners-Lee, Conseil Europeen pour la Recherche Nucleaire - CERN, Женева) предложил концепцию распределенной информационной системы с целью "объединения знаний человечества", которую он назвал "Всемирной паутиной" (World Wide Web - WWW). Для её создания он объединил две существующие технологии - технологию применения IP-протоколов для передачи данных и технологию гипертекста (Hypertext Technology). Эта технология основана на реализации быстрого перехода от одного фрагмента текста к другому по выделенным ссылкам (Dedicated Links), при этом указанные фрагменты могут располагаться на физически разделенных компьютерных носителях. Информационная система, построенная на этих принципах, могла объединить множество информационных ресурсов, разбросанных по многочисленным открытым базам данных.
Основная метафора Web-гипертекста - это "электронная книга" с автоматически поддерживаемыми мгновенными переходами по ссылкам. Сам же термин гипертекст был впервые предложен Тедом Нельсоном в 1965 году, а первую работающую гипертекстовую систему создал в 1968 году Дуг Энгельбард.
В 1991 году был создан первый браузер (Browser) - компьютерная программа просмотра гипертекста, - работавший в режиме командной строки. Его применение позволило уже в 1992 году успешно реализовать предложенный проект, направленный в конечном итоге на создание "бесшовного информационного пространства" (Seamless Informational Area), охватывающего всю планету.
С точки зрения пользователя, информационное пространство "всемирной паутины" состоит из документов различного формата (мультемедиа-документов), предметных указателей и ссылок. Для перехода по ссылке или поиска по указателю пользователь применяет соответствующий браузер, "понимающий" язык разметки гипертекста. Поисковая система отыскивает по ссылке или ключевым словам в "паутине" нужный каталог, читает его структуру, считывает нужный документ и пересылает его пользователю. Web-сервер автоматически генерирует гипертекстовое представление требуемых файлов по запросам пользователя.
В сентябре 1994 года Оливер Мак-Брайан (Oliver McBryan) из Колорадского университета (США) разработал одно из первых автоматических средств составления предметного указателя для WWW, названное WWW-Worm. За несколько минут Worm формировал базу данных из 300000 мультимедийных объектов, которые можно было находить по ключевым словам. Можно считать, что с этого момента информационное пространство World Wide Web было в принципе сформировано ( рис. 4.1). Дальнейшее развитие шло по линии совершенствования технологий поиска, передачи, обеспечения безопасности, разработки и стандартизации различных Web-интерфейсов, повышающих комфорт использования Web-технологий. С середины 90-х годов эти технологии стали находить все более широкое применение во многих сферах человеческой деятельности.
Основными элементами технологии WWW являются [Артемьев В.И. Разработка INTRANET-приложений. Учебное пособие. Ярославль: изд-во ЯрГПУ, 1998, 233 с.]:
- язык гипертекстовой разметки документов (Hyper Text Markup Language - HTML);
- протокол обмена гипертекстовой информацией (Hyper Text Transfer Protocol - HTTP);
- универсальный способ адресации ресурсов в сети (Universal Resource Identifier - URI, и Universal Resource Locator - URL);
- система доменных имен (Domain Name System - DNS);
- универсальный интерфейс шлюзов (Common Gateway Interface - CGI), добавленный позже сотрудниками Национального Центра Суперкомпьютерных Приложений (National Center for Supercomputing Applications - NCSA).
- расширяемый язык разметки (eXtensible Markup Language - XML), рекомендованный Консорциумом Всемирной паутины.
Язык гипертекстовой разметки HTML создан на опыте использования редактора TeX и системно- и аппаратно-независимых методов представления текста в электронной форме (Standard Generalized Markup Language - SGML, стандарт ISO 8879). Основная идея гипертекста заключается в присутствии внутри ASCII-текста форматирующих полей и ссылок как на части внутри документа, так и на другие документы. Благодаря этому можно просматривать документы в том порядке, в каком требуется, а не последовательно, как при чтении книг. База данных гипертекста является частью файловой системы, которая содержит текстовые файлы в формате HTML и связанные с ними графику, мультимедиа и другие ресурсы.
Текстовый формат XML добавился несколько позже и был предназначен для описания систем хранения структурированных данных. Целью создания формата XML было обеспечение совместимости при передаче структурированных данных между разными системами обработки информации, особенно при передаче таких данных через Internet, а также для создания на его основе более специализированных языков разметки, иногда называемых словарями. Словари, основанные на XML, сами по себе формально описаны, что позволяет программно изменять и проверять документы на основе этих словарей, не зная их семантики, то есть не зная смыслового значения элементов. Важной особенностью XML также является применение так называемых пространств имен (Name Space).
Для получения файла из Internet браузеру нужно знать, где находится файл и как общаться с компьютером, на котором этот файл находится. Программа-клиент WWW передает имя необходимого файла, его местоположение в Internet (адрес хоста) и метод доступа (обычно протокол HTTP или FTP). Комбинация этих элементов формирует универсальный идентификатор ресурса (Universal Resource Identifier - URI). URI определяет способ записи адресов различных информационных ресурсов. В основу URI были заложены идеи расширяемости, полноты и читаемости. Реализация URI для WWW является способом адресации в сети (Universal Resource Locator - URL). Общий формат ссылки URL - <протокол://узел/путь/файл /метка>.