HTML в Internet

Итак, WWW-документ может содержать стилизованный и форматированный текст, графику и гиперсвязи с различными ресурсами Internet. Чтобы реализовать все эти возмож-ности, был разработан специальный язык, названный HyperText Markup Language (HTML), то есть, Язык Разметки Гипертекста. Документ, написанный на HTML, представляет собой текстовый файл, содержащий собственно текст, несущий информацию читателю, и флаги разметки. Последние представляют собой определенные стандартом HTML последова-тельности символов, являющиеся инструкциями для программы просмотра; согласно этим инструкциям программа располагает текст на экране, включает в него рисунки, хранящиеся в отдельных графических файлах, и формирует гиперсвязи с другими документами или ресурсами Internet. Таким образом, файл на языке HTML приобретает облик WWW-доку-мента только тогда, когда он интерпретируется программой просмотра. О языке HTML мы подробно расскажем в соответствующих разделах книги, поскольку без знания основ этого языка невозможно создать свой собственный гипертекст для публикации в WWW.

2.3. Как в WWW задается местонахождение документа?

Виртуальный мир WWW населен миллионами документов, обитающих на сотнях тысяч серверов. Задача WWW-путешественника - найти среди них тот, который содержит необходимую информацию, и прочитать его при помощи программы просмотра, - а для этого программа просмотра должна знать точное местонахождение данного документа. Оно однозначно определяется адресом сервера, номером порта, именем директории и именем файла с этим документом. Для успешной загрузки требуемого документа сервера программе просмотра также нужно указать протокол, используемый этим сервером. Это связано с тем, то кроме WWW-серверов, программы просмотра могут обращаться к серве-рам пересылки файлов (так называемым FTP-серверам), серверам телеконференций, серве-рам электронной почты и некоторым другим типам серверов. Комбинация протокола, адреса сервера, номера порта, имени директории и имени файла получила название Uniform Resource Locator, или сокращенно URL. Синтаксис URL показан ниже:

протокол://адрес_сервера:номер_порта/имя_директории/имя_файла

Протокол, как уже было сказано выше, это совокупность правил, по которым происходит взаимодействие клиент-сервер. Мы уже знаем, что «родной» протокол WWW называется http. Кроме http, WWW-клиенты могут общаться с серверами, поддерживающи-ми протоколы ftp, gopher и некоторыми другими, на которых я здесь останавливаться не буду, а расскажу о них далее.

Название протокола отделяется от остальной части URL двоеточием. В названии протокола прописные латинские буквы и соответствующие им строчные буквы эквива-лентны.

Начало адреса отмечается двумя косыми чер-тами // Он состоит из нескольких частей - так называемых поддоменов. Поддомены, представляющие собой сочетания букв и цифр, разделяются точками, причем, «уточнение координат адресата» от более крупных к более мелким поддоменам происходит справа налево. Так же как и в названии протокола, в адресе сервера прописные латинские буквы и соответствующие им строчные буквы эквивалентны.

Номер порта выражается целым положительным числом и отделяется от адреса двоеточием. Порт - это как бы «дверь», через которую можно зайти в сервер. Сервер может иметь несколько доступных портов; если номер порта WWW-сервера равен 80, то в URL его можно не указывать.

Файлы с документами, публикуемыми в WWW, часто имеют суффиксы .html или .htm. Эти суффиксы являются аббревиатурой от названия языка, на котором пишут WWW-доку-менты, HyperText Markup Language, о котором будет подробно рассказано далее.

Если имя директории начинается с символа ~ (тильда), это означает, что это - так называемая домашняя директория (home directory) пользователя данной компьютерной системы. На компьютерах с многопользовательской операционной системой UNIX каждо-му пользователю присваивается имя пользователя, под которым он регистрируется в сис-теме, и выделяется собственная «домашняя» директория, предназначенная для хранения принадлежащих ему файлов. Имя домашней директории совпадает с именем пользователя. Вместо абсолютного имени домашней директории с указанием всех ее поддиректорий можно использовать имя пользователя, которому предшествует символ ~ (тильда).

Обратите внимание на следующие особенности задания имен директорий и файлов в URL:

Директория, указанная в URL, как правило, не совпадает с истинной директорией в файловой системе на том сервере, где находится требуемый файл. Преобразование дирек-торий, заданных в URL, в истинные директории в файловой системе осуществляется WWW-сервером согласно правилам, заданным при его установке и настройке.

Если в URL указано только имя директории, а имя файла не задано, то сервер на такой запрос вышлет файл с определенным именем, зависящим от настройки сервера. Если же такого файла в заданной директории нет, то большинство серверов автоматически вышлют вам список всех файлов в данной директории.

2.4. Программы просмотра

Мы уже знаем, что, программа, с которой непосредственно общается пользователь при работе с ресурсами WWW, называется программой просмотра WWW-документов. Напоминаем, что работа такой программы заключается в посылке запроса к заданному сер-веру, интерпретации полученной информации и представления ее пользователю. Кроме того, она выполняет ряд вспомогательных задач, например, поддержива-ет список прочи-танных документов, чтобы пользователь мог к ним вернуться в дальней-шем.

В настоящее время получили распространение более десяти программ просмотра WWW-документов. Из графических программ просмотра наибольшего внимания, на наш взгляд, заслуживают NCSA Mosaic, Netscape Navigator и Microsoft Internet Explorer.

Программа NCSA Mosaic была создана в Национальном Центре Суперкомпьютерных Приложений Университета штата Иллинойс в Урбана-Шампэйн в начале 1993 года груп-пой программистов, возглавляемых студентом по имени Марк Андреессен. В то время Mosaic являлась единственной программой просмотра, написанной на профессиональном уровне, дружественной по отношению к пользователю и работающей на многих типах компьютеров. Не вызывает сомнений, что именно Mosaic открыла World Wide Web для большинства пользователей. В настоящее время в NCSA группа разработчиков (в основ-ном, студентов старших курсов) продолжает трудиться над новыми версиями Mosaic, нес-мотря на то, что по своим возможностям эта программа уже существенно уступает более новым программам. Mosaic является некоммерческим программным продуктом, доступ-ным для пользователей бесплатно. Исходный код программы Mosaic открыт и активно используется разработчиками многих других программ просмотра.

Netscape Navigator (сокращенно - Netscape) - это в настоящий момент, пожалуй, самая популярная программой просмотра, работающая на тех же типах компьютеров, что и Mosaic. Netscape - детище компании Netscape Communications Corporation, основанной в начале 1994 года Джимом Кларком, который в свое время основал крупную компанию Silicon Graphics, знаменитую своими графическими станциями. Джиму Кларку удалось переманить в Netscape Communications Corporation первоначальных разработчиков програм-мы Mosaic из Иллинойса, в том числе и самого Марка Андреессена. Netscape - это коммер-ческий продукт, за пользование которым надо платить. Однако, для пользователей в уни-верситетах Netscape доступна бесплатно. Кроме версий, работа над которыми завершена, компания периодически выпускает отладочные версии Netscape (так называемые бета-версии), которыми можно пользоваться бесплатно до наступления определенной даты, после которой программа перестает функционировать.


Страница: