Унифицированные указатели ресурса (URL)

СЕТЕВЫЕ  ТЕХНОЛОГИИ

Унифицированные указатели ресурса (URL)

Для обеспечения адресации Web-документов и других информационных объектов в свое время была предложена концепция унифицированных указателей ресурса (Uniform Resource Locator, URL). URL представляет собой набор информации, необходимый для того, чтобы определить:

  • узел сети, на котором расположен информационный объект;

  • расположение информационного объекта на узле;

  • метод получения доступа к объекту.

 

Унифицированный указатель ресурса (URL) представляет собой частный случай унифицированного определителя ресурса (Uniform Resource Identifier, URI). URI - является абстрактным понятием, описывающим принципы универсальной адресации ресурсов сети, позволяющие идентифицировать любой информационный объект в сети, независимо от его внутренней структуры (форматов представления данных, кодировок и т.п.), расположения и сетевых сервисов, обеспечивающих доступ к нему. В настоящее время определены различные подходы к реализации такой универсальной адресации. Одним из таких подходов является URL, для которого ключевой информацией для идентификации объекта является его местоположение (location) в сети. Другой способ универсальной идентификации определен концепцией унифицированных имен ресурсов (Uniform Resource Name, URN), в которой ключевой информацией является уникальное мнемоническое имя ресурса, возможно никак не связанное с его физическим местоположением. Например, для однозначной идентификации человека в России можно использовать комбинацию "Фамилия-Имя-Отчество-Адрес Прописки" (аналог URL), или комбинацию "Номер и Серия паспорта" (аналог URN).

Поскольку для получения доступа к объекту все-таки необходимо знать его расположение (чтобы правильно адресовать запрос), то использование схем, не основанных на информации о расположении объекта, практически не очень удобно и требует дополнительных преобразований. Поэтому URL является наиболее популярной схемой адресации объектов в сети



Общая структура URL выглядит следующим образом:

Рис 1


Часть СХЕМА определяет способ получения доступа к ресурсу и то, каким образом представляется местоположение ресурса в части "ЧАСТЬ-ЗАВИСЯЩАЯ-ОТ-СХЕМЫ".
Ниже приведены примеры URL:

Рис 2

Рис 3

Как видно из примера, схема доступа может определять как конкретный протокол, так и целый сервис. В настоящее время существует целый ряд схем, которые могут использоваться в URL. Ниже перечислены наиболее часто использующиеся схемы:

Схема

Определяемый механизм доступа

mailto

Электронная почта

news

Телеконференции

ftp

Протокол FTP

telnet

Протокол Telnet

http

Протокол HTTP

https

Протокол HTTPS

file

Файл, расположенный на локальном компьютере

Независимо, от того, какая схема используется, "ЧАСТЬ-ЗАВИСЯЩАЯ-ОТ-СХЕМЫ" должна соответствовать следующим правилам:

  • набор символов ограничен латинскими буквами, цифрами, символами "-" и "_";

  • символы "%", "/", ":", ";", ".", "?", "@", "&", "#", "=", "+" используются как служебные (например, в качестве разделителей имен, входящих в состав адреса);

  • не существует различия между прописными и строчными буквами.