Internationalized Resource Identifier

Материал из Википедии — свободной энциклопедии
Перейти к навигацииПерейти к поиску

IRI (англ. Internationalized Resource Identifier) — интернационализированный идентификатор ресурса. По‐английски «IRI» произносится/aɪɑraɪ/, по‐русски иногда произносят [и́ри]. IRI — это короткая последовательность символов, идентифицирующая абстрактный или физический ресурс на любом языке мира. Идентификаторы IRI призваны в будущем заменитьURI.

Содержание

Основы

[править |править код]

IRI — это символьнаястрока, позволяющая идентифицировать какой‐либо ресурс:документ, изображение,файл, службу, ящикэлектронной почтыи т. д. Прежде всего, речь идёт, конечно, о ресурсах сетиИнтернет иВсемирной паутины. Идентификаторы IRI создавались как замена единообразным идентификаторамURI (англ. Uniform Resource Identifier) с целью избежать их ограничения на символы: URI могут содержать только латинские символы и знаки препинания из набора символов US-ASCII (в общей сложности около 60 символов). В результате, если мы захотим использовать в URI символыкириллицы,иероглифы или, скажем, специфические символыфранцузского языка иэсперанто, то нам придётся кодироватьURI так, как вВикипедии кодируются URL с символамиЮникода. Например, строка вида:

[[:Кириллица]]

кодируется в URL как:

[[:%D0%9A%D0%B8%D1%80%D0%B8%D0%BB%D0%BB%D0%B8%D1%86%D0%B0]]

Подробнее о кодировании см.URL.
В итоге URI во всех языках, кроме основанных на базовойлатинице, теряют своюудобочитаемость для человека. Это входит в противоречие с принципоминтернационализма, провозглашаемого всеми ведущими организациями Интернета, включаяW3C иISOC.Идентификаторы IRI созданы специально для решения этой проблемы. IRI могут содержать любые символы Юникода (Unicode/ISO 10646) в чистом виде, без всякого кодирования. IRI не ущемляют права другихязыков и ведут к более высокой степени равноправия пользователей Интернета.

В остальном идентификаторы IRI пока почти идентичны URI. Существует возможность несложной конвертации (англ. mapping) между идентификаторами URI и IRI.

История

[править |править код]

Разработка IRI началась примерно в ноябре2001 года вКонсорциуме Всемирной паутины. Первый вариант спецификации появился в апреле2002 года. Стандарт был закреплён вRFC 3987 в январе2005 года. Работы по спецификации IRI продолжаются в Рабочей группе по интернационализации (англ. Internationalization Working Group) Консорциума Всемирной паутины.

Применение

[править |править код]

В настоящее время IRI уже применяются в следующих технологиях:

  • XML 1.0 (системные идентификаторы)
  • XLink (атрибутhref)
  • XML Schema (тип данныхanyURI)

Существует также предложение об использовании Юникода (в форматеUTF-8) в системе доменных имёнDNS — системаIDNA[англ.], основанная наPunycode.

Проблемы

[править |править код]

Для однозначной идентификации адреса, например в ссылке, придется применять особые методы — например, дополнительное оформление для разных символов с одинаковым начертанием (например, символы А, В, Е, К, М, Н, О, Р, С, Т, Х вкириллице илатинице) — отличающиеся шрифты, цвета и т. п., либо владелец, скажем, домена «example.com» будет вынужден приобретать все домены, в которых содержатся такие символы в любой комбинации, которых в данном случае несколько: два «e», «x», «а» и «p», во избежание действий злоумышленников, которые могут выдать такой «смешанный» домен за сайт владельца домена «example.com», и получить конфиденциальную информацию от посетителей через формы.

Также необходимо будет регистрировать желаемые домены на всех языках мира, частично, по тем же причинам. В случае торговых марок проблему можно будет решить правовыми методами, а вот с такими сайтами, как «а.ком» и «a.com» дело обстоит иначе. Самому посетителю будет сложно разобраться с такими адресами, если это, например, чьи‑тодомашние страницы. Это касается и таких адресов как «dom.ru» и «дом.ру».

Некоторые[кто?] считают, что ограничениедоменного имени латинскими символами так же естественно, как для операторов в языках программирования. Проблема же названийфайлов и разделов может успешно решаться браузерами: например,Opera 8.5 иFirefox 3.0 отображают адрес «[[:Кириллица]]» именно так, кодируя его лишь для передачи запросасерверу.

См. также

[править |править код]

Ссылки

[править |править код]
Информация должна бытьпроверяема, иначе она может быть удалена. Вы можетеотредактировать статью, добавив ссылки наавторитетные источники в видесносок.(7 сентября 2018)
Источник —https://ru.wikipedia.org/w/index.php?title=Internationalized_Resource_Identifier&oldid=150912380
Категории:
Скрытые категории: