Url закодированное автоматическое сообщение

Обновлено: 07.07.2024

Что такое URL кодирование?

URL-адреса во всемирной сети могут содержать только буквенно-цифровые символы ASCII и некоторые другие безопасные символы, такие как дефис ( - ), подчеркивание ( _ ), тильда ( ~ ), и точка ( . ).

Любой другой символ, кроме указанного выше списка, должен быть закодирован.

URL кодирование, также известная как процентное кодирование, представляет собой способ кодирования или экранирования зарезервированных, непечатаемых или не ASCII-символов в URL-адресах в безопасный и надежный формат, который можно передавать через Интернет. Он также используется при подготовке данных для отправки HTML-форм с помощью application/x-www-form-urlencoded.

Как работает URL кодирование?

URL кодирование работает следующим образом: сначала она преобразует символ в один или несколько байтов. Затем каждый байт представляется двумя шестнадцатеричными цифрами, перед которыми стоит знак процента (%) , которое придает значение в кодировке URL.

Классификация символов кодировки URL

Ниже приводится классификация различных типов символов, которые нельзя включать непосредственно в URL-адреса.

Управляющие символы ASCII: Символы в диапазоне от 0 до 31 и 127 в наборе ASCII. Они не могут быть напечатаны и не могут быть помещены непосредственно в любой URL без кодировки. Некоторые примеры управляющих символов включают возврат на одну позицию, возврат каретки, перевод строки, вертикальную табуляцию, горизонтальную табуляцию и т.д.

Небезопасные символы: многие символы, такие как пробел , , > , < , >небезопасны и должны быть закодированы перед размещением их внутри URL-адресов.

Не символы ASCII: и наконец, вы не можете безопасно передавать символы вне набора ASCII внутри URL. Вы должны закодировать их.

URL (Uniform Resource Locator) – это единый указатель ресурсов, общепринятый способ записи адреса в сети Интернет.

Как правило, URL состоит из протокола, домена, номера порта (по умолчанию зависит от протокола), расположения каталога или страницы, параметров запроса, а также может содержать логин и пароль для доступа к серверу.

Поскольку изначально сеть Интернет разрабатывалась для нужд американских военных, URL имеет один существенный недостаток. В URL можно использовать только символы ASCII: английские буквы, цифры и некоторые спец.символы. Остальные символы нужно кодировать. Кодируются символы в шестнадцатеричный вид с простановкой вначале каждого символа знака процента (%).

Сайт построен на HTML5

Для корректной работы данного сайта требуется HTML5.

Пожалуйста, воспользуйтесь браузером, который поддерживает HTML5. Многие современные браузеры поддерживают HTML5. Например:

Считаете ли вы этот инструмент полезным? То поделитесь этим с друзьями или коллегами. Это поможет нам сделать наши бесплатные веб-инструменты лучше.

Введите здесь URL или текст для кодирования/декодирования:

Результат кодирования/декодирования URL

Об онлайн кодировщике/декодере URL-ов

Что такое кодирование/декодирование Url?

Кодировка URL, также известная как процентное кодирование - это механизм кодирования информации в универсальном идентификаторе ресурса (URI) при определенных обстоятельствах. Кодировка URL означает кодирование определенных символов в URL путем замены их одной или несколькими тройными символами, которые состоят из символа процента "%", за которым следуют две шестнадцатеричные цифры. Две шестнадцатеричные цифры триплетов представляют числовое значение заменяемого символа.

Допустимые символы в URI: зарезервировано или не зарезервировано (или символ процента как часть кодировки процента). Зарезервированные символы - это те символы, которые иногда имеют особое значение, в то время как незарезервированные символы не имеют такого значения. При использовании процентного кодирования символы, которые в противном случае не были бы разрешены, представлены с использованием разрешенных символов. Наборы зарезервированных и незарезервированных символов и обстоятельства, при которых определенные зарезервированные символы имеют особое значение, слегка менялись с каждым пересмотром спецификаций, которые управляют URI и схемами URI.

Согласно RFC 398, символы в URL должны быть взяты из определенного набора незарезервированных и зарезервированных символов ASCII. Любые другие символы не допускаются в URL.

Незарезервированные символы могут быть закодированы, но не должны кодироваться. Незарезервированные символы:

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9 - _ . ~

Зарезервированные символы должны быть закодированы только при определенных обстоятельствах. Зарезервированные символы:

О кодировщике/декодере URL

Инструмент Кодировщик URL Онлайн / Декодер URL Онлайн был создан, чтобы помочь с кодированием/декодированием текста (URL).

Как это работает?

Просто вставьте ваш URL или текст в поле ввода выше и нажмите кнопку "Кодировать" или "Декодировать", и вы получите ваш закодированный/декодированный URL.

Прежде чем приступить к обсуждению кодирования и декодирования, давайте сначала выясним проблему.
Что такое строка application / x-www-form-urlencoded?
Ответ:Это тип кодирования, Когда URL-адрес содержит строки не западноевропейских символов, система преобразует эти символы в строки application / x-www-form-urlencoded.

То же самое верно при отправке в форме, когда строка содержит символы не-Западной Европы, система также преобразует эти символы в строки application / x-www-form-urlencoded.

Однако этот метод кодирования неэффективен при отправке на сервер больших объемов текста, текста, содержащего символы не ASCII, или двоичных данных. На этот раз мы будем использовать другой

Значением атрибута ENCTYPE формы на стороне браузера является multipart / form-data, что говорит нам о том, что для передачи данных используется протокол передачи мультимедиа.Так как мультимедиа передает большой объем данных, файл загрузки должен быть методом post, а атрибут type должен быть Это файл.

Во-вторых, API кодирования и декодирования URL Java

Этот метод требует, чтобы вы сами указали формат кодировки. Эти два класса не нужно инициализировать:

Если эти два утверждения находятся на одной странице, результат будет следующим:

1、URLEncoder

Java предоставляет класс URLEncoder для кодирования строки в эту форму. Java1.2 добавил класс URLDecoder, который может декодировать строку в этой форме. Этот метод всегда использует формат кодировки по умолчанию для платформы, на которой он работает, поэтому он будет давать разные результаты в разных системах. Но в java1.4 этот метод был заменен другим методом.
Особенно важно отметить, что этот метод кодирует символы "\", "&", "=" и ":" и преобразует пробел ("") в (+ ). Он не пытается указать, как эти символы используются в URL. В результате вы должны закодировать свой URL-адрес кусками, а не передавать весь URL-адрес этому методу сразу. Это очень важно, потому что наиболее распространенное использование класса URLEncoder - это запрос строки, чтобы взаимодействовать с программой, используя метод GET на стороне сервера.
Например, предположим, что вы хотите закодировать эту строку:

Этот код кодирует его:

К сожалению, в результате получается:

2、URLDecoder

Класс URLDecoder, соответствующий классу URLEncoder, имеет два статических метода. Они декодируют строки, закодированные в форме x-www-form-url-encoded. Другими словами, они преобразуют все знаки плюс (+) в пробелы, а все% xx в соответствующие им символы:

Так как этот метод не затрагивает неэкранированные символы, выВы можете передать весь URL как параметр метода . Вам не нужно выполнять блок за блоком, как раньше, вы все равно можете получить правильный результат декодирования, который вы хотите. Например:

Обычно, если что-то нужно кодировать, это означает, что такая вещь не подходит для передачи. Есть много причин, таких как размер слишком велик и содержит личные данные.В Url причина для кодирования заключается в том, что некоторые символы в Url вызывают двусмысленность.

Например, в строке параметра Url пары ключ-значение ключ-значение используются для передачи параметров, а пары ключ-значение разделяются амперсандом, например / s? Q = abc & ie = utf-8. Если ваша строка значений содержит = или &, это неизбежно вызовет ошибку синтаксического анализа сервера, получающего URL-адрес, поэтому вы должны экранировать неоднозначные символы & и =, то есть кодировать их.

В качестве другого примера, формат кодирования Url использует код ASCII вместо Unicode, что означает, что вы не можете включать в Url любые символы, не относящиеся к ASCII, например китайский. В противном случае, если браузер клиента и браузер сервера поддерживают разные наборы символов, китайский язык может вызвать проблемы.

Принцип кодирования Url заключается в использовании безопасных символов (печатных символов без специального назначения или специального значения) для представления этих небезопасных символов.
Предварительные знания: URI - это смысл унифицированной идентификации ресурса, обычно URL-адрес, который мы называем, является просто своего рода URI. Формат типичного URL показан ниже. Кодировка URL, упомянутая ниже, должна фактически ссылаться на кодировку URI.

Какие символы должны быть закодированы

Документ RFC3986 предусматривает, что Url может содержать только английские буквы (a-zA-Z), цифры (0-9), специальные символы -_. ~ 4 и все зарезервированные символы. Документ RFC3986 сделал подробные предложения по кодированию и декодированию Url, указал, какие символы должны быть закодированы, чтобы не вызывать семантического изменения Url, и дал соответствующее объяснение, почему эти символы должны кодироваться.


В наборе символов US-ASCII нет соответствующих печатаемых символов: в Url допускаются только печатные символы. Все байты 10-7F в коде US-ASCII представляют управляющие символы, и ни один из этих символов не может отображаться непосредственно в URL. В то же время, для байта 80-FF (ISO-8859-1), поскольку он превысил диапазон байтов, определенный US-ACII, он не может быть помещен в URL-адрес.

Следует отметить, что для допустимых символов в Url кодирование и некодирование эквивалентны, но для вышеупомянутых символов, если они не закодированы, они могут привести к тому, что семантика Url будет другой. Поэтому для URL-адреса в незашифрованном URL-адресе могут отображаться только обычные английские символы и цифры, специальные символы $ -_. +! * ’() И зарезервированные символы. Другие символы должны быть закодированы, прежде чем они появятся в URL.

Однако по историческим причинам все еще существуют некоторые нестандартные реализации кодирования. Например, для символа ~, хотя документ RFC3986 предусматривает, что для волнистого символа ~, кодирование Url не требуется, но все еще есть много старых шлюзов или агентов передачи, которые будут кодировать.

Как кодировать недопустимые символы в URL

Обмен технологиями YunSoul, отсканируйте код, чтобы следовать общедоступной учетной записи WeChat


    - до тех пор, пока вы узнали что-то, что было невозможно, до сегодняшнего дня вы сильнее, чем вчера, вы были на пути к продвижению.

Читайте также: