js对url进行编码解码（三种方式） - js - 前端 - 技术设计

# 一、为什么要编码

对于 Url 来说，之所以要进行编码，是因为 Url 中有些字符会引起歧义。比如以下几种场景：

1. 场景一

路径中包含有中文。然而 Url 中不能包含任何非 ASCII 字符，如果客户端浏览器和服务端浏览器支持的字符集不同的情况下，中文可能会造成问题。

https://code-nav.top/download/3?type=视频教程

2. 场景二

Url 参数字符串中使用 key=value 键值对这样的形式来传参，键值对之间以 & 符号分隔，如 /s?q=abc&ie=utf-8 。如果你的 value 字符串中包含了 = 或者 & ，那么势必会造成接收 Url 的服务器解析错误，因此必须将引起歧义的 & 和 = 符号进行转义，也就是对其进行编码。

根据 RFC 标准，有些符号在 URI 中是不能直接传递的，要按照规定格式进行编码，下面我们看看哪些字符需要编码传递。

# 二、需要编码的字符

RFC3986 文档规定，**Url 中只允许包含英文字母（a-zA-Z）、数字（0-9）、-.~4 个特殊字符以及所有保留字符。** 因此对于 Url 而言，只有普通英文字符和数字，特殊字符 $-.+!*'() 还有保留字符，才能出现在未经编码的 Url 之中。其他字符均需要经过编码之后才能出现在 Url 中。

不安全的字符

字符	描述
空格	Url 在传输的过程，有可能引入无关紧要的空格，或者去掉一些有意义的空格
引号以及 <>	引号和尖括号通常用于在普通文本中起到分隔 Url 的作用
#	通常用于表示书签或者锚点
%	百分号本身用作对不安全字符进行编码时使用的特殊字符，因此本身需要编码
{}\|^[1]`~ \| 一些网关或者传输代理会篡改这些字符 \|

对于上面提到的这些字符，如果不经过编码，那么它们有可能会造成 Url 语义的不同。

# 三、编码的三种方式

# 第一种：escape 和 unescape

escape () 不能直接用于 URL 编码，它的真正作用是返回一个字符的 Unicode 编码值。规则如下：

方法	描述	返回值
escape()	使用转义序列替换某些字符来对字符串进行编码，除了 ASCII 字母、数字、标点符号 "@ * _ + - . /" 以外	返回 Unicode 编码字符串
unescape(String)	对使用 escape () 编码的字符串进行解码

除了 ASCII 字母、数字、标点符号 "@ * _ + - . /" 以外，对其他所有字符进行编码。在 u0000 到 u00ff 之间的符号被转成 % xx 的形式，其余符号被转成 % uxxxx 的形式。对应的解码函数是 unescape ()。

编码：

"https://code-nav.top/download/3?type=" + escape('视频教程')

解码：

	"https://code-nav.top/download/3?type=" + unescape('%u89C6%u9891%u6559%u7A0B')
	// 输出：https://code-nav.top/download/3?type = 视频教程

注意点：

首先，无论网页的原始编码是什么，一旦被 Javascript 编码，就都变为 unicode 字符。也就是说，Javascipt 函数的输入和输出，默认都是 Unicode 字符。这一点对下面两个函数也适用。
其次， escape() 不对 "+" 编码。但是我们知道，网页在提交表单的时候，如果有空格，则会被转化为 + 字符。服务器处理数据的时候，会把 + 号处理成空格。所以，使用的时候要小心。

# 第二种：encodeURI 和 decodeURI

encodeURI() 是 Javascript 中真正用来对 URL 编码的函数。规则如下：

方法	描述	返回值
encodeURI(String)	通过转义某些字符对 URI 进行编码，除了常见的符号以外（ASCII 字符），对其他一些在网址中有特殊含义的符号 "; / ? : @ & = + $ , #"，也不进行编码	输出 utf-8 形式字符串
decodeURI(String)	对使用 encodeURI () 方法编码的字符串进行解码

它用于对 URL 的组成部分进行个别编码，除了常见的符号以外，对其他一些在网址中有特殊含义的符号 ; / ? : @ & = + $ , # ，也不进行编码。编码后，它输出符号的 utf-8 形式，并且在每个字节前加上 %，，然后用十六进制的转义序列（形式为 % xx）对生成的 1 字节、2 字节或 4 字节的字符进行编码。
它对应的解码函数是 decodeURI() 。

编码：

encodeURI('https://code-nav.top/download/3?type=视频教程')

解码：

	decodeURI('https://code-nav.top/download/3?type=%E8%A7%86%E9%A2%91%E6%95%99%E7%A8%8B')
	// 输出：https://code-nav.top/download/3?type = 视频教程

# 第三种： encodeURIComponent 和 decodeURIComponent

与 encodeURI() 的区别是，它用于对整个 URL 进行编码。 ; / ? : @ & = + $ , # ，这些在 encodeURI() 中不被编码的符号，在 encodeURIComponent() 中统统会被编码。

规则如下：

方法	描述	返回值
encodeURIComponent(String)	通过某些转义字符对 URI 进行编码，会编译所有（包含特殊字符），ASCII 字符不编码，可以将参数中的中文、特殊字符进行转义	输出 utf-8 形式字符串
deencodeURIComponent(String)	对使用 encodeURIComponent () 方法编码的字符串进行解码

它对应的解码函数是 decodeURIComponent() 。

编码：

	encodeURIComponent('https://code-nav.top/download/3?type=视频教程')
	// 输出：https%3A%2F%2Fcode-nav.top%2Fdownload%2F3%3Ftype%3D% E8% A7%86% E9% A2%91% E6%95%99% E7% A8%8B

解码：

	decodeURIComponent('https%3A%2F%2Fcode-nav.top%2Fdownload%2F3%3Ftype%3D%E8%A7%86%E9%A2%91%E6%95%99%E7%A8%8B')
	// 输出： https://code-nav.top/download/3?type = 视频教程

注意：参数包含特殊字符可能会造成间断。

# 三、总结

escape 官方已不推荐使用了，基本淘汰了，如果想对 URL 编码，最好不要使用此方法， encodeURI 和 encodeURIComponent 比较常用。

后面两个函数区别：

前者假定它的参数是 URI 的一部分（比如协议、主机名、路径或查询字符串）。因此 encodeURIComponent () 函数将转义用于分隔 URI 各个部分的标点符号。

↩︎