rfc7230对应哪个字符（rfc7230和rfc3986）-南京晰视电子——松下安防监控产品代理、三星安防监控产品代理、博世报警代理、亚安代理、安讯士代理、Computar镜头代理、HID门禁系统代理

本篇目录：

1、关于url编码标准的说明
2、什么是CR和LF
3、解决springboot项目请求出现非法字符问题
4、Unicode详解
5、文字编码总结
6、UTF-8对应汉字是3个字节还是2个字节的相关推荐

关于url编码标准的说明

1、url编码：一种浏览器用来打包表单输入的格式。浏览器从表单中获取所有的name和其中的值，将它们以name/value参数编码（移去那些不能传送的字符，将数据排行等等）作为URL的一部分或者分离地发给服务器。

2、URL 中不能含有空格，URL 编码通常会将空格替换为加号（+）。

3、URL由三部分组成：资源类型、存放资源的主机域名、资源文件名。也可认为由4部分组成：协议、主机、端口、路径。URL语法主要部分：第五部分给出了URL语法的完整BNF描述。

4、一般来说，URL只能使用英文字母、阿拉伯数字和某些标点符号，不能使用其他文字和符号，这是因为网络标准 RFC 1738 做了硬性规定。如果URL中有汉字，就必须编码后使用。

5、URL是英语Uniform Resource Locator的缩写，中文名叫：统一资源定位符（或称统一资源定位器/定位地址、URL地址），有时也被俗称为网页地址（网址）。URL就如同在网络上的门牌，是因特网上标准的资源的地址（Address）。

6、URL是由一串字符组成，这些字符可以是字母，数字和特殊符号。一个URL可以用多种方法来表现，例如：纸上的字迹，或者是用字符集编码的八位字节序列。URL的解释仅取决于所用字符的特性。

什么是CR和LF

1、众所周知，Windows操作系统采用两个字符来进行换行，即CRLF；Unix/Linux/Mac OS X操作系统采用单个字符LF来进行换行；另外，MacIntosh操作系统（即早期的Mac操作系统）采用单个字符CR来进行换行。

2、，解释不同：LF是换行的意思，CR是回车的意思。2，功能不同：CR是光标重新回到本行开头，LF是光标往下一行（不一定到下一行行首）。3，执行的结果不同：CR会把这一行以前的输出覆盖掉，而LF不存在这个问题。

3、CR ：Carriage Return 回车，打字机车头的回位。LF：Line Feed 换行，打字机向下滚一行打字机的时代，这些是指挥打字机机械工作的指令，电脑时代只用在屏幕显示。

4、在文本处理中， CR， LF， CR/LF是不同操作系统上使用的换行符.Dos和windows采用回车+换行CR/LF表示下一行，而UNIX/Linux采用换行符LF表示下一行。

5、回车CR用符号\r表示，十进制ASCII代码是13，十六进制代码为0x0D。换行LF使用\n符号表示， ASCII代码是10，十六制为0x0A。

6、一个为“回车”（CR），表示把打印头定位在左边界；另一个为“换行”（LF），表示把纸向下移一行。这就是“换行”和“回车”的来历。后来，计算机发明了，这两个概念也被般到了计算机上。

解决springboot项目请求出现非法字符问题

1、启动springboot项目后，输入 https：//10.1：9910/nameList 报错，错误信息：查阅资料后，发现把 https：//10.1：9910/nameList 的https改为http，即可解决问题。

2、实际解决方式（针对于使用SpringBoot内置的Tomcat）：添加下面的配置Bean。

3、通过一些大神的反馈，在打成jar包后基本会遇到两个问题如下：基于这两个问题，一一解决。以上 static/model/pztjmodel.xls 这个路径是从 resources 目录下开始的。这个在打完包之后仍然可以。

4、在我们的项目中，在包点右键，新建一个java类。java类，名字叫做IController，这就是mvc架构中的c，即控制器。接着我们把Controller的注解加上，告诉springboot框架，这个是controller。

5、有效的解决办法是通过多种条件屏蔽掉非法的请求，例如 HTTP 头、参数等：防止大规模的恶意请求，niginx 反向代理可以配置请求频率，对 ip 做限制。

6、在application.properties中填写中文信息，在读取该文件时会出现中文乱码问题。

Unicode详解

Unicode可以表示世界上的每一个字符，每一个字符都有相应并且唯一的二进制编码。Unicode是一种字符集，让几乎所有语言中的每个字符都和一个唯一数字对应起来。

为了和以前的 ASCII 兼容， Unicode 的 128 个字符就是 ASCII 的拷贝.这是 unicode 编码面板中的前三个面板的使用频率图，可以看出使用频率最高的绝大多数分部在 BMP 内，零散的来自第二三个面板。

严的 Unicode 是4E25（100111000100101），根据上表，可以发现4E25处在第三行的范围内（0000 0800 - 0000 FFFF），因此严的 UTF-8 编码需要三个字节，即格式是1110xxxx 10xxxxxx 10xxxxxx。

文字编码总结

1、总结一下：中国国家标准总局把中文常用字符编码为94个区，每个区对应94个位，每个字符的区号和位号组合起来就是该字符的区位码，区位码用10进制数来表示，如4907就表示49区7位，对应的字符是“学”。

2、因此，它逐渐成为电子邮件、网页及其他存储或传送文字的应用中，优先采用的编码。

3、汉字的字形码又称为汉字编码（ChineseCharacterCode），是指将汉字转换成计算机可处理的二进制编码形式。它是计算机处理汉字的基础，也是汉字信息处理的重要技术之一。

4、最终，樊的UTF-8编码是11100110 10101000 10001010（E6 A8 8A）由此可以总结出字符用UTF-8编码的规律：注： UTF-8并没有编码所有的Unicode的字符，只包含了第0号平面(plane)和部分1号平面的字符。

5、str1 = hello # 默认使用 ASCII 编码 str2 = u你好 # 使用 Unicode 编码 Python x 字符编码在 Python x 中，str 类型默认使用 Unicode 编码，即 Python x 中的 Unicode 类型。

UTF-8对应汉字是3个字节还是2个字节的相关推荐

1、但UTF-8对所有常用的字符都可以用三个字节表示，而且它的另一种选择，UTF-16编码，对前述的第四种字符同样需要四个字节来编码，所以要决定UTF-8或UTF-16哪种编码比较有效率，还要视所使用的字符的分布范围而定。

2、个字节。如果你有十六进制编辑器，你自己就能验证。

3、常用中文字符用utf-8编码占用3个字节（大约2万多字），但超大字符集中的更大多数汉字要占4个字节（在unicode编码体系中，U+20000开始有5万多汉字）。

4、GBK编码，一个汉字占两个字节。UTF-16编码，通常汉字占两个字节，CJKV扩展B区、扩展C区、扩展D区中的汉字占四个字节（一般字符的Unicode范围是U+0000至U+FFFF，而这些扩展部分的范围大于U+20000，因而要用两个UTF-16）。

5、两个、三个或者四个字节。ASCII码中：一个英文字母（不分大小写）占一个字节的空间，一个中文汉字占两个字节的空间。一个二进制数字序列，在计算机中作为一个数字单元，一般为8位二进制数，换算为十进制。

6、一个字符是由一个字节（即8个二进制位）来表示的，不同编码方式、汉字或字母所需字节不同。ASCII 编码：一个英文字母占1个字节。GB 2312 编码/GBK 编码：一个汉字占2个字节。

到此，以上就是小编对于rfc7230和rfc3986的问题就介绍到这了，希望介绍的几点解答对大家有用，有任何问题和不懂的，欢迎各位老师在评论区讨论，给我留言。

rfc7230对应哪个字符（rfc7230和rfc3986）