无忧启动论坛

 找回密码
 注册
搜索
最纯净的「微PE装机优盘」UEPON大师作品系统gho:最纯净好用系统下载站数据恢复、数据保护、视频编辑
Win To Go 极致利器(IXUNCIS固态U盘)无忧启动网成立20周年!广告联系 QQ:184822951 微信:wuyouceo
12
返回列表 发新帖
楼主: 不点

[原创] UTF8 二进制扩展(utf8 binary extension)

    [复制链接]
发表于 2021-3-20 10:02:03 | 显示全部楼层
还占吗?

点评

占位太多,抱歉啊。谢谢前来捧场。  发表于 2021-3-20 10:58
回复

使用道具 举报

发表于 2021-3-20 10:42:57 | 显示全部楼层
而 Windows 的 cmd 命令行对 UTF8 的支持目前还没有,将来有没有,还不好说。



新建文本文档.bat (系统记事本自动保存为 UTF-8 编码)

  1. @echo off

  2. chcp 65001

  3. echo 测试UTF8编码字符串输出
  4. pause

  5. echo 测试显示UTF8文件内容
  6. type "%~0"

  7. pause
  8. goto :EOF

  9. >而 Windows 的 cmd 命令行对 UTF8 的支持目前还没有,将来有没有,还不好说。

  10. 一直都有支持的UTF8。
复制代码

点评

XP 下不工作。Win7 下我也曾经测试过,chcp 65001 是不工作的,无法处理 utf8 的字符输出。能告诉您所用的操作系统吗?您能给个图片来展示 cmd 下成功显示 utf8 汉字字符吗?另外,还有输入法支持,就不过高要求了。  发表于 2021-3-20 11:04
回复

使用道具 举报

发表于 2021-3-20 11:28:04 | 显示全部楼层
Windows 目前 支持的系统Win10及同内核的版本/Windows 8.1 扩展支持到2023年。Windows XP, 7已经不再支持了。

7上好像只支持Unicode,不支持UTF-8。

回复你自然用的是 目前 支持 的 Windows 10 操作系统。

WinUTF8.png
回复

使用道具 举报

发表于 2021-3-20 11:31:24 | 显示全部楼层
另外,还有输入法支持,就不过高要求了。


cmdutf8io.png


不知道这是不是高要求,不过测试来看,可以自带输入法,第三方输入法输入的汉字,可以输出成UTF8格式。

点评

这么说来,Linux 控制台支持 UTF8 还是要早一些,早在上世纪都支持了。微软只是最近几年才想着要支持而已。  发表于 2021-3-20 12:06
嗯,非常感谢您能告知 Win10 的控制台已经全面支持 UTF8 了。不过,Win7 不支持,也算是个不小的毛病。虽然微软说Win7过时了,但 XP 和 Win7 在我们办公环境占据 90%,Win10 在强制安装的情况下,也只装在新电脑上。  发表于 2021-3-20 12:02
回复

使用道具 举报

发表于 2021-3-20 12:24:12 | 显示全部楼层
本帖最后由 slore 于 2021-3-20 12:28 编辑
这么说来,Linux 控制台支持 UTF8 还是要早一些,早在上世纪都支持了。微软只是最近几年才想着要支持而已。

微软推自家的Unicode,带BOM,Linux是起步就UTF8,不是技术上的问题。

CR,LF,CRLF换行符现在系统上一样的。统一不难,不愿意做而已。

UTF8,字有1字节,2字节,3字节,甚至多字节,变化就是省了存储空间而已。
Unicode固定2字节,想想C语言的结构体内存对齐,占空间也有处理上的好处。

各有个的设计目的。

上世纪支持也好,现在才支持也好,哪怕不支持也好,系统不是照样用?
XP, 7不支持还不是你们办公环境占据90% 。系统支持它并没有难度,而是支持它有啥改变么。
Win10支持了,你们不是不愿意升级。

Win10融合Linux,开源,子系统等功能,促进它对UTF-8支持,或者说顺便支持。



点评

顺便说点废话。前些年,有人找我安装 Win7,我拒绝,因为我自己不用Win7。后来,我用了win7,就逐渐远离XP。但是,如今还有人要XP,我总是劝其安装Win7,但是有一半的人拒绝安装Win7。没办法只好备一个XP给他们用。  发表于 2021-3-24 10:03
学习了,谢谢  发表于 2021-3-21 08:55
自己不用 Win10,惯性地认为微软在控制台依旧不支持 UTF8,仅此而已,不必引申太远、太深。当我想发帖时,首先就遇到这样一个问题:发在哪个讨论区?研究半天,没见到合适的去处,权衡之下,觉得发在Linux区还行。  发表于 2021-3-20 16:36
回复

使用道具 举报

发表于 2021-3-20 14:01:51 | 显示全部楼层
不错,学习一下
回复

使用道具 举报

发表于 2021-3-20 14:48:31 | 显示全部楼层
为什么要用"占楼"而不使用论坛程序自带的"推荐"功能呢???

点评

谢谢指导。其一,占楼操作简单粗暴,好用,懒得以后再使用推荐功能。其二,推荐功能有出毛病、不起作用的时候。论坛更换程序时,功能就可能出现紊乱。其三,占楼也是模仿前人的做法,我只是小小学习了一把而已。  发表于 2021-3-20 16:45
回复

使用道具 举报

发表于 2021-3-21 00:07:44 | 显示全部楼层
全世界什么时候能统一一个编码。
我觉得UTF-8的事挺多的,比较烦人,有的地方需要带BOM,有的地方不能带BOM。

点评

UTF8 甚至具有某些“特性”,因使用场合的不同,可以看成“优点”或“缺点”:一个Unicode码点能够有多个UTF8表示。UTF8最多采用6字节,比4字节的unicode能够携带更多的信息,这一点有时是可以当作优点来利用的。  发表于 2021-3-21 07:45
刚才说“字符范围增大了”,是说 UTF8 在最窄时只用一个字节,表示的范围是 0-127。UTF16在最窄时使用2字节,表示的范围是 0-65535, 而 utf32 最窄使用4字节,表示的范围是 2^31 个字符。范围逐步增大了。  发表于 2021-3-21 00:46
Linux 的 csh/tcsh 似乎完全不适应BOM的存在。它会拒绝执行整个脚本。然而 csh/tcsh 是不重要的 shell, 很少有人使用。总之,BOM带来的问题不多,而且,随着时间的推移,问题会越来越少,适应的软件会越来越多。  发表于 2021-3-21 00:32
Linux 的 bash 脚本能够部分地适应BOM,只不过需要把第一行固定地当成会出错的行,而不要让第一行做事情,注意只用第二行以后的行来做事。当然了,linux 的 shell 脚本会把回车符当作非法字符,这是另一个话题。  发表于 2021-3-21 00:26
至于说BOM,还真不算个啥事。产生冲突的地方并不多。有许多软件能够适应BOM的存在。个别软件因BOM的存在而不能正常运行。  发表于 2021-3-21 00:20
回复

使用道具 举报

发表于 2021-3-22 11:56:44 | 显示全部楼层
规范不统一的确不太好。
回复

使用道具 举报

发表于 2021-3-23 13:29:13 | 显示全部楼层
收藏下来慢慢看
回复

使用道具 举报

发表于 2021-3-28 23:30:11 | 显示全部楼层
兼容是个问题,很多时间乱码就是因为编码不一致。
回复

使用道具 举报

发表于 2021-4-4 19:44:32 | 显示全部楼层
编码不统一造成乱码问题的确困扰,但是别的语言少乱码,乱码通常是中日韩三语言之间双字节出现多。
回复

使用道具 举报

发表于 2021-4-7 23:29:16 | 显示全部楼层
进来学习关注
回复

使用道具 举报

发表于 2021-4-10 08:14:01 | 显示全部楼层
关键是各个软件都兼容。
回复

使用道具 举报

发表于 2021-4-12 14:16:54 | 显示全部楼层
支持楼主分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|捐助支持|无忧启动 ( 闽ICP备05002490号-1 )

闽公网安备 35020302032614号

GMT+8, 2021-4-22 22:38

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表