| 系统gho:最纯净好用系统下载站 | 投放广告、加入VIP会员,请联系 微信:wuyouceo |
|
|
[原创] UTF8 二进制扩展(utf8 binary extension) |
点评
占位太多,抱歉啊。谢谢前来捧场。
| ||
点评
XP 下不工作。Win7 下我也曾经测试过,chcp 65001 是不工作的,无法处理 utf8 的字符输出。能告诉您所用的操作系统吗?您能给个图片来展示 cmd 下成功显示 utf8 汉字字符吗?另外,还有输入法支持,就不过高要求了。
| ||
| ||
| ||
点评
谢谢指导。其一,占楼操作简单粗暴,好用,懒得以后再使用推荐功能。其二,推荐功能有出毛病、不起作用的时候。论坛更换程序时,功能就可能出现紊乱。其三,占楼也是模仿前人的做法,我只是小小学习了一把而已。
| ||
点评
UTF8 甚至具有某些“特性”,因使用场合的不同,可以看成“优点”或“缺点”:一个Unicode码点能够有多个UTF8表示。UTF8最多采用6字节,比4字节的unicode能够携带更多的信息,这一点有时是可以当作优点来利用的。
刚才说“字符范围增大了”,是说 UTF8 在最窄时只用一个字节,表示的范围是 0-127。UTF16在最窄时使用2字节,表示的范围是 0-65535, 而 utf32 最窄使用4字节,表示的范围是 2^31 个字符。范围逐步增大了。
Linux 的 csh/tcsh 似乎完全不适应BOM的存在。它会拒绝执行整个脚本。然而 csh/tcsh 是不重要的 shell, 很少有人使用。总之,BOM带来的问题不多,而且,随着时间的推移,问题会越来越少,适应的软件会越来越多。
Linux 的 bash 脚本能够部分地适应BOM,只不过需要把第一行固定地当成会出错的行,而不要让第一行做事情,注意只用第二行以后的行来做事。当然了,linux 的 shell 脚本会把回车符当作非法字符,这是另一个话题。
至于说BOM,还真不算个啥事。产生冲突的地方并不多。有许多软件能够适应BOM的存在。个别软件因BOM的存在而不能正常运行。
| ||
| ||
Powered by Discuz! X3.3
© 2001-2017 Comsenz Inc.