Wolf's Plateau

Ming Hua's Web Log

Thursday, March 31, 2005

 

Autopackage

Autopackage is a new binary package format for Linux. Recently it reaches 1.0. I am interested in it because it seems a good idea for distribution of Chinese-related software, but I don't know much about packaging. So I am trying to collect comments and discussions from other people:

Jeff Licquia's (Debian) blog (with comments)

Joey Hess's (Debian) blog

Ubuntu developer mailing list

Mandrake cooker mailing list

Monday, March 21, 2005

 

中文编码和 Unicode

最近 Debian 的中文邮件列表非常的热闹,使得我这个 moderator 一时都忙不过来。有一个主题是在讨论应不应该统一使用 UTF-8 编码,说的也没有什么新意。倒是今天的另外一个主题中提到中国信息技术标准化技术委员会对于 GB18030 和 Unicode 的介绍,发现里面居然说 ISO10646 和 Unicode 是两个不同的标准,十分吃惊。自己在网上找了一下资料,才知道自己的理解基本没有错,而国内这些人真是极尽颠倒黑白之能事,一定要往自己脸上贴金。

Wikipedia 里面关于 ISO10646 的介绍还是很详细的。大体说来就是早期的 ISO10646 设计上有重大问题,和 ASCII 兼容不好,效率又低,得不到众多厂商的支持。后来不得不和各厂商联合成立的 Unicode 组织协调,把 ISO10646 做了很大的改变。现在所说的 ISO10646,已经和 Unicode 基本上是一码事了,只不过 ISO10646 是一个纯粹的字符映射,而 Unicode 还有一些针对各种语言的特殊规则,比如从右到左的书写,一个字符(character)对应多个字形(glyph)的情况。

那么为什么中国信息技术标准化技术委员会要把那个已经被废弃的老 ISO10646 标准拿出来说事儿呢?这就要翻翻老皇历了。Wikipedia 对于这种没人用的标准自然语焉不详,只好再找。好在有 UTF-1 这个听都没听说过的关键词,结果找到一篇技术细节很清楚的文章。 读了之后才明白,原来这个老 ISO10646 就是中国人为主制定的,在中国叫做 GB13000(这个我早就听说过,一直也不明白到底是什么东西),其核心就是要和 GB2312 和 GBK 兼容,采用两字节的编码,根本不管其它拉丁文字方不方便,更不要说阿拉伯什么国家的文字了。再加上 UTF-1 这个失败的和 ASCII 兼容的转换方式,有厂商支持才怪。

现在 ISO10646 实际已经和 Unicode 并轨了,国内的人还把 ISO10646 单独提出来,无非就是要说中国曾经在 ISO10646 的制定中起到重要的作用(好作用还是坏作用就不说了)。技术委员会的那篇文章,明明是介绍已经和 Unicode 并轨以后的 ISO10646(仔细看来 GB13000 实际上也是接受了 Unicode 的分区方法的),还硬要说是和 Unicode 不同,而且把 Unicode 对 ISO10646 的改进说得好象是 ISO10646 的原创,Unicode“和 ISO10646 兼容”,真是恬不知耻。

现在国内还有人声称 GB18030 比 Unicode 好,让人听了真是寒心。从兼容的角度来说,GB18030 倒不失为一种选择,但毕竟只注重和旧标准兼容,不顾国际标准,不是长久之计。至于硬是要编出一些名目来把本质上是旧标准扩充的 legacy encoding 说成是最先进的技术,还通过行政手段强行推广,就不知道有没有更险恶的内幕了。

Archives

10/01/2003 - 11/01/2003   11/01/2003 - 12/01/2003   02/01/2004 - 03/01/2004   03/01/2004 - 04/01/2004   06/01/2004 - 07/01/2004   03/01/2005 - 04/01/2005   06/01/2005 - 07/01/2005   02/01/2007 - 03/01/2007   03/01/2007 - 04/01/2007   04/01/2007 - 05/01/2007   05/01/2007 - 06/01/2007  

This page is powered by Blogger. Isn't yours?