当前位置:建党百年话标准 >标准故事

标准化奠定中文信息技术产业基石

发布时间:2021-08-23 16:29      信息来源:国家标准化管理委员会

20世纪末以来,信息技术作为高新技术成为引领全球化浪潮的弄潮儿,自1974年“748工程”启动,中文信息技术出现至今,已蓬勃发展近50年之久。今天,中文信息技术的应用已经深入到我国社会的几乎所有领域和各个层面,成为人们日常工作和生活不可或缺的技术,为我国软实力的建设和发展提供了强有力的支持。中文信息技术产业成为极富我国文化和语言特色的产业,也成为世界信息技术市场中的一个重要领域。

标准化是现代社会一切产业的基本保障,是从手工作坊式的分散产业迈向大工厂生产乃至形成大规模产业链的必要手段。在中文信息技术诞生的同时,中文信息技术标准化就成为我国信息产业发展规划中的重要内容,并在我国中文信息技术产业发展中起到了关键性的作用。标准化工作为我国中文信息技术构建了支持市场以及相关技术开发和应用的、较为完备的中文信息技术标准体系。所有这些标准化成果成为我国中文信息技术产业发展的重要基石。 

中文编码标准是中文信息处理广泛应用的基础 

第一个中文信息技术标准——GB 2312。上世纪80年代,为解决汉字处理的互通问题,原电子工业部和国家标准局组织有关单位研制了我国第一个汉字编码字符集标准GB 2312-1980《信息交换用汉字编码字符集 基本集》,规定了最常用的6763个汉字的编码位置,作为各类汉字信息处理产品所采用的最小字符集,能够保证汉字信息处理基本应用,在中文信息技术领域发挥了里程碑式的重大作用,该标准获得国家科技进步一等奖。 

GB 2312从1980年发布到今天,已经过去了四十余年,在此期间,尽管先后制定和发布了具备更广应用覆盖面和更强适应性的其他汉字字符集国家标准,但是这个基本集仍然作为各类汉字信息处理产品所采用的最小字符集,发挥着保证汉字信息处理基本应用的作用。 

汉字大字符集——GB 18030。随着信息技术的迅速发展,满足更广、更高的汉字信息处理应用需求逐渐成为可能。汉语言的文字不是少数字母组成的拼音文字,而是图形符号,一个汉字就是一个图形符号。据文字学家估计,我国汉字的总量在10万个以上。收录6763个汉字的GB 2312在许多信息技术应用领域已不敷使用。2000年3月17日,支持超大字符集的强制性国家标准GB 18030-2000《信息技术 中文编码字符集》发布实施。该标准规定汉字的编码及其内码实现方式,是收录汉字数量最多的中文编码字符集标准,自发布以来对我国中文信息技术产品市场产生了深刻而有益的影响。该标准历经20年,经过两次重大修订,其最新版本于今年报批,总收纳汉字达到87875个。为我国大规模信息化建设奠定了标准化基础。 

少数民族文字编码标准。少数民族地区经济和文化的发展离不开少数民族文字信息处理标准化。国际标准ISO/IEC 10646《信息技术 通用多八位编码字符集》的框架刚刚诞生,我国专家就开始着手将少数民族文字编码纳入国际标准体系。在我国专家的长期努力下,现如今收录于ISO/IEC 10646的我国少数民族文字包括蒙古文、满文、希伯文、藏文、维吾尔文、哈萨克文、柯尔克孜文、规范彝文、西双版纳老傣文、西双版纳新傣文、德宏傣文、朝鲜文、滇东北苗文、傈僳文、八思巴文、老维吾尔文、察合台文等。同时,依托各民族语言文字和信息技术专家组成的藏文、蒙古文、彝文、傣文、维哈柯文、锡伯文、壮文、朝鲜文共八个少数民族语言文字国家标准工作组,不仅推动国际标准提案的研制,还研制了一批国家标准。20世纪80年代我国发布了第一个少数民族文字信息技术国家标准GB 8045-1987《信息处理交换用蒙古文七位和八位编码图形字符集》,此后陆续发布了多项其它文种和技术种类的国家标准,其中国家标准GB/T 20542《信息技术 藏文编码字符集 扩充集A》荣获“中国标准创新贡献”一等奖。 

这些标准的发布,对规范我国的民族文信息产业具有重要意义,对我国少数民族文字信息技术和产业的发展提供了基本保障,解决了民族文字信息处理产品的兼容性问题,初步改变了我国少数民族地区在各类信息化应用方面的落后局面。 

中文字型标准是信息时代文化传承的必要手段 

字型是文字的精确显示。世界上,许多民族创造了属于他们的比较通用的字型。汉字字型尤其丰富。在很多应用场合,需要计算机处理特定的字型。为了使计算机认识并且在输出和显示设备上保真地呈现具有特定字型的汉字以及其他有关的字符,字型也必须予以规范。为了满足信息技术在我国文化环境下应用的需求,在编码字符集标准发布后,我国先后制定了大量中文字型标准。这些字型标准研制活动的一个突出特点是与我国信息技术及其应用发展的需求——当时的需求和预见的需求,密切配合。 

汉字字型标准。在1980年发布GB 2312之后,为配合标准实施,推动中文信息处理系统的应用,我国于1985年发布了15×16点阵(GB 5199-1985)、24点阵宋体(GB 5007-1985)和32点阵宋体(GB 6345-1985)3项汉字点阵字型标准,这些标准的发布实施,标志着我国中文信息处理进入了实用化阶段。随着我国信息化工作的加快,为配合我国编码字符集标准的实施,满足对汉字字型多元化的需求,从1985年至今,我国共发布50余项汉字点阵字型国家标准(现行有效的39项),12项汉字字型电子行业标准,有力配合了国家信息化建设发展的需要。 

少数民族文字字型标准。我国少数民族文字字型是中文字型的重要组成部分,我国有56个民族,但是使用法定文字的少数民族并不多。根据国家相关语言文字法规,除汉文外,蒙古文、藏文、维吾尔文、哈萨克文、朝鲜文、彝文、壮文这7种少数民族文字是我国党和政府文件、法规等使用的法定少数民族语言文字。我国的少数民族文字字型标准化工作基本紧随汉字字型标准化工作起步,在上世纪80年代末、90年代初陆续制定发布了一批少数民族文字字型标准,进入新世纪,少数民族文字字型标准化工作得到党和政府的高度重视,截至2021年7月,我国发布少数民族文字字型国家标准72项(蒙古文8项、锡伯文/满文18项、藏文13项、维哈柯文22项、彝文2项、傣文9项)。 

供稿:全国信息技术标准化技术委员会(SAC/TC 28)