全文预览

模块2 文本处理技术 《多媒体技术与应用案例教程》

上传者:塑料瓶子 |  格式:ppt  |  页数:36 |  大小:0KB

文档介绍
能包括编码、输入、存储、编辑、输出和传输。编码是关键,不解决这个问题,汉字就不能进入计算机。目录2.1 文本在计算机中的编码方式 1.分类 3)机内码 4)字形码 2)交换码 1)外码目录2.1 文本在计算机中的编码方式 2.类型字形为主、字音为辅的编码法字形分解法全拼音输入法拼音为主、字形为辅的编码法整字输入法 123 4 5 目录编码方案繁多,需要有一个统一的标准。 1981 年,中国国家标准化管理局公布了《信息交换用汉字编码字符集——基本集》共分两级,一级 3 755 个字,二级 3 008 个字,共 6 763 个字。这种汉字标准交换码是计算机的内部码,可以为各种输入/输出设备的设计提供统一的标准,使各种系统之间的信息交换有共同一致性,从而使信息资源的共享得以保证。正在制定的《信息交换用汉字编码字符集——辅助集》用以满足少数用字量超过基本集的用户和中国台湾、中国香港等地区的需要。 2.1 文本在计算机中的编码方式 3.标准化目录2.1 文本在计算机中的编码方式 4.字符集目录2.1 文本在计算机中的编码方式目录2.1 文本在计算机中的编码方式 2.1.2 西文编码 3.字符代码表 4.ASCII 字符集和 ASCII 码 2.字符的编码 1.西文字符集目录2.1 文本在计算机中的编码方式 2.1.3 Unicode 编码 Unicode 采用两个字节编码体系,因此它可以表示 65 536 个字符,这已能满足目前大多数场合的需要。前 128 个 Unicode 字符是标准的 ASCII 字符,接下来是 128 个扩展的 ASCII 字符,其余的字符供不同语言的文字和符号使用。其 3.0 版本于 2000 年公布,内容包括字母和符号 10 236 个、汉字 27 786 个、韩文拼音 11 172 个、造字区 6 400 个、保留 20 249 个、控制符 65个。

收藏

分享

举报
下载此文档