中文信息处理技术

当前位置:首页 > 计算机网络 > 征订教材 > 中文信息处理技术

出版社:清华大学
出版日期:2005-7
ISBN:9787302112006
作者:李宝安

书籍目录

第1章  中文信息处理技术概论
  1.1 信息处理的实质
    1.1.1 信息和信息技术
    1.1.2 文字信息处理
    1.1.3 中文的文字信息处理的特点
  1.2 汉字编码的种类与中文信息处理过程中汉字编码的变换
  1.3 中英文兼容技术
  1.4 ASCII体系的汉字内码
    1.4.1 概述
    1.4.2 未占用C1区的编码方式
    1.4.3 覆盖C1区的编码方式
  1.5 Unicode与Unicode汉字
    1.5.1 背景
    1.5.2 替代标准
    1.5.3 方法与状态
    1.5.4 设计思想
    1.5.5 Unicode字集
    1.5.6 未来扩展与字符收录
    1.5.7 代码赋值
    1.5.8 细目
    1.5.9 Unicode汉字
  1.6 中文信息处理系统五层结构模型
  1.7 中文信息处理技术发展概况
    1.7.1 汉字标准代码
    1.7.2 汉字操作平台
    1.7.3 汉字输入方法
    1.7.4 文字处理和文字编辑排版系统
    1.7.5 中文信息检索系统技术
    1.7.6 翻译系统技术
    1.7.7 汉语自然语言理解
  习题1
第2章 汉字编码输入原理
  2.1 汉字和汉字属性
    2.1.1 汉字发展及其分级
    2.1.2 汉字的结构分析
    2.1.3 汉字的字音和字义
    2.1.4 汉字的排序
    2.1.5 汉字的属性  2.2 汉字编码输入方法
    2.2.1 概述
    2.2.2 汉字键盘码的笛卡儿积集分析
    2.2.3 汉字信息的熵值
    2.2.4 海曼公式与汉字编码的键盘特性
    2.2.5 汉字编码输入方法的简易评测方法
    2.2.6 汉字编码输入方法专业评测方法
    2.2.7 汉字键盘码的译码问题
  2.3 有关中文输入技术现状与发展的几个问题
  习题2
第3章 汉字字形存储与压缩技术
  3.1 汉字字形存储与字形码
    3.1.1 汉字字形的数字化
    3.1.2 整字存储与压缩存储
  3.2 汉字压缩存储常见方法
  3.3 衡量压缩与还原技术的重要指标
  3.4 汉字字形压缩的方法与技术
    3.4.1 汉字笔画矢量存储方法
    3.4.2 部件组字压缩方法
    3.4.3 子信息块哈夫曼树压缩
    3.4.4 字形轮廓压缩
    3.4.5 黑白段与线性增量压缩
    3.4.6 笔画轮廓压缩
  习题3
第4章 汉字识别技术
  4.1 OCR技术概况
    4.1.1 概述
    4.1.2 汉字识别应用领域
    4.1.3 印刷体文字识别的研究
  4.2 汉字识别种类
  4.3 汉字识别原理
  4.4 汉字识别一般方法
    4.4.1 印刷体文字识别研究方法简介
    4.4.2 联机手写文字识别研究方法
  4.5 汉字识别产品介绍
    4.5.1 汉王数字化档案馆解决方案概述
    ……第5章 中西文兼容处理技术
第6章 汉语自然语言理解
第7章 中文信息处理技术的应用
附录参考文献

作者简介

本书以简单、实用、易于理解为原则,内容力求全面、新颖,涵盖了中文信息处理的主要相关技术和研究成果。读者阅读本书之后,能够系统地了解汉字的编码、字形压缩与还原、光学汉字识别、中西文兼容处理、汉语自然语言处理等技术,以及中文信息处理技术的典型应用系统的原理与使用,如电子排版印刷系统、办公自动化系统、Internet搜索引擎、智能检索系统等,最终达到对中文信息处理技术的系统性了解。本书附录中还提供了该领域常用的各项国家标准。
本书可作为大专院校计算机、信息管理、系统工程等专业的本科教材,也可以供从事中文信息系统研发工作的科研人员参考。
-------
目录
第1章 中文信息处理技术概论
1.1 信息处理的实质
1.1.1 信息和信息技术
1.1.2 文字信息处理
1.1.3 中文的文字信息处理的特点
1.2 汉字编码的种类与中文信息处理过程中汉字编码的变换
1.3 中英文兼容技术
1.4 ASCII体系的汉字内码
1.4.1 概述
1.4.2 未占用C1区的编码方式
1.4.3 覆盖C1区的编码方式
1.5 Unicode与Unicode汉字
1.5.1 背景
1.5.2 替代标准
1.5.3 方法与状态
1.5.4 设计思想
1.5.5 Unicode字集
1.5.6 未来扩展与字符收录
1.5.7 代码赋值
1.5.8 细目
1.5.9 Unicode汉字
1.6 中文信息处理系统五层结构模型
1.7 中文信息处理技术发展概况
1.7.1 汉字标准代码
1.7.2 汉字操作平台
1.7.3 汉字输入方法
1.7.4 文字处理和文字编辑排版系统
1.7.5 中文信息检索系统技术
1.7.6 翻译系统技术
1.7.7 汉语自然语言理解
习题1
第2章 汉字编码输入原理
2.1 汉字和汉字属性
2.1.1 汉字发展及其分级
2.1.2 汉字的结构分析
2.1.3 汉字的字音和字义
2.1.4 汉字的排序
2.1.5 汉字的属性
2.2 汉字编码输入方法
2.2.1 概述
2.2.2 汉字键盘码的笛卡儿积集分析
2.2.3 汉字信息的熵值
2.2.4 海曼公式与汉字编码的键盘特性
2.2.5 汉字编码输入方法的简易评测方法
2.2.6 汉字编码输入方法专业评测方法
2.2.7 汉字键盘码的译码问题
2.3 有关中文输入技术现状与发展的几个问题
习题2
第3章 汉字字形存储与压缩技术
3.1 汉字字形存储与字形码
3.1.1 汉字字形的数字化
3.1.2 整字存储与压缩存储
3.2 汉字压缩存储常见方法
3.3 衡量压缩与还原技术的重要指标
3.4 汉字字形压缩的方法与技术
3.4.1 汉字笔画矢量存储方法
3.4.2 部件组字压缩方法
3.4.3 子信息块哈夫曼树压缩
3.4.4 字形轮廓压缩
3.4.5 黑白段与线性增量压缩
3.4.6 笔画轮廓压缩
习题3
第4章 汉字识别技术
4.1 OCR技术概况
4.1.1 概述
4.1.2 汉字识别应用领域
4.1.3 印刷体文字识别的研究
4.2 汉字识别种类
4.3 汉字识别原理
4.4 汉字识别一般方法
4.4.1 印刷体文字识别研究方法简介
4.4.2 联机手写文字识别研究方法
4.5 汉字识别产品介绍
4.5.1 汉王数字化档案馆解决方案概述
……
第5章 中西文兼容处理技术
第6章 汉语自然语言理解
第7章 中文信息处理技术的应用
附录
参考文献

图书封面


 中文信息处理技术下载



发布书评

 
 


精彩短评 (总计3条)

  •     这本书期待很久了,来得也快,很和我意,呵呵
  •     我是因为web开发遇到乱码才买这书的,但是没看到什么。讲乱码的没有。当然可能是因为我买错了,不一定是书不好。
  •     中文信息处理技术,原理,应用
 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024