西安电子科技大学技术转移中心
欢迎访问西安电子科技大学技术转移中心!
西安电子科技大学技术转移中心
当前位置: 主页 > 科技市场 > 成果提交库 >

面向手机等移动终端的嵌入式手写体识别系统

时间:2014-05-20 11:28 点击:
       一、研究背景:
      联机手写体汉字识别是汉字识别领域研究最广泛的一个分支,具有广阔的应用前景和巨大的商业价值。针对移动设备(手机和PDA等)对汉字识别的需求,课题组研究面向移动设备的嵌入式手写体识别软件。
      联机手写体汉字识别(OLCCR)是指用户一边用笔在图形输入板上写字,机器一边识别处理。图1是联机手写体汉字识别原理框图。

图1 联机手写体汉字识别原理框图
      二、研究对象简介:
      课题组主要研究手写体汉字、数字、字母、符号以及小语种(如维吾尔文、越南语)的识别。
      汉字12164个,其中简体汉字6763个,繁体汉字5401个。
      数字0~9,共计10个。
      字母和符号是指GB2312简体中文编码表中的常用符号,共186个。
      手写体类型是指所写汉字的字体,研究的字体类型包括:楷书(Regular script)、行书(Fluent script)和草书(Cursive script)
      三、研究成果以及软件简介:
      3.1  数据库录入系统
      数据建立是实现手写体识别软件最基本、最重要的部分。数据库建立的好坏影响着识别软件的性能。对此,课题组建立了自己的具有自主知识产权的数据库录入软件(Xidian-WriteFun),可以实现录入汉字、字母、数字、符号以及小语种文字(如维吾尔文、越南语)的强大功能。除此之外,还可以录入其它语种,具有很好的实用性和通用性。
数据库录入系统根据国际通用的Unicode码分别对汉字、数字、字母、符号等排序。将同一个人写的字体(如汉字、字母、数字、符号等)存放在同一个文件夹下,使得所建立的数据库可以发挥更大的作用,如笔迹鉴定,性别分析等等。此外,数据库录入系统还具有删除功能和实现录入者信息的添加(如姓名)。
     3.2  识别软件
     3.2.1  算法简介
 

图2算法流程图
     识别软件主要是通过分析手写体的笔迹信息和统计信息来识别汉字,具体流程图如2所示。预处理采用去噪,平滑,线性以及非线性归一化来实现对图象的尺寸归一化、轮廓提取、细化等处理。粗分类主要采用首末笔信息作为粗分类特征,可得到非常高的正确率。细分类主要提取手写体的笔画(轨迹)特征和局部结构特征,利用降维和欧斯距离进行分类,最后输出前十位识别结果的候选汉字。
      3.2.2 识别软件性能简介
      本课题组开发的手写体嵌入式软件除过对汉字的识别外,还可以实现对维吾尔文、越南文,数字,字母以及等识别,具有比较好的通用性。
      此外,本系统拥有学习功能,当使用者输入的汉字不在第1候选时,可通过点击正确识别的序号(比如“为”字是第三候选),系统自动将使用者笔迹保存并加入到训练库中,进一步丰富和扩大数据库,使得软件不断的熟悉使用者笔迹,获得更高的识别率。 
     上述系统的研制和开发仍在持续进行。本课题组具有汉字和其他文字(汉藏蒙维等少数民族和外语)手写识别系统的研制和开发能力,本系统对少数民族地区,以及发展中国家小语种(越、泰、朝、巴等)手机产品的附加值应用有重要价值。欢迎有兴趣的企业交流、投资和合作。


------分隔线----------------------------
栏目列表
联系我们
地址:北校区教辅楼三层
电话:029-88452239
邮箱:xgwang@xidian.edu.cn