您好,欢迎来到纷纭教育。
搜索
您的当前位置:首页个性化中文字库构造初探

个性化中文字库构造初探

来源:纷纭教育
维普资讯 http://www.cqvip.com 电脑知识与技术 ・・・・・・研究开发・ 个性化中文字库构造初探 马文军 (鲁东大学地理与资源管理学院,山东烟台264025) 摘要:个性化中文字库构造是个性化中文信息打印显示输出实现的核心,目前标准化字库构造的常规方案不适合个性化字库的构 造。一种基于点阵技术的以新型点阵扫描识别仪研究开发为核心的新型方案设计,使得个性化中文字库的构造可以较好的实现。 关键词:个性化;中文字库;点阵 中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2006)17-0127-01 Research on Construction of Personal Chinese Word Stock MAwen-jan (Geography and Resource Management CoHege of Ludong umvemiW,Yantai 264025,China) 、Abstract:The construction of personal Chinese word stock is the core of personal print and display output of Chinese information and the normal scheme of construction of standard word stock is not suitable for it.The designing of a new construction scheme centering on the devel- opment of a new kind scan and identify machine based on the technology of dot matrix,turns the construction of personal Chinese word stock be true. Key wordS:personality;Chinese word stock;dot matrix 1引言 容括的7445个常用汉字和符号分解处理,形成具有上下文意的 在个性化日益张扬的今天,我们常常渴盼着能将PC内的中 既囊括全部文字符号又基本不重复的系列优美句子或短文。构建 文信息以带有个性化的方式打印和显示出来。我们对中文信息个 相应的句库和文库;③研究开发一种新型点阵扫描识别仪,该识 性化打印显示输出的需求,主要集中在四方面:能反映用户个性 别仪具备以下功能:能够对特定用户在特定规格点阵标识的标准 化笔迹特色的字体和能满足用户个性化偏好的字号、字色、版式; 化誊写纸上誊写的个性化字体进行扫描识别。并分析处理转化为 能满足用户个性化偏好的字号、字色、版式,可以借助word界面 PC可以识别的编码。 的相应功能实现;所以,能反映用户个性化笔迹特色的字体,就成 后期构造阶段包括两个流程,分别是:①特定中文用户从构 为中文信息个性化打印显示输出愿望能否实现的关键所在。而能 建的中文句库和文库中择一,在标准化誊写纸上全部誊写;②用 反映用户个性化笔迹特色的字体,显然应从个性化字库构造人 新型点阵扫描识别仪对用户誊写的个性化字体进行扫描识别.’并 手。目前,个性化中文字库构造的研究非常滞后,市场上还没有类 直接分析处理转化,形成面向该特定用户的个性化字库。 似产品推出。由此,选择个性化中文字库构造进行探讨很有意义。 2常规构造方案的失效 基于GB231 2-80库 I l特定规恪点阵标诅的 I l新型点阵打描识别 l 前期开发阶段 的旬库和支库柑建 I l 标准化t写I氏设计 l  l仪研究开发 l 包括宋体、黑体等在内的标准化中文字库的常规构造方案 是:先收集标准化字体信息,然后选择运用点阵法、向量法或曲线 特定用户在}i准化t写I氏 用点R4:J 面向特定用户的 1法,进行分析处理转化编码,最后构造出标准化字库。然而个性化 上誊写全帮甸子戚短文 个性化中文字库 i 化字体信  后婀构造阶段 要求所导致的以下两个因素的存在,使得运用点阵法、向量法、曲 个性化中文字库新型构造方案示意图 线法以标准化字库构造的常规方案去构造个性化字库,不具备现 4新型构造方案的评价 实的可能:一是对个性化字库而言,即使相同的笔划也会有太多 从上可知.在与个性化中文字库构造直接相关的后期阶段 不规则的变化类型,这就使得收集用户个性化字体信息和其后分 中,第一个流程属于纯个性化流程,后一流程属于可自动化处理 析处理转化编码,均需逐字逐场合的纯粹个性化处理,难度和成 的标准化流程,从而一方面从源头上对用户的个性化予以了保 本都大大提升。二是一种个性化中文字库的构造,其应用范围往 证.另一方面全部工作中可自动化处理的标准化部分大大提升 往只是一个中文用户,甚至只是一台PC机,而不能够被广泛推 了,由此,这种个性化中文字库构造的难度和成本会大大降低.从 广,构造个性化字库所花费的高额成本,难以通过用户数量扩大 而完全可能得到广泛推广。 而分摊。可见,对个性化中文字库的研究开发,必须另起炉灶。 特别指出。前期阶段三项开发任务是本项目研究的关键所在。 3新型构造方案的设计 其中.标准化誊写纸设计、对应于GB2312—80库的句库和文库的构 用常规方案进行个性化字库构造之所以不可行.核心原因在 建相对容易。而新型点阵扫描识别仪的开发难度相对较大。不过。 于字库构造各流程均需进行个性化处理。如果对常规方案进行必 以目前的技术水平而言.这通过一定努力是可以得到解决的。 要改造.使个性化字库构造各流程中的大部分工作能够标准化自 参考文献: 动化处理,就可使个性化中文字库的构造成为可行。基于以上分析 【1】余锦凤.中文信息处理基础教程【M】.北京:北京大学出版社, 和点阵技术,给出一个新型个性化中文字库构造方案示意图。 20o2. 前期开发阶段包括三个部分,分别是:①具有特定规格点阵 【2】景年社.字库技术及其应用概述【J].印刷杂志,2002,(09):41— 标识的标准化誊写纸的设计;②以GB2312—80库为基础,将该库 44;(1 o1:52-55. 收稿日期:2006-02-09 作者简介:马文军(1973一),博士,教授,主要研究方向为投资经济与管理信息系统研究。 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- fenyunshixun.cn 版权所有 湘ICP备2023022495号-9

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务