面向满文字符识别的训练数据增广方法研究

在线阅读 下载PDF 导出详情
摘要 为解决采用深度学习方法研究满文识别中训练样本匮乏的问题,提出一种使用数据增广方法扩展训练样本集的技术框架。该框架包括字体几何结构变形与图像质量变换两个模块,采用仿射变换、弹性形变等9种数据生成方法,分别模拟满文字符图像的笔画粗细变化、扭曲变形、光照不均、不同视角及背景等情况下的采集效果。在满文识别的研究中,采用该方法将每个类别的字符数据量扩展到7万个。实验表明,该方法生成的数据在一定程度上弥补了训练样本不足的问题,是解决训练样本匮乏问题的有效技术手段。
机构地区 不详
出处 《大连民族大学学报》 2018年1期
出版日期 2018年01月11日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献