编号:B208
大小:27M
环境:Matlab2020
简介:任意给定一张书法字的图像,请编写程序自动判别图像并输出数据集中相同字的图案。
实验结果与分析:
通过设定检索区间,以匹配度最高的为基准在周围进行检索,保证了查准率,而查全率可以通过提高尝试次数来提高:
若不设定检索区间,匹配度排序确定的序列中,前n个字有m个是正确字,应该匹配到的总字数是a,则查全率为m/a,查准率为m/n。
设定检索区间,将范围缩小到范围为2*threshold的区间,跳过了序列前部存储位置差距巨大的字,而存储时草书文件夹和楷书文件夹互相交错,很大程度上减少了错字的发现。因此要提高查全率只需提高trial,即在序列的前trial个字中搜索。
此方法的弊端是:若匹配度最高的字为错字,则之后所查全为错字。
本次检索,目的是在楷书中检索楷书,在草书中检索草书,但由于形状匹配也会造成草书和楷书的匹配,所以会出现混杂。若需要混合检索,只需调高threshold即可。
总之,本文提供了一个用户自定义参数来检索相似书法字的MATLAB程序,用户使用上包括ui界面批处理数据,ui界面读取测试图,输出匹配图案以及名称等功能。
内部实现了图像归一化处理、形状属性提取、图像匹配的功能。
理论来源为:《根据形状相似性的书法内容检索》(中图分类号TP39)《计算机辅助设计与图形学学报》第17卷 第11期
查全率-查准率曲线由于统计工作需要数据量,而检测正确率需要人工,时间紧迫,无法绘制。以下是一些运行实例。
本次实验采用了设定检索区间的方法保证了检索的正确率,但前提是数据集的字符存储是有序的,如果仅依靠形状相似度,以下因素会降低查准率:
1)图像压缩损失细节(细笔画、密集笔画等);
2)区域判断函数my_area 中的雷达区间划分长度为经验划分;
3)单字匹配度的欧氏距离的权重a为经验值;
4)匹配点判断时,进行判断前提条件为距离小于某个值(isClose函数),该值也为经验值;
5)汉字的形似字不易区分:日和月、丈和万、散和众(繁体)等;
6)某个字中含有样本字的一部分(子图也可能判断相似),如有和月。
运行展示
配套文件
我们提供完整项目文件清单如下:
文件目录
├ 1.项目源码
├ 2.运行截图
└ 3.演示视频
2. 分享目的仅供大家学习和交流,请不要用于商业用途!
3. 如果你也有好源码或者文档,可以与我们交换,分享有积分奖励和额外收入!
4. 本站提供的源码、文档等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
7. 如遇到加密压缩包,默认解压密码为"www.2zcode.com",如遇到无法解压的请联系管理员!
8. 因为资源和程序源码均为可复制品,所以不支持任何理由的退款兑现,请斟酌后支付下载
声明:网站内的所有源码都经过我们亲自测试,均可以正常使用.
索炜达.猿创 » 基于Matlab余弦形状相似度的书法字识别
常见问题FAQ
- 免费下载或者VIP会员专享资源能否直接商用?
- 本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
- 提示下载完但解压或打开不了?
- 你们有qq群吗怎么加入?