找回密码
 注册
搜索
查看: 2457|回复: 17

不是我军不努力,实在共军太狡猾

[复制链接]
门派:不明
发表于 2011-1-22 07:09:12 | 显示全部楼层 |阅读模式
有人提解 ll 的全自动机器人,
做了点调查,

试用了下目前比较好的开源 OCR (图像字符识别)引擎 tesseract
识别下图:


结果是:
-----------------start---------------------------
_ , 4`
74'善 4′4奋 青了.@ 阜_
虹仲  ;/;懋7亏7青吧:'; , '
_§%.墨 红`,h:7鲁萋ã:三言鳕i澈§佯蕊禀言
  ,, , __ _ ,,4 1;  , 4_皇i-咿_
Q / }’1`-“<--' 一-`.青-__. 、 』
-------------------end-------------------------
其原因是字体,由于 ll 输出的字体是多样的,而 tesseract 提供的中文识别数据包根据我测试是比较好地支持书写工整的黑体,而其它字体或者有很多噪音的(比如小点和黑线)则够呛。

结论是,想要全自动机器人的伙计们,道高一尺,魔高一丈,够不着。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
门派:不明
发表于 2011-1-22 08:51:31 | 显示全部楼层
不用那么全自动吧,只要把图片发到手机里实现手机和电脑交互就可以了
门派:不明
发表于 2011-1-22 09:07:17 | 显示全部楼层
半夜3点还起来看手机!
门派:不明
发表于 2011-1-22 12:00:06 | 显示全部楼层
继续往前走啊,有门,先去掉噪音看能识别多少
门派:不明
发表于 2011-1-22 12:01:26 | 显示全部楼层
还是鼓动大家全都改成一个名字比较合适,名字全是一样的,按nick代号来识别的
门派:不明
 楼主| 发表于 2011-1-22 12:08:52 | 显示全部楼层
原帖由 asiaking@ts 于 2011-1-22 12:01 发表
还是鼓动大家全都改成一个名字比较合适,名字全是一样的,按nick代号来识别的


关键有些人喜欢把名字弄成别人不认识的,扰乱别人的 ll
门派:不明
 楼主| 发表于 2011-1-22 12:13:47 | 显示全部楼层
原帖由 asiaking@ts 于 2011-1-22 12:00 发表
继续往前走啊,有门,先去掉噪音看能识别多少


主要是字体麻烦,估计要自己做字体识别库的,看样子集成好几种字体了的,识别率降 n 多。
门派:不明
发表于 2011-1-25 16:42:03 | 显示全部楼层
xli 你试试尚书7.0+word 2003字体补充包
门派:不明
发表于 2011-1-25 17:02:42 | 显示全部楼层
请再用力一些吧     
  XLI加油
门派:不明
发表于 2011-1-25 18:14:10 | 显示全部楼层
支持!支持!
为了表示我的支持,我赞助你3yb,已资鼓励!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|书剑永恒MUD ( 闽ICP备14012032号|闽公网安备 35050202000162号 )

GMT+8, 2025-7-17 13:48 , Processed in 0.030922 second(s), 27 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表