优秀的ORC软件——OneNote
的有关信息介绍如下:这里指的ORC软件就是那些将扫描图上的文字提取出来的软件,像这一类的软件还有很多(如汉王ORC软件等),但都各有各的好处在里面,通过对比之后个人觉得OneNote还是识别速度和准确率相当高的一个软件,现在就给大家推荐和介绍一下了。
先下载安装微软OFFICE 2010官方中文版(http://dl.pconline.com.cn/html_2/1/82/id=8870&pn=0.html),然后下载个OFFICE 2010激活工具或说是破解工具吧(http://www.xiazaiba.com/html/3957.html),进行激活。
打开新建笔记之后是一片空白的,现在我们按下开始菜单下的屏幕剪辑进行一段文字的剪辑。
现在试着在图片上点击右键看下,使图片中的文本可搜索选择为中文,在右击编辑替换文字就可以看到识别的文字了。右键复制图片中的文本进行源文件格式的粘贴就可以得到基本上和源图片格式相当的文本了。(这里在识别上那个OneNote的“o”被识别成了“。”,这种就需要手动修改过来了)
今天不是要给大家讲关于这个单一图片的文字识别(目前针对文字识别OneNote暂时还不支持对繁体字的识别,关于对繁体字的识别还得看微软后续该如何下工夫了),现在是关于其在任何可打印的条件下进行的打印者的文字识别(如PDF文件等)。
其实OneNote在安装时就为我们安装上了一个虚拟的打印机名叫:发送到OneNote,只要在打印文件时在打印机处选择此项就可以把要打印的内容直接全部发送到OneNote上去了。
在OneNote上根据情况选择一个插入点(即是否要新建还是直接插入在当前笔记后面等),进度条过后就可以看到要打印的内容全部复制到此笔记里了,现在如果是要把此些内容全部进行识别,就要使用Ctrl+A进行全部选择,然后右击复制所有打印输出的文本。
等待进度条结束(因为识别时占用内存比较高,一般在识别时我们不推荐再进行其它操作),然后可试着新建一个word文档进行源文档格式粘贴就可以看到识别结果了,当然不一定全部是正确规范的,还需要你进行检查和修改。但它已为我们省下了不少的工夫,如此识别随手拍下来的报纸内容或是名片都是很好用的,大家不防回去都试试。觉得好的朋友顶下哦。
识别图片尽可能是规范和清晰的