大化工论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录,快人一步

手机号码,快捷登录

手机号码,快捷登录

开启左侧

[话题讨论] 数字图书ocr识别的办法

[复制链接]
发表于 2007-8-25 23:48:41 | 显示全部楼层 |阅读模式
数字图书ocr识别的办法
对于数字图书的识别,其实有很多方法,关键是看你的数字图书的来源和清晰度。
我一般习惯用两种:
1、
利用office2003的虚拟打印机Microsoft Office Document Image Writer,识别时,选择打印,打印机选择Microsoft Office Document Image Writer就可以,打印成*.mdi文件,office识别,里面就有ocr识别了,识别后可以发送到word或者记事本。不果打印的页数不咬太多,要不然识别的时候时间太长,还以为死机了呢,可以分段识别。不过对表格的识别较差。表格要先拷贝出去。(office2003安装是选择全部安装即可!)
2、
用尚书,把想要识别的文件,存成tiff文件,再尚书里开开就识别了。
这两种我都用过,效果还可以。
大家有什么问题可以跟贴,我负责回答。包括pdf文件的制作。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 |

本版积分规则

QQ|Archiver|手机版|小黑屋|大化工论坛 ( 鲁ICP备12015736号-12 )

GMT+8, 2024-12-23 07:23 , Processed in 0.046841 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表