查看完整版本: [-- [求助]関於图片里的文字转纯文字文件..... --]

【 浮游城 - Castle in the Sky | 开放邀请注册,PS|SS|WII|DC下载研究中心 】 -> 【 电脑全方位 | Computer All Round 】 -> [求助]関於图片里的文字转纯文字文件..... [打印本页] 登录 -> 注册 -> 回复主题 -> 发表主题

丘貝雷 2004-04-20 00:14

有沒有什么办法,或是有沒有什么软件可以将下面那张图里的文字部分转成纯文字文件?

dc_cd 2004-04-20 00:20
OSR,英文的识别率应该比较高

丘貝雷 2004-04-20 00:59
引用 (dc_cd @ 2004-04-20 00:22:31)
OSR,英文的识别率应该比较高

OSR?这是什么软件來着?有的下吗?

dc_cd 2004-04-20 01:23
记错了,是OCR
http://www.skycn.com/soft/6564.html

清华紫光 OCR支持Windows环境下的GB、BIG5、JIS和Shift-JIS等多种内码。在印刷体汉字识别中还加入了MMX优化技术,使识别速度得到了很大提高。我们用它识别一页A4大小的印刷体中英文混排的纯文本文件,只用了几秒钟。而且识别率非常高,只有极个别的字出现了差错。在这个版本中新增了表格识别功能。选择了识别表格的选项后,它会自动将表格的框线先识别出来,再对表格中的文字进行识别。文字全部识别出来之后会将文字按原样恢复到表格中。在这项测试中识别率也很不错。但是在测试中我们的工程师发现,当文字与表格的框线距离较近时,它的识别效果就没有那么理想了。如果用户想对一个图文混排的文件进行识别,则清华紫光 OCR还具有版面自动分析功能。它自动对扫描的版面进行分析,把应识别的文字区域划分出来,之后进行识别。对于被划分区域内的文字有很高的识别率,而且速度同样很快。不过遗憾的是,在这个版本中没有提供版面自动恢复的功能,因此如果想把文件恢复成原来的版面,则还需要重新手动排版。它的导出功能可以将带有表格的文当导出成为RTF格式的文件,从而允许用户在Word等应用程序中继续进行编辑。它还可以将扫描进来的图像格式转换成TIFF、BMP或PCZ等格式,具有很大的灵活性。它的批量识别功能可以让用户一次把多页文稿全部扫描之后再进行识别,避免了扫描一页识别一页带来的麻烦。这一版本最多可实现10000页的批量识别。该版本还增加了一项非常实用的功能,就是手写体的识别。有了这一功能,许多以前手写的信件或文件就可以扫描到计算机中,识别出来后用电子文档的方式进行保存了。不过目前的手写体识别功能还不够完全成熟,它对书写有很高的要求,如每个字之间要有一定的间隔,不能有连笔的情况等。尽管如此,手写体识别这一功能还是能够在一定程度上减轻文字录入工作的负担。该OCR还具有自学习功能,当遇到有生僻字时,可以通过键盘输入进行学习。有了这一功能,用户就可以自由地添加一些本来不“认识”的字,大大拓宽了中文OCR系统的识别字符集。清华紫光这一款专业版的OCR软件,不仅可以对纯文本文件进行识别,而且可以进行复杂的图文混排和图表文档的识别,最大限度地把人们从繁杂的文字再录入的工作中解脱出来。

nsgoh 2004-04-20 09:14
一般的扫描器都有副送的啊!
楼主可以检查一下买扫描器所副送的软件!

丘貝雷 2004-04-20 17:15
暈.....
只有Win 95/98能用而已阿,我的是Win2000阿

Taburiss 2004-04-20 18:02
........现在的OCR别说你的2000~~我的2003也一样用~~~
而且,识别E文的话~~可以考虑用Office自带的哦~~

丘貝雷 2004-04-20 23:16
引用 (Taburiss @ 2004-04-20 18:04:53)
........现在的OCR别说你的2000~~我的2003也一样用~~~
而且,识别E文的话~~可以考虑用Office自带的哦~~

office自帶的?什麼工具?能否帮我转一下?先说声谢谢!!

http://home.pchome.com.tw/hot/r711034/001.zip

心太 2004-04-20 23:20
如果楼主能等到明天上午,我倒是可以帮忙.不过转换过的校对就由楼主自己来了

丘貝雷 2004-04-20 23:27
<!--QuoteBegin-wanyangx+2004-04-20 23:22:00--></div><table border='0' align='center' width='95%' cellpadding='3' cellspacing='1'><tr><td><b>引用</b> (wanyangx @ 2004-04-20 23:22:00)</td></tr><tr><td id='QUOTE'><!--QuoteEBegin--> 如果楼主能等到明天上午,我倒是可以帮忙.不过转换过的校对就由楼主自己来了 <!--QuoteEnd--> </td></tr></table><div class='postcolor'> <!--QuoteEEnd--><br> 时间不是问题,你肯帮我这個忙我就很感谢了...

心太 2004-04-21 16:56
你给的图片太小了,识别全是乱码.如果是扫描的,最好保证每张在2MB以上的JPG

你也可以自己试试
下载地址

丘貝雷 2004-04-21 17:40
.................
[attachment=33929]

心太 2004-04-21 19:12
这次可以了,不过对公式的识别比较差

效对楼主自己完成吧 kaixin.gif kaixin.gif

jinal 2004-04-21 19:22
好麻烦啊
不如自己对着打一遍
或者拿到专门打字的地方去打

丘貝雷 2004-04-21 21:41
真的非常感谢,谢谢~


查看完整版本: [-- [求助]関於图片里的文字转纯文字文件..... --] [-- top --]


Powered by PHPWind Code © 2003-08 PHPWind
Gzip enabled

You can contact us