不久前,微信PC端更新了OCR功能,使其能够识别图片中的文字。
老实说,这可能是微信十年来推出的最实用的功能之一。
例如,使用微信屏幕快照时,单击下面的“识别文本”可以获得屏幕快照中的文本。
微信内收到的照片也支持直接选择文本复制。
除了功能实用性外,微信软件已经成为计算机必备的软件,微信截图也是很多人的基本截图工具。
因此,微信OCR相当于系统功能。不需要安装费用。如果以后出现无法复制的文本,可以微信载入。
一般来说,微信OCR可以满足大多数人的需求。
但是因为功能比较基础,所以在某些特殊情况下看起来有点笨。
例如,如果有很多要识别的文本,则需要捕获一次,再识别一次,然后再次复制。
或者,您可能想要OCR的告示。文字是纵向的,从右向左走的话,微信识别的顺序可能会混乱。(约翰f肯尼迪)。
最近,我们发现了支持Win1011的名为Umi-OCR的工具。
这个功能非常强大,可以帮助您大量识别照片、选择遮罩区域、指定文字方向,以及做所有不能微信的事情。
哦,最重要的是免费开源,不需要安装,不需要网络,也可以离线使用。
给你简单看一下。
如果是需要下面钱才能复制的文字,我们点击软件的截图功能,然后打开文字,0.73秒后就可以得到文字。
因为在本地工作,所以计算机性能越强,花费的时间就越少。
与微信不同,Umi-OCR包含记录板,每当识别的文本出现在记录板中时,都会继续保留。
也就是说,如果有一堆可以识别的文章,就可以像连著一样连续截图。
所有的画都剪完了,记录本上也已经识别出了所有的文字。
到这个时候,你再复印粘贴会方便得多。
5&from=ar;x-expires=1705582092&x-signature=eXD0cpZheh7NWUvi2rmZzDVK4ok%3D&index=6" width="640" height="337"/>当然还有一种情况,你本地里已经存好了所有的图片,那这就更方便了。
Umi-OCR 支持批量识别,如果说刚才是连狙,那么这个功能就是一键加特林。
直接扔几百张图片过去,剩下的交给 Umi-OCR。
接着,记录板上就会出现一行行的文字。
与此同时,识别结果还会以 txt 文件保存起来,可以说一条龙服务齐全了。
如果你不需要 txt,而是 md、jsonl 的格式,没关系它都支持。
除了刚才说的这几项,Umi-OCR 还有一些细节功能,可以照顾到特殊情况。
举个例子,下面这个图你只想要正文里的那一句话,水印等其他无效信息不想要。
要是一张图,你截图划一个区域就行了。
但要是有 100 张类似的图呢?
诶,这个软件支持你指定识别区域。
只要你导入一张照片,然后选择一些要屏蔽的区域,那接下来所有同分辨率的图片,识别时就会自动屏蔽这些区域。
这样批量识别出的结果,就只有我们想要的部分了。
另外,Umi-OCR 还可以调整段落化。
什么意思呢,一般 OCR 段落识别是根据行距来的,行与行之间空隙大了,它就会判断为下一段。
但如果遇到下面这样的特殊格式,一句话就是一段,距离很近,那 OCR 工具会把它们识别成一句话,合在一起。
比如微信识别出来是这样的。
但 Umi-OCR 支持段落优化,不同的段落格式可以选择不同的设置,如单行优化、左对齐、自然段等等。
遇到刚才的格式,就可以选择「 优化单行 」。
其他的情况也都有对应的选项,下图供参考。
最后,Umi-OCR 还支持更改文字识别方向。
比如你要识别一首古诗,只要选择一下「 文字方向为纵向、从右到左 」即可。
对了有一点忘了提,除了支持中文、英文识别,通过导入多语言识别扩展包,Umi-OCR 还支持繁中、日、韩、俄、德、法等语言,链接会一起放在文末。
我知道,大家肯定关心它的识别准确率,我只能说表现尚可。
在第一张测试图里,世超就发现捂脸表情被识别成一个( ,然后少了一个引号和一个句号。
小表情识别成文字,这点错误各位应该可以接受,毕竟没多少文章像我们这样,写着写着塞点表情。
引号和句号丢失,我认为无伤大雅。
但除了这几个问题,Umi-OCR 也会识别错文字,比如把「 毕竟 」识别成了「 华竟 」。
另外,世超建议各位不要用它识别一些粗体字,效果不太理想。
当然,大家也不要因此拒绝使用 Umi-OCR,市面上就没有一家 OCR 工具敢保证 100% 准确率。
像刚才的古诗,Umi-OCR 错了最后一个字,但微信 OCR 识别下来,就没几个对的了。
此外,微信 OCR 还会把粗体的 MVP 识别成 MUP。
所以说,使用 OCR,不管你用的是哪家,都要做好会遇到识别错误的准备。世超是建议大家每次自己再简单检查一遍。
还是那句话,如果只是偶尔需要 OCR,那还是微信好。
但如果你的需求很大,很特殊,害怕泄露隐私啥的,那这款 Umi-OCR 更适合你。