首页 - 要闻 > 图文识别转文字(什么软件可以将扫描出来的图片,自动转成文本格式?有哪些软件推荐)

图文识别转文字(什么软件可以将扫描出来的图片,自动转成文本格式?有哪些软件推荐)

发布于:2024-05-10 14:52:01 来源:互联网

这里以Python为例,简单介绍一下,如何从图片中识别文字,主要用到Tesseract这个开源软件,感兴趣的朋友可以尝试一下:

01

安装Tesseract

这个直接到官网下载即可,Tesseract是谷歌一个非常著名、开源的OCR识别引擎,可以轻松识别图片中的任何文字,包括中文、英文等,Windows是一个exe文件,直接双击安装即可,如下,32位、64位都有,选择适合自己平台的版本就行:

安装时候,建议勾选“中文简体”和“中文繁体”这2项,这样在识别中文的时候,才能更好的支持,准确率也会有所提升:

02

识别图片文字

Tesseract安装完成后,这里还需要先安装pytesseract模块,直接在cmd窗口运行命令“pip install pytesseract”即可,程序会自动检测相关依赖并安装,接着我们就可以直接编程调用Tesseract识别图片文字了,测试代码如下,这里包括英文和中文图片识别,基本思路先读取图片,然后加载tesseract,最后再直接调用image_to_string函数识别即可:

程序运行截图如下,第一幅图为英文识别效果,准确率还是非常高的,第二幅图是中文识别效果,效果有些不理想,个别文字存在较大误差,需要改进和优化:

至此,我们就完成了利用Python从图片中识别文字。总的来说,整个过程非常简单,借助于Tesseract,我们可以快速从图片中提取文字,只要你熟悉一下上面的操作过程,很快就能掌握的,网上也有相关教程和资料,介绍的非常详细,感兴趣的话,可以搜一下,希望以上分享的内容能对你有所帮助吧,也欢迎大家评论、留言进行补充。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

相关文章