2021-10-13java代码实现图片内容转文字

java代码实现图片内容转文字

前言

在找Java图片转文字的资料时,找到的资料很多都不全面,经过不断的搜集,才找到差不多的一些资料,整理用作后期备份吧:
1、使用的springboot的maven进行导入tess4j的jar包。

pom.xml配置文件设置

<dependency>
    <groupId>net.sourceforge.tess4j</groupId>
    <artifactId>tess4j</artifactId>
    <version>3.2.1</version>
</dependency>

test.java

 @RestController
@RequestMapping("/hello")
public class HelloController {

    @GetMapping("/say")
    public String sayHello(){
        return "Hello Spring";
    }
    @RequestMapping("picture")
    public String picture(){
        Tesseract tesseract = new Tesseract();
        String picturePath ="C:/Users/pc/Desktop/testpicture";
        tesseract.setDatapath(picturePath);
        String s="";
        try {
            s = tesseract.doOCR(new File("C:/Users/pc/Desktop/picturetest.jpg"));
        } catch (TesseractException e) {
            e.printStackTrace();
        }
        return s;
    }
}

2.tesseract.setDatapath(picturePath)这一行主要是在设置LSTM数据集,获取方式网址是:https://github.com/tesseract-ocr/tesseract/wiki/Data-Files
里面什么语言都有,也有这项技术的简介。
3、可以使用下载的资源中的eng.traineddata,chi_sim.traineddata两个文件,eng代表英文的,chi_sim代表简体中文的,每种语言对应一个训练好的模型文件。

里面什么语言都有,也有这项技术的简介。

3.new File(“C:/Users/pc/Desktop/picturetest.jpg”)主要是在设置相关图片的资源
4、启动项目,在页面访问项目路径就能获取到识别到的结果。


版权声明:本文为ITChark原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。