欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

Java光學字符的識別方式

本篇內容介紹了“Java光學字符的識別方式”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!

創(chuàng)新互聯(lián)公司服務項目包括雙峰網站建設、雙峰網站制作、雙峰網頁制作以及雙峰網絡營銷策劃等。多年來,我們專注于互聯(lián)網行業(yè),利用自身積累的技術優(yōu)勢、行業(yè)經驗、深度合作伙伴關系等,向廣大中小型企業(yè)、政府機構等提供互聯(lián)網行業(yè)的解決方案,雙峰網站推廣取得了明顯的社會效益與經濟效益。目前,我們服務的客戶以成都為中心已經輻射到雙峰省份的部分城市,未來相信會繼續(xù)擴大服務區(qū)域并繼續(xù)獲得客戶的支持與信任!

1.1 介紹

開發(fā)具有一定價值的符號是人類特有的特征。對于人們來說識別這些符號和理解圖片上的文字是非常正常的事情。與計算機那樣去抓取文字不同,我們完全是基于視覺的本能去閱讀它們。

另一方面,計算機的工作需要具體的和有組織的內容。它們需要數(shù)字化的表示,而不是圖形化的。

有時候,這是不可能的。有時,我們希望自動化的完成用雙手從圖像重寫文本的任務。

針對這些任務,光學字符識別(OCR)被設計成一種允許計算機以文本形式“閱讀”圖形化內容的方法,和人類工作的方式相似。雖然這些系統(tǒng)相對準確,但仍然可能有相當大的偏差。即便如此,修復系統(tǒng)的錯誤結果也遠比手工從頭開始要更加容易和快速。

就像所有的系統(tǒng)一樣,本質上是相似的,光學字符識別軟件在準備好的數(shù)據(jù)集上進行訓練,這些數(shù)據(jù)集提供了足夠多的數(shù)據(jù)用來幫助學習字符間的差異。如果我們想讓結果更加準確,那么這些軟件如何學習也是非常重要的話題,不過這將是另外一篇文章的內容了。

與其重新造輪或者想出一個非常復雜(但有用)的解決方案,不如我們先坐下來看看已有的解決方案。

1.2 Tesseract

科技巨頭 Google 一直在開發(fā)一個 OCR 引擎 Tesseract ,它從最初誕生到現(xiàn)在已有數(shù)十年的歷史。它為許多語言提供了API,不過我們將專注于 Tesseract 的 Java API 。

很容易使用 Tesseract 來實現(xiàn)一個簡單的功能。它主要用于讀取計算機在黑白圖片上生成的文字,并且結果的準確度較好。但這不是針對真實世界的文本。

對于現(xiàn)實世界中,我們最好使用像谷歌 Vision 這樣的更高級的光學字符識別軟件,這將在另一篇文章中討論。

1.2.1 Maven依賴

我們只需要簡單的添加一個依賴,就可以將引擎引入到我們的項目:

<dependency>
    <groupid>net.sourceforge.tess4j</groupid>
    <artifactid>tess4j</artifactid>
    <version>3.2.1</version>
</dependency>

1.2.2 光學字符識別

使用 Tesseract 毫不費力:

Tesseract tesseract = new Tesseract();
tesseract.setDatapath("E://DataScience//tessdata");
System.out.println(tesseract.doOCR(new File("...")));

我們先實例化一個 Tesseract 實例,然后為已訓練好的 LSTM (長短期記憶網絡)模型設置數(shù)據(jù)路徑。

數(shù)據(jù)可以從官方GitHub帳號處下載。

然后我們調用 doOCR() 方法,該方法接受一個文件參數(shù)并且返回一個字符串——提取的內容。

讓我們給它提供一張有著大而清晰的黑色字符的白色背景圖片:

Java光學字符的識別方式

提供這樣一張圖片會獲得完美的結果:

Optical Character Recognition in Java is made easy with the help of Tesseract'

不過這張圖片掃描起來過于簡單了。它已經被歸一化,而且有高分辨率和一致的字體。

讓我們來試試在紙上手寫一些字符并將該圖片提供給應用程序,這將會發(fā)生些什么呢:

Java光學字符的識別方式

我們可以立即看到結果的改變:

A411“, written texz: is different {mm compatar generated but

有一些單詞十分準確,并且你可以很輕松的辨認出 “written text is different from computer generated” ,但是第一個和最后一個單詞差得有點多。

現(xiàn)在,為了讓程序使用起來更簡單,我們把它轉換成一個十分簡單的 Spring Boot 應用程序,用更加舒適的圖形化界面來展示結果。

1.3 實現(xiàn)

1.3.1 Spring Boot應用程序

首先,從使用Spring Initializr創(chuàng)建我們的項目開始。它包含spring-boot-starter-webspring-boot-starter-thymeleaf依賴。然后我們手動導入Tesseract:

Java光學字符的識別方式

1.3.2 控制器

該應用程序只需要一個控制器,它將為我們提供兩個頁面的展示、處理圖片上傳和光學字符識別功能:

@Controller
public class FileUploadController {

    @RequestMapping("/")
    public String index() {
        return "upload";
    }

    @RequestMapping(value = "/upload", method = RequestMethod.POST)
    public RedirectView singleFileUpload(@RequestParam("file") MultipartFile file,
                                   RedirectAttributes redirectAttributes, Model model) throws IOException, TesseractException {

        byte[] bytes = file.getBytes();
        Path path = Paths.get("E://simpleocr//src//main//resources//static//" + file.getOriginalFilename());
        Files.write(path, bytes);

        File convFile = convert(file);
        Tesseract tesseract = new Tesseract();
        tesseract.setDatapath("E://DataScience//tessdata");
        String text = tesseract.doOCR(convFile);
        redirectAttributes.addFlashAttribute("file", file);
        redirectAttributes.addFlashAttribute("text", text);
        return new RedirectView("result");
    }

    @RequestMapping("/result")
    public String result() {
        return "result";
    }

    public static File convert(MultipartFile file) throws IOException {
        File convFile = new File(file.getOriginalFilename());
        convFile.createNewFile();
        FileOutputStream fos = new FileOutputStream(convFile);
        fos.write(file.getBytes());
        fos.close();
        return convFile;
    }
}

Tesseract 可以和Java的 File 類一起工作,但是不支持表單上傳的 MultipartFile 類。為了便于處理,我們添加了一個簡單的 convert() 方法,它將 MultipartFile 對象轉換成一個普通的 File 對象。

一旦我們利用 Tesseract 提取出了文本,我們只需將該文本和掃描的圖像一起添加到模型當中,然后附加到重定向的展示頁面 - result。

1.3.3 展示頁面

現(xiàn)在,讓我們定義一個包含簡單文件上傳表單的展示頁面:

<h2>Upload a file for OCR:</h2>

<form method="POST" action="/upload" enctype="multipart/form-data">
    <input type="file" name="file"><br><br>
    <input type="submit" value="Submit">
</form>

以及一個結果頁面:

<h2>Extracted Content:</h2>
<h3>&gt;<span th:text="${text}"></span></h3>

<p>From the image:</p>
<img th:src="'/' + ${file.getOriginalFilename()}" src="">

運行這個應用程序將會有一個簡單的交互界面迎接我們: Java光學字符的識別方式

添加一個圖片并提交它,屏幕上的結果將會包含提取的文本和上傳的圖片: Java光學字符的識別方式

成功了!

1.4 結論

利用谷歌的 Tesseract 引擎,我們搭建了一個十分簡單的應用,它接受從表單提交來的圖片,從中提取文本內容,最后將結果和圖片一起返回給我們。

由于我們只使用了 Tesseract 有限的功能,所以這不是一個特別有用的應用程序。而且該應用程序對于演示目的之外的任何其他用途都過于簡單,但是它可以作為一個有趣的工具來實現(xiàn)和測試。

“Java光學字符的識別方式”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關的知識可以關注創(chuàng)新互聯(lián)網站,小編將為大家輸出更多高質量的實用文章!

網頁名稱:Java光學字符的識別方式
分享地址:http://aaarwkj.com/article20/gihhco.html

成都網站建設公司_創(chuàng)新互聯(lián),為您提供動態(tài)網站、App開發(fā)、網站內鏈、建站公司品牌網站制作、網站設計

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

商城網站建設
日韩一区二区免费看视频| 丝袜美腿一区二区三区动态图| 亚洲精品色婷婷一区二区| 综合av在线一区天堂| 亚洲国产a级一区二区| 亚洲人妻一区二区久久| 欧美v日韩v亚洲综合国产高清 | 欧美日韩在线一区二区精品| 美味人妻手机在线观看| 午夜精品人妻一区二区| 欧美精品国产一区二区免费| 亚洲av成人精品网站推荐| 日本一本一道高清不卡视频| 中文字幕日本乱码精品久久| 中文字幕一区二区三区精彩视频| 日韩丰满少妇在线观看| 青草成人在线视频观看| 麻豆精品情欲人妻一区| 日本高清一区二区网站| 国产美女口爆吞精久久| 精品人妻一区二区四区| 天堂社区人妻在线亚洲| 亚洲一区二区日韩人妻| 尤物视频在线观看一下| 中文字幕一区二区三区精彩视频| 日韩精品在线观看一二三区| 18岁下禁止看的视频| 日本东京热加勒比视频| 超薄丝袜美腿一二三区在线播放| 国产亚洲精品a久久7777| 国产精品久久中文字幕网| 亚洲人妻av一区二区| 暖暖免费中文高清日本三区| 久久久亚洲精品中文字幕蜜桃| 亚洲av少妇高潮流白浆在线| 亚洲欧美国产日韩另类| 午夜福利视频欧美成人| 九九热在线免费观看精品视频 | 国产一区二区传媒视频| 肥胖老熟女一区二区三区| av在线免费观看大全|