這篇文章給大家分享的是有關(guān)怎么用Python和Tesseract識(shí)別圖片文字的內(nèi)容。小編覺(jué)得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過(guò)來(lái)看看吧。
10年積累的網(wǎng)站設(shè)計(jì)、做網(wǎng)站經(jīng)驗(yàn),可以快速應(yīng)對(duì)客戶對(duì)網(wǎng)站的新想法和需求。提供各種問(wèn)題對(duì)應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認(rèn)識(shí)你,你也不認(rèn)識(shí)我。但先網(wǎng)站設(shè)計(jì)后付款的網(wǎng)站建設(shè)流程,更有漢壽免費(fèi)網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。
Linux 和 Mac 平臺(tái)的安裝非常簡(jiǎn)單,直接命令行安裝即可,默認(rèn)只有英文語(yǔ)言包,漢語(yǔ)包需要額外指定
sudo apt-get install tesseract-ocr # ubuntu
brew install tesseract # macOS
Windows 平臺(tái)需要二進(jìn)制安裝包,官方下載地址 https://github.com/tesseract-ocr/tesseract/wiki/4.0-with-LSTM#400-alpha-for-windows,安裝時(shí)需要選擇中文語(yǔ)言包才是識(shí)別漢字
安裝完成后,需要設(shè)置兩個(gè)環(huán)境變量 $PATH 和 $TESSDATA_PREFIX,如果不指定后面會(huì)報(bào)錯(cuò),把 tessertact 的安裝路徑加入 PATH 變量中,TESSDATA_PREFIX 變量的值指定為語(yǔ)言包的路徑
Python-tesseract 是 tessertact 的 Python 封裝包,它需要依賴圖片處理庫(kù) PIL(Pillow),環(huán)境搭建完成后就可以開(kāi)始做定制化開(kāi)發(fā)了。
以下我以杜甫的《登高》作為 demo 從中提取出其中的文字
# pip install pytesseract 先安裝依賴包
try:
import Image
except ImportError:
from PIL import Image
import pytesseract
# lang 指定中文簡(jiǎn)體
text = pytesseract.image_to_string(Image.open('dufu-denggao1.jpeg'), lang='chi_sim')
print(text)
輸出結(jié)果:
風(fēng) 急 天 高 猿 哨 哀 , 渚 清 沙 白 鳥(niǎo) 飛 回 。 無(wú) 邊 落 木 蕭 蕭 下 , 不 盡 長(zhǎng) 江 滾 滾 來(lái) 。 萬(wàn) 里 悲 秋 常 作 客 , 百 年 多 病 獨(dú) 登 臺(tái) 。 艱 難 苦 恨 繁 霜 鬢 , 漫 倒 新 停 濁 酒 杯 。
感謝各位的閱讀!關(guān)于“怎么用Python和Tesseract識(shí)別圖片文字”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!
網(wǎng)頁(yè)題目:怎么用Python和Tesseract識(shí)別圖片文字
URL標(biāo)題:http://aaarwkj.com/article26/gjdejg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供移動(dòng)網(wǎng)站建設(shè)、關(guān)鍵詞優(yōu)化、營(yíng)銷(xiāo)型網(wǎng)站建設(shè)、定制開(kāi)發(fā)、云服務(wù)器、App開(kāi)發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)