假設(shè)有如下一張圖,如何把其中的文本分塊切割出來,比如“華普超市朝陽門店”、“2015-07-26”就是兩個文本塊。
為濟寧等地區(qū)用戶提供了全套網(wǎng)頁設(shè)計制作服務(wù),及濟寧網(wǎng)站建設(shè)行業(yè)解決方案。主營業(yè)務(wù)為網(wǎng)站設(shè)計、網(wǎng)站制作、濟寧網(wǎng)站設(shè)計,以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務(wù)。我們深信只要達到每一位用戶的要求,就會得到認可,從而選擇與我們長期合作。這樣,我們也可以走得更遠!做圖像切割有很多種方法,本文描述一種最直觀的投影檢測法。先來看看什么是投影,簡單來說,投影就是在一定方向上有效像素的數(shù)量。來看個直觀的圖像:
這是一張水平投影圖與原圖的對比,從投影圖上能看到多個波峰,文字多的地方,投影就長,行間的空白處,投影為0。 上個示例代碼:
public void HorizontalProjection() { //以灰度圖方式讀入源文件 string filename = "source.jpg"; var src = IplImage.FromFile(filename, LoadMode.GrayScale); //二值化,采用閾值分割法 Cv.Threshold(src, src, 0, 255, ThresholdType.BinaryInv | ThresholdType.Otsu); //存儲投影值的數(shù)組 var h = new int[src.Height]; //對每一行計算投影值 for(int y = 0;y < src.Height;++y) { //遍歷這一行的每一個像素,如果是有效的,累加投影值 for(int x = 0;x < src.Width;++x) { var s = Cv.Get2D(src, y, x); if(s.Val0 == 255) h[y]++; } } //準備一個圖像用于畫投影圖 var paintY = Cv.CreateImage(src.Size, BitDepth.U8, 1); Cv.Zero(paintY); //畫圖 var t = new CvScalar(255); for(int y = 0;y < src.Height;++y) { for(int x = 0;x < h[y];++x) Cv.Set2D(paintY, y, x, t); } //顯示 using(var window = new CvWindow("Source")) { window.Image = src; using(var win2 = new CvWindow("Projection")) { win2.Image = paintY; Cv.WaitKey(); } } }
顯然找出波峰對應(yīng)的y值,就能把行切割開了。 得到一行以后,可以采用類似的思想進行垂直投影,挑了一行測試一下,效果如下:
可以看到效果不是特別好,左右結(jié)構(gòu)的漢字有可能被切開,一個完整的數(shù)值也有可能分成多個數(shù)字,這種情況需要做一下處理,比如識別的時候要判斷如果間距較小就認為仍是同一文本塊,或者對圖像進行一下橫向膨脹處理:
var kernal = Cv.CreateStructuringElementEx(3, 1, 1, 0, ElementShape.Rect); Cv.Dilate(src, src, kernal, 4);
再計算投影,得到的效果就好多了:
最后上完整代碼以及切割效果展示:
using System; using System.Collections.Generic; using System.IO; using System.Text; using OpenCvSharp; using OpenCvSharp.Extensions; using OpenCvSharp.Utilities; namespace OpenCvTest { class Program { static void Main(string[] args) { //打開源文件 string filename = "source.jpg"; var src = IplImage.FromFile(filename); //轉(zhuǎn)成灰度圖 var gray = Cv.CreateImage(src.Size, BitDepth.U8, 1); Cv.CvtColor(src, gray, ColorConversion.BgrToGray); //二值化,閾值分割算法 Cv.Threshold(gray, gray, 0, 255, ThresholdType.BinaryInv | ThresholdType.Otsu); //分行 var rows = GetRowRects(gray); //針對每一行再分塊 var items = new List<CvRect>(); foreach (var row in rows) { var cols = GetBlockRects(gray.Clone(row), row.Y); items.AddRange(cols); } //把識別出的每一塊畫到原圖上去 var color = new CvScalar(255, 0, 0); foreach (var rect in items) { Cv.DrawRect(src, rect, color, 1); } //顯示 using (var window = new CvWindow("Image")) { window.Image = src; Cv.WaitKey(); } } /// <summary> /// 識別行 /// </summary> /// <param name="source"></param> /// <returns></returns> private static List<CvRect> GetRowRects(IplImage source) { var rows = new List<CvRect>(); //用于存儲投影值 var projection = new int[source.Height]; //遍歷每一行計算投影值 for (int y = 0; y < source.Height; ++y) { for (int x = 0; x < source.Width; ++x) { var s = Cv.Get2D(source, y, x); if (s.Val0 == 255) projection[y]++; } } bool inLine = false; int start = 0; //開始根據(jù)投影值識別分割點 for (int i = 0; i < projection.Length; ++i) { if (!inLine && projection[i] > 10) { //由空白進入字符區(qū)域了,記錄標記 inLine = true; start = i; } else if ((i - start > 5) && projection[i] < 10 && inLine) { //由字符區(qū)域進入空白區(qū)域了 inLine = false; //忽略高度太小的行,比如分隔線 if (i - start > 10) { //記錄下位置 var rect = new CvRect(0, start - 1 , source.Width, i - start + 2); rows.Add(rect); } } } return rows; } /// <summary> /// 識別塊 /// </summary> /// <param name="source"></param> /// <param name="rowY"></param> /// <returns></returns> private static List<CvRect> GetBlockRects(IplImage source, int rowY) { var blocks = new List<CvRect>(); //用于存儲投影值 var projection = new int[source.Width]; //先進行橫向膨脹 var kernal = Cv.CreateStructuringElementEx(3, 1, 1, 0, ElementShape.Rect); Cv.Dilate(source, source, kernal, 4); //遍歷每一列計算投影值 for (int x = 0; x < source.Width; ++x) { for (int y = 0; y < source.Height; ++y) { var s = Cv.Get2D(source, y, x); if (s.Val0 == 255) projection[x]++; } } bool inBlock = false; int start = 0; //開始根據(jù)投影值識別分割點 for (int i = 0; i < projection.Length; ++i) { if (!inBlock && projection[i] >= 2) { //由空白區(qū)域進入字符區(qū)域了 inBlock = true; start = i; } else if ((i - start > 10) && inBlock && projection[i] < 2) { //由字符區(qū)域進入空白區(qū)域了 inBlock = false; //記錄位置,注意由于傳入的是source只是一行,因此最終的位置信息要+rowY if(blocks.Count > 0) { //跟上一個比一下,如果距離過近,認為是同一個文本塊,合并 var last = blocks[blocks.Count - 1]; if (start - last.X - last.Width <= 5) { blocks.RemoveAt(blocks.Count - 1); var rect = new CvRect(last.X, rowY, i - last.X, source.Height); blocks.Add(rect); } else { var rect = new CvRect(start, rowY, i - start, source.Height); blocks.Add(rect); } } else { var rect = new CvRect(start, rowY, i - start, source.Height); blocks.Add(rect); } } } return blocks; } } }
得到的圖像如下,效果還行,將來繼續(xù)優(yōu)化吧:
未經(jīng)許可嚴禁轉(zhuǎn)載。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。
名稱欄目:基于OpenCV進行文本分塊切割-創(chuàng)新互聯(lián)
文章起源:http://aaarwkj.com/article42/ppeec.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)網(wǎng)站建設(shè)、企業(yè)建站、網(wǎng)站排名、搜索引擎優(yōu)化、營銷型網(wǎng)站建設(shè)、手機網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)