本篇內(nèi)容主要講解“Lucene的文件結構是怎樣的”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Lucene的文件結構是怎樣的”吧!
為新洲等地區(qū)用戶提供了全套網(wǎng)頁設計制作服務,及新洲網(wǎng)站建設行業(yè)解決方案。主營業(yè)務為成都網(wǎng)站建設、做網(wǎng)站、新洲網(wǎng)站設計,以傳統(tǒng)方式定制建設網(wǎng)站,并提供域名空間備案等一條龍服務,秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務。我們深信只要達到每一位用戶的要求,就會得到認可,從而選擇與我們長期合作。這樣,我們也可以走得更遠!
Lucene的文件結構是一個層次結構。
Lucene文件層次結構包含:
如果非要打一個比方:
這里的索引相當于數(shù)據(jù)庫中的表,當表中的記錄達到一定的量之后,我們要對表進行分區(qū)操作。
這里的段就相當于表的分區(qū)。
也就是說,索引可以分解成多個段。
數(shù)據(jù)表中的記錄又保存不同的分區(qū)中內(nèi),這里的文檔就相當于數(shù)據(jù)庫表中的記錄。不同的文檔保存在不同的段中。
與表的分區(qū)略有不同的是,這里的段可以合并成一個新段。
一個索引包含多個段,每個段包含一個或多個文檔,文檔中包含多個域,域可以進行分詞劃分成一個或多個詞元。
Lucene索引中保存了正向信息和反向信息。
正向信息:按層次保存了索引到詞的包含關系。
索引-段-文檔-域-詞
一個索引包含哪些段,每個段包含哪些文檔,文檔中包含哪些域,域劃分成哪些詞元。
反向信息:詞到文檔的映射關系。
在本系列前面的文章(1)中,我們將這種從詞到文檔的映射關系,定義為倒排表。通過倒排表,我們可以看到每一個詞分別在哪些文檔中出現(xiàn)。
到此,相信大家對“Lucene的文件結構是怎樣的”有了更深的了解,不妨來實際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關內(nèi)容可以進入相關頻道進行查詢,關注我們,繼續(xù)學習!
本文題目:Lucene的文件結構是怎樣的
網(wǎng)頁URL:http://aaarwkj.com/article14/pdeide.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供域名注冊、云服務器、虛擬主機、網(wǎng)頁設計公司、營銷型網(wǎng)站建設、App設計
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)