創(chuàng)新互聯(lián)www.cdcxhl.cn八線動態(tài)BGP香港云服務器提供商,新人活動買多久送多久,劃算不套路!
不懂用python如何構(gòu)建知識圖譜?其實想解決這個問題也不難,下面讓小編帶著大家一起學習怎么去解決,希望大家閱讀完這篇文章后大所收獲。
知識圖譜可以用python構(gòu)建嗎?
答案當然是可以的?。。?/strong>
那么如何使用python構(gòu)建
什么是知識圖譜
從Google搜索,到聊天機器人、金融風控、物聯(lián)網(wǎng)場景、智能醫(yī)療、自適應教育、推薦系統(tǒng),無一不跟知識圖譜相關。它在技術領域的熱度也在逐年上升。
互聯(lián)網(wǎng)的終極形態(tài)是萬物的互聯(lián),而搜索的終極目標是對萬物的直接搜索。傳統(tǒng)搜索引擎依靠網(wǎng)頁之間的超鏈接實現(xiàn)網(wǎng)頁的搜索,而語義搜索是直接對事物進行搜索,如人物、機構(gòu)、地點等。這些事物可能來自文本、圖片、視頻、音頻、IoT設備等各種信息資源。而知識圖譜和語義技術提供了關于這些事物的分類、屬性和關系的描述,使得搜索引擎可以直接對事物進行索引和搜索。
知識圖譜是由Google公司在2012年提出來的一個新的概念。從學術的角度,我們可以對知識圖譜給一個這樣的定義:“知識圖譜本質(zhì)上是語義網(wǎng)絡(Semantic Network)的知識庫”。但這有點抽象,所以換個角度,從實際應用的角度出發(fā)其實可以簡單地把知識圖譜理解成多關系圖(Multi-relational Graph)。
那什么叫多關系圖呢? 學過數(shù)據(jù)結(jié)構(gòu)的都應該知道什么是圖(Graph)。圖是由節(jié)點(Vertex)和邊(Edge)來構(gòu)成,但這些圖通常只包含一種類型的節(jié)點和邊。但相反,多關系圖一般包含多種類型的節(jié)點和多種類型的邊。
本項目利用pandas將excel中數(shù)據(jù)抽取,以三元組形式加載到neo4j數(shù)據(jù)庫中構(gòu)建相關知識圖譜。
運行環(huán)境
基于Neo4j能夠很容易構(gòu)建知識圖譜,除了用neo4j自帶的cypher,也支持Python包py2neo創(chuàng)建節(jié)點和關系從而構(gòu)建知識圖譜。本項目是基于發(fā)票信息,將發(fā)票數(shù)據(jù)中結(jié)構(gòu)化數(shù)據(jù)抽象成三元組,分別創(chuàng)建節(jié)點和關系從而構(gòu)建成知識圖譜。
具體包依賴可以參考文件requirements.txt
neo4j-driver==1.6.2numpy==1.15.3pandas==0.23.4parso==0.3.1pickleshare==0.7.5pluggy==0.8.0prompt-toolkit==1.0.15py==1.7.0py2neo==3Pygments==2.2.0pytest==3.9.3python-dateutil==2.7.5wcwidth==0.1.7wincertstore==0.2xlrd==1.1.0
將所需依賴安裝到pyton中:pip install -r requirements.txt
Pandas抽取excel數(shù)據(jù)
python中pandas非常適用于數(shù)據(jù)分析與處理,可以將excel文件轉(zhuǎn)換成dataframe格式,這種格式類似于Spark中的Dataframe結(jié)構(gòu),可以用類sql的形式對數(shù)據(jù)進行處理。
Excel數(shù)據(jù)結(jié)構(gòu)如下
通過函數(shù)data_extraction和函數(shù)relation_extrantion分別抽取構(gòu)建知識圖譜所需要的節(jié)點數(shù)據(jù)以及聯(lián)系數(shù)據(jù),構(gòu)建三元組。
數(shù)據(jù)提取主要采用pandas將excel數(shù)據(jù)轉(zhuǎn)換成dataframe類型
invoice_neo4j.py
建立知識圖譜所需節(jié)點和關系數(shù)據(jù)
DataToNeo4jClass.py
感謝你能夠認真閱讀完這篇文章,希望小編分享用python如何構(gòu)建知識圖譜內(nèi)容對大家有幫助,同時也希望大家多多支持創(chuàng)新互聯(lián),關注創(chuàng)新互聯(lián)-成都網(wǎng)站建設公司行業(yè)資訊頻道,遇到問題就找創(chuàng)新互聯(lián),詳細的解決方法等著你來學習!
網(wǎng)頁標題:用python如何構(gòu)建知識圖譜-創(chuàng)新互聯(lián)
文章來源:http://aaarwkj.com/article26/ihccg.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供企業(yè)網(wǎng)站制作、做網(wǎng)站、App設計、商城網(wǎng)站、虛擬主機、軟件開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)