2021-02-04 分類: 網(wǎng)站建設
17行代碼跑最新NLP模型?你也可以!
- Senta是百度NLP開放的中文情感分析模型,可以用于進行中文句子的情感分析,輸出結果為{正向/中性/負向}中的一個,關于模型的結構細節(jié),請查看Senta----github.com/PaddlePaddle/Paddlehub/demo/senta
- PaddleHub是基于PaddlePaddle開發(fā)的預訓練模型管理工具,可以借助預訓練模型更便捷地開展遷移學習工作。
總結
1.模型計算耗時較小,使用體驗不錯。
2.成語情感分析方面,我專門挑選的是一些比較難從字面理解的,容易混淆情感的成語(比如差強人意被判定為消極),這些也是高考??嫉膬?nèi)容。雖然最后模型正確率只有一般,但是我認為是可以接受的,適當增加成語語句作為訓練語料會使模型"更懂"中文。
大家有興趣的可以試一試一些比較容易從字面理解情感的成語,我覺得得分會比本次評測的結果要好。
3.轉折語句情感分析本身也是對模型的一種挑戰(zhàn),實測效果為65分,個人覺得模型對于像“但是”,“雖然”這樣的詞語沒有足夠的attention,因為這些轉折詞背后的語義往往才是最影響整個句子的情感的,最終評分65分,個人認為模型在這方面表現(xiàn)一般。
4.評分最好看的是具體場景情感分析,大概預訓練語料中有大量的淘寶評價?像殺馬特 20 科比 這些小字眼是判定情感的關鍵,而模型也確實捕捉到并判斷出來了,這點比較讓我驚喜。
文章標題:17行Python代碼做情感分析?你也可以的
網(wǎng)址分享:http://aaarwkj.com/news/99070.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供建站公司、網(wǎng)站營銷、商城網(wǎng)站、定制網(wǎng)站、響應式網(wǎng)站、網(wǎng)站改版
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容