例子里用到的 org.htmlparser.Parser 是一個html 的解析器,可以在 sourceforge 上下載。
10年積累的成都做網(wǎng)站、網(wǎng)站設(shè)計經(jīng)驗,可以快速應(yīng)對客戶對網(wǎng)站的新想法和需求。提供各種問題對應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認(rèn)識你,你也不認(rèn)識我。但先網(wǎng)站設(shè)計后付款的網(wǎng)站建設(shè)流程,更有丹棱免費網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。這個例子使用 org.htmlparser.Parser 包來解析一個 html 格式的字符串,要解析的 html 字符串保存在conntentOld 字段里。
解析過程去除了 html 格式里所有標(biāo)簽,并將結(jié)果保存在 content 字段里。
注意事項:
1. 需要事先將htmlparser.jar包 放在kettle 的 libext 目錄,kettle 在啟動時會自動加載libext 目錄下的所有 jar 包。
2. modified java script 步驟要選中 compatibility mode,并將 content 設(shè)置為輸出的字段。
代碼如下:
[@more@]var parser = new Packages.org.htmlparser.Parser( contentOld );
本文名稱:kettlemodifiedjavascript步驟的一個例子-創(chuàng)新互聯(lián)
文章轉(zhuǎn)載:http://aaarwkj.com/article36/dgdcpg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供電子商務(wù)、全網(wǎng)營銷推廣、標(biāo)簽優(yōu)化、網(wǎng)頁設(shè)計公司、用戶體驗、域名注冊
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容