欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

分類信息網站應怎樣防范垃圾信息

百度把搜索不公正歸于垃圾信息,而Google 則反唇相譏,說靠機器、技術手段來反垃圾已經成為通行法則,百度的說法僅僅是一個借口而已。不管誰對誰錯,一個不爭的事實是垃圾信息已經成為如今的信息時代的公敵。
方法一通過提取信息里的聯系方式,建立聯系方式黑名單

垃圾信息制造者不管IP如何變、內容如何變,但是聯系方式是不變的。我們可以根據這一點來建立聯系方式黑名單數據庫。目前中國用戶用的最多的聯系方式有:電話號碼、QQ號、網址、Email地址等。這些聯系方式都有一定的特征,很容易通過正則表達式提取出來。那么具體如何建立黑名單呢?列表網的做法是:如果一條信息被用戶惡評五次,那么該信息自動標記為惡評狀態(tài)并隱藏。經確認的被用戶投訴的信息也被置于惡評狀態(tài)。當一條信息被置于惡評的時候,該惡評信息里的所有聯系方式均被存入黑名單數據庫中,并且出現頻率字段加1。這樣我們就有了聯系方式黑名單數據庫了,該數據庫有聯系方式的出現頻率及最新出現時間等信息。所有這些操作除了用戶投訴需要人工辨別外,其他的都是機器自動完成的。

方法二鑒別并刪除異地商家信息

分類信息網站的特點之一就是本地性,本地用戶到分類信息網站上來看的就是本地的租房、交友、服務等信息。因此如果信息里面出現異地的電話號碼的話則應該作為垃圾信息處理。這個可以通過手機屬地數據庫及電話區(qū)號數據庫來判斷。并不是所有的類目都適用這條方法的,像交友、尋人類目就不應該采用這種方法。但是像二手車類目、服務類目則完全可以采用這種方法過濾掉異地信息。

方法三限制某些類目同一天內一個用戶只能發(fā)布一條信息

重復的信息太多了,對用戶的體驗也不好。在這里重復信息的定義是:同一個用戶或商家(包括商家聘請的信息發(fā)布者)發(fā)布的內容相同或相似的信息。這些類目包括:生活服務、商務服務、培訓、交友、車輛等。那么如何避免重復信息的發(fā)布呢?列表網的做法是:在這些類目中用戶一天內發(fā)布的所有信息中只保留最近發(fā)布的信息,其他信息則刪除。

方法四關鍵字過濾

最后不要忘了關鍵字過濾。一些有害的、敏感的關鍵字是肯定需要過濾的。

以上是分類信息網站可以采納的反垃圾信息的簡單的行之有效的幾種方式。如果能配合貝葉斯算法過濾垃圾信息那就更完美了。

網站欄目:分類信息網站應怎樣防范垃圾信息
路徑分享:http://aaarwkj.com/article26/dghpdjg.html

成都網站建設公司_創(chuàng)新互聯,為您提供、標簽優(yōu)化、小程序開發(fā)、網站策劃、網站設計公司、軟件開發(fā)

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯

成都網站建設
麻豆国产av巨做国产剧情| 中文字幕韩国三级电影| 国产三级尤物在线观看 | 人妻少妇被猛烈进入久久精品| 国产二区日韩成人精品| 麻豆国产自拍在线视频| 亚洲欧美日韩精品麻豆| 精品国产无遮挡污污网站| 日本一区二区三区免费看视频| 91国产熟女自拍视频| 成人黄色av大片在线观看| 精品自拍一区在线观看| 粉嫩国产av一区二区三区| 亚洲人妻一区二区久久| 日本黄色免费在线观看网站| 97在线视频在线播放| 日本欧美国产一区二区| 日本免费熟女一区二区| 中文字幕精品一区二区三区精品| 亚洲理论在线观看电影| 亚洲视频免费在线一区| 6080yy精品一区二区三区| 国产一级三级视频在线| 欧美一区二区精品少妇| 日韩精品一区二区视频| 亚洲一区二区日本乱码| 日韩三级成人在线视频| 欧美精品黑人三级精品| 久久婷婷av一区二区三区| 日本加勒比系列在线视频| 国产日韩传媒在线观看| 日韩精品免费在线观看视频网站| 原创国产av剧情精品| 欧美日韩国产综合一区二区| 亚洲国际天堂av在线| 日韩午夜电影一区二区三区| 亚洲日本欧洲二区精品| 亚洲精品日韩一区二区| 日本精品在线亚洲国产欧美| 国产夫妻性生活国产视频| 白白色成人永久在线观看视频|