欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

如何對python讀寫文件去重-創(chuàng)新互聯

這篇文章主要介紹了如何對python讀寫文件去重,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

創(chuàng)新互聯建站主營尼元陽網站建設的網絡公司,主營網站建設方案,app軟件開發(fā)公司,尼元陽h5成都小程序開發(fā)搭建,尼元陽網站營銷推廣歡迎尼元陽等地區(qū)企業(yè)咨詢

如下所示:

# -*- coding:utf-8 -*-
 
from datetime import datetime
import re
 
 
def Main():
 sourcr_dir = '/data/u_lx_data/fudan/muying/muying_11yue_all.txt'
 target_dir = '/data/u_lx_data/fudan/muying/python/uid_regular_get.txt'
 
 uset = set() #去重
 
 print("開始。。。。。")
 print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
 
 with open(target_dir, 'w+') as f_write:
  with open(sourcr_dir, 'r') as f_scorce:
   for line in f_scorce:
   line = line.strip().split("\t")
   # 寶寶樹
   if line[2] == 'babytree.com':
    uidList = re.findall(r'.*NL=u%02(u\d+)', line[3], re.I)
    if uidList:
     # 去重代碼
     if uidList[0] not in uset:
      f_write.write(uidList[0] + "\n")
      uset.add(uidList[0])
      print("寶寶樹已完成")
 
   # 柚寶寶
   elif line[2] == 'youzibuy.com':
    if line[4].find("yunqi.youzibuy.com/tae_top_notify") != -1:
     uidList = re.findall(r'.*myuid=(\d+)', line[4], re.I)
     if uidList:
      if uidList[0] not in uset:
       f_write.write(uidList[0] + "\n")
       uset.add(uidList[0])
       print("柚寶寶已完成")
 
   # 媽媽幫
   elif line[2] == 'mmbang.com':
    uidList = re.findall(r'.*uid=(\d+)', line[3], re.I)
    if uidList:
     if uidList[0] not in uset:
      f_write.write(uidList[0] + "\n")
      uset.add(uidList[0])
      print("媽媽幫已完成")
 
   # 媽媽網
   elif line[2] == 'mama.cn':
    if line[4].find("mapi.mama.cn/feed/users/show") != -1:
     uidList = re.findall(r'.*friend_uid=(\d+)', line[4], re.I)
     if uidList:
      if uidList[0] not in uset:
       f_write.write(uidList[0] + "\n")
       uset.add(uidList[0])
    if line[4].find("mamaquan/mmq_thread") != -1:
     uidList = re.findall(r'.*uid=(\d+)', line[4], re.I)
     if uidList:
      if uidList[0] not in uset:
       f_write.write(uidList[0] + "\n")
       uset.add(uidList[0])
       print("媽媽網已完成")
 
   # 育兒網
   elif line[2] == 'ci123.com':
    uidList = re.findall(r'.*ci123js=([a-zA-Z]+\d+)', line[3], re.I)
    if uidList:
     if uidList[0] not in uset:
      f_write.write(uidList[0] + "\n")
      uset.add(uidList[0])
      print("育兒網已完成")
 
 print("完成。。。。。")
 print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
if __name__ == "__main__":
 Main()

感謝你能夠認真閱讀完這篇文章,希望小編分享的“如何對python讀寫文件去重”這篇文章對大家有幫助,同時也希望大家多多支持創(chuàng)新互聯成都網站設計公司,關注創(chuàng)新互聯成都網站設計公司行業(yè)資訊頻道,更多相關知識等著你來學習!

另外有需要云服務器可以了解下創(chuàng)新互聯scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、網站設計器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。

本文標題:如何對python讀寫文件去重-創(chuàng)新互聯
網頁路徑:http://aaarwkj.com/article40/phoho.html

成都網站建設公司_創(chuàng)新互聯,為您提供網站排名、建站公司、電子商務、動態(tài)網站企業(yè)網站制作、網站策劃

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯

成都定制網站建設
亚洲精品一区二区三区小| 日韩精品在线观看大全套| 亚洲男人的天堂社区av| 国产成人av麻豆色哟哟| 国产成人亚洲欧美激情| 国产一区二区不卡自拍| 国产亚洲一区二区精品| 激情亚洲欧美日韩精品| 成人黄网站色大片免费观看| 青青草免费视频观看在线| 亚洲日本欧美激情综合| 好色人妻在线播放中文字幕| 丰满人妻一区二三区av| 91中文在线观看一区| 中文字幕乱码人妻一二三| 欧美夫妻香蕉视频网站| 国产在线不卡中文字幕| 懂色av中文一区二区| 国产欧美日韩精品av| 青青草免费在线播放视频网站| 久国产亚洲精品久久久极品| 一区二区三区毛片在线看| 自由成熟性生活免费视频| 日本美女午夜福利视频| av在线中文字幕乱码| 日本成熟亚洲中文字幕的| 懂色一区二区三区精品视频| 99亚洲综合一区二区三区| 色播五月麻豆激情综合网| 淫色网av人妻中文字幕| 高清av中文免费在线| 特黄特色的日本大片| 久久香蕉国产线看观看av| 高潮的毛片激情久久精品| 亚洲成人永久免费精品| 99久久热这里只有精品| 四虎在线观看最新入口| 无套内射精品一区二区| 蜜桃免费观看在线视频| 国产精品一区二区麻豆本子| 91国内偷拍富婆国内精品对白 |