欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

python中怎么處理文本數據-創(chuàng)新互聯

這篇文章給大家介紹python中怎么處理文本數據,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。

為金臺等地區(qū)用戶提供了全套網頁設計制作服務,及金臺網站建設行業(yè)解決方案。主營業(yè)務為成都網站制作、成都做網站、金臺網站設計,以傳統方式定制建設網站,并提供域名空間備案等一條龍服務,秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務。我們深信只要達到每一位用戶的要求,就會得到認可,從而選擇與我們長期合作。這樣,我們也可以走得更遠!

1) 問題描述

數據:某個區(qū)域181天內的訪客數據,格式如下,第一列代表訪客的名稱,第二列代表這位訪客在181天內到達這片區(qū)域的時刻:

python中怎么處理文本數據

目的:將訪客數據進行統計,并時間離散化,按照天 /周/小時處理為72624的三維矩陣。
也就是說,矩陣中的每一個值,代表該區(qū)域 周X、第幾周、幾點 的到訪人數,如
[1,5,19]=100,代表第5周的周一晚上7點的人數為100。

2)難點

當然是對我的難點。

2.1)怎么按行統計

2.2)怎么進行時間離散化(存為天、周、時刻的矩陣)

3)代碼

import time
import numpy as np
import sys
import datetime
import pandas as pd
import os
#用字典查詢代替類型轉換,可以減少一部分計算時間
date2position = {}
datestr2dateint = {}
str2int = {}
for i in range(182):
 date = datetime.date(day=1, month=10, year=2018)+datetime.timedelta(days=i)
 #print(i,":",date)
 date_int = int(date.__str__().replace("-", ""))
 date2position[date_int] = [i%7, i//7]
 datestr2dateint[str(date_int)] = date_int
#print(datestr2dateint)
#
for i in range(24):
 str2int[str(i).zfill(2)] = i
f=open("D:\BaiDuBigData19-URFC-master\\UrbanRegionFunctionClassification-master\data\\train_visit\\000000_008.txt")
#table = pd.read_csv(f, header=None,error_bad_lines=False)
table = pd.read_csv(f, header=None,sep='\t')

#print(table.shape)
#print(table.ix[1])
strings = table[1]
#print(strings)
init = np.zeros((7, 26, 24))
for string in strings:
 temp = []
 for item in string.split(','):
 temp.append([item[0:8], item[9:].split("|")])
 for date, visit_lst in temp:
 # x - 第幾周
 # y - 第幾天
 # z - 幾點鐘
 # value - 到訪的總人數
 # print(visit_lst)
 print(date)
 x, y = date2position[datestr2dateint[date]]
 for visit in visit_lst: # 統計到訪的總人數
  init[x][y][str2int[visit]] += 1
 #print(init[x][y][str2int[visit]])```

3.1)創(chuàng)建字典,時間離散化,節(jié)省時間

此處創(chuàng)建了三個字典,讓我們看一下代碼實現以及打印結果:

date2position = {}
datestr2dateint = {}
str2int = {}
for i in range(182):
 date = datetime.date(day=1, month=10, year=2018)+datetime.timedelta(days=i)
 #print(i,":",date)
 date_int = int(date.__str__().replace("-", ""))
 date2position[date_int] = [i%7, i//7]
 datestr2dateint[str(date_int)] = date_int
for i in range(24):
 str2int[str(i).zfill(2)] = i

打印一下 date2position:

python中怎么處理文本數據

打印一下 datestr2dateint:

python中怎么處理文本數據

打印str2int:

python中怎么處理文本數據

可以看出,datestr2dateint是將str的日期,轉換為了int的日期。
而date2position 才是計算出的每一個具體的日期,代表了第幾周、第幾天。
str2int代表了一天中的24個時刻。

3.2)讀取文件,按行獲取字符串

注意到文本的分隔符為\t(區(qū)分用戶名與到訪信息的分割),于是采用

f=open("D:\BaiDuBigData19-URFC-master\\UrbanRegionFunctionClassification-master\data\\train_visit\\000000_008.txt")
#table = pd.read_csv(f, header=None,error_bad_lines=False)
table = pd.read_csv(f, header=None,sep='\t')

然后用strings讀取到訪信息,也就是table的第二列:

strings = table[1]

3.3)切分字符串

首先,strings為:

python中怎么處理文本數據

可以看到每一行string,為一個用戶的到訪記錄,循環(huán)讀取。其中,不同日期的到訪是用“,”隔開,故要使用:

for string in strings:
 temp = []
 for item in string.split(','):

item就可以分開每一個日期的到訪記錄了:

python中怎么處理文本數據

其后,使用temp列表,每一行存儲日期和時刻。
如第一個item為 20181221&09|10|11|12|13|14|15
日期為 item[0:8],
時刻之間使用分隔符“|”隔開,故可以通過item[9:].split("|")得到。

temp.append([item[0:8], item[9:].split("|")])

打印一下temp為:

python中怎么處理文本數據

所以需要用兩個數據分別存儲日期,以及時刻。
首先用來轉換成 周、天、時刻的72624矩陣(根據前面的轉換函數)
其后根據這個矩陣,統計每一個位置的訪客數量

for date, visit_lst in temp:
 # x - 第幾周
 # y - 第幾天
 # z - 幾點鐘
 # value - 到訪的總人數
 # print(visit_lst)
 #print(date)
 x, y = date2position[datestr2dateint[date]]
 for visit in visit_lst: # 統計到訪的總人數
  init[x][y][str2int[visit]] += 1

關于python中怎么處理文本數據就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

另外有需要云服務器可以了解下創(chuàng)新互聯scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。

網站題目:python中怎么處理文本數據-創(chuàng)新互聯
文章鏈接:http://aaarwkj.com/article48/pipep.html

成都網站建設公司_創(chuàng)新互聯,為您提供網站策劃、營銷型網站建設動態(tài)網站、關鍵詞優(yōu)化響應式網站、品牌網站設計

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯

手機網站建設
91久久精品凹凸一区二区 | 亚洲精品国产第一区| 绯色av一区二区三区蜜臀| 性生活真实视频免费看| 亚洲精品在线观看日韩欧美| 国产精品日韩伦理一区二区| 亚洲精品紧身裙女教师av| 亚州精品少妇久久久久久| 国产伦精品二区三区视频| 日本免费精品一区二区三区四区| av黄色在线播放网页| 黄色录像黄色片黄色片| 欧美激情性国产精品潮| 人妻一本久道久久综合鬼色| 激情婷婷亚洲五月综合网| 免费看真人性生活视频| 亚洲精品国产av一区二区三区 | 欧美性做爰片免费视频网| 欧美日韩一区二区激情在线| 亚洲国产精品综合久久久 | 囗交囗爆吞精在线视频| 国产在线不卡免费精品| 国产精品对白久久久久粗| 女子张开腿让男人捅爽| 亚洲五月婷婷久久综合| 九九热在线免费观看精品视频| 内射极品美女在线观看| 亚洲风情亚av在线播放| 欧美黑人少妇高潮喷水| 人妻中字幕出轨中文字幕| 精品一区二区三区高清| 久久国产福利一区二区| 欧美αv一区二区三区| 91精品人妻一区二区三区| 尤物视频官网在线观看| 久久午夜福利欧美视频| 成人性生交免大片免费| 亚洲熟女精品不卡一区二区| 日本国产精品免费在线观看| 欧美日韩黄片免费在线观看| 欧美日韩精品人妻二区|