欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

如何解決基于python等頻分箱qcut的問(wèn)題-創(chuàng)新互聯(lián)

小編給大家分享一下如何解決基于python等頻分箱qcut的問(wèn)題,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

成都創(chuàng)新互聯(lián)公司是專(zhuān)業(yè)的沾化網(wǎng)站建設(shè)公司,沾化接單;提供成都網(wǎng)站建設(shè)、網(wǎng)站制作,網(wǎng)頁(yè)設(shè)計(jì),網(wǎng)站設(shè)計(jì),建網(wǎng)站,PHP網(wǎng)站建設(shè)等專(zhuān)業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行沾化網(wǎng)站開(kāi)發(fā)網(wǎng)頁(yè)制作和功能擴(kuò)展;專(zhuān)業(yè)做搜索引擎喜愛(ài)的網(wǎng)站,專(zhuān)業(yè)的做網(wǎng)站團(tuán)隊(duì),希望更多企業(yè)前來(lái)合作!

在python 較新的版本中,pandas.qcut()這個(gè)函數(shù)中是有duplicates這個(gè)參數(shù)的,它能解決在等頻分箱中遇到的重復(fù)值過(guò)多引起報(bào)錯(cuò)的問(wèn)題;

在比較舊版本的python中,提供一下解決辦法:

import pandas as pd
 
def pct_rank_qcut(series, n):
  '''
  series:要分箱的列
  n:箱子數(shù)
  '''
  edages = pd.series([i/n for i in range(n)] # 轉(zhuǎn)換成百分比
  func = lambda x: (edages >= x).argmax() #函數(shù):(edages >= x)返回fasle/true列表中第一次出現(xiàn)true的索引值
  return series.rank(pct=1).astype(float).apply(func) #series.rank(pct=1)每個(gè)值對(duì)應(yīng)的百分位數(shù),最終返回對(duì)應(yīng)的組數(shù);rank()函數(shù)傳入的數(shù)據(jù)類(lèi)型若為object,結(jié)果會(huì)有問(wèn)題,因此進(jìn)行了astype

補(bǔ)充拓展:Python數(shù)據(jù)離散化:等寬及等頻

在處理數(shù)據(jù)時(shí),我們往往需要將連續(xù)性變量進(jìn)行離散化,最常用的方式便是等寬離散化,等頻離散化,在此處我們討論離散化的概念,只給出在python中的實(shí)現(xiàn)以供參考

1. 等寬離散化

使用pandas中的cut()函數(shù)進(jìn)行劃分

import numpy as np
import pandas as pd
 
# Discretization: Equal Width #
# Datas: Sample * Feature
def Discretization_EqualWidth(K, Datas, FeatureNumber):
  DisDatas = np.zeros_like(Datas)
  for i in range(FeatureNumber):
    DisOneFeature = pd.cut(Datas[:, i], K, labels=range(1, K+1))
    DisDatas[:, i] = DisOneFeature
  return DisDatas

2. 等頻離散化

pandas中有qcut()可以使用,但是邊界易出現(xiàn)重復(fù)值,如果為了刪除重復(fù)值設(shè)置 duplicates=‘drop',則易出現(xiàn)于分片個(gè)數(shù)少于指定個(gè)數(shù)的問(wèn)題,因此在此處不使用qcut()

import numpy as np
import pandas as pd
 
# Discretization: Equal Frequency #
# vector: single feature
def Rank_qcut(vector, K):
  quantile = np.array([float(i) / K for i in range(K + 1)]) # Quantile: K+1 values
  funBounder = lambda x: (quantile >= x).argmax()
  return vector.rank(pct=True).apply(funBounder)
 
# Discretization: Equal Frequency #
# Datas: Sample * Feature
def Discretization_EqualFrequency(K, Datas, FeatureNumber):
  DisDatas = np.zeros_like(Datas)
  w = [float(i) / K for i in range(K + 1)]
  for i in range(FeatureNumber):
    DisOneFeature = Rank_qcut(pd.Series(Datas[:, i]), K)
    #print(DisOneFeature)
    DisDatas[:, i] = DisOneFeature
  return DisDatas

看完了這篇文章,相信你對(duì)“如何解決基于python等頻分箱qcut的問(wèn)題”有了一定的了解,如果想了解更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!

當(dāng)前題目:如何解決基于python等頻分箱qcut的問(wèn)題-創(chuàng)新互聯(lián)
文章路徑:http://aaarwkj.com/article48/cdhpep.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)網(wǎng)站制作、靜態(tài)網(wǎng)站網(wǎng)站導(dǎo)航、關(guān)鍵詞優(yōu)化、自適應(yīng)網(wǎng)站、網(wǎng)站營(yíng)銷(xiāo)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

手機(jī)網(wǎng)站建設(shè)
日韩精品一区福利合集| 六月丁香花五月婷婷| 加勒比人妻一区二区三区| 日韩精品专区在线影院重磅| 久久精品国产亚洲av亚| 国产精品传媒免费在线观看| 免费看av网站一区二区| 国产精品v一区二区三区| 97在线资源视频播放| 无遮挡无掩盖的免费网站| 人妖系列中文字幕欧美系列| 国产精品国产精品国产| 天天操夜夜操夜夜操| 亚洲乱码在线中文字幕| 麻豆精品国产免费av影片| 野花日本免费高清完整| 免费高清av一区二区| 一级欧美黄片在线播放| 91在线国产手机视频| 成人激情电影免费在线| 国产精品三级久久久| 日韩三级黄片在线观看| 日韩精品视频高清在线观看| 精品视频日韩在线观看| 日本高清加勒比免费在线| 国产精品久久久久久爽| 91欧美精品在线视频| 日本精品视频一区二区三区| 日韩在线一区二区视频| 人体蜜桃视频一区二区| 97人妻人人澡人人添人人爽| 亚洲精品中文一区二区三区| 亚洲欧美激情国产综合久久| 欧美一区二区三区情色| 深夜成人免费观看视频| 四季一区二区三区av| 国产精品福利手机在线观看| 亚洲精品网站国产高清| 成人激情视频在线网页| 国产一区二区三区自拍| 久久综合婷婷亚洲五月|