本篇文章給大家分享的是有關(guān)怎么分析大數(shù)據(jù)分析基礎(chǔ)概念,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
網(wǎng)站建設(shè)哪家好,找創(chuàng)新互聯(lián)建站!專注于網(wǎng)頁設(shè)計(jì)、網(wǎng)站建設(shè)、微信開發(fā)、重慶小程序開發(fā)、集團(tuán)企業(yè)網(wǎng)站建設(shè)等服務(wù)項(xiàng)目。為回饋新老客戶創(chuàng)新互聯(lián)還提供了路南免費(fèi)建站歡迎大家使用!
互聯(lián)網(wǎng)進(jìn)一步聚合,對大數(shù)據(jù)的分析必然會成為一個(gè)關(guān)鍵的策略部門的工作。
像很多事物先是存在,然后再變得合理一樣,數(shù)據(jù)分析師也會因?yàn)橐恍┕镜膶?shí)際需求而存在,然后從事的工作與技能也會不斷地變得豐富與完善。
說到數(shù)據(jù)分析,小程會想起Sherlock Home,破案是需要分析數(shù)據(jù)。
但作為一般的技術(shù)人員,讀者并不需要像電視劇的人物那么“聰明”,只需要掌握一般的知識與技能就有可能勝任工作了,然后才是不斷的能力提升。
已經(jīng)有一些機(jī)構(gòu)根據(jù)自己的理解,定義了數(shù)據(jù)分析師應(yīng)該掌握的技能,比如下面這個(gè)來自網(wǎng)上的圖片:
這個(gè)圖有一定的合理性,立志成為數(shù)據(jù)分析師的讀者,可以參考一下其中提到的技能要求。
作為數(shù)據(jù)分析的開篇,本文介紹幾個(gè)在數(shù)據(jù)分析時(shí)經(jīng)常會說到的概念。
以下介紹的概念,讀者有可能會覺得枯燥,建議跳讀即可。
平均數(shù),指得是算術(shù)平均值,也就是總和除以個(gè)數(shù)(或其它單位的和)。平均值,是經(jīng)常用到的概念,比如“平均每個(gè)同學(xué)可以分到2個(gè)蘋果手機(jī)”、“下載的平均速度是1MB/s”、“一個(gè)月的花費(fèi)平均是4千塊”。
均值有一個(gè)缺陷就是在極端情況存在時(shí),也就是極大與極小都很離譜時(shí),平均出來的值就變得不合理,這也是投票取平均分時(shí),可能會考慮把最高分與最低分去掉再作平均的原因。
對于這種缺陷的例子,可以看看下面來自網(wǎng)絡(luò)的圖片:
招聘者告訴讀者,就職的話平均工資有1800,而實(shí)際當(dāng)讀者就的是員工一職時(shí),工資就只有800了。
這個(gè)也是平均值謬誤的一個(gè)例子。
再看另一張圖:
不同等級的收入差距很大,假如收集到若干家庭的收入,并取平均數(shù)來代表普遍家庭收入的話,就是不靠譜的,富人把窮人平均了。
對于這種統(tǒng)計(jì),可以去掉極端值再統(tǒng)計(jì),或者取每個(gè)區(qū)間的比例,或者用下面介紹的中值或眾數(shù)。
中位數(shù)是大小值的分隔值,出現(xiàn)極大值或極小值都不影響到中位數(shù),所以在這種極端的情況下,中位數(shù)是可用的一個(gè)參考值。
對于奇數(shù)個(gè)數(shù)的數(shù)值序列(已排序),中位數(shù)就是中間那個(gè)值。對于偶數(shù)個(gè)數(shù)的,中位數(shù)就是中間兩個(gè)值的和除以2。
比如:1,2,3,4,5 中位數(shù)是3。
比如:1, 2, 3, 4, 5, 6 中位數(shù)是(3+4)/2=3.5。
眾數(shù),就是出現(xiàn)次數(shù)最多的值??赡芤粋€(gè)眾數(shù)都沒有,也可能有多個(gè)眾數(shù)。
比如:1, 1, 2, 5, 3, 5, 1 眾數(shù)是1。
比如:5, 4, 6, 2, 5, 6 眾數(shù)是5跟6。
眾數(shù)就是“大家都這樣”,是具有一定參考意義的。
絕對數(shù)是沒有對比的數(shù),比如天氣是27度、一個(gè)班有50名學(xué)生、月薪是5萬塊,等等。
相對數(shù)是一個(gè)比值,比如提升了10%、體重不到某人的一半、比例是1:3,等等。
簡單來說,絕對數(shù)是自然數(shù),而相對數(shù)一般是百分比(或能轉(zhuǎn)為百分比)。
成本上漲了80%、速度下降了30%,這些都是百分比,這是一個(gè)經(jīng)常出現(xiàn)的形式。
一個(gè)點(diǎn),或一個(gè)百分點(diǎn),就是1%。
一般在百分比的幅度變化時(shí),使用百分點(diǎn),比如從3%到5%,提升了2個(gè)百分點(diǎn)。
部分占總體的比重,為比例。比如失敗率是0.01%(占失敗與成功的總和)、男同事占所有同事的70%,等等。
比率,是各部分的比,比如女學(xué)員與男學(xué)員的比率是1:3,等等。
一般在上漲的情景,用倍數(shù),比如漲了2倍。而在下降的情景要用百分比,比如收入減少了30%,當(dāng)然在上漲的時(shí)候也可以使用百分比,比如參會人數(shù)增加了300%。
番數(shù),表示2的N次方。
純收益番了一番,表示增加1倍(2的1次方,也就是原來的2倍)。
番了兩番,表示變成了4倍(2的2次方);番3番,表示8倍,等等。
同比,用于比較,比如現(xiàn)在是5月,同比于去年的5月,這個(gè)月的重大故障下降了30%。
環(huán)比,用于趨勢,比如環(huán)比上一周、環(huán)比上一個(gè)月,這一周或這一個(gè)月是怎么樣的。
以上就是怎么分析大數(shù)據(jù)分析基礎(chǔ)概念,小編相信有部分知識點(diǎn)可能是我們?nèi)粘9ぷ鲿姷交蛴玫降?。希望你能通過這篇文章學(xué)到更多知識。更多詳情敬請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。
分享名稱:怎么分析大數(shù)據(jù)分析基礎(chǔ)概念
鏈接URL:http://aaarwkj.com/article10/pegpdo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供小程序開發(fā)、靜態(tài)網(wǎng)站、營銷型網(wǎng)站建設(shè)、網(wǎng)站建設(shè)、網(wǎng)站設(shè)計(jì)、服務(wù)器托管
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)