全國最多中醫師線上諮詢網站-台灣中醫網
發文 回覆 瀏覽次數:2834
推到 Plurk!
推到 Facebook!

【值得收藏】數據分析師必備的分析思維方法,你知道多少?

 
lilylee
一般會員


發表:76
回覆:3
積分:15
註冊:2017-09-29

發送簡訊給我
#1 引用回覆 回覆 發表時間:2020-02-24 14:33:12 IP:103.137.xxx.xxx 未訂閱

故事引入

本節主要講解通用的資料分析思維方法,説明大家快速建立起體系化的資料分析思維。

“伯樂”相馬



第二個故事是我們的十大元帥之一——林彪,軍隊之中也能用資料分析克敵制勝,運籌帷幄之中,決勝於千里之外。 話說在遼沈戰役開始後,林彪每天深夜都要值班參謀讀出下屬各個縱隊、師、團用電臺報告的當日戰況和繳獲情況。林彪的要求很細,俘虜要分清軍官和士兵,繳獲的槍支,要統計出機槍、長槍、短槍,擊毀和繳獲尚能使用的汽車,也要分出大小和類別。一天,他聽參謀彙報的時候突然說“停”,問“剛才的念的在胡家窩棚那個戰鬥的繳獲,你們聽到了嗎?”,在大家一臉茫然的時候他連問了三句:
“為什麼那裡繳獲的短槍與長槍的比例比其它戰鬥略高?” “為什麼那裡繳獲和擊毀的小車與大車的比例比其它戰鬥略高?” “為什麼在那裡俘虜和擊斃的軍官與士兵的比例比其它戰鬥略高?”
他就此判斷,那個戰鬥發生的地方,就是敵人的指揮所。他命令部隊乘勝追擊,並且傳達下口號“矮胖子,白淨臉,金絲眼鏡,湖南腔,不要放走廖耀湘!”。剛剛慶倖脫身的廖耀湘,就這樣成了俘虜。林彪之所以可以做出準確及時的判斷,是和他的資料積累和對資料的敏感分不開的,可以迅速在資料中發現異常點。 作為一個數據人,你需要具備很多的能力,如基本的統計和數學能力,分析能力,建模能力,這些能力可以讓你成為一個不錯的BI工程師。如果更進一步能夠對業務有這更加深刻的理解,根據業務的需求,提出問題,並找到解決的辦法的能力。具備了這個能力,你就有機會成為真正一流的資料科學家。 在這些能力之上,良好的溝通能力,協調能力,能讓你成為一個不錯的資料科學團隊的Leader,可以整合資源,用團隊的力量完成公司重要的項目。

資料分析的戰略思維

提到資料分析,大家腦海浮現的可能是一些複雜的報表,或者是華麗的數據大屏,亦或是高級的建模手法。但其實分析是我們每個人都具備的能力,例如我們會根據股票的走勢決定是繼續購買還是拋出,根據同一商品不同門店的價格和評價做出最終購買選擇。 前面介紹的這些基於資料的小型決策,其實主要是根據我們腦海中的日常資料經驗來做出判斷的,屬於簡單的分析過程。那麼對於我們數據人或者業務決策者來說,則需要系統的掌握一套科學的、符合商業規律的資料分析方法。

資料分析的目的

對於企業而言,資料分析可以説明企業優化流程,提高營業額,降低成本,而往往我們把這類資料分析定義為商業資料分析。商業資料分析的目標是利用大資料為所有業務決策者做出迅捷、高質、高效的決策,提供可規模化的解決方案。商業資料分析的本質在於能夠創造商業價值 ,驅動企業業務增長。

資料分析的驅動力



我們以商業資料分析為例,通常會以商業回報比來定位資料分析的不同階段,我們這邊把它劃分為四個階段,分別是觀察當前資料發生了什麼、理解為什麼會發生、預測未來會發生什麼、怎樣達到更好地商業決策。

觀察當前資料發生了什麼?

資料分析的第一步,我們需要觀察當前資料發生了什麼。在企業中,這通常可以使用一些固定報表來做日常的即時資料監控。例如在某一製造企業剛投入一個新設備,那麼則可以通過觀察設備諸如良品率等一系列運行資料來觀察當前設備的運行狀態。再比如互聯網企業新上線了一個產品,我們可以觀察這個產品在投入前期的註冊人數、熱度等一系列資料來知道當前產品的狀態。

理解為什麼會發生?

在觀察當前資料狀態之後,如果發現資料出現異常情況,我們就需要對資料的背後進行深層次挖掘與診斷。例如上面說的製造企業在投入新設備之後,發現設備產出的良品率較低,那麼我們則需要進一步去分析是由於對設備不正當操作導致,還是設備是超負荷運轉,亦或是新設備本身在設計時存在固有缺陷等等原因。這種對資料分多維深度分析,通過FineBI工具的便捷操作能夠極大地提到我們資料的分析和決策效率。

預測未來會發生什麼?

當我們通過對資料的一系列深層分析之後,發現了設備良品率較低的真實原因是設備本身在設計時存在固有缺陷,那麼如果此時還讓它繼續生產,那麼未來良品率自然長期會得不到保障(我們也可以通過資料擬合以及資料採擷的手段,來預測未來的資料)。

怎樣達到更好地商業決策

最後一步,也是所有資料分析工作中最有意義的一步,我們則需要去思考未來應該如何進行業務決策,通過資料分析的結果指導業務決策,精細化運營,以發揮更好的商業價值。

資料分析的基本工作流程


舉個例子: 現在有一個線下銷售的產品。我們發現8月的銷售額度下降,和去年同比下降了20%。我想先觀察時間趨勢下的波動,看是突然暴跌還是逐漸下降。再按照不同地區的資料看一下差異,有沒有地區性的因素影響。我也準備問幾個銷售員,看一下現在的市場環境怎麼樣,聽說有幾家競爭對手也縮水了,是不是這個原因。 按照MECE進行維度和指標的拆解也就是:
首先可以確定銷量會下降,那麼下降多少?這裡就要假設商品流量情況,提價後轉化率的變化情況,然後根據歷史資料匯總出銷量下降的情況,從而得出銷售額的變化情況。通過MECE核心指標拆解方法的長期訓練,能夠説明我們形成嚴謹的結構化思維邏輯體系。

數據拆分建模

第三步,根據我們制定好的分析計畫,準備和拆分我們真正需要的資料表,進行初步的資料加工和建模,為後續的分析計畫執行做好準備。

執行分析計畫

第四步,開始進行資料視覺化分析,從事先制定好的分析計畫,按照不同的分析角度對資料進行多維分析,對資料背後的業務價值不斷進行精細化的洞察和探索。

提煉業務洞察

第五步,根據分析過程中的猜想和資料驗證,得出提煉之後的業務洞察。

產出商業決策

第六步,根據前面提煉出來的資料背後的業務洞察,指導並進行最終的業務決策。

驗證決策效果

第七步,產出商業決策之後,並不意味著我們的資料分析工作已經真正結束了,我們未來還需要通過一段時間對資料進行觀察和判斷,驗證之前根據資料分析結論指導制定的業務決策,是否真正能夠驅動我們的業務產生價值。 如果發現在進行相關業務決策之後,確實使業務資料發生了改觀,那麼則說明我們前面的資料分析工作確實找到了業務的實際問題所在。否則,則需要返回到第一步繼續進行思考,分析是否是由於之前考慮不周亦或是有偏差。

經典資料分析方法

上面給大家介紹了資料分析的七步基本工作流程,我們在遇到需要進行資料分析的時候,可以幫助我們快速搭建一個清晰的資料分析思路框架。最後再給同學們總結一下我們資料人在日常工作中常用的經典分析方法,讓同學們在遇到不同業務場景下的資料分析問題時能夠更加靈活地去應對。

趨勢分析法

首先是趨勢分析法,也是我們資料人在日常分析工作中使用的最多的方法,它能夠幫助我們快速地説明我們觀察資料的變化趨勢。

如上圖所示,這是一家牛奶生產企業的某個固定銷售報表的看板,我是這家公司的戰略決策者,那麼我從這樣的固定維度的報表中只能夠得出兩個結論:
1.2016年相比2015年的公司牛奶銷售額相對有所增長,環比增長率位122.82%; 2.每年中各個月份的銷售額相差不大,唯一是在2月份中,可能是由於春節的影響,拉動了大眾的集中消費,所以在每年2月份公司的牛奶銷售額會迎來一個小高峰階段。
如果是傳統的固定報表,那麼資料分析能給使用者傳遞的資訊可能也就到此為止了。可是真的僅僅如此嗎?我們再來引入產品維度分析看看。

這裡我們進一步來驗證一下。繼續用雷達圖進行每個季度不同產品類別的牛奶銷售額統計,觀察每年季度的銷售額數據統計結果,我們可以輕鬆驗證之前的資料觀察結果。 我們再來從業務的角度進一步思考目前的資料結果原因,第一季度和第四季度主要為春、冬季節,天氣比較冷,這種冷天大家都喜歡熱鮮奶喝,因為比較暖身體。第二季度和第三季度主要為夏、秋季節,天氣比較熱,而這種熱天大家都喜歡和優酪乳,因為比較清爽。 如果我是這家公司的戰略決策者,那麼每年對於第一季度和第四季度,公司將主要生產鮮奶,降低優酪乳的生產量;對於第二季度和第三季度公司將主要生成優酪乳,降低鮮奶的生產量。這樣一來,我們通過逐步的探索分析將資料和業務聯合起來,總體上既能提高企業的產品銷售額,又能降低每個季度公司的庫存壓力。 我們每天遵循的習慣可能會隱藏資料背後潛在的價值,所以我們需要多嘗試從看表格數位思考轉換到看圖形感知分析,勇於改變現狀。在對資料進行探索分析思考時,要善於從不同角度去進行視覺化分析,完善資料全貌,這樣才能發掘資料背後的巨大價值。除此之外,我們還可以借助FineBI的聯動和鑽取功能,一層層抽絲撥繭,直到找到資料最根源的原因。落實到具體的資料工作中,也就是說作為數據人,我們除了分析日常業務提出來的問題之外,還需要學會積極去處理未預見的問題,時刻保持對資料的懷疑態度,練就自己在探索資料業務問題時的前瞻性。


象限法分析




前面講了互聯網企業常用的用戶留存率指標,在產品在上線過程中經常會使用 A/B 測試(增長駭客的一個主要思想之一)來測試不同產品或者功能設計的效果,市場和運營可以通過 A/B 測試來完成不同管道、內容、廣告創意的效果評估,以選擇最佳的轉化方案。 要進行 A/B 測試有兩個必備因素:第一,有足夠的時間進行測試;第二,資料量和資料密度較高。因為當產品流量不夠大的時候,做 A/B 測試得到統計結果是很難的,也會影響結論的準確性。

經典模型(二八、ABC、RFM、購物籃模型等)

這裡著重講下RFM模型和購物籃模型。 關聯分析是一種簡單、實用的分析技術,是指從大量資料集中發現項集之間的關聯性或相關性。若兩個或多個變數的取值之間存在某種規律性,就稱為關聯。關聯可分為簡單關聯、時序關聯、因果關聯。關聯分析的一個典型例子是購物籃分析。該過程通過發現顧客放人其購物籃中的不同商品之間的聯繫,分析顧客的購買習慣。通過瞭解哪些商品頻繁地被顧客同時購買,這種關聯的發現可以幫助零售商制定行銷策略。其他的應用還包括價目表設計、商品促銷、商品的排放和基於購買模式的顧客劃分。 可從資料庫中關聯分析出形如"由於某些事件的發生而引起另外一些事件的發生"之類的規則。如“67%的顧客在購買啤酒的同時也會購買尿布”,因此通過合理的“啤酒和尿布”的貨架擺放或捆綁銷售可提高超市的服務品質和效益。

資料採擷(時序預測、聚類、分類、回歸分析、關聯規則)

回歸分析


回歸分析估計的是兩個或兩個以上變數間的關係。我們可以舉這樣一個例子來幫助理解: 假設A想根據公司當前的經濟狀況估算銷售增長率,而最近一份資料表明,公司的銷售額增長約為財務增長的2.5倍。在此基礎上,A就能基於各項資料資訊預測公司未來的銷售情況。 使用回歸分析有許多優點,其中最突出的主要是以下兩個:
  • 它能顯示因變數和引數之間的顯著關係; 它能表現多個獨立變數對因變數的不同影響程度
除此之外,回歸分析還能揭示同一個變數帶來的不同影響,如價格變動幅度和促銷活動多少。它為市場研究人員/資料分析師/資料科學家構建預測模型提供了評估所用的各種重要變數。

具體可參考這篇文章《這7種回歸分析方法,資料分析師必須掌握!

以上部分圖表來自FineReport製作,歡迎大家免費試用!

免費下載FineReport10.0

相關文章: 細數那些最有意思的資料視覺化!

30個值得推薦的資料視覺化工具,趕緊收藏!

閱讀原文:數據分析師必備的分析思維方法,你知道多少?
編輯記錄
lilylee 重新編輯於 2020-02-24 15:07:35, 註解 無‧
lilylee 重新編輯於 2020-02-24 15:07:35, 註解 無‧
系統時間:2024-11-21 18:20:32
聯絡我們 | Delphi K.Top討論版
本站聲明
1. 本論壇為無營利行為之開放平台,所有文章都是由網友自行張貼,如牽涉到法律糾紛一切與本站無關。
2. 假如網友發表之內容涉及侵權,而損及您的利益,請立即通知版主刪除。
3. 請勿批評中華民國元首及政府或批評各政黨,是藍是綠本站無權干涉,但這裡不是政治性論壇!