數據分析的兩大概念:你可能忽略的離群值與回歸均值


感謝大家抽空閱讀本期《傳球視野 Court Vision》

還沒訂閱的朋友,可以考慮加入訂閱者行列哦!

 

傳球視野 · Court Vision

嗨大家好!歡迎來到《傳球視野 Court Vision》的首期電子報!我想透過本期內容跟大家分享兩個概念:離群值(Outliers)回歸均值(Regression to the mean),這是在數據分析領域中相當重要的兩個概念。

上個星期日(8月18日),很榮幸可以邀請到台灣職籃PLG總冠軍新北國王的助理教練林政語(James Lin),前來吉隆坡主持「籃球數據與影片分析講習班」。他在講習班上提到了兩個很重要但又常被忽略的數據分析概念:離群值和回歸平均值。

對於一般球迷來說,估計應該都不太會去在意這兩個概念,但是在籃球分析領域,理解離群值和回歸平均值等概念,對於評估球員和球隊的表現就顯得很重要。在這篇電子報中,我將與大家分享這些概念,並解釋它們如何應用於籃球數據分析中。

什麼是離群值?

定義:
離群值是指數據集中明顯偏離其他數據點的值,這些數值通常較為極端,可能過高或過低。在籃球數據分析中,離群值經常出現在球員突然爆發的得分上,或在某場比賽中的異常表現。

在籃球分析中的應用:
想象一位平均得分15分的球員突然在一場比賽中拿下40分。這樣的表現可能令人震驚,但它很可能只是一個離群值,並不代表這名球員的實力突飛猛進。

處理方法:
在數據分析中,對於離群值的處理非常重要。分析師可能會選擇忽略離群值,或者進行更詳細的分析來理解其背後的原因,而不是直接將其視為球員能力的提升。

在瞭解了離群值的概念後,我們來看看這些極端數據點如何隨時間變化——這正是回歸均值所揭示的。

回歸均值:高峰過後的理性回落

定義:
回歸均值指的是,在經歷了極端表現之後,球員的表現通常會在接下來的時間內回歸到他們的平均水平。這意味著,無論是突然的高光時刻還是低谷期,都不會持續太久。

在籃球分析中的應用:
如果一個球員在某場比賽中打得特別好或特別差,這種表現往往並不會持續。隨著時間的推移,他的表現會逐漸回到他平時的平均水準。這就是所謂的“回歸均值”現象。

重要性:
理解回歸均值對於評估球員的穩定性非常重要。如果不考慮這一點,可能會誤以為某次的高光表現代表了球員的真實水平,從而做出錯誤的判斷。

造成離群值和回歸平均值現象的原因

籃球或任何運動數據分析中的離群值現象和回歸均值現象可以歸因於幾個因素。理解這些原因有助於分析師、教練和球迷更準確地解釋球員的表現。以下是導致這些現象的一些關鍵原因:

1. 隨機變異

  • 解釋:在任何運動中,表現可能會因為隨機因素而波動。例如,球員可能因為有利的條件(如對手較弱、主場優勢或狀態正佳)而有出色的表現。
  • 影響:這種隨機性可能導致異常的表現,這並不能準確反映球員的真實水平。隨著時間的推移,這些隨機變異往往會趨於平衡,導致表現回歸平均值。

2. 樣本量小

  • 解釋:單場比賽僅代表球員整體能力的一小部分。比賽結果可以受到多種因素的影響,包括對手、比賽節奏甚至運氣。
  • 影響:當僅看一場比賽時,極端的表現可能顯得異常。然而,隨著比賽次數的增加,數據會更具代表性地反映球員的真實能力,導致回歸平均值。

3. 心理因素

  • 解釋:球員可能會因心理高峰或低谷而影響表現。信心、壓力和動機都可能導致超常的表現或顯著的失常。
  • 影響:球員可能因為特殊的情感狀態而有過去最佳表現,但這些心理狀態通常是暫時的,導致隨後的比賽表現回歸到他們的平均水準。

4. 對手和比賽情境

  • 解釋:比賽的具體情境,包括防守對手和球隊戰術,可以大大影響球員的表現。球員可能會利用有利的對手而有異常的表現。
  • 影響:在一個賽季中,球員會面對不同的對手和防守策略。雖然某場比賽可能會突出球員在面對弱防守時的優勢,但未來的比賽將呈現不同的挑戰,導致更典型的表現。

5. 傷病和疲勞

  • 解釋:傷病會顯著影響球員的表現。一名正在康復的球員可能會因為腎上腺素或有利的對手而表現出色,但他們的整體表現可能會受到持續問題的影響。
  • 影響:隨著球員從傷病或疲勞中恢復,他們的表現往往會穩定在平均水平附近。這可能會導致康復期內的異常表現,隨後回歸到基線表現水準。

6. 團隊動力和化學反應

  • 解釋:團隊的動力可以影響個別球員的表現。陣容變動、交易或傷病都可能導致表現的暫時波動。
  • 影響:球員可能因增加的機會或角色變化而有異常的比賽表現。然而,隨著團隊找到節奏和化學反應,個別表現往往會回歸到平均水準。

7. 統計噪音

  • 描述:在體育分析中,統計噪音指的是表現數據中的隨機波動,這並不代表球員能力的任何實質性變化。
  • 影響:這種噪音可能會產生誤導分析師的異常表現。隨著數據的積累,這些噪聲往往會平均化,從而更清晰地反映球員的真實表現水準。

結論

在籃球數據分析中,正確識別和理解離群值以及回歸平均值現象,能夠幫助更準確地評估球員的表現,並避免因極端數據點而產生的誤解。在分析時,保持對這兩個概念的敏感度,能讓數據解讀更接近現實,並為戰術決策提供更有價值的參考依據。

你的見解?

那麼,現在你理解離群值和回歸均值的概念了嗎?留言告訴我你的想法,期待聽到你的見解和經驗!

The Jordan Letters

Reveal the hidden layers of basketball through exclusive insights and stories (Without the clutter of generic news). Join 1000+ of readers and get the latest issue sent straight to your inbox.

Read more from The Jordan Letters

🇨🇳🇬🇧 This is a bilingual weekly newsletter. 👇 Scroll to bottom for ENGLISH VERSION 點擊閱讀網頁版Read web version here 我們都看過這樣的場景:球隊不斷傳導,球在外圍流動,五次、六次、七次傳球。看起來節奏流暢、配合漂亮,但最終卻往往以一個倉促、受干擾的出手結束。 球是有在動,可防守卻始終沒被真正打開。那一回合看似團隊合作,實際上只是「動作多於意圖」的空轉。 許多教練在教進攻時,就像在跑一份清單:跑戰術、站好位置、等好機會。但他們常常忽略了現代籃球最關鍵的一個核心概念。 正如克利夫蘭騎士隊助理教練 Alex Sarama 所說,這個被忽略的概念,其實才是一切的關鍵:「大多數教練教進攻時,都像在跑清單:跑戰術、站定位、等好球出現。但他們錯過了一個重點,那不是一套戰術,也不是一個陣型,而是一個『優勢』。」 Sarama 所提出的「多米諾哲學」(Dominoes Philosophy)提供了一種全新的思維方式。重點不再是執行戰術模式,而是創造、辨識、並轉化「優勢」。...

🇨🇳🇬🇧 This is a bilingual weekly newsletter. 👇 Scroll to bottom for ENGLISH VERSION 點擊閱讀網頁版Read web version here 「這裡沒人把你當一回事。」 挑戰傳統,往往比提出新方法更難。 最近有位朋友向我推薦了一本書:Alex Sarama 所著的《Transforming Basketball: Changing How We Think About Basketball Performance》。去年7月,他受聘為 NBA 克利夫蘭騎士隊的球員發展總監,今年夏天正式升為球隊的助理教練。 我隨手翻開幾頁便被吸引住了。書中許多概念完全顛覆了我們長期以來在亞洲球館裡反覆操作的訓練方式。讀得越多,我就越覺得必須把這些想法分享給大家。 一個挑戰傳統的框架 Sarama 並不是全盤否定傳統。他承認老派教練與舊的方法在他們的那個年代具有劃時代的價值。但他同時也提出一個發人深省的觀點:在今日這個研究與方法論都在不斷精進的時代,墨守成規,本身就是一種風險。 這讓我想起林書豪的訓練師 Josh...

🇨🇳🇬🇧 This is a bilingual weekly newsletter. 👇 Scroll to bottom for ENGLISH VERSION 點擊閱讀網頁版Read web version here 為期兩天的 Bang Lee Skill Lab 精英籃球訓練營在上周末圓滿結束,在 Bang Lee 教練回國前,我和他做了一次簡單的訪問。他沒有再談技術細節或場上的高光時刻,而是留下了三個關鍵詞: 自信 聆聽 強度 他說,這是大馬年輕球員未來成長最需要補上的部分。天賦不是問題,「原材料」我們都有,而如何把潛力轉化為實力,正是我們面前最值得期待的方向。 除了 Bang Lee 的觀察,我自己也注意到另一個提升空間:核心力量、平衡與協調能力。這些基礎條件不像灌籃或快攻那樣直觀,但如果能補強它們,其他技術將更穩固。 一、自信 —— 成長的第一道門檻 Bang Lee 對我們球員的身體條件感到驚訝:身高、體格、速度,甚至可以灌籃,條件一應俱全。這代表我們已具備天賦,只差一步,就是建立真正的信念。...