數據分析的兩大概念:你可能忽略的離群值與回歸均值


感謝大家抽空閱讀本期《傳球視野 Court Vision》

還沒訂閱的朋友,可以考慮加入訂閱者行列哦!

 

傳球視野 · Court Vision

嗨大家好!歡迎來到《傳球視野 Court Vision》的首期電子報!我想透過本期內容跟大家分享兩個概念:離群值(Outliers)回歸均值(Regression to the mean),這是在數據分析領域中相當重要的兩個概念。

上個星期日(8月18日),很榮幸可以邀請到台灣職籃PLG總冠軍新北國王的助理教練林政語(James Lin),前來吉隆坡主持「籃球數據與影片分析講習班」。他在講習班上提到了兩個很重要但又常被忽略的數據分析概念:離群值和回歸平均值。

對於一般球迷來說,估計應該都不太會去在意這兩個概念,但是在籃球分析領域,理解離群值和回歸平均值等概念,對於評估球員和球隊的表現就顯得很重要。在這篇電子報中,我將與大家分享這些概念,並解釋它們如何應用於籃球數據分析中。

什麼是離群值?

定義:
離群值是指數據集中明顯偏離其他數據點的值,這些數值通常較為極端,可能過高或過低。在籃球數據分析中,離群值經常出現在球員突然爆發的得分上,或在某場比賽中的異常表現。

在籃球分析中的應用:
想象一位平均得分15分的球員突然在一場比賽中拿下40分。這樣的表現可能令人震驚,但它很可能只是一個離群值,並不代表這名球員的實力突飛猛進。

處理方法:
在數據分析中,對於離群值的處理非常重要。分析師可能會選擇忽略離群值,或者進行更詳細的分析來理解其背後的原因,而不是直接將其視為球員能力的提升。

在瞭解了離群值的概念後,我們來看看這些極端數據點如何隨時間變化——這正是回歸均值所揭示的。

回歸均值:高峰過後的理性回落

定義:
回歸均值指的是,在經歷了極端表現之後,球員的表現通常會在接下來的時間內回歸到他們的平均水平。這意味著,無論是突然的高光時刻還是低谷期,都不會持續太久。

在籃球分析中的應用:
如果一個球員在某場比賽中打得特別好或特別差,這種表現往往並不會持續。隨著時間的推移,他的表現會逐漸回到他平時的平均水準。這就是所謂的“回歸均值”現象。

重要性:
理解回歸均值對於評估球員的穩定性非常重要。如果不考慮這一點,可能會誤以為某次的高光表現代表了球員的真實水平,從而做出錯誤的判斷。

造成離群值和回歸平均值現象的原因

籃球或任何運動數據分析中的離群值現象和回歸均值現象可以歸因於幾個因素。理解這些原因有助於分析師、教練和球迷更準確地解釋球員的表現。以下是導致這些現象的一些關鍵原因:

1. 隨機變異

  • 解釋:在任何運動中,表現可能會因為隨機因素而波動。例如,球員可能因為有利的條件(如對手較弱、主場優勢或狀態正佳)而有出色的表現。
  • 影響:這種隨機性可能導致異常的表現,這並不能準確反映球員的真實水平。隨著時間的推移,這些隨機變異往往會趨於平衡,導致表現回歸平均值。

2. 樣本量小

  • 解釋:單場比賽僅代表球員整體能力的一小部分。比賽結果可以受到多種因素的影響,包括對手、比賽節奏甚至運氣。
  • 影響:當僅看一場比賽時,極端的表現可能顯得異常。然而,隨著比賽次數的增加,數據會更具代表性地反映球員的真實能力,導致回歸平均值。

3. 心理因素

  • 解釋:球員可能會因心理高峰或低谷而影響表現。信心、壓力和動機都可能導致超常的表現或顯著的失常。
  • 影響:球員可能因為特殊的情感狀態而有過去最佳表現,但這些心理狀態通常是暫時的,導致隨後的比賽表現回歸到他們的平均水準。

4. 對手和比賽情境

  • 解釋:比賽的具體情境,包括防守對手和球隊戰術,可以大大影響球員的表現。球員可能會利用有利的對手而有異常的表現。
  • 影響:在一個賽季中,球員會面對不同的對手和防守策略。雖然某場比賽可能會突出球員在面對弱防守時的優勢,但未來的比賽將呈現不同的挑戰,導致更典型的表現。

5. 傷病和疲勞

  • 解釋:傷病會顯著影響球員的表現。一名正在康復的球員可能會因為腎上腺素或有利的對手而表現出色,但他們的整體表現可能會受到持續問題的影響。
  • 影響:隨著球員從傷病或疲勞中恢復,他們的表現往往會穩定在平均水平附近。這可能會導致康復期內的異常表現,隨後回歸到基線表現水準。

6. 團隊動力和化學反應

  • 解釋:團隊的動力可以影響個別球員的表現。陣容變動、交易或傷病都可能導致表現的暫時波動。
  • 影響:球員可能因增加的機會或角色變化而有異常的比賽表現。然而,隨著團隊找到節奏和化學反應,個別表現往往會回歸到平均水準。

7. 統計噪音

  • 描述:在體育分析中,統計噪音指的是表現數據中的隨機波動,這並不代表球員能力的任何實質性變化。
  • 影響:這種噪音可能會產生誤導分析師的異常表現。隨著數據的積累,這些噪聲往往會平均化,從而更清晰地反映球員的真實表現水準。

結論

在籃球數據分析中,正確識別和理解離群值以及回歸平均值現象,能夠幫助更準確地評估球員的表現,並避免因極端數據點而產生的誤解。在分析時,保持對這兩個概念的敏感度,能讓數據解讀更接近現實,並為戰術決策提供更有價值的參考依據。

你的見解?

那麼,現在你理解離群值和回歸均值的概念了嗎?留言告訴我你的想法,期待聽到你的見解和經驗!

The Jordan Letters

Reveal the hidden layers of basketball through exclusive insights and stories (Without the clutter of generic news). Join 1000+ of readers and get the latest issue sent straight to your inbox.

Read more from The Jordan Letters

🇨🇳🇬🇧 This is a bilingual weekly newsletter. 👇 Scroll to bottom for ENGLISH VERSION 上週,我們聊到日本是如何通過系統性的自我分析,明確定位了自己的國家籃球風格。我也結合了日本篮协的两份重磅报告《Basketball Japan’s Way 2023》和《2020東京奧運技術報告》,試著回答以下三個關鍵問題: 我們到底該打什麼風格的籃球? 要打這種風格,球員需要具備什麼能力? 我們該如何培養出適合這種風格的球員? 這一期,我想和你分享2020年疫情期間我參加的一場難忘的線上講座。 當時,日本男籃的阿根廷籍助教Herman Mandole(赫爾曼・曼多雷)分享了球隊的「擋拆進攻體系」,並說明球隊是如何以數據分析為基礎打造這個體系,然後轉化成明確的球隊準則與規則, 這場講座之所以一直留在我心中,是因為它展示了: 球隊如何確定最有效的出手選擇(而非胡亂出手) 如何設計戰術以創造最有效的出手選擇(而非隨便跑戰術) 用明確規則打造系統 Mandole教練提到的第一個關鍵就是: 數據決定進攻選擇...

🇨🇳🇬🇧 This is a bilingual weekly newsletter. 👇 Scroll to bottom for ENGLISH VERSION 什麼風格的籃球才最適合我們? 最近跟朋友聊起這個話題。我想,答案不會只有一種。但或許,我們可以從日本的經驗中,找到一些值得參考的啟發。 近年來,日本籃球的崛起為亞洲籃球發展提供了極具參考價值的案例。他們通過系統性的自我分析,明確定位了「從始至終先發制人、持續進攻」的國家籃球風格。 這篇文章将结合日本篮协的两份重磅报告《Basketball Japan's Way 2023》和《2020東京奧運技術報告》,試著回答以下三個關鍵問題: 我們到底該打什麼風格的籃球? 要打這種風格,球員需要具備什麼能力? 我們該如何培養出適合這種風格的球員? 從日本經驗看國家籃球風格的建立 1)我們到底該打什麼風格的籃球? 日本籃協在制定發展戰略時,首先進行了深度的環境分析。他們清楚認識到作為島國的地理特點、重視團隊協作的文化傳統,以及在基礎設施和訓練體系方面的優勢。同時,他們也直面了日本球員在身高和力量方面的劣勢。...

🇨🇳🇬🇧 This is a bilingual weekly newsletter. 👇 Scroll to bottom for ENGLISH VERSION 我不知道這是不是亞洲的文化,傳統的思維都會認為:「工作時間越長,代表你越有生產力,越接近成功。」 換到籃球場上也一樣,現在還是有很多教練相信:「練得越多,進步越快。」 我甚至聽過有教練會讓他的球隊一天練8個小時,實在是不可思議! 這讓我想起剛剛帶領桃園領航猿奪得台灣 P. League + 隊史首冠的西班牙籍主帥卡米諾斯(卡總)講過的一句話: 「不是練得多,而是練得對。」 這句話,讓我重新思考整個訓練的本質。 本週我想跟你分享我在 Podcast 對談中,來自卡總的幾段話。他在亞洲執教的經歷,給我們帶來了極深刻的提醒。 啟發一:別當大象闖進瓷器店 「你不能強行改變他們的思維,因為你不知道他們的起點是什麼。慢慢的把門打開,先觀察這間房間,再慢慢移動椅子。」 很多外籍教練一到亞洲,就急著「改革體系」。但卡總的做法是: 他先觀察球員背景與文化 再根據球員基礎調整自己的系統 而不是全部打掉重來...