Re: [問題] WPA
※ 引述《Romulus (Säubern Mode)》之銘言:
: ※ 引述《newbornme (開始上班)》之銘言:
: : 是阿。
: : 但是也常有人一年關鍵打席特別多, WPA 還是不上不下的,
: : 所以或許也可以參考 WPA / PA ,
: : 用平均值來看會比較客觀?
: 應該是 WPA / clutch PA吧
: 可是clutch PA怎麼定義?XD
: : 可是連發揮能力的機會都很少,怎麼會知道他是 clutch ? :p
: 可能他從NYY被交易到TB XD
: : OPS 就算被冰還是可以很高阿, VORP 就真的不行了。
我一直覺得這個數據有點不對勁,不過在想清楚之前不太敢多說。
目前我所能想到的是在 conditional expectation 上面的問題。
不管 win share (暫時只考慮打擊部份就好)或是 VORP,我們並不在乎安打
是在第一局還是第九局,領先十分、一分,還是落後一分、十分之下的表現。
我們做的不管這些時間和狀況的參數,試圖用這些數據重建比賽。
BP 的 W1/L1, W2/L2, 和 W3/L3 就是建立在用這些方法建構出球隊應得與應失
的分數,透過 Pythagorean approach 去討論球隊應該贏多少球賽。這一部份當
然有誤差,Pythagorean 公式和實際成績的差異可能是 random disturbance,
最起碼目前我們沒有完美解釋。我們可以列出下面兩個問題:
1. 球隊得失分的 volatility 不小,並不是穩定的數據。當然,這個數據如果
標準差是零的話我們就不用玩了,得分多的會贏得所有的比賽。但是這些數據的
標準差似乎要比我們期望的大了一些,以致於 Pythagorean 公式有一些不被預期
的誤差。
2. 在重建比賽時我們給予所有的同樣的結果相同的權重,例如壘上有人的的一
壘安打、無人時的一壘安打、第一局、第九局、領先很多、戰況膠著、遠遠落後
時都是一樣的。背後的假設是我們不認為任何的 "clutch performance" 是真正
的能力,沒有球員可以在他們『想要』有某種英雄式表現時就會做到。透過這些
表現隨機出現建構出球隊的攻擊火力以及得分,從而創造出勝和負。事實上雖然
我們找不到足以支撐 clutch player 的證據,但是 clutch performance 的確
是存在,而且在一個球季之內不易用這些誤差會自己 "even out" 來忽略掉。
我現在對於 WPA 的想法是它針對第二點做了矯正,不過我覺得矯枉過正了。關
鍵在於條件機率這部份。
由於我們的時間是單向流動的,所以在第一局的時候我們不會知道後面八局發
生什麼事情,但是第九局發生的事情是建築在前面八局發生過的事件的基礎上。
問題就在這裡。
第一局一隻全壘打的價值是多少?在 WPA 裡面第一局的一隻全壘打價值固定,
並不受到後面事件的影響。但是當一切事情塵埃落定,第一局的一隻全壘打是
不是無論後面發生什麼事情價值都是固定的?考慮下面幾種情形:
1. 比賽結束 1:0,第一局打出全壘打的球隊獲勝。
2. 比賽結束 16:3,第一局打出全壘打的球隊獲勝。
3. 2:1,打出那隻全壘打的輸球。
4. 7:2,打出全壘打的輸球。
要比較後面幾種情況比較困難,但是第一種情形很明顯的那隻全壘打的『價值』
比較高,因為那是這場比賽中兩隻球隊唯一的得分。
Win shares 和 VORP 一樣沒有考慮這種情況,不過它們不是做狀況分析,而且
最後是建築在事件導致得分或失分,而得失分影響勝負場的邏輯。如果我們能夠
證明 clutch performance 是隨機事件,沒有任何個人或球隊可以任意做到他們
想要達成的任務,那麼長期下來這些效果會彼此 even out。剛剛提到的一隻一
壘安打也許這一次會出現在滿壘的時候,下一次是壘上無人,再下一次是......。
由於我們不是把這隻安打放在一場球賽裡看,而是放在一整個球季,各種情況
出現而把極端情況 even out 的機會比較高。我們在這些數據分析時完全不考慮
時間軸的方向,事實上,我們完全沒有考慮時間。
WPA 在計算時考慮到了時間,而時間是單向流動的。這個特殊現象造成了第一局
的三分全壘打和第九局的三分全壘打有不同的價值。如果我們說我們在考慮第一
局的三分全壘打的價值時同時考慮後面八局敵我雙方的攻守表現,這是很奇怪的
事情,但是為什麼不?反對 WPA 這個數據的人第一個想法可能就是在一個九局打
出三分 walk-off homerun 的全壘打使比數成為 6:5 贏球為什麼價值比一局時
打出三分全壘打使比數暫時成為 3:0 高那麼多?如果沒有第一局那隻全壘打的話,
就算打出 grand slam 也不過是 4:5 輸球,何來的價值?第九局的三分全壘打是
建築在前面的事情都已經知道而不能改變了,但是我們不能這樣說第一局發生的
事情。
用前面那幾個同樣在第一局打出一分全壘打但是後面結果不同的情況,我們大概
可以看出問題在哪裡。Win share 和 VORP 這一類的數據不考慮已經發生了的事
情固然有他們的限制,但是 WPA 一樣有很大的限制,而且還不見得更好。
與其用 WPA 來分析球員的貢獻,我倒覺得這個工具用來分析球賽中的調度以及
拿來檢驗 manager 的調度可能更為適合。拿來檢驗 manager 有沒有 push the
right button 大概會是這個方法最有效的應用。
這些大概是我現在想到的東西,不過我還是覺得裡面有漏洞,看看有沒有什麼不
同意見能夠幫忙修正甚或推翻我現在的想法。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
推
10/05 21:20, , 1F
10/05 21:20, 1F
→
10/05 21:20, , 2F
10/05 21:20, 2F
→
10/05 21:21, , 3F
10/05 21:21, 3F
→
10/05 21:21, , 4F
10/05 21:21, 4F
我的想法是 WPA 用來評價 managerial move 應該是個好的工具,一方面大部分的
managerial move 都是在球賽末端,不會有太極端的情況。另一方面,不管是早先
的 managerial move 或是後面的都要由 manager 來負責,不像前面的兩隻三分全
壘打例子可能是兩個不同球員。
這邊的 managerial move 主要指的是戰術運用和球員的更換對於戰局造成的影響。
※ 編輯: CCLu 來自: 61.228.242.187 (10/06 02:17)
推
10/06 12:58, , 5F
10/06 12:58, 5F
討論串 (同標題文章)
Sabermetrics 近期熱門文章
PTT體育區 即時熱門文章