Re: [情報] WAR, a case study: Fielder vs. Ryan

看板MLB (美國職棒/大聯盟)作者 (肌腱炎者少打字)時間13年前 (2013/03/02 02:10), 編輯推噓39(39022)
留言61則, 38人參與, 最新討論串4/4 (看更多)
※ 引述《abc12812 ()》之銘言: : : 推 julians:我很好奇的是說,如果是這樣的話,那我們擺九個Ryan跟擺 03/01 12:58 : → julians:九個Fielder最後得到的勝場會不會差不多呢? 03/01 12:59 : : 理論上是這樣沒錯 : : Ryan的打擊在一壘會很悲劇 但同樣的Fielder當游擊霸的守備肯定也很悲劇 : : 推 Guillen:不會,因為Ryan移去一壘的話WAR會大降,可能會變成負的。 03/01 13:00 : : 理論上不會變 因為Ryan照理說會比"守備好的一壘手"再更多攔到很多球 : (可以想像一下Pujols和Ryan的範圍差距) : : 這些多攔到的球抵消掉轉一壘的position adjust (約15分) : : : 不過實際上沒人這樣玩過 所以無法驗證 其實相反,我覺得理論上不會這樣 wOBA也好、TZ、ZR、WAR也好,所有的關鍵都在runs created/saved上 runs created/saved最後是連到理論勝率上 這當中的橋樑都是回歸分析,回歸分析取是大數,不是極端值 任何時候你也只能應用這些數字在大樣本、接近平均值的樣本 例如說,一支一壘安打長期而言等於0.17分 但是在Barry Bonds前面的一壘安打是不是0.17分? 很顯然不是,因為Bonds就是個離群值 一樣的道理,positional adjustment SS +7.5、 1B -10都是大數取樣 你把很顯然的離群值擺進去還能用這個數字推論嗎?可能可以,但是要很小心 打個比方,假設今天你用一個價錢區間在$100~$200的東西推算價格彈性 那麼能不能計算你把他漲價漲到$1000時的銷售量? 不管你在$100~$200之間用的是哪一種curve,out of sample的數字理論上都是沒根據的 甚至極端一點,任何沒有出現過的price point都是沒根據的,即使within sample range 我們信賴現在wOBA乃至WAR的理由是他們的計算結果極為接近真實情況 (全隊的wOBA、SIERA推論全隊得失分準確,全隊得失分推論全隊勝率準確) 但前提是多數球隊都在你的sample pool裡面玩,沒有人瘋到把肥王子丟到SS 當我們今天要討論肥王子這個個案的時候,守位校正已經失準了 事實上,任何的個案都存在這種情況,例如說拿FIP看全盛時期的大數準不準? FIP可能對99%的球員都準,但偏偏對他就很可能不準 SIERA對他可能稍準一點,但同樣的,因為他是個很例外的投手,你拿根據多數投手計算 出來的加權套在他身上誤差就會偏高 : 推 julians:然後,如果Fielder移到游擊去WAR不也會因此大降呢? 03/01 13:12 : → pujos:胖王子去守游擊WAR可能會升.而且機率不是一般的大*-* 03/01 13:14 : : 理論上也是不會變 : : Fielder當游擊霸的防守恐怕不是普通的慘烈 : : → pujos:守備要扣到比在1b慘有可能嗎xdd 03/01 13:17 : → pujos:只要不是連一壘都傳不了.範圍小就小了 03/01 13:18 : : 游擊手比較的對象 最爛的是至少很會跳傳的Jeter : : 雖然沒人實驗過 但Fielder當游擊真的很可能一個反手就是內安 : : 這樣看來還有人會覺得轉職WAR就會自動加分嗎? 另外一個問題是WAR的假設,對的根據WAR的假設你說的沒錯 但是WAR的假設符合這個case嗎?恐怕不是 WAR假設所有的守位可以透過平均校正,這個校正本身忽略了很多因素 例如說假設有個人正手接超強反手接超爛,他站在左邊或右邊差異就很大 但這個校正的假設是不管你換到哪個位置你的守備能力都不會變 再來,守備位置有沒有可能影響打擊表現? WAR的假設是沒有,很多球界的人相信有,我們不知道有沒有,或說有多大 : : 推 hunterqiji:任憑WAR再怎麼合理﹐真正付錢的老板和GM還是不認的 03/01 13:19 : → hunterqiji:一個簡單的問題﹐Ryan能簽到20M/y的合約嗎? 03/01 13:19 市場效率是一件事,硬球之前有篇文章談守備職人是不是衰退比較快 那篇文章懷疑是的。 所以Bourn簽不到符合WAR的大約、Ryan甚至連張普通約都可能拿不到 也許反映的不是市場效率不彰,是球團的人遠比你以為的聰明 : : 推 TaiwanNeko:守備組薪水比不上重砲手的另一個原因,球迷喜歡打擊大 03/01 21:56 : → TaiwanNeko:爆發勝過穩定的守備,球迷多自然賺的多 03/01 21:57 這話不是沒有道理,但關係可能沒那麼強 得分跟全壘打佔票房的比重的確高過失分,但是戰績跟球場才是最重要的 : 推 blue142857:問題是一壘手根本不可能cover"大部分"右半邊內野 03/01 22:56 : → maxspeed150:你怎麼知道不可能? 03/01 22:57 : → blue142857:一壘手在多數的情況下還是會回到壘包而非出去搶球 03/01 22:57 : → maxspeed150:這些守位分數可不是亂加亂扣的 03/01 22:57 不是亂加亂扣,但是沒辦法處理極端值 另外blue142857說的也是很有可能,兩個活動力一樣的一壘手跟三壘手 假設他們正反手接球都一樣好,他們的站位會一樣嗎? 很可能不會,站三壘他可以站得很靠二壘,但是站一壘他必須要回去接球 這樣的差別可能只在一個人活動力大到可以站在二三壘中間依舊cover三壘時才出現 大部分的情況下不會有這樣的一三壘手,但是Ryan會不會是?我們不知道 : 你給Fielder守1B他當然撿不到幾球 但Pujols就不同了 : : 可是Pujols的範圍又跟Ryan有差 : : 可以想像一下Ryan如果守1B會是多神的防守者 事實上我覺得Ryan越神這個差距就越無法預測 他越是out of sample,我們越不知道會發生什麼事 : → maxspeed150:備就是一個慘烈 03/01 23:13 : → maxspeed150:就是因為1B從來就不會有很多很多球可以守才有守備扣分 03/01 23:13 : → maxspeed150:在看WAR時請把那些理所當然的直覺丟掉 一切讓統計數據 03/01 23:14 : → maxspeed150:說話 03/01 23:14 這樣講我覺得就有點太過,任何的統計都假設,你要很清楚這些假設才能正確的讓數字 說話。當這個數字出來違反你的常識的時候,除了懷疑常識是否正確也要懷疑假設是否 還適用 : → maxspeed150:WAR這東西就是為了要更客觀評價球員才發明的 03/01 23:57 : 推 blue142857:WAR是個客觀評價的標準這我同意 但個人認為他的缺陷在 03/01 23:58 : → blue142857:其實也不算缺陷啦..反正就是他是用統一修正的數據 03/01 23:59 : → blue142857:所以對每個隊伍而言 同樣把一個球員WAR提升2.0 03/01 23:59 : → blue142857:可能會因為隊伍組成而帶來不同的效益 03/02 00:00 其實與其說是為了客觀評價,不如說是為了簡化理解 你對.3/.4/.5沒概念,換成幾勝總有概念了吧? 但問題就在,WAR是透過層層回歸計算的結果,每一次的計算都有假設 有越多的假設運用的限制就越多 這是不是缺陷?我覺得這不算是缺陷,重點是你要理解你模型的假設跟限制 : 推 OoyaoO:如果規則改成多守下一分對方球隊得分會減1 多守跟多打一分 03/02 00:49 : → OoyaoO:的價值才會相等吧 03/02 00:49 : → OoyaoO:多守了3分被尻陽春HR但是打不下分最後還是會0:1輸球 不會 03/02 00:51 : → OoyaoO:變成0:-2贏球 03/02 00:51 你這樣的理解就跟WAR的應用不同了, 打出一支一壘安打不會馬上幫你在計分板放上0.17分,但是長期來說會往這個方向回歸 一場比賽0:1輸球還是2:0贏球從來都不會是統計的重點 統計處理的是長期,是一整季是一個世代,一場球的輸贏表現是沒辦法用任何數字預測的 : 推 waijr:一些統計方法都會有極端值 一般來說都是拿掉 有必要鑽牛角尖 03/02 01:01 : 推 prereality:要找出war的弊端我覺得很容易 假設你找了8個在各防守 03/02 01:12 : → prereality:位置都是頂尖war但是攻擊指數平均只有6~7左右的野手組 03/02 01:12 : → prereality:成一隊應該就會發現問題出在哪了 03/02 01:14 : → prereality:但所謂這種找出8個極端的球員組在一隊並且讓他們打滿 03/02 01:17 : 推 OoyaoO:不可能 沒人會去做這種看起來就死定而且高成本的實驗 03/02 01:18 : → prereality:整個球季這種事情現實中幾乎不可能發生 所以很難去反駁 03/02 01:19 : 推 catsondbs:現實中防守打擊以外的變數也很多 投手+守備也不能控制 03/02 01:27 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 68.61.37.218

03/02 02:15, , 1F
03/02 02:15, 1F

03/02 02:20, , 2F
好文
03/02 02:20, 2F

03/02 03:06, , 3F
推推 這篇即使沒有甚麼數字也好想推數學去死 orz
03/02 03:06, 3F

03/02 03:46, , 4F
簡單來說 不該用9個Ryan對上9個小王子這樣比較
03/02 03:46, 4F

03/02 03:55, , 5F
推!
03/02 03:55, 5F

03/02 04:01, , 6F
03/02 04:01, 6F

03/02 04:32, , 7F
大推 這篇幫到我理解很多東西
03/02 04:32, 7F

03/02 04:39, , 8F
推,說得很清楚又仔細
03/02 04:39, 8F

03/02 05:39, , 9F
03/02 05:39, 9F

03/02 06:08, , 10F
深夜好文
03/02 06:08, 10F

03/02 08:29, , 11F
03/02 08:29, 11F

03/02 08:36, , 12F
好文大推!!
03/02 08:36, 12F

03/02 09:53, , 13F
03/02 09:53, 13F

03/02 10:05, , 14F
感謝學長好文
03/02 10:05, 14F

03/02 10:19, , 15F
03/02 10:19, 15F

03/02 10:30, , 16F
03/02 10:30, 16F

03/02 10:40, , 17F
深入淺出啊
03/02 10:40, 17F

03/02 10:46, , 18F
早上再來看一次 WAR守位修正應該也是基於replacement le
03/02 10:46, 18F

03/02 10:46, , 19F
vel的概念對嗎?
03/02 10:46, 19F

03/02 11:09, , 20F
....腦殘了 WAR本來就是說 replacement level
03/02 11:09, 20F

03/02 11:18, , 21F
感謝大大好文
03/02 11:18, 21F

03/02 11:45, , 22F
關於守位影響打擊 其實是有的 其實守備很消耗體力跟精神
03/02 11:45, 22F

03/02 11:46, , 23F
但是你說Ry去打DH打擊成績會好很多嗎? 這也未必
03/02 11:46, 23F

03/02 11:47, , 24F
只能說專心打擊的DH有更多時間去調整自己的下一個打擊
03/02 11:47, 24F

03/02 11:47, , 25F
也有更多的時間休息以及觀察投手
03/02 11:47, 25F

03/02 12:10, , 26F
總是有很多人認為數據統計要反映在每"一場"比賽 Orz
03/02 12:10, 26F

03/02 12:11, , 27F
我真的希望大多數人可以花一點小時間來看看這篇文章
03/02 12:11, 27F

03/02 12:44, , 28F
但是彭政閔前幾年也說如果上場守備比較不會胡思亂想
03/02 12:44, 28F

03/02 12:44, , 29F
打擊狀態反而比較好 當然這類討論已經超脫數據能說的
03/02 12:44, 29F

03/02 15:07, , 30F
專業好文
03/02 15:07, 30F

03/02 15:18, , 31F
push
03/02 15:18, 31F

03/02 16:42, , 32F
推~ 好文
03/02 16:42, 32F

03/02 17:19, , 33F
03/02 17:19, 33F

03/02 17:29, , 34F
03/02 17:29, 34F

03/02 20:07, , 35F
推好聞
03/02 20:07, 35F

03/02 21:42, , 36F
推 最後一段尤其好
03/02 21:42, 36F

03/03 00:00, , 37F
看好幾遍才看懂原來"大數"是指"大樹"
03/03 00:00, 37F

03/03 05:34, , 38F
推!好多引戰哥都腫了
03/03 05:34, 38F

03/03 08:01, , 39F
沒有什麼腫不腫,有想法敢討論比推廢話強一萬倍
03/03 08:01, 39F

03/03 09:23, , 40F
意思是說,不該存在九人都是胖王子這種假設來比嗎?
03/03 09:23, 40F

03/03 12:14, , 41F
該說像他守這麼爛的是無法預測的
03/03 12:14, 41F

03/03 12:40, , 42F
我推斷時是沒想到極端值的問題.......
03/03 12:40, 42F

03/03 13:12, , 43F
03/03 13:12, 43F

03/03 13:14, , 44F
position adjust是拿有多重守位的球員做計算 這樣有個盲
03/03 13:14, 44F

03/03 13:15, , 45F
點是會玩大風吹的大多是有SS底的工具人 所以計算起來
03/03 13:15, 45F

03/03 13:15, , 46F
SS => 1B的價值估計比較準 1B => SS的估計容易失真
03/03 13:15, 46F

03/03 13:16, , 47F
回到Ryan/Fielder的問題 如果調換守位 我會猜Ryan 1B
03/03 13:16, 47F

03/03 13:17, , 48F
會比較接近估計值(~15R) Fielder SS 會比較偏離估計值
03/03 13:17, 48F

03/03 13:17, , 49F
9 Ryan 推測起來應該會比 9 Fielder強
03/03 13:17, 49F

03/03 16:16, , 50F
好文推
03/03 16:16, 50F

03/03 21:19, , 51F
推這篇!真的是"深入淺出"
03/03 21:19, 51F

03/03 23:19, , 52F
推好文章!
03/03 23:19, 52F

03/04 09:16, , 53F
如果所謂「想法」只是拿著「數據」亂用,那比推廢文還可怕
03/04 09:16, 53F

03/04 09:17, , 54F
偏偏有些假數據派就是拿著雞毛當令劍鬼扯
03/04 09:17, 54F

03/04 09:18, , 55F
這點在當年大樹哥當紅時特別明顯
03/04 09:18, 55F

03/04 09:19, , 56F
如果一昧敵視中文報導無論良窳是CCR,那把數據亂用鬼扯
03/04 09:19, 56F

03/04 09:21, , 57F
其實跟被鄙視的墮落媒體沒兩樣
03/04 09:21, 57F

03/04 09:22, , 58F
而本篇提到的很多觀念其實只是計量、統計的基礎觀念
03/04 09:22, 58F

03/04 09:30, , 59F
不是說不能犯這種基礎錯誤,但本版長期以來的風氣,嘿,
03/04 09:30, 59F

03/04 09:32, , 60F
或許是比較支持容忍這種問題吧
03/04 09:32, 60F

11/02 08:25, , 61F
11/02 08:25, 61F
文章代碼(AID): #1HCEyfQR (MLB)
文章代碼(AID): #1HCEyfQR (MLB)