Re: [情報] LaTroy Hawkins & Danny Farquhar
看板FBaseball (Fantasy Baseball)作者phrygia (Daily Fantasy)時間12年前 (2013/08/19 01:04)推噓12(12推 0噓 0→)留言12則, 12人參與討論串6/8 (看更多)
※ 引述《nickyang (肌腱炎者少打字)》之銘言:
: ※ 引述《Phatmen (一丘之貉被戰活該)》之銘言:
: : 推 gundam00:YES 但我主要的疑問是 FIP真的能夠就說這個投手好 並且 08/16 00:08
: : → gundam00:扣掉守備及運氣成份嗎? 感覺被HR和K和BB也都有運氣成份 08/16 00:09
: : → gundam00:一個投手整季對米糕162場 FIP我覺得會比他整季都不對米糕 08/16 00:10
: : → gundam00:還要高上不少 打者能力也有差不是?還有被HR有時候也是 08/16 00:11
: : → gundam00:運氣 不同球場的強距離不同 這場地HR 別場地被沒收 這也 08/16 00:12
: : → gundam00:運氣阿 08/16 00:12
: : → gundam00:xFIP也有盲點 有的投手被HR%低 但xFIP標準化全部投手為 08/16 00:14
: : → gundam00:聯盟平均 那不就忽略每個投手被HR%的數據了? 08/16 00:15
: : 推 phrygia:球場上本來就有運氣,沒有任何數據可以排除所有的隨機成分 08/16 02:10
: : → phrygia:如果真的有那樣的數據,球也不用打了,算算術就知道結果了 08/16 02:11
: : → phrygia:重點在於,FIP或xFIP是否比傳統的ERA更能排除運氣的干擾 08/16 02:13
: : → phrygia:更能夠反應球員的true talent level 08/16 02:14
: well,其實我覺得這是個誤會
: FG在解釋他們跟BR對投手WAR算法不同的時候這麼講過:
: 當你校正的東西越多,越容易犯錯(BR從RA開始一路校正回去)
: FIP並不宣稱它解釋了投手能力,它只是排除掉現在不能解釋的部分
: 所以你說,FIP是否比ERA更能排除運氣的干擾?其實不行
: 就像gundam00說的,HR、K、BB都有運氣的成分
: 小樣本,兩種數據是一樣落漆,大樣本,一樣都回歸平均
感謝你的回覆。不過我想這是詮釋上的問題。
「小樣本,兩種數據是一樣落漆,大樣本,一樣都回歸平均。」這句話沒有
錯。但什麼時候是大樣本,什麼時候又是小樣本,完全是context dependent
,它涉及到模型中解釋項的解釋能力,以及你需要多少的樣本量,才能宣稱
兩個球員的能力在統計上有顯著的差異。
就算是BABIP,只要樣本夠大,我們還是能夠在統計上有意義地偵測出不同的
投手間能力上的不同(不考慮knucleballer),但是一般來說,做出這個統
計斷言所需要的樣本量,絕對遠遠超過你要偵測兩個投手間三振能力的差異
。這是因為如果每個投手都被賦予一個真實的先驗K%,由投手先驗K%所構成
的母體範圍可能會落在5%到35%之間,而先驗的BABIP,多數只會在0.27到0.33
之間遊走。這使得每名投手本身K%變異數和母體變異數的比,遠遠小於BABIP。
舉例來說,假設整個投手母體K%平均是20%,BABIP平均是0.300,今天我們要
在統計上確認一個K%=25%的投手above average,只要200個樣本就可以讓
p-value小於0.05,但是要確認一個BABIP=0.280的投手above average,你需
要將近1500個樣本才能達到相同的確定性。
這個結果,用常識性的語言來描述,就是K%的變異受到投手「能力」的影響必
較大,而BABIP的變異,受到投手「能力」的影響比較小。由於FIP的構成元素
,多是能力導向的數據,要達到穩定所需要的樣本量也遠比ERA少。就這個意
義上來講,FIP的確能夠排除更多的運氣干擾。
: FIP是實際上在做的,像是FG講的,它只是解釋現在可預測性高的部分
: 換句話說,是YOY correlation高的部分,以前是TTO,現在多加了一個IFFB
: 所以為什麼叫Fielding Independant Pitching?因為這四樣是跟守備一點關係都沒有的
: (IFFB以ML的層級來說,幾乎是跟守備能力一點關係都沒有)
: 所以它是不是排除「運氣」?我覺得嚴格來說不是,
: 應該說,現在對於守備的評估遠比其他數據差太多,所以FIP把這部分排除
: 守備能力是不是運氣?這五年的錢球派絕對跟你說不是的
: 所以可以說FIP排除運氣嗎?我覺得不行
: 會認為FIP比ERA好的檢驗方式是YOY的corr.,但是corr高可以說明什麼?
: 其實只能說明TTO比起守備能力對於一個投手而言更「穩定」
: 現在有五個因子,K、BB、HR、IFFB、Fielding
: 最不穩定的就是Fielding,FIP把最不穩定的踢掉,比起五個都包含的ERA
: 自然它YOY的corr.會高了
說的很好,我也完全同意你的看法。但真正讓我感到有趣的,是統計研究者跟
決策者之間心態上的差異。
我自己大學念數學,算是跟統計有點關係,不過那已經是二十年前的往事了,
學校的東西早就丟還給老師。但是我沒有真的跟統計脫節,最近十多年,我的
工作就是看一大堆數據然後做決策。我知道每個統計方法都有它的限制,但是
我會不會偶爾無視於它的限制而做決定?會。因為決策離不開風險,而一個風
險低的決定也不必然等於一個好的決定。
迴歸分析的第一課,通常會告訴你correlation不等於因果關係,沒錯,這的
確是至理名言。套用康德的講法,因果關係是人類理性所賦予的,去除掉理性
,因跟果其實只是自然界發生的兩個事件而已。作為一個研究者,我們當然可
以輕鬆寫意的說X和Y有高度相關,然後不提供任何解釋。但是如果你需要根據
統計結果來下決策,你就必須賦予這個結果一個和你知識脈絡融貫的詮釋,即
便這當中有一些猜想,但只要make sense,這個詮釋還是能夠被我們所接受。
言歸正傳。守備能力當然不是運氣,但這個命題對我們決策的影響有多大,同
樣是context dependent。首先,現今仍然沒有一套有效的方法可以完整評估
守備對比賽勝負的貢獻,為什麼十多年研究仍舊沒有辦給出一個決定性的答案
?一個合理的猜想是:守備能力的特徵很可能類似於前述的BABIP,也就是球員
彼此間的能力太接近,以致於沒有辦法累積足夠樣本,讓這項能力detectable
。這當然只是猜想,我沒有辦法證明一定是這樣(說不定現在沒有辦法準確的
評估守備,只是因為我們設備還不夠發達,或許有天MLB裝上類似NBA SportVU
這種可以追蹤球和每個守備者3D位移的裝置,我們就可以很清楚的評價球員的
守備能力)。然而不管真相到底如何,重點在於,我的猜想和我們對棒球的理
解是融貫的:棒球比賽的守備機會太有限了,ball in play每場不會超過30個
,而且每個位置的守備機會極度不均等,更嚴重的是,大多數的守備機會對MLB
等級的選手來說都只是routine,這使得足以鑑別守備能力差異的樣本數少得
可憐。在這個脈絡下,說守備能力不是運氣,和說BABIP不是運氣,對一個決
策者而言,其實是差不多的。因為就算你能找到一種完整描述守備能力的統計
工具,再把它加入你的模型,模型的預測能力也不會因此有明顯的改善。
其次,個別球員間守備能力的落差也許很明顯(所以不是運氣),但不要忘記
我們討論的主題是關於投手能力的評估。一個球被打進場內,連同投手在內,
總共有九個守備者,在這種情況下,個別球員守備能力的差異,其實是會被
round out的。簡單說,投手失分與否固然會受到守備的影響,但除非在極端
特殊的情形,好比九個都是金手套,否則我們有理由相信團隊守備所帶來的變
異相對是比較小的,即使把它當成常態的隨機變數來處理,也不至於嚴重影響
預測結果。在這個意義下,守備更接近於運氣。
最後,在一個模型當中,如果我的經驗告訴我某項變數對結果很可能有解釋力
,但是我卻沒有辦法準確地測量它,我該怎麼處理?除非有明顯的證據告訴我
這個變數的特徵如何如何,否則唯一合理的作法就是假設它是常態隨機變數,
丟進模型的誤差項(白話文翻譯:不理它)。這個假設有沒有可能錯?當然有
。然而,對於決策者而言,既然什麼都不知道,假設成常態是風險最小的作法
。而當我們這麼做的時候,其實就是把它當成運氣在處理。
你所引用的FG上的文章,是典型統計人的口吻。我可以理解作為一個實證研究
者,他們必須小心翼翼的提醒讀者這項工具的界限,以免數據遭到濫用(這讓
我想到台灣的民調)。但是對於一個希望依據這些數據對未來做出預測的人,
「YOY高度相關」、「穩定」這些詞彙根本沒有意義,他必須自己去賦予這些
數據因果關係,把所謂的「穩定」轉化為對未來的「預測力」,這些數據才可
變成有意義的工具。而這兩種截然不同的態度,其實只是一體的兩面。
這麼說好了,假如你要預測明年某個投手的責失分,你會參考他今年的ERA,
還是FIP?我想絕大多數的人一定會不假思索的選擇FIP(當然我也是)。但是
讓我們做個思想實驗,想像一下如果現在大聯盟投手一年不是投200局,而是
10000局呢?不用說,當然是選ERA,因為它考慮了更多的變數,而且10000局
的樣本理論上應該已經足夠迴歸平均了。
在小樣本的時候選擇FIP背後所蘊含的理性,正是我「FIP更能夠排除運氣干擾
」這句話所想要表達的。也許我的用語不夠精確,然而所謂的「FIP比ERA穩定
」,不正意味著在同樣的樣本量下,FIP的變異比ERA還要來得小?如果FIP的
變異小,在日常語言下,為什麼不能描述成運氣成分的干擾會更少呢?
: 所以說FIP是否比ERA更能反應球員的true talent level?
: 我覺得從定義上來說,其實並不行
: 是不是真的有讓人打出去軟趴趴的投手?其實有
: 這樣的投手一定比K/BB ratio高的投手差嗎?其實不一定
這一段也講得很對,但同樣的,我不覺得我的想法和你有本質上的差異,總之
,這也是脈絡的問題。
就如同前一段所舉的例子,在小樣本的情況下,FIP比ERA對未來的預測更準確
,但是如果樣本真的很大很大,無疑的ERA絕對比FIP優越。不過問題在於,現
實上我們不可能擁有足夠大的樣本讓ERA對未來的預測力超越FIP,所以,所謂
「FIP更能反應球員的true talent level」,是基於這個脈絡底下說的。
至於你提到少數FIP無法很好解釋的特例,我有些想法。首先,我們必須搞清楚
我們對FIP或ERA這些數據的期待到底是什麼,究竟是期待它像物理學的萬有理
論(Theory of everything)一樣無所不能?還是希望它像牛頓力學一樣能夠
解釋大部分日常生活所會遇到的現象就夠了?就作為一個一般性的解釋工具而
言,我覺得FIP已經夠好了,雖然免不了遇到一些特例無法解釋,但是本來我們
就不會,也不應該對它有無所不能的期待。
另一個是關於如何處理這些特例的問題。有一個不可能透過時光旅行回到過去
的論證是這樣子的:
如果人類能夠回到過去,我們現在(或過去)應該看到很多時光旅者。
但是我們連一個都沒看到,所以時光旅行根本不可能。
這個論證跟棒球有什麼關係呢?有的。因為就算FIP這類的工具可能會遇到一些
無法解釋的類型,但是我相信以現今對棒球統計的研究密度,如果真的存在這
樣的個案,我們一定能發現它(Knuckleballer、極端的滾地球投手就是很好的
例子)。如果你問我,是不是還存在其他未知的例外類型,到現在還沒被發現
?我想我會套用上面時光旅行的論證告訴你,如果這麼多年下來都還找不到,
相信「沒有」遠比相信「有」還要合邏輯。
總而言之,即使FIP對某些類型的投手解釋有缺陷,我們現在也能夠很清楚的知
道那些無法解釋的個案具有什麼樣的特徵,從而在解釋這些個案的時候特別謹
慎。這對FIP作為一個有效的預測工具,並不會產生實質的影響。
: : 推 sausage:請問一下 進階數據對於SP跟RP的適用性是不是有所不同? 08/16 03:42
: : → sausage:以Farquhar來說 FIP跟xFIP跟ERA差距甚大 是不是因為IP較少 08/16 03:44
: : → sausage:所以反映不出真實的狀況 但SP大部分ERA跟FIP的落差都不大 08/16 03:48
: : → sausage:所以我在想拿進階數據預測RP是不是會誤差比較大? 08/16 03:49
: 我認為這個問題跟任何數據都無關,樣本數是任何統計的根本
: RP比SP難預測就是因為樣本太小,多數的情況下,任何數據要拿來檢驗RP都比SP難得多
: : 推 gundam00:感謝phrygia點醒 過度強調完全沒有運氣的數據 那還真的是 08/16 07:01
: : → gundam00:算算術就好XD 況且有運氣成份在 才是棒球迷人的地方阿! 08/16 07:02
: 我覺得phrygia講的強調有無運氣云云其實是對數據有所誤解了
: 運氣在統計上就是小樣本事件,沒有統計學家可以宣稱他們能排除小樣本事件
: 事實上,真正的數據派絕對不可能否認運氣到處都是,這跟人生是一樣的
: 只算數學的數據派你幾乎可以說他絕對是半吊子的數據派
說我是半弔子的數據派可能還抬舉我了。前陣子要用個指數分配機率密度函數
還得去查維基,學校學的真的全丟光了。
不過我還是要再強調一次,我從來沒有說過FIP「沒有」運氣成分,也沒有說
過FIP可以完全排除小樣本所造成的變異。事實上,我在推文裡所要表達的,跟
你所說的事完全一樣:沒有那種可以完全排除運氣的數據,我們所能選擇的,
就是在相同樣本量下變異比較少的那種。
坦白說,最後一段話讓我有點不太舒服。半弔子是還好,反正我也沒資格否認
,但是說我無視於運氣在統計所扮演的角色,那還真的讓我很難接受。因為如
果說我在我這行混飯吃有什麼特長,唯一能夠拿出來說嘴的,就是我對樣本大
小的敏感度比一般人都好,我通常可以直覺的判斷出一份數據的樣本量,足不
足以支持我要的結論,而根據這樣的結論做決策,風險又有多高。沒事,特技
被無視,發發牢騷而已。
很高興可以跟你討論。不過我下星期要出國,如果還有什麼要談的,可能要等
一個禮拜以後了。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 119.14.255.78
推
08/19 01:10, , 1F
08/19 01:10, 1F
推
08/19 01:18, , 2F
08/19 01:18, 2F
推
08/19 01:39, , 3F
08/19 01:39, 3F
推
08/19 01:49, , 4F
08/19 01:49, 4F
推
08/19 02:14, , 5F
08/19 02:14, 5F
推
08/19 09:15, , 6F
08/19 09:15, 6F
推
08/19 12:22, , 7F
08/19 12:22, 7F
推
08/19 15:11, , 8F
08/19 15:11, 8F
推
08/19 15:56, , 9F
08/19 15:56, 9F
推
08/19 18:39, , 10F
08/19 18:39, 10F
推
08/20 04:13, , 11F
08/20 04:13, 11F
推
08/20 10:14, , 12F
08/20 10:14, 12F
討論串 (同標題文章)
FBaseball 近期熱門文章
12
23
PTT體育區 即時熱門文章
37
68
30
52