Re: [情報] LaTroy Hawkins & Danny Farquhar

看板FBaseball (Fantasy Baseball)作者phrygia (Daily Fantasy)時間12年前 (2013/08/19 01:04)推噓12(12推 0噓 0→)

留言12則, 12人參與討論串6/8 (看更多)

※ 引述《nickyang (肌腱炎者少打字)》之銘言： : ※ 引述《Phatmen (一丘之貉被戰活該)》之銘言： : : 推 gundam00:YES 但我主要的疑問是 FIP真的能夠就說這個投手好並且 08/16 00:08 : : → gundam00:扣掉守備及運氣成份嗎？感覺被HR和K和BB也都有運氣成份 08/16 00:09 : : → gundam00:一個投手整季對米糕162場 FIP我覺得會比他整季都不對米糕 08/16 00:10 : : → gundam00:還要高上不少打者能力也有差不是？還有被HR有時候也是 08/16 00:11 : : → gundam00:運氣不同球場的強距離不同這場地HR 別場地被沒收這也 08/16 00:12 : : → gundam00:運氣阿 08/16 00:12 : : → gundam00:xFIP也有盲點有的投手被HR%低但xFIP標準化全部投手為 08/16 00:14 : : → gundam00:聯盟平均那不就忽略每個投手被HR%的數據了? 08/16 00:15 : : 推 phrygia:球場上本來就有運氣，沒有任何數據可以排除所有的隨機成分 08/16 02:10 : : → phrygia:如果真的有那樣的數據，球也不用打了，算算術就知道結果了 08/16 02:11 : : → phrygia:重點在於，FIP或xFIP是否比傳統的ERA更能排除運氣的干擾 08/16 02:13 : : → phrygia:更能夠反應球員的true talent level 08/16 02:14 : well，其實我覺得這是個誤會 : FG在解釋他們跟BR對投手WAR算法不同的時候這麼講過： : 當你校正的東西越多，越容易犯錯（BR從RA開始一路校正回去） : FIP並不宣稱它解釋了投手能力，它只是排除掉現在不能解釋的部分 : 所以你說，FIP是否比ERA更能排除運氣的干擾？其實不行 : 就像gundam00說的，HR、K、BB都有運氣的成分 : 小樣本，兩種數據是一樣落漆，大樣本，一樣都回歸平均感謝你的回覆。不過我想這是詮釋上的問題。「小樣本，兩種數據是一樣落漆，大樣本，一樣都回歸平均。」這句話沒有錯。但什麼時候是大樣本，什麼時候又是小樣本，完全是context dependent ，它涉及到模型中解釋項的解釋能力，以及你需要多少的樣本量，才能宣稱兩個球員的能力在統計上有顯著的差異。就算是BABIP，只要樣本夠大，我們還是能夠在統計上有意義地偵測出不同的投手間能力上的不同（不考慮knucleballer），但是一般來說，做出這個統計斷言所需要的樣本量，絕對遠遠超過你要偵測兩個投手間三振能力的差異。這是因為如果每個投手都被賦予一個真實的先驗K%，由投手先驗K%所構成的母體範圍可能會落在5%到35%之間，而先驗的BABIP，多數只會在0.27到0.33 之間遊走。這使得每名投手本身K%變異數和母體變異數的比，遠遠小於BABIP。舉例來說，假設整個投手母體K%平均是20%，BABIP平均是0.300，今天我們要在統計上確認一個K%=25%的投手above average，只要200個樣本就可以讓 p-value小於0.05，但是要確認一個BABIP=0.280的投手above average，你需要將近1500個樣本才能達到相同的確定性。這個結果，用常識性的語言來描述，就是K%的變異受到投手「能力」的影響必較大，而BABIP的變異，受到投手「能力」的影響比較小。由於FIP的構成元素，多是能力導向的數據，要達到穩定所需要的樣本量也遠比ERA少。就這個意義上來講，FIP的確能夠排除更多的運氣干擾。 : FIP是實際上在做的，像是FG講的，它只是解釋現在可預測性高的部分 : 換句話說，是YOY correlation高的部分，以前是TTO，現在多加了一個IFFB : 所以為什麼叫Fielding Independant Pitching？因為這四樣是跟守備一點關係都沒有的 : （IFFB以ML的層級來說，幾乎是跟守備能力一點關係都沒有） : 所以它是不是排除「運氣」？我覺得嚴格來說不是， : 應該說，現在對於守備的評估遠比其他數據差太多，所以FIP把這部分排除 : 守備能力是不是運氣？這五年的錢球派絕對跟你說不是的 : 所以可以說FIP排除運氣嗎？我覺得不行 : 會認為FIP比ERA好的檢驗方式是YOY的corr.，但是corr高可以說明什麼？ : 其實只能說明TTO比起守備能力對於一個投手而言更「穩定」 : 現在有五個因子，K、BB、HR、IFFB、Fielding : 最不穩定的就是Fielding，FIP把最不穩定的踢掉，比起五個都包含的ERA : 自然它YOY的corr.會高了說的很好，我也完全同意你的看法。但真正讓我感到有趣的，是統計研究者跟決策者之間心態上的差異。我自己大學念數學，算是跟統計有點關係，不過那已經是二十年前的往事了，學校的東西早就丟還給老師。但是我沒有真的跟統計脫節，最近十多年，我的工作就是看一大堆數據然後做決策。我知道每個統計方法都有它的限制，但是我會不會偶爾無視於它的限制而做決定？會。因為決策離不開風險，而一個風險低的決定也不必然等於一個好的決定。迴歸分析的第一課，通常會告訴你correlation不等於因果關係，沒錯，這的確是至理名言。套用康德的講法，因果關係是人類理性所賦予的，去除掉理性，因跟果其實只是自然界發生的兩個事件而已。作為一個研究者，我們當然可以輕鬆寫意的說X和Y有高度相關，然後不提供任何解釋。但是如果你需要根據統計結果來下決策，你就必須賦予這個結果一個和你知識脈絡融貫的詮釋，即便這當中有一些猜想，但只要make sense，這個詮釋還是能夠被我們所接受。言歸正傳。守備能力當然不是運氣，但這個命題對我們決策的影響有多大，同樣是context dependent。首先，現今仍然沒有一套有效的方法可以完整評估守備對比賽勝負的貢獻，為什麼十多年研究仍舊沒有辦給出一個決定性的答案？一個合理的猜想是：守備能力的特徵很可能類似於前述的BABIP，也就是球員彼此間的能力太接近，以致於沒有辦法累積足夠樣本，讓這項能力detectable 。這當然只是猜想，我沒有辦法證明一定是這樣（說不定現在沒有辦法準確的評估守備，只是因為我們設備還不夠發達，或許有天MLB裝上類似NBA SportVU 這種可以追蹤球和每個守備者3D位移的裝置，我們就可以很清楚的評價球員的守備能力）。然而不管真相到底如何，重點在於，我的猜想和我們對棒球的理解是融貫的：棒球比賽的守備機會太有限了，ball in play每場不會超過30個，而且每個位置的守備機會極度不均等，更嚴重的是，大多數的守備機會對MLB 等級的選手來說都只是routine，這使得足以鑑別守備能力差異的樣本數少得可憐。在這個脈絡下，說守備能力不是運氣，和說BABIP不是運氣，對一個決策者而言，其實是差不多的。因為就算你能找到一種完整描述守備能力的統計工具，再把它加入你的模型，模型的預測能力也不會因此有明顯的改善。其次，個別球員間守備能力的落差也許很明顯（所以不是運氣），但不要忘記我們討論的主題是關於投手能力的評估。一個球被打進場內，連同投手在內，總共有九個守備者，在這種情況下，個別球員守備能力的差異，其實是會被 round out的。簡單說，投手失分與否固然會受到守備的影響，但除非在極端特殊的情形，好比九個都是金手套，否則我們有理由相信團隊守備所帶來的變異相對是比較小的，即使把它當成常態的隨機變數來處理，也不至於嚴重影響預測結果。在這個意義下，守備更接近於運氣。最後，在一個模型當中，如果我的經驗告訴我某項變數對結果很可能有解釋力，但是我卻沒有辦法準確地測量它，我該怎麼處理？除非有明顯的證據告訴我這個變數的特徵如何如何，否則唯一合理的作法就是假設它是常態隨機變數，丟進模型的誤差項（白話文翻譯：不理它）。這個假設有沒有可能錯？當然有。然而，對於決策者而言，既然什麼都不知道，假設成常態是風險最小的作法。而當我們這麼做的時候，其實就是把它當成運氣在處理。你所引用的FG上的文章，是典型統計人的口吻。我可以理解作為一個實證研究者，他們必須小心翼翼的提醒讀者這項工具的界限，以免數據遭到濫用（這讓我想到台灣的民調）。但是對於一個希望依據這些數據對未來做出預測的人，「YOY高度相關」、「穩定」這些詞彙根本沒有意義，他必須自己去賦予這些數據因果關係，把所謂的「穩定」轉化為對未來的「預測力」，這些數據才可變成有意義的工具。而這兩種截然不同的態度，其實只是一體的兩面。這麼說好了，假如你要預測明年某個投手的責失分，你會參考他今年的ERA，還是FIP？我想絕大多數的人一定會不假思索的選擇FIP（當然我也是）。但是讓我們做個思想實驗，想像一下如果現在大聯盟投手一年不是投200局，而是 10000局呢？不用說，當然是選ERA，因為它考慮了更多的變數，而且10000局的樣本理論上應該已經足夠迴歸平均了。在小樣本的時候選擇FIP背後所蘊含的理性，正是我「FIP更能夠排除運氣干擾」這句話所想要表達的。也許我的用語不夠精確，然而所謂的「FIP比ERA穩定」，不正意味著在同樣的樣本量下，FIP的變異比ERA還要來得小？如果FIP的變異小，在日常語言下，為什麼不能描述成運氣成分的干擾會更少呢？ : 所以說FIP是否比ERA更能反應球員的true talent level？ : 我覺得從定義上來說，其實並不行 : 是不是真的有讓人打出去軟趴趴的投手？其實有 : 這樣的投手一定比K/BB ratio高的投手差嗎？其實不一定這一段也講得很對，但同樣的，我不覺得我的想法和你有本質上的差異，總之，這也是脈絡的問題。就如同前一段所舉的例子，在小樣本的情況下，FIP比ERA對未來的預測更準確，但是如果樣本真的很大很大，無疑的ERA絕對比FIP優越。不過問題在於，現實上我們不可能擁有足夠大的樣本讓ERA對未來的預測力超越FIP，所以，所謂「FIP更能反應球員的true talent level」，是基於這個脈絡底下說的。至於你提到少數FIP無法很好解釋的特例，我有些想法。首先，我們必須搞清楚我們對FIP或ERA這些數據的期待到底是什麼，究竟是期待它像物理學的萬有理論（Theory of everything）一樣無所不能？還是希望它像牛頓力學一樣能夠解釋大部分日常生活所會遇到的現象就夠了？就作為一個一般性的解釋工具而言，我覺得FIP已經夠好了，雖然免不了遇到一些特例無法解釋，但是本來我們就不會，也不應該對它有無所不能的期待。另一個是關於如何處理這些特例的問題。有一個不可能透過時光旅行回到過去的論證是這樣子的：如果人類能夠回到過去，我們現在（或過去）應該看到很多時光旅者。但是我們連一個都沒看到，所以時光旅行根本不可能。這個論證跟棒球有什麼關係呢？有的。因為就算FIP這類的工具可能會遇到一些無法解釋的類型，但是我相信以現今對棒球統計的研究密度，如果真的存在這樣的個案，我們一定能發現它（Knuckleballer、極端的滾地球投手就是很好的例子）。如果你問我，是不是還存在其他未知的例外類型，到現在還沒被發現？我想我會套用上面時光旅行的論證告訴你，如果這麼多年下來都還找不到，相信「沒有」遠比相信「有」還要合邏輯。總而言之，即使FIP對某些類型的投手解釋有缺陷，我們現在也能夠很清楚的知道那些無法解釋的個案具有什麼樣的特徵，從而在解釋這些個案的時候特別謹慎。這對FIP作為一個有效的預測工具，並不會產生實質的影響。 : : 推 sausage:請問一下進階數據對於SP跟RP的適用性是不是有所不同? 08/16 03:42 : : → sausage:以Farquhar來說 FIP跟xFIP跟ERA差距甚大是不是因為IP較少 08/16 03:44 : : → sausage:所以反映不出真實的狀況但SP大部分ERA跟FIP的落差都不大 08/16 03:48 : : → sausage:所以我在想拿進階數據預測RP是不是會誤差比較大? 08/16 03:49 : 我認為這個問題跟任何數據都無關，樣本數是任何統計的根本 : RP比SP難預測就是因為樣本太小，多數的情況下，任何數據要拿來檢驗RP都比SP難得多 : : 推 gundam00:感謝phrygia點醒過度強調完全沒有運氣的數據那還真的是 08/16 07:01 : : → gundam00:算算術就好XD 況且有運氣成份在才是棒球迷人的地方阿！ 08/16 07:02 : 我覺得phrygia講的強調有無運氣云云其實是對數據有所誤解了 : 運氣在統計上就是小樣本事件，沒有統計學家可以宣稱他們能排除小樣本事件 : 事實上，真正的數據派絕對不可能否認運氣到處都是，這跟人生是一樣的 : 只算數學的數據派你幾乎可以說他絕對是半吊子的數據派說我是半弔子的數據派可能還抬舉我了。前陣子要用個指數分配機率密度函數還得去查維基，學校學的真的全丟光了。不過我還是要再強調一次，我從來沒有說過FIP「沒有」運氣成分，也沒有說過FIP可以完全排除小樣本所造成的變異。事實上，我在推文裡所要表達的，跟你所說的事完全一樣：沒有那種可以完全排除運氣的數據，我們所能選擇的，就是在相同樣本量下變異比較少的那種。坦白說，最後一段話讓我有點不太舒服。半弔子是還好，反正我也沒資格否認，但是說我無視於運氣在統計所扮演的角色，那還真的讓我很難接受。因為如果說我在我這行混飯吃有什麼特長，唯一能夠拿出來說嘴的，就是我對樣本大小的敏感度比一般人都好，我通常可以直覺的判斷出一份數據的樣本量，足不足以支持我要的結論，而根據這樣的結論做決策，風險又有多高。沒事，特技被無視，發發牢騷而已。很高興可以跟你討論。不過我下星期要出國，如果還有什麼要談的，可能要等一個禮拜以後了。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 119.14.255.78