[討論] 狀況內與狀況外

看板CMWang (王建民 - 大樹哥)作者 (三分熟的鬧鐘)時間18年前 (2007/08/06 18:45), 編輯推噓24(2406)
留言30則, 23人參與, 最新討論串1/2 (看更多)
其實當神棍還是蠻有趣的... 延續一下去年的模型: 用 Poisson distribution 研究投手表現. 首先有一個基本的問題... 小王今年越來越猛了. 而我好奇的就是, 如何評估他這些場次的表現? 7/03 MIN 7.0 IP, 7/08 LAA 6.1 IP 兩場一路塞鴨蛋的比賽當然沒話講. 可是天使的火力比雙城要猛, 撐 6.1 局跟撐 7.0 局的表現哪個好? 又譬如白襪今年的打擊實在太悲了... 那麼對 6/06 白襪投了九局掉一分, 相較於 5/05 對西雅圖投了八局掉一分. 到底哪個難度比較高? 另外那種 6.0 局掉四分, 跟 5.2 局掉三分的又要怎麼比, 也是很麻煩. 所以只好開壇作法, 呼喚 Poisson 大神. 當然還是要用幾句話描述一下整個模型的概念. 我們一樣假設: 一場棒球比賽的得分, 對於局數來說呈現卜松分佈. 然後把整個美聯賽事看成一個投手跟一個打者對決. 成績是 1546 場比賽失 7546 分. 或者說這是 R/9 = 4.88 的卜松投手對決 RS/9 = 4.88 的卜松打者. 兩個人打了........................嗯, 一千多場比賽. 現實投手的作用是什麼? 以小王做例子, 小王投 136.2 局失 53 分. 他可以把 RS/9 = 4.88 的 Poisson trial 壓制成 RS/9 = 3.49. 對攻擊來說呢, Yankees 在 111 場比賽裡頭打了 660 分. 所以 Yankees 可以把 R/9 = 4.88 的 Poisson trial 打成 R/9 = 5.95. 從上面這一段可以算出小王對決洋基的失分期望值... 我講得很抽象, 然而算式很簡單, 因為卜松大神的特色就是線性. :P 小王 vs NYY, 投七局的情況下, 失分期望值應該會是... 4.88 * (3.49 / 4.88) * (5.95 / 4.88) * 7 / 9 = 3.31 就是說大概掉三分多左右. 交代完畢... 來看結果. ────────────── AL games: 1546, runs: 7546 NL games: 1770, runs: 8104 王建民: R = 53, IP = 136.2 ────────────────────────────────────── 日期 勝 隊伍 局數 失分 火力表 應失分 再壓制率 持平 再失分率 ────────────────────────────────────── 7/03 W MIN 7.0 0 110/507 2.56 ------ 7.70% 92.30% 7/08 W LAA 6.1 0 110/554 2.53 ------ 7.93% 92.07% 6/06 W @CWS 9.0 1 111/480 3.09 4.54% 14.04% 81.42% 5/05 W SEA 8.0 1 109/526 3.07 4.65% 14.28% 81.07% 8/03 W KC 7.0 1 110/512 2.59 7.51% 19.45% 73.04% 6/12 W NL-ARI 7.0 1 113/467 2.45 8.63% 21.14% 70.24% 5/16 W @CWS 7.0 1 111/480 2.41 9.03% 21.71% 69.27% 6/17 W NL-NYM 8.2 2 111/519 3.43 14.32% 19.03% 66.64% 5/21 W BOS 6.1 2 111/574 2.60 26.70% 25.09% 48.21% 5/26 L LAA 8.0 3 110/554 3.20 37.97% 22.26% 39.77% 7/19 L TOR 7.1 3 110/512 2.71 49.07% 22.08% 28.85% ────────────────────────────────────── 6/01 W @BOS 5.2 3 111/574 2.33 58.86% 20.50% 20.64% 7/14 W @TB 6.0 3 110/512 2.22 61.77% 19.80% 18.44% 7/29 W @BAL 6.0 3 110/503 2.18 62.81% 19.52% 17.67% 4/29 L BOS 6.0 4 111/574 2.47 76.50% 13.08% 10.42% 4/24 L @TB 6.1 4 110/512 2.34 79.07% 12.05% 8.88% 6/23 NL-@SF 6.1 4 109/466 2.29 80.07% 11.63% 8.30% 7/24 W @KC 6.0 4 110/512 2.22 81.56% 10.98% 7.46% 6/28 @BAL 6.1 6 110/503 2.30 97.00% 2.06% 0.94% 5/10 L TEX 6.1 7 111/533 2.42 98.80% 0.85% 0.35% ────────────────────────────────────── 以這張表來說, 預測失分跟實際失分的理論誤差大約是 1.65 分左右. 模式符合得有點誇張, 我不知道其他投手會不會這樣子. O_o 然而請不要叫我深入研究, 抄寫數據很麻煩... :P 解釋兩個名詞... 「再壓制率」是說: 如果又打一場, 小王有多大的可能會讓失分更低... 「再失分率」剛好反過來, 是說對手有什麼樣的機會可以打得更好. 舉 7/19 L TOR 7.1IP 3R 那一場來說. 如果再一次 7.1 局對決, 小王讓失分更低的機率是 50% (49.07%) 左右. 而藍鳥要打得更好的機會只有不到三成 (28.85%). 另外兩成多的結果不變... 裡頭可以看到兩場, 5/26 LAA, 7/19 TOR 算是狀況內還敗投. 話說回來, 狀況外還勝投的有 6/01, 7/14, 7/24, 7/29 四場. :P 不過只有 5/26 LAA 敗得比較冤, 7/24 @KC 勝得比較虛. 請注意, 這邊都是自己跟自己比. 全盛時期的 Randy Johnson 就算狀況不太好, 應該也是大殺四方. 而且這是攻守雙方的數據. 或許狀況未必差, 是對方的棒子也太燙了. :PPP 由好排到壞的結果, 大概長那個樣子. ──── 這個模型還有一些有趣的地方... 譬如也可以計算: 小王今天拿出了十場只會出現一場的壓制力. 對決紅襪也是十場只會出現一場的火力... 會怎麼樣? 來算算對戰的勝敗機率賺 P 幣也是可以啦. 只是呢, 那真的就是神棍之魂的領域了... :Q -- 新詩練習:新鮮。踩破初春裡的狗大便;不經意的滄桑,滿溢著嫩黃的喜悅。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.125.101.95

08/06 18:51, , 1F
這篇大概又要M了 先來推XD
08/06 18:51, 1F

08/06 18:55, , 2F
大推!!!
08/06 18:55, 2F

08/06 18:59, , 3F
這一篇文章值 23 銀
08/06 18:59, 3F

08/06 19:29, , 4F
哇靠 好強!!!推!!!
08/06 19:29, 4F

08/06 19:35, , 5F
統計魔人!!!!
08/06 19:35, 5F

08/06 19:36, , 6F
好強阿!!! 我雖然學過統計 不過還是一整個看不懂 囧
08/06 19:36, 6F

08/06 19:37, , 7F
神棍成這樣,不推也不行
08/06 19:37, 7F

08/06 19:41, , 8F
唉...可惜統計沒學好,不然用在棒球上應該蠻好玩得
08/06 19:41, 8F

08/06 19:55, , 9F
묠這一篇文章值 23 銀
08/06 19:55, 9F

08/06 20:28, , 10F
老實說 有一點複雜!!
08/06 20:28, 10F

08/06 21:22, , 11F
其實我ㄧ直想問 有人常推文說:這篇文章值幾元
08/06 21:22, 11F

08/06 21:23, , 12F
是要做什麼啊?有什麼用意嗎?
08/06 21:23, 12F

08/06 21:36, , 13F
推推
08/06 21:36, 13F

08/06 22:01, , 14F
有看沒懂 真慚愧 我是統計系的...
08/06 22:01, 14F

08/06 22:04, , 15F
就看完比賽的感覺
08/06 22:04, 15F

08/06 22:38, , 16F
一整個 Data 分析魔人,要是我作實驗也有這種精神就好了
08/06 22:38, 16F

08/06 23:13, , 17F
給happiness2:因為一篇很長的文章,通常得到的P幣不少
08/06 23:13, 17F

08/06 23:14, , 18F
而 P幣太少有可能是複製貼上。
08/06 23:14, 18F

08/06 23:16, , 19F
所以有些人會用這個來判斷是不是自己打的。
08/06 23:16, 19F

08/06 23:19, , 20F
不過有時候也只是貼好玩的啦!XD
08/06 23:19, 20F

08/06 23:36, , 21F
也不能這樣說,PTT現在的狀況沒人敢在上面打長文吧囧
08/06 23:36, 21F

08/06 23:36, , 22F
在文章列表那文章前按下shift+q 就可以查該文po完得的p幣
08/06 23:36, 22F

08/06 23:37, , 23F
再看內容,可以判斷出是純灌水騙p幣或是貼上的或是直接打
08/06 23:37, 23F

08/06 23:38, , 24F
字的,大概這樣,基本上我把這功能當成小遊戲偶爾為之
08/06 23:38, 24F

08/06 23:58, , 25F
給caten:我沒有說這篇不是自己打的意思啦!XD
08/06 23:58, 25F

08/07 02:15, , 26F
我比較想知道 為何可以假設這是卜瓦松分配?!
08/07 02:15, 26F

08/07 07:32, , 27F
原po可以去買運動彩卷啦
08/07 07:32, 27F

08/07 08:07, , 28F
這是你的論文題目吧
08/07 08:07, 28F

08/07 08:42, , 29F
上三樓可以去搜原po以前的文
08/07 08:42, 29F

08/07 13:45, , 30F
還頗送 ~_~ 要不要那麼專業啊........
08/07 13:45, 30F
文章代碼(AID): #16jlkyU6 (CMWang)
文章代碼(AID): #16jlkyU6 (CMWang)