Re: [外電] Wang-o-Rama: All Hail the King?

看板CMWang (王建民 - 大樹哥)作者時間18年前 (2007/09/05 19:11), 編輯推噓12(16428)
留言48則, 15人參與, 最新討論串8/35 (看更多)
我是反對看era還要去掉某些比賽, 不然可能要拿其他數據來看,才能準確點 John Garland 176.1 IP 4.75 era 五分以上的去掉 139 IP 2.72 era Jose Contreras 155 IP 5.86 era 五分以上的去掉 106.2 IP 2.45 era Barry Zito 167.2 IP 4.42 era 五分以上的去掉 129 IP 2.23 era 不是說他們幾位投手差,只是這一季表現的確不理想 其實era看的也只是簡單的平均,是個結果 還要再修改就失去意義了 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.135.108.72

09/05 19:12, , 1F
扣除比率也太大了吧 通常最多上下極犖搹U扣5%
09/05 19:12, 1F

09/05 19:13, , 2F
極端各扣5%也就是最好最壞各扣一場
09/05 19:13, 2F

09/05 19:14, , 3F
顯然原Po的統計學還有加強的地方~
09/05 19:14, 3F

09/05 19:15, , 4F
HALLADAY割盲腸前兩場要扣 BECKETT有一場失常也該扣掉
09/05 19:15, 4F

09/05 19:14, , 5F
乾脆把他們有失分的比賽都扣掉好了,更強
09/05 19:14, 5F

09/05 19:16, , 6F
大家扣一扣 每個ERA都在3以下
09/05 19:16, 6F

09/05 19:16, , 7F
大家愛用統計卻又忽略統計理論XDD
09/05 19:16, 7F

09/05 19:16, , 8F
沒學過統計,純粹用上一篇的標準,酸小力一點 = =b
09/05 19:16, 8F

09/05 19:17, , 9F
我是按照統計原理的狀況剔除outlier的 不是我自己想像的
09/05 19:17, 9F

09/05 19:18, , 10F
如果今天小王有完全比賽,扣掉來看也很正確
09/05 19:18, 10F

09/05 19:34, , 11F
偏離學理的數據引用 除了誤導之外看不出其他功用
09/05 19:34, 11F

09/05 19:36, , 12F
沒錯,所以我反對把五分以上的去掉
09/05 19:36, 12F

09/05 19:36, , 13F
去一兩場其實根本沒差,那乾脆直接就看ERA
09/05 19:36, 13F

09/05 19:36, , 14F
Lackey扣一場大爆炸 ERA也要到3以下了 大家一起扣吧
09/05 19:36, 14F

09/05 19:36, , 15F
有啊...去一兩場小王Era差超多
09/05 19:36, 15F

09/05 19:37, , 16F
去掉最差的一場 現在是3.33 去掉最差的兩場 現在是3.08
09/05 19:37, 16F

09/05 19:38, , 17F
而且這兩場加起來才8.2局而已 就大約5%的局數
09/05 19:38, 17F

09/05 19:38, , 18F
其實另外95%的局數小王真的蠻穩的
09/05 19:38, 18F

09/05 19:39, , 19F
只能扣最好和最差各一場,一場爆八分和一場最長無失分
09/05 19:39, 19F

09/05 19:41, , 20F
把最差的和最好的去掉 ERA是3.44 現在是3.68
09/05 19:41, 20F

09/05 19:42, , 21F
甚至之後多投幾季,直接看ERA就夠了
09/05 19:42, 21F

09/05 19:42, , 22F
老實說...扣除極值真的是自爽用的啦...本來就是看ERA
09/05 19:42, 22F

09/05 19:43, , 23F
但在王版自high一下也不錯
09/05 19:43, 23F

09/05 19:55, , 24F
挖勒 這三個投手扣的極端值也太多了吧
09/05 19:55, 24F

09/05 19:58, , 25F
而且極端值哪是這樣定義的 去翻一下統計的書吧
09/05 19:58, 25F

09/05 20:01, , 26F
上下5%也是專業的板友說的,你要不要自己拿計算機敲一下
09/05 20:01, 26F

09/05 20:03, , 27F
1.請問扣掉失5分以上,是扣了幾場? 2.小王若扣掉失5分以
09/05 20:03, 27F

09/05 20:04, , 28F
上的局數,總局數也有152.x 加上小王今年少出賽了幾場,
09/05 20:04, 28F

09/05 20:04, , 29F
再對照原po的數據,就可以看出...
09/05 20:04, 29F

09/05 20:05, , 30F
對照18220 我只是要證明直接扣除是失敗的
09/05 20:05, 30F

09/05 20:05, , 31F
推文中也講了,去頭去尾其實差別很小
09/05 20:05, 31F

09/05 20:06, , 32F
18220中,扣掉的是2x場,不過您舉的例子,扣掉的大約有4x場
09/05 20:06, 32F

09/05 20:06, , 33F
就比較不像極端值,不過當然了,ERA還是直接看才比較具有意
09/05 20:06, 33F

09/05 20:07, , 34F
義,因為小王爆,其他優秀的投手其實也爆過 xd
09/05 20:07, 34F

09/05 20:07, , 35F
並非去頭去尾5%,outlier的定義是要偏離平均太多
09/05 20:07, 35F

09/05 20:07, , 36F
扣除前後如果有達到統計上的顯著差異,那就該扣除
09/05 20:07, 36F

09/05 20:08, , 37F
如果扣除前後沒達到統計上顯著差異,那就不應該扣除
09/05 20:08, 37F

09/05 20:09, , 38F
不過小王今年算是練球年,所以還是很值得觀察後續狀況
09/05 20:09, 38F

09/05 20:09, , 39F
原PO光去頭的局數就不止5%了 這有參考價值嗎
09/05 20:09, 39F

09/05 20:10, , 40F
統計上並不是非扣除5%的頭尾不可
09/05 20:10, 40F

09/05 20:11, , 41F
o兄 我知道極端值的定義 可是原PO砍的樣本數太多 不論
09/05 20:11, 41F

09/05 20:12, , 42F
定義是什麼 都差太多
09/05 20:12, 42F

09/05 20:22, , 43F
怎麼沒人噓原PO 這種基本的統計不是高中就學過了~~
09/05 20:22, 43F

09/05 20:20, , 44F
嗯,我只是解釋直接去是失敗的,要去5%差距也是很小的
09/05 20:20, 44F

09/06 04:16, , 45F
原PO丁丁...
09/06 04:16, 45F

09/06 04:19, , 46F
把平均值附近的樣本踢掉,還一再大言不慚是引用理論?
09/06 04:19, 46F

09/06 04:24, , 47F
看ERA當然不用去掉,但推論的時候單看平均值常失之偏頗
09/06 04:24, 47F

09/07 02:28, , 48F
補血
09/07 02:28, 48F
文章代碼(AID): #16texe08 (CMWang)
討論串 (同標題文章)
文章代碼(AID): #16texe08 (CMWang)