[問題] 關於平行移動的研究
通常研究兩聯盟水準差異時,
最常用的方法是研究一批球員在兩個不同聯盟平行移動時
平均成績的差異
(最常看到的例子是Clay Davenport)
比如說同一批球員
在B 聯盟的OPS 大概是在A 聯盟時OPS 的九折
如果只要據此表示B 聯盟水準比A 聯盟高, 高多少
只要樣本夠大我是沒有大問題 (一些小問題當然還有)
不過當拿來預測單一球員的成績轉換時
通常所有人都會再加上一個"假設"
即如果A 球員在A 聯盟OPS 多少, 那在B 聯盟他也照乘九折
這聽起來很合理
但是這其實還假設說原本已經有平行移動資料的那一大堆選手裡面
比如X 好了
X 在A 聯盟的成績比這一堆選手在A 聯盟的成績高出10%
那麼X 在B 聯盟的成績還是會傾向比這一堆選手在B 聯盟的成績高出10% 左右
事實上是不是這樣? 當然不完全是這樣 (每個人適應狀況不同)
我的問題就是有沒有人估計過偏差的狀況大概是怎樣?
一個方法可能是
假設有一群選手{X1,X2,.....X_n}
這群選手在A 聯盟的平均表現數值是P, 在B 聯盟的平均表現是Q
然後X1 在A 聯盟的表現數值相較於P 好了a_1 個百分比
(或者如果平均表現數值是用OPS, 那這個部分可以算OPS+ 之類)
X1 在B 聯盟的表現數值相較於Q 則好了b_1 個百分比
依此類推之後
我們拿 {a_1,....a_n} 和{b_1,....,b_n} 來求相關係數
這個相關係數可以大概告訴我們
直接拿conversion factor 去乘成績得到轉換推測結果的可靠度在哪裡
就實務來說
通常認為由三A 推算出來的MLB equivalent 還算可靠
二A 馬馬虎虎
一A 或以下則僅供參考
我是有點好奇這三組情形如果用上面方法算出相關係數, 不知道大概分別會是多少
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 210.203.106.120
推
03/18 20:47, , 1F
03/18 20:47, 1F
→
03/18 20:55, , 2F
03/18 20:55, 2F
※ 編輯: Herlin 來自: 210.203.106.120 (03/18 20:56)
討論串 (同標題文章)
Sabermetrics 近期熱門文章
PTT體育區 即時熱門文章