Re: [情報] 洋基的開書考
我在 MLB 版 po 出了美國鄉民答案,2700 多人的答案,
有空可以去看看。
首先以下當然是我個人的答案,不包對,又不是補教協會。
這份考卷大概是第一關拿來大量篩掉不適的應徵者用的,
我想應該不用全對才能進到面試下一關,但是起碼也得對
個九成五就是了。不過也不用太過緊張,很多題前面都加註
「若沒有其他資訊」,也就是說你不用自行腦補各種狀況,
沙盤推演,只要就題面作答就好了。
就題目來說,這很顯然是要考你對棒球數據分析的基本認知
題目大概就幾個觀念:
1)基本的數據推論 -- 大樣本,長期的數據結論要比短期,
小樣本的數據解釋能力強,信賴區間低。除非:
a.兩組數據結論並無二致
b.或者所使用的數據已經經過檢驗為無用的。
2) 包括上面 b 項,這份試題是在測驗你的知識程度,要
了解你對棒球數據分析從 Bill James 以降大概到本世紀
第一個十年間所做出的結論,這些結論大概都是已經翻過來
倒過去經過無數檢驗,因此可信度都是沒有問題的。
3) 最後當然還是要測驗你對進階棒球數據定義的熟稔度,
不然上班來開會鐵定雞同鴨講。
(蘿蔔汁: 拜託,你一份問卷連一題考左右病的都沒有,
怪不得你洋基連季後賽都進不去)
棒球數據分析的結論很多是反直覺的,這也是當然的,人
類天生就愛好直觀、簡單的解釋,這跟演化有關,從已知
用火拜自然神到現在是沒有什麼變化。
※ 引述《Manstein (exposure)》之銘言:
: ※ [本文轉錄自 Baseball 看板 #1b6TNVsO ]
: 作者: Manstein (exposure) 看板: Baseball
: 標題: [情報] 洋基的開書考
: 時間: Mon Oct 2 04:26:04 2023
: 美國有位鄉民去年去應徵各球團的工作(初階工作),據他表示
: 沒有人理他。但是洋基倒是回了他電子郵件,並附上網址表示
: 請先做答然後回傳,他做完以後回傳然後想當然耳沒有再聽到
: 回音,事隔一年,他把這個試題網址 po 出來給美國鄉民評價
: 一下到底洋基墊底是不是因為高層的腦袋都糨糊,從試題中可
: 知一二。
: 原網址最後面有附,試題網址現在還有效,不過出題的順序是
: 隨機給的,跟我下面翻譯的順序一定不一樣。翻譯當然是我翻的,
: 大家將就一下。
: 1.以下哪位球員在到盜壘嘗試上(stolen base attempts)
: 是比較有價值的球員?
: 跑者A: 42 SB, 23 CS (註CS=Caught Steal)
: 跑者B: 12 SB, 2 CS
這是考一般結論。一般認為盜壘的成功率必須要有七成五或者
起碼七成以上,才會對球隊攻擊面有所助益。跑者 A 不符,
跑者 B 及格。不放心的話可以用 SBR 去算一下不過這個差太多
了我想就不用了。原本的結論是要用 RE 去推,不過當然不用
搞到那麼麻煩,你只要知道這個結論就可以了。
: 2.若無其他資訊,你會派以下哪位捕手明天先發?(捕手
: 防禦率表示該捕手蹲捕時的投手防禦率)
: 捕手A: .850 OPS, 4.25 捕手防禦率(Catcher ERA)
: 捕手B: .700 OPS, 3.50 捕手防禦率
捕手防禦率是一個基本上無用的東西,研究的結果是你要嘛
就要看得更細(用相同投手對照),不然就是直接看一下能夠
直接觀察而且有精密指標的(補逸、擋球、Framing 等等),
夯部啷噹通通炒一鍋算 CERA 雜訊量太大,沒有意義。
FG 上面有一篇文章提過一個經典的研究,假設有 A/B 兩捕手,
假設今年他們都僅蹲過本隊的三位先發投手,沒有其他投手,
兩人蹲捕局數相同,三位投手在分別使用 A/B 時防禦率都
完全相同,那麼直觀的想,兩位捕手的 CERA 應該也會完全
一樣,對嗎?
結果是反直覺的不對,兩人 CERA 會不同,而且不是微差,
是頗有不同,這是因為三位投手分配到搭配的局數不同。
這也就是我們在計算死亡率時要進行年齡標準化的原因(
聽不懂沒關係,反正就是要校正就對了)。
不過有人研究的結論是說,長期(這個是真的長期了)來說,
如果自己跟自己比較的話,捕手的經驗值對於提升(應該說
是壓低) CERA 的確是有助益,這大概也就是為什麼你可以
看到幾個老捕手老的連球棒都拿不動了都還是照蹲不誤。
: 3.若無其他資訊,你會比較想要以下哪位打者來你的球隊?
: 打者A: .240/.280/.550
: 打者B: .260/.420/.410
: 打者C: .320/.350/.480
我們這種身經百戰的台灣人一眼就可以看出來出題者玩的花招,
他把三個打者 OPS 都調到一樣。這個也是考基本觀念,如果
沒有其他資訊,打者三圍哪一項最重要?結論當然是 OBP,這
可是遠古從豆爺時代就發展出來的概念。
: 4.下面哪位投手你比較喜好來你的球隊?
: 投手A:每次都投 4.2 局無失分
: 投手B: 每次都投 6.0 局失兩分
這個是要考你會不會誤入傳統數據的窠臼當中,投 B 每場都
獲得 QS,但連傳統派都不會太在意,因為 QS 是一個武斷
(Arbitrary)的門檻式數據,這種數據的解釋力很低,可以略過。
投 A 是防禦率為零的投手!
: 5.以下何者為影響 wOBA 但不影響 xwOBA
: a.接觸(擊球)品質(Quality of contact)
: b.比賽水平(Quality of competition)
: c.面對擊球之防守(Defense on batted balls)
: d.打席的槓桿/影響力(Leverage of plate appearance)
這題基本上就是考定義,xwOBA 就是拿來消除防守水準差異
(當然還有其他)用的,寫太快可能會誤選 A,xwOBA 就是
拿來看擊球品質的,當然影響。
: 6.下面哪位投手你比較喜好來你的球隊?
: 投手A: 3.50 FIP, 65 QS%
: 投手B: 4.50 FIP, 100 QS %
同樣的概念。如果只有 FIP 和 QS,應使用 FIP。
: 7.是或否: 開局投手(opener) 用幾場還行,但是一年用
: 40-50 場的話這種策略是行不通的。
Why not? 這題就是要考你是否會受到傳統觀念的束縛,
沒人有做過不代表不應該做或者做了會失敗。
: 8.A 隊與 B 隊目前隊上都有一位 2-WAR 的三壘手,他們
: 都有機會用一年 15M 的薪水簽下一位 5-WAR 的三壘手。
: A 隊目前明年預估可以贏 70 場,B 隊可贏 88 場。在
: 無其他資訊的狀況下,哪支球隊會得利於這位三壘手較多?
: a. A隊
: b. B隊
: c.兩隊一樣多
5-2=3,這很容易,基本上是在考 WAR 的定義。我知道有人
會辯解說 88 勝僱人進季後賽的勝算較高,同學,題目沒有
提的,請不要自行腦洞。
: 9.若無其他資訊,以下哪位打者你會讓他先發今天的比賽?
: a.本季.240/305/475 (414打席)對戰本日投手 13-18 4HR
: b.本季.305/325/375 (389打席)對戰本日投手 5-20 2HR
: c.本季.225/520/550 (403打席)對戰本日投手 1-15 7K
這題也是很容易的,全季的 OPS 勝過任何小樣本,我知道
很多人看到 13-18 4HR 就高潮啦,這也是無可厚非啦,但是
這 OPS 差了幾乎兩百點,這出題就是要告訴你這沒什麼好比的。
: 10.是或否 AVG with RISP (譯:跑者在得分位置時的打擊率)
: 是測量打者天分的好指標因為好打者總有辦法打回分數。
你下次再聽到有人重複這種大悲咒的時候麻煩套個緊箍咒到他頭上。
: 11.打者三圍中,下列何者對他的進攻價值最重要?
: a.打擊率
: b.上壘率
: c.長打率
同樣概念。OBP 為先。
: 12.以下何者會造成球員的 xwOBA 高於他的 wOBA
: a.打出好些強勁的出局球
: b.打出好些軟弱的一壘安打
: c.擊球分布在整個球場(spraying the ball to all parts of the field)
: d.對聯盟平均來說面對相對較弱的對手
: e.打出好些灌水全壘打,在其他球場都會被接殺
同樣,進階數據定義與概念。強勁出局求正常或者大概率會形成安打,這人
運氣略嫌不好,xwOBA 會還他公道。
: 13.評估一名 2A 球員時,下面哪一項數據最重要
: a.防禦率
: b.勝敗紀錄
: c.K/BB (三振/四壞)
你要是有朋友選 B 請你跟他絕交。K/BB 是常用數據。
: 14.你的先發投手本季 FIP 為 3.20。今天這場比賽他已經面對了
: 18 人次,五局沒有失分,而今天比賽是非贏不可。他今天已經投了
: 71 球,而你在牛棚裡面有休息充足的五個牛棚投手 FIP 在 3.20
: 到 3.40 之間,而場上目前比數為 1 比 0 領先,如果沒有其他資訊
: ,第六局你會怎麼做?
: a.不換投
: b.換投
這是 Snell 案例。這題比較不直觀,這時我們就要用台灣人身經百戰
的考場小智慧來解題。他先講先發 FIP 3.2,又講五個牛 FIP 都再
3.2-3.4 間,他是在告訴你這樣的資訊 -- 這六名投手水準差不多,
所以答案不在這些投手之間的水準差異。
那其他還有什麼資訊? 他已經丟了 71 球,而且他已經丟了 18 人次,
這是很明顯地暗示,因為 18 人次就兩輪,換句話說六局上來就是新
一輪一棒打起。研究顯示在沒有其他資訊的狀況下,投手第三輪的壓制
力都會開始下降。因此,換投是正確的。
我知道一定有很多人 argue 啊但是牛上來放火了啊(更別提幫本隊獲得冠
軍了),Well 話不能這樣講,這玩意兒跟指數型投資一樣,你要每天搞
今日老師特選股,長期下來,你的績效幾乎可以確定是落後的。你要怪
就怪之前沒燒香....吧?
: 15.以下何數據對於評估救援投手來說最有用?
: a.K%
: b.K/9
: c.LOB%
兩個 K 數據容易混淆,這也是定義問題,想清楚了就明白。K/9 高的
投手 BB/9 H/9 不一定低,但 K% 越高表示投手直接拿到出局數的機率
越高(與其交給神秘的 BABIP 大神)
: 16.是或否: 球隊必須在強力打者和接觸型打者(contact hitters)
: 中取得平衡以贏得世界大賽。
同樣的,考你是否會陷入傳統派思維?
: 17.若無其他資訊,在必贏不可的第九局你會派哪位打者上來?
: a. .750 OPS .350 avg w/RISP (皆本季,起碼 500 打席)
: b. .800 OPS .250 avg w/RISP (同上)
兩數據樣本一大一小,一可靠一運氣多,選擇是很明顯的。
: 18.沒有其他資訊的話,你會想要以下哪位打者?
: a. .300/.450/.600
: b. .000/1.000/.000
這大概是最能代表豆爺不死的考題了。
: 19.下列何種戰術狀況下三壘有人打帶跑是聰明的決策?
: a.無人出局
: b.一人出局
這個詳細也是要去用 RE 算,但是你只知道結論那也無妨,
答案是 b。簡單的來說,a 狀況下下打跑你會讓本局的得分
期望值(超過一分的期望值)大幅下降,因此虧本。
: 20.下述打擊數據中何者最穩當(robust) (全面的價值考量)
: (i.e., value-driven all-encompassing)?
: a.wOBA
: b.wRC+
: c.OPS
: d.TB
: e.OBP
這就是考你對數據如何產生以及定義了。robust 這個字雖然
有稍微念過學術的人都知道而且大概很常用,但是中文很不好
翻。答案自然是 wRC+,三圍一併考量而且加上校正。
: 21.沒有其他資訊狀況下,下面哪位球員你會先發明天必勝
: 不可的比賽?
: A球員: 850 OPS, 最近 35 打席 2 安打
: B球員: 800 OPS, 最近 35 打席 13 安打
同樣的問題,這跟 17 題是一樣的。
: 22.沒有其他資訊下,你明年會請哪位球員加入球隊?
: A投手: 60IP, 90K, 10BB, 3.00ERA, 0SV, 5BS
: B投手: 60IP, 60K, 30BB, 2.50ERA, 20SV, 0BS
: C投手: 60IP, 90K, 40BB, 2.75ERA, 50SV, 5BS
你簡單算一下防禦率和 K/BB 就知道總和來說 A 投手是最好的,
SV/BS 都是解釋力奇低的數據。
: 23.以下哪一項數據可以清楚顯示某打者的 .350 打擊率是
: 該校正回歸了?
: OPS
: OPS+
: wOBA
: BABIP
: OPB
: SLG
這大概是數據派最早的反直覺結論了。答案給 D。
: 24.沒有其他資訊下,哪位球員你會先發世界大賽第七戰?
: A投手:2.50 FIP (例行賽200IP), 5.50 FIP (季後賽 20 IP)
: B投手:4.50 FIP (例行賽200IP), 1.50 FIP (季後賽 20 IP)
你要相信兩百 ip 的結論還是 20 ip 的結論,我知道很多人要
argue 什麼疲勞啊近況啊受傷啊,題目就已經說了,沒有其他
資訊,不要再牽拖了。
: 25.下面各數據中何者最穩當(robust) (全面的價值評量
: (i.e., value-driven all-encompassing)?
: WHIP
: FIP
: ERA
: QS%
: LOB%
雖然 FIP 也不是完美(事實上是離完美差很多),但是都比其他
的要高明。
: 26.是或否 一支頂尖救援投手對一隻已經有其他五個頂尖
: 救援投手的球隊比較沒有價值,他對另一隻天分相同但僅有
: 一支頂尖救援投手的球隊比較有價值(假設兩支球隊都用
: 五人輪值每人平均每場都投五局)
: 是:因為第一支球隊沒有那麼多高槓桿/關鍵局數分給救援
: 投手
: 否:頂尖牛棚永遠不嫌多,而且第一支球隊可能會有傷兵。
這題基本上考一個觀念,situational 的資訊除了特例或者少數
狀況以外,幾乎沒有任何解釋力或者價值,高槓桿局數/情勢
的出現是一種貝式的產物,你很難「事先安排」答案選否。
不過這題蘿蔔汁鐵定不會答錯「啊本隊不是永遠都是牛不夠多....」
不過如果他是問這樣一個五頭牛和一個同樣 2WAR 的野手的
話,那麼你就要思考一下了,答案要選野手。因為防守有最低
值為零,但進攻沒有最大值。
: 27.無其他資訊下,五戰三勝的季後賽你比較想對到誰?
: A. 例行賽 98-64,例行賽對戰本隊 1 勝 5 敗
: B. 例行賽 92-70,例行賽對戰本隊 6 勝 0 敗
98 vs 92 勝這種差距太小,沒有解釋力(區間實力的差別
很容易就可以讓結果扭曲,當然現在賽程重排好多了),
你不放心的話還可以上網找個 two-proportional test
calculator 簡單算一下。大數字沒有用自然是用小的,
而且對戰成績你真的亂做用無母數的話還會得到顯著....
: 28.一位 23 歲的新秀投手在 5 場大聯盟等級先發中繳出
: ERA 1.50 的成績,沒有其他資訊下,你認為該投手明年
: 大聯盟最有可能的成績會
: 是?
: 1.00 ERA
: 1.50 ERA
: 2.00 ERA
: 2.50 ERA
: 2.75 ERA
: 3.00 ERA
5 場球是沒有什麼解釋能力的(當然這個門檻在那裡很難說,
但他當然也不會考你這個,反正 5 場顯然過小),他明年的
成績「在沒有其他資訊下」(很重要我們再說三次)自然最
可能的落點自然是聯盟平均,聯盟平均是多少?不知道沒關係,
反正一定超過 3,選 3.00 就對了。
: 29.你認為球員逃脫權(opt-out)對球員有利,還是對球隊有利,
: 還是雙方都有利?
: A. 對球員有利
: B. 對球隊有利
: C. 雙方都有利
當然是對球員有利,不然為什麼要有 team-option, 還有 dual-option?
: 原文:
: https://www.reddit.com/r/baseball/comments/16w6hy6/
: i_applied_for_a_baseball_operations_job_with_the/
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 47.151.240.39 (美國)
※ 文章網址: https://www.ptt.cc/bbs/Dodgers/M.1696273019.A.FDD.html
→
10/03 08:34,
1年前
, 1F
10/03 08:34, 1F
推
10/03 11:57,
1年前
, 2F
10/03 11:57, 2F
推
10/03 23:09,
1年前
, 3F
10/03 23:09, 3F
推
10/04 20:19,
1年前
, 4F
10/04 20:19, 4F
推
10/04 20:52,
1年前
, 5F
10/04 20:52, 5F
討論串 (同標題文章)
Dodgers 近期熱門文章
82
242
32
66
PTT體育區 即時熱門文章
-8
134