Re: [情報] 洋基的開書考

看板Dodgers作者 (exposure)時間7月前 (2023/10/03 02:56), 編輯推噓4(401)
留言5則, 5人參與, 7月前最新討論串2/2 (看更多)
我在 MLB 版 po 出了美國鄉民答案,2700 多人的答案, 有空可以去看看。 首先以下當然是我個人的答案,不包對,又不是補教協會。 這份考卷大概是第一關拿來大量篩掉不適的應徵者用的, 我想應該不用全對才能進到面試下一關,但是起碼也得對 個九成五就是了。不過也不用太過緊張,很多題前面都加註 「若沒有其他資訊」,也就是說你不用自行腦補各種狀況, 沙盤推演,只要就題面作答就好了。 就題目來說,這很顯然是要考你對棒球數據分析的基本認知 題目大概就幾個觀念: 1)基本的數據推論 -- 大樣本,長期的數據結論要比短期, 小樣本的數據解釋能力強,信賴區間低。除非: a.兩組數據結論並無二致 b.或者所使用的數據已經經過檢驗為無用的。 2) 包括上面 b 項,這份試題是在測驗你的知識程度,要 了解你對棒球數據分析從 Bill James 以降大概到本世紀 第一個十年間所做出的結論,這些結論大概都是已經翻過來 倒過去經過無數檢驗,因此可信度都是沒有問題的。 3) 最後當然還是要測驗你對進階棒球數據定義的熟稔度, 不然上班來開會鐵定雞同鴨講。 (蘿蔔汁: 拜託,你一份問卷連一題考左右病的都沒有, 怪不得你洋基連季後賽都進不去) 棒球數據分析的結論很多是反直覺的,這也是當然的,人 類天生就愛好直觀、簡單的解釋,這跟演化有關,從已知 用火拜自然神到現在是沒有什麼變化。 ※ 引述《Manstein (exposure)》之銘言: : ※ [本文轉錄自 Baseball 看板 #1b6TNVsO ] : 作者: Manstein (exposure) 看板: Baseball : 標題: [情報] 洋基的開書考 : 時間: Mon Oct 2 04:26:04 2023 : 美國有位鄉民去年去應徵各球團的工作(初階工作),據他表示 : 沒有人理他。但是洋基倒是回了他電子郵件,並附上網址表示 : 請先做答然後回傳,他做完以後回傳然後想當然耳沒有再聽到 : 回音,事隔一年,他把這個試題網址 po 出來給美國鄉民評價 : 一下到底洋基墊底是不是因為高層的腦袋都糨糊,從試題中可 : 知一二。 : 原網址最後面有附,試題網址現在還有效,不過出題的順序是 : 隨機給的,跟我下面翻譯的順序一定不一樣。翻譯當然是我翻的, : 大家將就一下。 : 1.以下哪位球員在到盜壘嘗試上(stolen base attempts) : 是比較有價值的球員? : 跑者A: 42 SB, 23 CS (註CS=Caught Steal) : 跑者B: 12 SB, 2 CS 這是考一般結論。一般認為盜壘的成功率必須要有七成五或者 起碼七成以上,才會對球隊攻擊面有所助益。跑者 A 不符, 跑者 B 及格。不放心的話可以用 SBR 去算一下不過這個差太多 了我想就不用了。原本的結論是要用 RE 去推,不過當然不用 搞到那麼麻煩,你只要知道這個結論就可以了。 : 2.若無其他資訊,你會派以下哪位捕手明天先發?(捕手 : 防禦率表示該捕手蹲捕時的投手防禦率) : 捕手A: .850 OPS, 4.25 捕手防禦率(Catcher ERA) : 捕手B: .700 OPS, 3.50 捕手防禦率 捕手防禦率是一個基本上無用的東西,研究的結果是你要嘛 就要看得更細(用相同投手對照),不然就是直接看一下能夠 直接觀察而且有精密指標的(補逸、擋球、Framing 等等), 夯部啷噹通通炒一鍋算 CERA 雜訊量太大,沒有意義。 FG 上面有一篇文章提過一個經典的研究,假設有 A/B 兩捕手, 假設今年他們都僅蹲過本隊的三位先發投手,沒有其他投手, 兩人蹲捕局數相同,三位投手在分別使用 A/B 時防禦率都 完全相同,那麼直觀的想,兩位捕手的 CERA 應該也會完全 一樣,對嗎? 結果是反直覺的不對,兩人 CERA 會不同,而且不是微差, 是頗有不同,這是因為三位投手分配到搭配的局數不同。 這也就是我們在計算死亡率時要進行年齡標準化的原因( 聽不懂沒關係,反正就是要校正就對了)。 不過有人研究的結論是說,長期(這個是真的長期了)來說, 如果自己跟自己比較的話,捕手的經驗值對於提升(應該說 是壓低) CERA 的確是有助益,這大概也就是為什麼你可以 看到幾個老捕手老的連球棒都拿不動了都還是照蹲不誤。 : 3.若無其他資訊,你會比較想要以下哪位打者來你的球隊? : 打者A: .240/.280/.550 : 打者B: .260/.420/.410 : 打者C: .320/.350/.480 我們這種身經百戰的台灣人一眼就可以看出來出題者玩的花招, 他把三個打者 OPS 都調到一樣。這個也是考基本觀念,如果 沒有其他資訊,打者三圍哪一項最重要?結論當然是 OBP,這 可是遠古從豆爺時代就發展出來的概念。 : 4.下面哪位投手你比較喜好來你的球隊? : 投手A:每次都投 4.2 局無失分 : 投手B: 每次都投 6.0 局失兩分 這個是要考你會不會誤入傳統數據的窠臼當中,投 B 每場都 獲得 QS,但連傳統派都不會太在意,因為 QS 是一個武斷 (Arbitrary)的門檻式數據,這種數據的解釋力很低,可以略過。 投 A 是防禦率為零的投手! : 5.以下何者為影響 wOBA 但不影響 xwOBA : a.接觸(擊球)品質(Quality of contact) : b.比賽水平(Quality of competition) : c.面對擊球之防守(Defense on batted balls) : d.打席的槓桿/影響力(Leverage of plate appearance) 這題基本上就是考定義,xwOBA 就是拿來消除防守水準差異 (當然還有其他)用的,寫太快可能會誤選 A,xwOBA 就是 拿來看擊球品質的,當然影響。 : 6.下面哪位投手你比較喜好來你的球隊? : 投手A: 3.50 FIP, 65 QS% : 投手B: 4.50 FIP, 100 QS % 同樣的概念。如果只有 FIP 和 QS,應使用 FIP。 : 7.是或否: 開局投手(opener) 用幾場還行,但是一年用 : 40-50 場的話這種策略是行不通的。 Why not? 這題就是要考你是否會受到傳統觀念的束縛, 沒人有做過不代表不應該做或者做了會失敗。 : 8.A 隊與 B 隊目前隊上都有一位 2-WAR 的三壘手,他們 : 都有機會用一年 15M 的薪水簽下一位 5-WAR 的三壘手。 : A 隊目前明年預估可以贏 70 場,B 隊可贏 88 場。在 : 無其他資訊的狀況下,哪支球隊會得利於這位三壘手較多? : a. A隊 : b. B隊 : c.兩隊一樣多 5-2=3,這很容易,基本上是在考 WAR 的定義。我知道有人 會辯解說 88 勝僱人進季後賽的勝算較高,同學,題目沒有 提的,請不要自行腦洞。 : 9.若無其他資訊,以下哪位打者你會讓他先發今天的比賽? : a.本季.240/305/475 (414打席)對戰本日投手 13-18 4HR : b.本季.305/325/375 (389打席)對戰本日投手 5-20 2HR : c.本季.225/520/550 (403打席)對戰本日投手 1-15 7K 這題也是很容易的,全季的 OPS 勝過任何小樣本,我知道 很多人看到 13-18 4HR 就高潮啦,這也是無可厚非啦,但是 這 OPS 差了幾乎兩百點,這出題就是要告訴你這沒什麼好比的。 : 10.是或否 AVG with RISP (譯:跑者在得分位置時的打擊率) : 是測量打者天分的好指標因為好打者總有辦法打回分數。 你下次再聽到有人重複這種大悲咒的時候麻煩套個緊箍咒到他頭上。 : 11.打者三圍中,下列何者對他的進攻價值最重要? : a.打擊率 : b.上壘率 : c.長打率 同樣概念。OBP 為先。 : 12.以下何者會造成球員的 xwOBA 高於他的 wOBA : a.打出好些強勁的出局球 : b.打出好些軟弱的一壘安打 : c.擊球分布在整個球場(spraying the ball to all parts of the field) : d.對聯盟平均來說面對相對較弱的對手 : e.打出好些灌水全壘打,在其他球場都會被接殺 同樣,進階數據定義與概念。強勁出局求正常或者大概率會形成安打,這人 運氣略嫌不好,xwOBA 會還他公道。 : 13.評估一名 2A 球員時,下面哪一項數據最重要 : a.防禦率 : b.勝敗紀錄 : c.K/BB (三振/四壞) 你要是有朋友選 B 請你跟他絕交。K/BB 是常用數據。 : 14.你的先發投手本季 FIP 為 3.20。今天這場比賽他已經面對了 : 18 人次,五局沒有失分,而今天比賽是非贏不可。他今天已經投了 : 71 球,而你在牛棚裡面有休息充足的五個牛棚投手 FIP 在 3.20 : 到 3.40 之間,而場上目前比數為 1 比 0 領先,如果沒有其他資訊 : ,第六局你會怎麼做? : a.不換投 : b.換投 這是 Snell 案例。這題比較不直觀,這時我們就要用台灣人身經百戰 的考場小智慧來解題。他先講先發 FIP 3.2,又講五個牛 FIP 都再 3.2-3.4 間,他是在告訴你這樣的資訊 -- 這六名投手水準差不多, 所以答案不在這些投手之間的水準差異。 那其他還有什麼資訊? 他已經丟了 71 球,而且他已經丟了 18 人次, 這是很明顯地暗示,因為 18 人次就兩輪,換句話說六局上來就是新 一輪一棒打起。研究顯示在沒有其他資訊的狀況下,投手第三輪的壓制 力都會開始下降。因此,換投是正確的。 我知道一定有很多人 argue 啊但是牛上來放火了啊(更別提幫本隊獲得冠 軍了),Well 話不能這樣講,這玩意兒跟指數型投資一樣,你要每天搞 今日老師特選股,長期下來,你的績效幾乎可以確定是落後的。你要怪 就怪之前沒燒香....吧? : 15.以下何數據對於評估救援投手來說最有用? : a.K% : b.K/9 : c.LOB% 兩個 K 數據容易混淆,這也是定義問題,想清楚了就明白。K/9 高的 投手 BB/9 H/9 不一定低,但 K% 越高表示投手直接拿到出局數的機率 越高(與其交給神秘的 BABIP 大神) : 16.是或否: 球隊必須在強力打者和接觸型打者(contact hitters) : 中取得平衡以贏得世界大賽。 同樣的,考你是否會陷入傳統派思維? : 17.若無其他資訊,在必贏不可的第九局你會派哪位打者上來? : a. .750 OPS .350 avg w/RISP (皆本季,起碼 500 打席) : b. .800 OPS .250 avg w/RISP (同上) 兩數據樣本一大一小,一可靠一運氣多,選擇是很明顯的。 : 18.沒有其他資訊的話,你會想要以下哪位打者? : a. .300/.450/.600 : b. .000/1.000/.000 這大概是最能代表豆爺不死的考題了。 : 19.下列何種戰術狀況下三壘有人打帶跑是聰明的決策? : a.無人出局 : b.一人出局 這個詳細也是要去用 RE 算,但是你只知道結論那也無妨, 答案是 b。簡單的來說,a 狀況下下打跑你會讓本局的得分 期望值(超過一分的期望值)大幅下降,因此虧本。 : 20.下述打擊數據中何者最穩當(robust) (全面的價值考量) : (i.e., value-driven all-encompassing)? : a.wOBA : b.wRC+ : c.OPS : d.TB : e.OBP 這就是考你對數據如何產生以及定義了。robust 這個字雖然 有稍微念過學術的人都知道而且大概很常用,但是中文很不好 翻。答案自然是 wRC+,三圍一併考量而且加上校正。 : 21.沒有其他資訊狀況下,下面哪位球員你會先發明天必勝 : 不可的比賽? : A球員: 850 OPS, 最近 35 打席 2 安打 : B球員: 800 OPS, 最近 35 打席 13 安打 同樣的問題,這跟 17 題是一樣的。 : 22.沒有其他資訊下,你明年會請哪位球員加入球隊? : A投手: 60IP, 90K, 10BB, 3.00ERA, 0SV, 5BS : B投手: 60IP, 60K, 30BB, 2.50ERA, 20SV, 0BS : C投手: 60IP, 90K, 40BB, 2.75ERA, 50SV, 5BS 你簡單算一下防禦率和 K/BB 就知道總和來說 A 投手是最好的, SV/BS 都是解釋力奇低的數據。 : 23.以下哪一項數據可以清楚顯示某打者的 .350 打擊率是 : 該校正回歸了? : OPS : OPS+ : wOBA : BABIP : OPB : SLG 這大概是數據派最早的反直覺結論了。答案給 D。 : 24.沒有其他資訊下,哪位球員你會先發世界大賽第七戰? : A投手:2.50 FIP (例行賽200IP), 5.50 FIP (季後賽 20 IP) : B投手:4.50 FIP (例行賽200IP), 1.50 FIP (季後賽 20 IP) 你要相信兩百 ip 的結論還是 20 ip 的結論,我知道很多人要 argue 什麼疲勞啊近況啊受傷啊,題目就已經說了,沒有其他 資訊,不要再牽拖了。 : 25.下面各數據中何者最穩當(robust) (全面的價值評量 : (i.e., value-driven all-encompassing)? : WHIP : FIP : ERA : QS% : LOB% 雖然 FIP 也不是完美(事實上是離完美差很多),但是都比其他 的要高明。 : 26.是或否 一支頂尖救援投手對一隻已經有其他五個頂尖 : 救援投手的球隊比較沒有價值,他對另一隻天分相同但僅有 : 一支頂尖救援投手的球隊比較有價值(假設兩支球隊都用 : 五人輪值每人平均每場都投五局) : 是:因為第一支球隊沒有那麼多高槓桿/關鍵局數分給救援 : 投手 : 否:頂尖牛棚永遠不嫌多,而且第一支球隊可能會有傷兵。 這題基本上考一個觀念,situational 的資訊除了特例或者少數 狀況以外,幾乎沒有任何解釋力或者價值,高槓桿局數/情勢 的出現是一種貝式的產物,你很難「事先安排」答案選否。 不過這題蘿蔔汁鐵定不會答錯「啊本隊不是永遠都是牛不夠多....」 不過如果他是問這樣一個五頭牛和一個同樣 2WAR 的野手的 話,那麼你就要思考一下了,答案要選野手。因為防守有最低 值為零,但進攻沒有最大值。 : 27.無其他資訊下,五戰三勝的季後賽你比較想對到誰? : A. 例行賽 98-64,例行賽對戰本隊 1 勝 5 敗 : B. 例行賽 92-70,例行賽對戰本隊 6 勝 0 敗 98 vs 92 勝這種差距太小,沒有解釋力(區間實力的差別 很容易就可以讓結果扭曲,當然現在賽程重排好多了), 你不放心的話還可以上網找個 two-proportional test calculator 簡單算一下。大數字沒有用自然是用小的, 而且對戰成績你真的亂做用無母數的話還會得到顯著.... : 28.一位 23 歲的新秀投手在 5 場大聯盟等級先發中繳出 : ERA 1.50 的成績,沒有其他資訊下,你認為該投手明年 : 大聯盟最有可能的成績會 : 是? : 1.00 ERA : 1.50 ERA : 2.00 ERA : 2.50 ERA : 2.75 ERA : 3.00 ERA 5 場球是沒有什麼解釋能力的(當然這個門檻在那裡很難說, 但他當然也不會考你這個,反正 5 場顯然過小),他明年的 成績「在沒有其他資訊下」(很重要我們再說三次)自然最 可能的落點自然是聯盟平均,聯盟平均是多少?不知道沒關係, 反正一定超過 3,選 3.00 就對了。 : 29.你認為球員逃脫權(opt-out)對球員有利,還是對球隊有利, : 還是雙方都有利? : A. 對球員有利 : B. 對球隊有利 : C. 雙方都有利 當然是對球員有利,不然為什麼要有 team-option, 還有 dual-option? : 原文: : https://www.reddit.com/r/baseball/comments/16w6hy6/ : i_applied_for_a_baseball_operations_job_with_the/ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 47.151.240.39 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Dodgers/M.1696273019.A.FDD.html

10/03 08:34, 7月前 , 1F
太強了@@...很多都不會XD
10/03 08:34, 1F

10/03 11:57, 7月前 , 2F
這次流出的試題真的很有趣 可以研究一陣子
10/03 11:57, 2F

10/03 23:09, 7月前 , 3F
有趣 感謝分享
10/03 23:09, 3F

10/04 20:19, 7月前 , 4F
推個
10/04 20:19, 4F

10/04 20:52, 7月前 , 5F
10/04 20:52, 5F
文章代碼(AID): #1b6n9x_T (Dodgers)
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
文章代碼(AID): #1b6n9x_T (Dodgers)