[轉載] 打擊率其實是棒球比賽中最沒用的數據?

看板BaseballXXXX作者 (近鉄バファローズ魂不滅)時間2小時前 (2025/10/28 16:19), 編輯推噓12(13117)
留言31則, 20人參與, 1小時前最新討論串1/1
轉文自:https://www.ctee.com.tw/news/20240609700004-431001 《聰明看棒球》書摘精選 工商時報 聰明看棒球:賽伯計量學如何打破舊思維,改變棒球傳統文化 Smart Baseball: The Story Behind the Old Stats That Are Ruining the Game, the New Ones That Are Running It, and the Right Way to Think About Baseball 棒球的語言,是圍繞著其一些最基本的數據所建立起來的。打擊率(Batting Average, 簡稱BA),簡單把打者紀錄裡的安打數除以打數,是棒球裡討論「打擊王」的基礎。所謂 「打擊王」,就是一個聯盟裡打擊率最高的選手。打者退休時,我們會去數他拿到過幾次 打擊王,然後拿去跟其他拿過打擊王的選手相比,看誰次數多。比起生涯打擊率「只」有 二成九九的選手,我們會格外敬重「生涯打擊率三成的打者」,彷彿他們晉身到了某種更 高維度的存在。但打擊王的頭銜與那背後的數據,其實都有事情沒有告訴我們,也都沒有 讓我們看到該打者表現的全貌。 我們可以來看看這些名人堂球員的銘刻上,都是怎麼說的: 一名手持球棒的匠人,其日復一日對卓越的追尋,成果是生涯打擊率三成三八,生涯累積 三千一百四十一支安打,以及平國家聯盟紀錄的八次打擊王 節錄自東尼.葛溫( Tony Gwynn)的名人堂銘刻 五次打擊王,並在上壘率與被故意四壞球保送次數上都曾六度領先全聯盟 節錄自威 德.伯格斯(Wade Boggs)的名人堂銘刻 十二次在美國聯盟打擊率上排名第一 節錄自泰.柯布(Ty Cobb)的名人堂銘刻 這些球員的成就偉大歸偉大,但他們在古柏鎮(Cooperstown,名人堂在紐約州的所在地 )受到的禮遇忽略了一個很關鍵的問題:光是在打擊率這個漏洞百出又有失完整的數據上 排名第一,某人就值得被認為是全聯盟最厲害的打者嗎?如果其實有人比你打得更好,那 你還應該被稱為是「打擊王」嗎? 從有打者把棒子揮向棒球以來,打擊率就一直在一堆打者統計數據中萬人之上。一般認為 是英裔美籍統計學者亨利.查德維克(Henry Chadwick)在十九世紀晚期創造出了打擊率 (跟一干常見的棒球數據),而他當時的設計參考了板球版本的打擊率,也就是把打者的 得分除以其出局次數。十九世紀的棒球近似今日的棒球,但有幾點顯著的差異,像是有段 期間打者可以按自己的心意,告訴投手該往哪兒投,或是有些時期保送不是「四」壞球, 打者因為好球出局也不是「三」振,而是各有其他的數字。在十九世紀,過大牆的全壘打 少之又少(以一八九五年為例,那年國家聯盟的全壘打王也就打了十八轟),畢竟大多數 打者都只求把球打進場內。所以在當時,查德維克的想法有其優點:在打者鮮少被保送且 一心要打中球的狀況下,安打數除以打數或許確實能挺好地反映出攻擊者的表現。 時至今日,打擊率也不能說是一無是處,但其價值確實受限了很多;打擊率的主要問題出 在它太出鋒頭。如果打擊率可以安於二線統計的職責,只去傳達少量的資訊,而不去主張 自己是那個無所不是也無所不包的終極打擊數據,那也許它就不會被雷達捕捉到,也就不 會成為傳統派或數據派重點關注的對象。 啊,但你一旦宣稱自己是數據中的萬王之王,但又沒辦法拿出實績來的時候,我就看不下 去了。就像圈內的分析師與棒球高階主管們也都在發出不平之鳴,畢竟他們如今都已體認 到那些打擊率宣稱可以但未曾提供的資訊,都有其他更完整、更無漏洞的統計數據可以幫 忙。所以即便我們還在為「贏得打擊王」的選手鼓掌,也還在因為某人的打擊率最高就說 他是「聯盟中最強的打者」,但其實打擊率這個數據本身已經失寵了二十個年頭,而且其 衰落的速度只會繼續增快。 這段歷史讀來或許讓人嘖嘖稱奇,但我們真正該聚焦的是打擊率究竟告訴了我們什麼東西 。打擊率是國小三年級水準的數學,把打者的安打數調出來,除以該打者的打數,然後四 捨五入到小數點後面三位數,這就是打擊率。而雖然在小樣本裡打擊率可以低到0.000, 高到1.000,但在現代棒球裡,典型的打擊率一般會落在0.200到0.400區間。在從二○一 一到二○一五的五年當中,沒有哪個有資格獲得打擊王的球員打擊率高過三成五,甚至突 破三成四的人也只有兩個(荷西.奧圖維〔Jose Altuve〕一回,米格爾.卡布雷拉〔 Miguel Cabrera〕兩回)。 你是否注意到了上面這句話裡,有個地方怪怪的─什麼叫「有資格」獲得打擊王?這話要 從打擊率是一種比率說起,比率的意思就是要有分子跟分母(以打擊率而言分子是安打數 ,分母則是打數),大聯盟為個人獎項的得獎者都設定了競爭資格的門檻,以打擊率而言 ,門檻就是所屬球隊出賽一場,你平均要獲得算是很合理的三.一個打席數。由於大部分 球隊整季都會打一百六十二場比賽,所以打者必須累積到五百零三個打席數,才能在打擊 王競逐中榜上有名,不管是不是第一名。 好喔,但我們剛剛一直聊的不是打數嗎?怎麼這會兒又冒出來一個打席數?的確,這種掛 羊頭賣狗肉的做法暴露出了打擊率的第一個重大瑕疵。打擊率無法告訴你打者多久能打出 一支安打,它只能告訴你打者在排除掉他「選到保送、挨觸身球、打出高飛犧牲打、犧牲 觸擊成功,或是因為捕手妨礙打擊而上壘」以外的時候,多久能打出一支安打。以上這些 狀況都不計打數,但要計打席數。(其中前三樣會納入上壘率的計算,而上壘率作為一項 極具價值的數據,本書會在後頭專章討論。) 所以打擊率為什麼要無視這些不是安打或不是單純出局的事件呢?要知道在極端的狀況下 ,這些事件可以占到一名選手超過三分之一的打席數。(貝瑞.邦茲〔Barry Bonds〕就 曾兩度締造這種紀錄,二○○二到二○○四年各一次,同時他也是史上唯一一個打席數比 打數高出過百分之五十以上的大聯盟球員。)關於這個問題的答案嗯,滿分的解釋還 真不存在。我前面已經提到過了最可能的理論,那就是當查德維克創造出打擊率的時候, 這些被排除的事件都還非常罕見,或是單純不被認為會涉及打者的技術或努力,所以查德 維克便索性選擇忽視這些事件。光是這點,就可以讓你了解何以純用打擊率,或甚至以打 擊率為主去評估打者的表現,會疏漏太多關鍵的資訊。把打者用重要的選球能力拗到的保 送排除在分子外(讓分子只有安打數),也排除在分母外(讓分母只有打數),將讓你看 不到打者全季表現的完整面貌。 不過打擊率的罪過還不只是選擇性忽視而已。打擊率的分子部分還有你所不知的缺陷,主 要是這個完全由安打數構成的分子對所有的安打都一視同仁,不論你是一壘安打還是全壘 打,在打擊率的計算中都有著一樣的權重,即使我們都知道一壘安打跟全壘打在比賽中的 分量有多麼不同。 所以關於打者在某段時間內的表現,打擊率實際上告訴了我們什麼?它告訴了我們打者在 沒被四壞保送、沒被觸身保送、沒打出高飛犧牲打或犧牲短打,乃至於沒發生其他不計打 數的罕見狀況時,其剩下的打席數有多常打出安打;它只告訴了我們打者打出了一些安打 ,但沒告訴我們他都打了些什麼樣的安打。(所以才會有那句,當打者靠著軟弱內野安打 上到一壘後聽到的棒球金句:「鳥安也是安打。」)這明明是個不好的傳統,但卻在糾纏 我們長達一百多年後,仍舊在我們討論跟評價打者時帶有其不該帶有的重要性,尤其是我 們會因此高估聯盟打擊率的領先者,只因為我們會說他們「贏得了」某種頭銜。我們容易 受到混淆,是因為高打擊率的打者普遍來講也是好打者,這點無庸置疑;我們從打擊率處 獲得的並不都是假訊息,但我們會受到打擊率之假精度的誤導,我們會以為打擊率精準到 小數點後面三位數,就足以讓我們總結出對某個球員的判斷。而想完整了解打擊率的缺陷 大到什麼程度,我們可以將之拿來跟其他更完備的數據比較。 我會常在這本書裡用上的一個基本統計工具,名為相關分析(correlation analysis), 意思是我會把兩欄資料放在一起對比,然後得出一個數字在零與一之間,重點是這個數字 會讓我們知道這兩欄資料的相關性強弱,而讀者可以將之理解為這兩欄資料亦步亦趨的程 度高低,零代表兩欄資料毫無相關性,一則代表兩欄資料完美相關。基本上這個數字愈大 ,兩組數據的相關性就愈強,意即當A數據變動時,B數據也會跟著變動。但這並不代表A 造成了B或B引發了A;你應該聽人說過「相關性並不能證明因果關係」,因為相關分析能 夠告訴我們的,只是兩組統計數據間看不看得出某種關係。兩組數據之間的相關性背後可 能是直接的因果,也可能純屬巧合,但總之這項工具能讓我們知道的,就只有兩個數據亦 步亦趨的程度高低。在本書裡,我會經常在提及兩組數據的相關性時表示是其中一個數據 「預測」了另外一個。 -- 2001年大阪近鉄バファローズ 投手陣 1.パウエル RP: 盛田幸妃   大村直之 2.岩隈久志 三澤興一 ローズ 礒部公一 3.バーグマン 愛敬尚史     ギルバード  水口榮二 4.前川勝彥 關口伊織 中村紀洋 吉岡雄二 5.高村祐 岡本晃 的山哲也 DH: 川口憲史 6.門倉健 CP: 大塚晶文 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.15.48.205 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/BaseballXXXX/M.1761639540.A.32E.html

10/28 16:20, 2小時前 , 1F
大師表示:
10/28 16:20, 1F

10/28 16:23, 2小時前 , 2F
勝投感覺更廢一點
10/28 16:23, 2F

10/28 16:23, 2小時前 , 3F
勝投才是最無用的+1
10/28 16:23, 3F

10/28 16:24, 2小時前 , 4F
因為勝投可以用做的
10/28 16:24, 4F

10/28 16:25, 2小時前 , 5F
還在打擊率文章 就有其他數據可以分析了
10/28 16:25, 5F

10/28 16:31, 2小時前 , 6F
勝投+1 打擊率再怎樣都還是擊出安打的機率,不會到無用
10/28 16:31, 6F

10/28 16:35, 2小時前 , 7F
應該說打擊率的定義扣掉太多事件,真的要看一個打者
10/28 16:35, 7F

10/28 16:35, 2小時前 , 8F
的綜合實力應該先看上壘率,但有的打者雖然有選球眼
10/28 16:35, 8F

10/28 16:35, 2小時前 , 9F
但不一定能對付高階變化球,所以打擊率還是有參考價
10/28 16:35, 9F

10/28 16:35, 2小時前 , 10F
10/28 16:35, 10F

10/28 16:35, 2小時前 , 11F
最沒用的應該還是勝投,然後救援成功也是
10/28 16:35, 11F

10/28 16:36, 2小時前 , 12F
打擊率怎樣都是你數據的基礎
10/28 16:36, 12F

10/28 16:41, 2小時前 , 13F
覺得可以討論要不要重視 但絕對不到最沒用的數據
10/28 16:41, 13F

10/28 16:46, 2小時前 , 14F
不會最沒用吧 擊出安打的機率
10/28 16:46, 14F

10/28 16:47, 2小時前 , 15F
陳金鋒表示不同意,現代數據算法才不準呢
10/28 16:47, 15F

10/28 16:48, 2小時前 , 16F
打點?
10/28 16:48, 16F

10/28 16:48, 2小時前 , 17F
不管誰怎麼說 打擊率就是轉播圖卡三圍最左邊 橫向閱讀的第
10/28 16:48, 17F

10/28 16:48, 2小時前 , 18F
一順位
10/28 16:48, 18F

10/28 16:49, 2小時前 , 19F
就看作個人能力的數據其實沒問題啊。y
10/28 16:49, 19F

10/28 16:52, 2小時前 , 20F
具體來說 就看你覺得不覺得Arraez是很好的球員
10/28 16:52, 20F

10/28 16:55, 2小時前 , 21F
勝敗投最廢
10/28 16:55, 21F

10/28 16:56, 2小時前 , 22F
救援成功也很廢
10/28 16:56, 22F

10/28 16:57, 2小時前 , 23F
打擊率其實還是很重要 是因為打擊率很難打高才會需要
10/28 16:57, 23F

10/28 16:57, 2小時前 , 24F
其他項目來輔助判斷球員的價值
10/28 16:57, 24F

10/28 17:00, 2小時前 , 25F
觸身數最沒用吧
10/28 17:00, 25F

10/28 17:29, 1小時前 , 26F
不到最沒用啦,還有其他更沒用的數據,像觸身率,而打擊率可
10/28 17:29, 26F

10/28 17:30, 1小時前 , 27F
以略推上壘率高低,而打擊率真正的價值在於「帥」,安打上壘
10/28 17:30, 27F

10/28 17:30, 1小時前 , 28F
就是比保送和觸身帥,數據是沒辦法反應帥的價值的
10/28 17:30, 28F

10/28 17:30, 1小時前 , 29F
別忘了棒球本質還是一場秀,所以「帥」還是很重要的
10/28 17:30, 29F

10/28 17:51, 1小時前 , 30F
兩成五跟三成五的大谷,同樣都55轟,那當然三成五更強
10/28 17:51, 30F

10/28 17:57, 1小時前 , 31F
安打不重要嗎?
10/28 17:57, 31F
文章代碼(AID): #1f07nqCk (BaseballXXXX)
文章代碼(AID): #1f07nqCk (BaseballXXXX)