穩定性是啥米碗糕? (Part I)

看板Sabermetrics作者 (Win Shares 痴漢)時間18年前 (2006/03/10 01:04), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/4 (看更多)
http://twbaseball.info/column.php?column_no=151 前幾天閱讀七月份 Hit 雜誌時,在中職戰報談到熊隊的部份看到這兩句話: 即使是初階球迷,也看得出來 La New 熊是一支典型的年輕球隊,當然,最欠缺的也就 是穩定。 (73頁) 連勝之後又是連敗,La New 熊隊的穩定性還要加強。 (94頁) “穩定性“是啥?這並不是個新鮮名詞,不管是看報章雜誌還是教練或球員被訪問時所 說的話,都常常把穩定性拿出來用,好像穩定性好就會戰績好,穩定性差就容易會戰績 差. 由於這三個字的意義模糊,不加以明確定義的話自然是無法用數據來探討的。按照 我的經驗,一般人講到穩定性時,通常有三種可能的意義: 1. 球隊之勝敗紀錄:常常連續好幾勝然後連續好幾敗是為不穩定. 前文所引用之 page 94 頁那句話可代表之。 2. 球隊之得失分紀錄:常常連續好幾局不得(失)分然後又一下子得(失)一堆分數是為不 穩定。 3. 個別球員之攻守紀錄:以打者為例,常常一場打個三四安打然後又好幾場打不出來是 為不穩定。 由於這三者意義相差甚多,在本文中將先探討第一種意義:勝敗紀錄。 首先我們必須知道,會連勝然後連敗然後又連勝如此循環的球隊跟穩定性未必有任何關 係。如果連續丟一枚正反面出線機率都是五成的銅板二十次,結果可能是: 正正反反反反正正反反反正正正反正正反反反 (亂數模擬結果) 如果把正面當成勝,反面當成敗,那意思就是說這枚銅板一樣也會出現連勝與連敗。但 這枚銅板的“穩定性“如何?如果“穩定性“是指球隊整體獲勝的能力,也就可以大略 用銅板出現正面的機率來代表。(當然,現實生活中,這還跟對手的銅板長怎樣有關, 也就是比較像是在玩西八辣,所以這個模型已被簡化了很多。不過概念是不變的,較複 雜的模型一樣可以藉由模擬來比較。)那麼銅板的穩定性當然是最好的,不管是第幾次 丟,都是五成五成機會。 那麼實際上的球隊又是如何呢? 以熊隊上半季為例,勝敗紀錄依序是:(這裡忽略和局以便處理) L、L、W、W、L、L、L、L、W、L、W、W、L、L、L、L、L、W、L、W、L、L、L、L、L、W 、L、L、W、L、L、W、L、L、L、W、W、W、W、W、W、L、L、L、L、L、L、L 共16勝32敗 既然要觀察連勝連敗,我們將連續的 W 還有連續的 L 改寫成以下的格式: L2、W2、L4、W1、L1、W2、L5、W1、L1、W1、L5、W1、L2、W1、L2、W1、L3、W6、L7 意義就是先連敗兩場,然後連勝兩場,然後連敗四場,以此類推。所以在這 48 場比賽 中,熊隊一共有 19 個連勝或連敗,而平均每個連勝或連敗的長度是 (2+2+4+1+...+3+6+7)/19 = 2.53 另一方面,假設現在另有一支球隊,獲勝機率與熊隊上半季的勝率完全相同,每場都是 1/3 的機會贏,我們用一個正面出現機率 1/3 的銅板來模擬,連丟 48 次,代表 48 場 比賽,然後紀錄下來連勝連敗的次數以及平均長度。 以丟銅板的觀點來說,如果熊隊勝敗紀錄穩定性不足,傾向於持續連勝連敗的話,那麼 熊隊的平均連勝或連敗長度就會比銅板的連續正面或連續反面長度要來得更長;相對的 ,熊隊的連勝或連敗次數就會比銅板的連續正面或連續反面次數要來得更少。 當然,只拿銅板連丟個 48 次然後來跟熊隊戰績做比較變數太大,只模擬一次在統計上 的意義不大,所以我模擬了 1000 個半季,也就是 1000 次 48 場比賽,分別記錄下次 數以及長度,最後加以平均。除了考慮熊隊,也對其他隊作相同的處理,每支隊伍對應 到一個正面機率等於該球隊上半季勝率的銅板,然後各模擬 1000 個半季。結果相當有 趣: 實際結果 模擬結果 Games Wins Str StL Wins Str StL 兄弟 48 25 25 1.92 25.07 24.54 2.00 統一 50 24 26 1.92 23.99 25.80 2.02 興農 48 28 23 2.09 27.95 24.07 2.04 中信 48 24 24 2.00 23.94 24.42 2.01 誠泰 48 28 21 2.29 28.01 23.91 2.06 La New 48 16 19 2.53 15.95 21.86 2.26 Str = Streaks = 連勝或連敗的次數 StL = Streak Lengths = 連勝或連敗的平均長度 由於模擬的球季數相當多,每支球隊實際的勝場數跟模擬出來 1000 個球季的平均勝場 數幾乎一樣,這沒啥新鮮的。重點來了,如果我們觀察每支球隊的實際與模擬的連勝連 敗次數及長度,可以發現: 兄弟、統一、興農,和中信四支隊伍幾乎沒差,次數跟長度誤差頂多就只有 5% 上下。 雖然誠泰與 La New 都有明顯地有較少以及更長的連勝連敗,不過這兩支隊伍的情況大 不相同。誠泰之球季初期受中本以及兩名日投的影響,戰績低迷不振,而在林恩宇入隊 以及啟用馬力歐之後煥然一新。用 48 場比賽都是固定正面機率的銅板來模擬誠泰隊結 果得到這麼大的差距很可能原因就在於此。 至於 La New,我找不到什麼好理由了。所以 Hit 雜誌中的那兩句話的確有些道理。 而穩定性跟會不會奪冠軍有啥關係?如果只看連勝連敗的紀錄,在上面的這種解釋之下 ,即將爭奪上半季冠軍的興農跟第五名的統一在這方面的“穩定性“沒啥差別。另一支 要爭冠的誠泰隊和一直墊底的 La New 熊隊的穩定性也沒啥差別。一支勝率百分百的球 隊跟一支贏不了球的球隊有相同的穩定性。用數學來說的話,如果把這兩支球隊的勝率 變化曲線畫在座標平面上,則畫出來的都是一條水平線。有比贏不了球的球隊更穩定的 球隊嗎?所以, 別把一支球隊的獲勝的機率跟穩定性混為一談。球隊戰力比較穩定不會讓你多贏球,球 隊戰力強才會。 -- Win Shares (暫譯勝場貢獻指數) 是由棒球統計魔人 Bill James (現任紅襪隊 Senior Advisor, Baseball Operations) 所提出用來衡量棒球選手攻守整體價值的一套系統, 我 將原公式作了些許的調整與取捨, 以用來計算中華職棒史的球員排名. 相關文章放在 ptt BBS 站 CPBL板精華區以及台灣棒球資訊網專欄區 http://twbaseball.info/column_alist.php?editer_no=21 歡迎來信指教 ^^ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 69.162.28.246
文章代碼(AID): #144607KA (Sabermetrics)
文章代碼(AID): #144607KA (Sabermetrics)