[專欄] 關於EPM改版

看板NBA (美國籃球)作者 (帽子裡的兔子)時間2小時前 (2024/11/20 15:03), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/1
https://reurl.cc/lNVzxj 作者:籃圈即是原點 每天都刷BBE的朋友可能已經發現了,BBE首頁的一體化數據頁面做了一些小調整,主要是 為了應對這賽季EPM的徹底改版。 EPM在這賽季的早些時候上了個全新的版本,這次變化不是簡單的算法優化更新,而是讓E PM完全變成了另一個數據。過去的單賽季EPM是根據當賽季數據計算的球員賽季表現。根 據作者的意圖,它既是一種面向未來的前瞻性數據,也是一種對當賽季已經完成了的比賽 中球員表現的解釋性或者總結性數據,但是新EPM則是完全的前瞻性數據,提供一種近未 來的球員表現預測。 新EPM的含義和思路基本上和Kostya Medvedovsky創建的DARKO一致。之前我聊過一次幾個 常見一體化數據的對比,當時單獨撇開了DARKO系統中的DPM,就是因為DARKO是思路最特 殊,意圖也完全不同的數據。新EPM和DARKO都采用了機器學習,並且根據球員整個職業生 涯到目前為止的表現,來估算當下這個時間節點下,球員在下一場比賽最有可能打出的表 現,所以他們都是每日滾動更新的。 在DARKO系統中,最核心的其實是對球員面板數據的預測,DPM反倒是個順便產生的數據, 它最初的目的在於回答「當一個球員打出了某種數據,我們該認為這是隨機性帶來的噪音 ,還是具有長期意義的水平變化」這個問題。它把球員整個職業生涯的數據都納入計算範 圍,並且給每一項數據設置了一個在0-1之間的參數,並附帶一個和時間軸相關的指數模 型,即越近的比賽在計算中會擁有越高的權重。不同的數據項目會有不同的參數來應對這 項數據本身的穩定性,比如三分命中率遠期數據權重就會比籃下命中率的要高,因為三分 命中率本身的隨機性更大,長期表現更可靠。 DARKP和新EPM通過這種方式把球員的進步或衰退動態地體現在數據中,獲得更好的預測效 果。所以,如果一個球員在新賽季開賽後有一個爆發式的進步,模型在一開始並不會立刻 反映這一點,而是會基於生涯數據對這種進步只給出謹慎地評估,但隨著賽季的進行,球 員持續保持這種水平,近期的比賽數據就會把它視作長期的水平變化反映在預測系統中。 例如Garland在開賽首周後的O-EPM只有+0.8,更接近於它上賽季的表現,兩周後就上升到 了+1.8,現在上升到了+2.8。在舊EPM,LEBRON等xRAPM數據,包括基於面板數據計算的BP M,PIPM等一體化數據中,我們在賽季初期可能會看到一些很誇張的數值,之後才會因為 樣本增大,數據逐漸趨向穩定(所以他們經常要開賽一兩個月後才公布,BPM的小樣本爆 炸則很容易看到)。 與DARKO的面板數據預測一樣,伴隨新EPM一起上線了Estimated Skills系統,它也給出了 球員面板數據的預測,我個人不玩FBA,不知道DARKO和EPM的這種預測對玩FBA有沒有幫助 ,但DARKO的作者聲稱它的系統在FBA遊戲中的預測表現很不粗,至少肯定強於此前市面上 一些網站的表現。 EPM的這次更新對很多pvp玩家來說,價值暴跌,畢竟不再是單賽季的表現綜述了,對線的 時候用起來很不方便,描述本賽季表現得時候並不合適,之前發開賽影響力數據圖得時候 我也用了LEBRON而不是新EPM。不過無論是新EPM還是DARKO本身仍然是非常有價值的,NBA 業內人士有不少也都認可DARKO這種思路,EPM現在也往這個方向上走,或許正說明了這是 一體化數據未來發展的趨勢,所以BBE就借這個機會也把這兩項擺上去方便大家看。比較 遺憾是這類數據的動態變化部分BBE的框架沒法展示。 最近因為更新,可能會連帶出一些bug,有遇到的話可以給我留言或者私信。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.84.233 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/NBA/M.1732086229.A.F7C.html
文章代碼(AID): #1dFOdLzy (NBA)
文章代碼(AID): #1dFOdLzy (NBA)