Re: [討論]現役球員誰能進名人堂?已回收

看板NBA (美國籃球)作者 (いい天気!)時間12年前 (2013/12/15 02:26), 編輯推噓9(9016)
留言25則, 12人參與, 最新討論串6/6 (看更多)
※ 引述《RollingWave (Lost in the Dark)》之銘言: : 以上這幾個中 Nash 應該備這種計算法嚴重的低估了,光是兩個MVP 應該就99% 了 : KD 這種年紀就74% 只要不要出現悲劇應該都沒問題的,阿罵這種倒退應該看來是沒機 : 會了。 VC / Pau 這兩個爭議比較大,不過以King 能進,T-Mac 看來也會進的情況下 : 我想他最後也會,Pau 戒指跟聖衣加持機率應該也不錯。 : 在這後面大概最有機會的老人應該無疑是Manu, 他國際加分爆表,光是打爆夢幻隊這點 : 就加分到爆炸了。 以NBA HOF的實際投票法來推測Manu幾乎是100% 看推文一堆批鬥,不過批BR算法之前先來搞清楚一下這東西的基礎。 http://www.basketball-reference.com/about/hof_prob.html 1. 這是一個典型的分類問題,使用一些指標,將樣本來分類, 這邊的類別就是"進名人堂"跟"沒進"兩種,BR使用Logistic Regression, 以過去球員的樣本是否進入名人堂,來評估未來的球員進入名人堂的機率。 2. 他們所使用的預測指標一共有七個,身高、時間指標(可忽略)、 場均得分、籃板、助攻、全明星次數、冠軍次數。 為什麼是這七個,BR沒有解釋,很明顯的可以看出沒有考量國際賽加分之類的, 因為很明顯的是,過去球員根本沒有幾個會有國際賽加分這回事, 這怎麼會有預測力? 但要以這個來批BR的算法是不切實際的,這是整個球員pool在結構性上的改變, 要得到至少在模型內有意義的結果,很難去考慮這種非常細微的因素。 3. 這七個指標的係數分別是: 身高 -0.1771 時間指標 3.1498 場均得分 0.3433 場均籃板 0.4193 場均助攻 0.3327 明星賽次數 0.5626 冠軍次數 0.9151 以Nash跟Bosh為例,兩個人都是八次全明星,得分Bosh勝, 籃板跟助攻兩人數據幾乎是互換,而可以看到助攻其實比較不值錢。 最重要的是熱火這兩連霸下去自然Bosh佔上非常大的優勢。 再者,這裡使用的是場均數據,Nash在生涯末期、Bosh在當打之年, 場均系列的數據Bosh未來只會下修,看看明星賽跟冠軍的累積是否能彌補下去。 而長年得到的累計數據,則沒有被考慮到,原因可能與第4點有關。 推文有人說KD現在就有N%了以後應該也會進, 這是沒有考慮到這個算法可能favor壯年期球員的現實所造成的誤解, 因為這可能會往下降。 4. 傳統上都會覺得有拿MVP就是穩進。那為什麼BR居然沒把MVP次數給放進去? 我的看法是,因為MVP這個指標放進去了,也會被場均數據給"吃掉", 意思是說,拿MVP基本上就是數據好,但是數據好不一定會拿MVP, 而數據好會進名人堂,當把數據好跟MVP這兩件事一起評估下去的時候, 會發現數據好的cover範圍比較大,MVP這個指標有解釋力太小的問題。 5. Nash這兩個MVP其實也是前述結構性上改變的一種體現,翻開NBA的MVP得主清單, Nash跟Bill Russell就是在比誰得分比較低,而綜合各種場均表現的WS/48來說, 其實也都還算在後段。 第一年拿MVP的時候,其實沒什麼異議,當年太陽62勝聯盟第一, 而MVP幾乎都是投給最佳隊伍的老大; 第二年聯盟有三支60+勝的球隊,而當年在阿罵缺陣的情況下拿下了54勝, 單純從數據上看不出來有什麼改變,但他的價值真正的被凸顯出來。 我認為這是NBA在投MVP票選時一個些微的改變, 導致過去他可能會拿不到第二個MVP,但在現在的體系下他拿到了。 那麼BR沒把MVP當指標放進去是錯的嗎?只要使用過去的資料推測未來這個信條不變, 他就沒什麼道理是錯的,因為你最多也就只能說, 用過去球員是否進名人堂的資料、無法推測現代球員是否會進, 但一旦連過去資料的價值都推翻,那我們還剩下什麼?   感覺、印象、去猜測這個球員會不會進去嗎?   BR這套做法,在結構變動的現今看起來不完美,但應該是best we can do. 與其否定這套估計方式的價值,不如就多等等這個新結構的資料開始累積, 看看"光靠國際賽殺爆夢幻隊就會進"這種斷言是否成真, 然後反過來在修正模型,才是上策。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 123.192.228.219 ※ 編輯: Yukirin 來自: 123.192.228.219 (12/15 02:28)

12/15 02:35, , 1F
的確 這計算方式對岳父不利
12/15 02:35, 1F

12/15 02:55, , 2F
但是投票的是記者 又不是單看數據或是跟以前比較....
12/15 02:55, 2F

12/15 02:58, , 3F
恩 的確也有可能因為感覺、印象得到票啊啊啊啊
12/15 02:58, 3F

12/15 02:59, , 4F
我把名人堂跟MVP搞混了 sorry 名人堂好像是小評審團
12/15 02:59, 4F

12/15 03:00, , 5F
少了MVP次數nash才會那麼低
12/15 03:00, 5F

12/15 03:13, , 6F
為什麼身高可忽略? 因為參數太小嗎?!
12/15 03:13, 6F

12/15 05:23, , 7F
這是把過去數據+進不進名人堂丟去迴歸?
12/15 05:23, 7F

12/15 05:25, , 8F
那個系數是BETA?
12/15 05:25, 8F

12/15 05:28, , 9F
我看懂了..可是我覺得這個參考價值沒有到很高..
12/15 05:28, 9F

12/15 05:59, , 10F
光是身高那就很奇怪了,身高越高機率越低(其他條件相)
12/15 05:59, 10F

12/15 06:01, , 11F
而且只考慮到平均完全不看職業生涯長短或累積數據
12/15 06:01, 11F

12/15 06:10, , 12F
感覺還蠻硬套的..
12/15 06:10, 12F

12/15 06:28, , 13F
身高低有加分 如AI ,
12/15 06:28, 13F

12/15 09:03, , 14F
可能就是最佳模型吧 身高剛好跑出顯著
12/15 09:03, 14F

12/15 09:05, , 15F
專業
12/15 09:05, 15F

12/15 09:38, , 16F
場均得分的相關性沒想像的高...
12/15 09:38, 16F

12/15 09:59, , 17F
MVP主要的價值是在貢獻度 根本不是均數據可以抹滅的
12/15 09:59, 17F

12/15 11:06, , 18F
身高的解釋力會被籃板吃掉 導致變成矮的打出一樣成績
12/15 11:06, 18F

12/15 11:06, , 19F
會加分
12/15 11:06, 19F

12/15 12:33, , 20F
場均得分的係數低是因為通常得分>>>籃板和助攻阿
12/15 12:33, 20F

12/15 12:34, , 21F
矮的打出一樣成績會加分...還是覺得蠻怪的..
12/15 12:34, 21F

12/15 12:35, , 22F
你就想AI跟老巴這種身材劣勢的反而印象更強啊
12/15 12:35, 22F

12/15 12:36, , 23F
職業生涯長短跟累計數據我猜會被明星賽次數吃掉 作
12/15 12:36, 23F

12/15 12:36, , 24F
回歸本來就很常出現係數被吃的現象 不是說他沒有影
12/15 12:36, 24F

12/15 12:37, , 25F
響力 而是這個影響力可以被其他更好的變數取代
12/15 12:37, 25F
文章代碼(AID): #1IhABTFD (NBA)
文章代碼(AID): #1IhABTFD (NBA)