Re: [討論] 統計版??

看板CMWang (王建民 - 大樹哥)作者 (ho)時間18年前 (2008/05/01 19:02), 編輯推噓4(4018)
留言22則, 4人參與, 最新討論串2/2 (看更多)
※ 引述《pctiger (ho)》之銘言: : 標題: [討論] 統計版?? : 時間: Thu May 1 01:02:40 2008 : : 這裡變統計版嗎?? : : 不過統計這個東西不就是以過去發生的事情 : 來推估可能的結果嗎?? : 而且統計中最基本的假設不就是 : 任何可能都會發生 : 所以統計結果都有一個信心水平 : 如果信心水平達到100% : 結果就是任何可能 : : = = = = = : 統計不好,說錯了鞭小力一點 : = = = = = : : 統計這種東西樣本應該是非常重要的吧 : 當樣本數夠大的時候 : 才能夠預測在相同條件下的所產生的結果 : 我想MLB的樣本應該是夠大的 : 他只是將這些變數帶入進去 : 跑出一個預測結果出來 : 在這個模式下,他有一定的可信度 : : 就像展元常常拿數據出來一樣 : 說明在以中職現有的數據下 : 壘上有人的結果 : 落後幾分下的最後結果 : : 但這只是參考 : 並不是一定會發生的 : 只是說在這個情形下最可能會發生的情形 : 也不代表未來不會發生 : 像今天九局上中信狂輸20分 : 有沒有可能會發生逆轉 : 在統計的觀點下是有可能發生的 : 但機會微乎其微 : : 補充一下 : 預測這種東西 : 只是說明在這種客觀條件下 : 最可能發生的事 : 但不一定會發生 : : 講一個比較貼近的實例 : 颱風路徑預報 : 常常有人再說氣象局預報不準 : 其實氣象局並沒有什麼過失 : 他們也是把現有數據帶下去跑過一次 : 得到的最可能情形 : 但是大家都知道 : 有好幾次預測都偏離 : 這只能說 : 數據並不夠 : 並不能說 : 統計不正確 : : = = = = = : : 我都不知道自己再說什麼了.... : : -- : ※ 發信站: 批踢踢實業坊(ptt.cc) : ◆ From: 61.229.113.205 : 推 kevin78224:補充一點 母體夠大 能夠視為常態唷 05/01 01:03 : → kevin78224:在常態分部之下 任何事情都是有可能的 05/01 01:04 : → kevin78224:信心水準 不適合100% 100%要視為點估計~"~ 05/01 01:04 : → kevin78224:IF 大聯盟平均得分 是7分 一個標準差是2分 05/01 01:05 : → kevin78224:要狂輸20分的機率是1/42.25 05/01 01:07 : → kevin78224:但 變數太多 不曉得 是不是該用無母數統計呢?? 05/01 01:08 : → kevin78224:小弟還沒修到 請其他大大來解吧 XD 05/01 01:08 : ※ 編輯: pctiger 來自: 61.229.113.205 (05/01 01:18) : → Talkman:無母數跟變數多寡無關 跟變數多寡最相關的是回歸分析 05/01 01:13 : → Talkman:還有多變量 05/01 01:13 : → Talkman:另外沒有所謂的信心水準100%... 05/01 01:14 : → JackelLee:請用中央極限定理 05/01 01:19 : → JackelLee:學過統計都知道沒有 信心水準100% 這種東西 05/01 01:20 : 推 kevin78224:100% 就是點估計了 信心水準 是用在區域估計 05/01 01:23 : → kevin78224:JACK大 所以 就要配上中央極限+柴比雪夫囉?? 05/01 01:23 : → loloool:這才是'球最有趣的地方阿 棒球也是運動中數據玩最兇的 05/01 01:40 : → flowwinds:我統計不是很好,信心水準 100% 估計區間應該蠻大的吧? 05/01 02:48 : 推 susej:請不要唬爛統計 05/01 03:23 : → susej:統計是利用已知的資訊估算未知的情形 05/01 03:23 : → susej:不一定是用過去估算未來 05/01 03:24 : → susej:點估計就是點估計,沒有所謂的信心水準 05/01 03:24 : → susej:100%信心水準的區間估計沒有意義,因為誤差範圍是無限大 05/01 03:25 : → susej:母體沒有所謂的大不大 小不小,也沒有一定是常態分配 05/01 03:25 : → susej:CLT是指母體平均數和變異數為收斂的前提,樣本數夠多,樣本平 05/01 03:25 : → susej:均數會是常態分配 05/01 03:26 : → susej:無母數統計是不考慮母體分配的統計方法,和變數多少無關 05/01 03:26 : 推 kevin78224:100%信心水準 不是=點估計了嗎?? 100%命中 05/01 08:03 : → eowa:樓上請不要任意聯想,信心水準越高,須要的估計區間就越大 05/01 08:17 : → eowa:要信心水準100%的話,等於估計區間要包含所有可能的樣本空間 05/01 08:23 : → eowa:這樣當然會100%命中,但是也沒有什麼意義 05/01 08:25 : → eowa:反過來說點估計的命中率應該是0% (就連續變數來說) 05/01 08:25 : → eowa:只猜一個點,當然不可能剛好猜中 05/01 08:26 : 推 kee32:剛好最近在修統計,推文幾乎是幫我做期末總複習哪! 05/01 09:13 : 推 kevin78224:= = 事嘛 我們教授這樣教的耶 05/01 17:40 : → kevin78224:點估計 不是100%就0% 05/01 17:41 : 推 susej:是你自己觀念不清,連定義都搞不清,而誤解教授意思吧 05/01 18:23 : → susej:信心水準是參數值在信賴區間內的機率 05/01 18:24 : → susej:單一次區間估計,參數值在信賴區間內的機率不是0就是1 05/01 18:24 : → susej:而點估計量是一個值,沒有區間範圍哪來的的信心水準 05/01 18:24 統計不好 請教一下大大吧 我自己的見解 在機率密度函數下 值域是從負無窮~正無窮 而機率密度函數的積分為1 表示100% 所以如果信心水準要達到100 表示包含所有的可能性 也就是所有的情形都會發生 信心水平100是沒意義 但是如果換個想法 也就是將信賴區間定在負無窮~正無窮 也就是包含所有可能性 信心水準是不是100? 舉個例子說明 颱風路徑 雖然不是很清楚氣象局的路徑預估信心水準有多少 但是應該是95% ---------,(颱風位置) __-- -- 虛線是未來2小時95%信心水準下的颱風可能路徑 但是如果是信心水準100% 颱風未來2小時可能路徑 --------- --- , --- --------- --------- 表示所有可能都發生 但是其他可能出現的機率 但是只有5% = = = = 回到王建民身上 大家在討論王建民的勝投數準不準 可是好像只有著重在那預估的12勝 沒有考慮到誤差範圍 如果最後的結果 沒落在那個勝投可能範圍內 是不是表示對於王建民這個樣本來說 犯了統計的第一類錯誤 也就是說王建民的結果是落在那機率不高的5%內 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.229.113.205

05/01 20:05, , 1F
你根本搞錯統計的意義了, 12勝是所謂的期望值
05/01 20:05, 1F

05/01 20:06, , 2F
(12+A, 12-A)這才是所謂的信賴區間
05/01 20:06, 2F

05/01 20:07, , 3F
信心水準越高只是拉大A的值而已
05/01 20:07, 3F

05/01 20:08, , 4F
(12-A, 12+A)
05/01 20:08, 4F

05/01 20:10, , 5F
這其實跟拿尺來量身高一樣, 尺的精確度越高, 上下誤差值越小
05/01 20:10, 5F

05/01 20:11, , 6F
預測小王勝投值不過就只是期望值,會跟期望值有差距是自然的
05/01 20:11, 6F

05/01 21:28, , 7F
信心水準是表示參數落在信賴區間的機率而已
05/01 21:28, 7F

05/01 21:30, , 8F
應該說信賴區間包含參數的機率
05/01 21:30, 8F

05/01 21:31, , 9F
例如說100% 9~15wins ...跟點估計沒關係
05/01 21:31, 9F

05/01 21:33, , 10F
信賴區間也不能自己訂
05/01 21:33, 10F

05/01 22:03, , 11F
範圍為[-∞,∞]的區間估計,信心水準都是100%
05/01 22:03, 11F

05/01 22:04, , 12F
颱風未來路線就是未來不同時間點颱風位置的點估計
05/01 22:04, 12F

05/01 22:04, , 13F
12勝是把過去的數字和假設的參數或條件下帶進估計式算出來的
05/01 22:04, 13F

05/01 22:05, , 14F
不是任何統計相關的東西都能混在一起看
05/01 22:05, 14F

05/01 22:06, , 15F
硬要把區間估計的觀點套進去看沒什麼意義
05/01 22:06, 15F

05/01 22:06, , 16F
另外你估計和檢定分不清
05/01 22:06, 16F

05/01 22:06, , 17F
目前的棒球統計對過去資料分析的參考價值遠大於對未來的預測
05/01 22:06, 17F

05/01 22:07, , 18F
因為預測未來有太多因素很難建構在模型裡
05/01 22:07, 18F

05/01 22:07, , 19F
而在太多假設的前提做出來的東西也不能要求有多準確
05/01 22:07, 19F

05/01 22:07, , 20F
我是認為預測的內容比預測結果重要
05/01 22:07, 20F

05/01 22:08, , 21F
一昧批評結果不準,不如去研究過程有什麼問題讓結果不準
05/01 22:08, 21F

05/01 23:50, , 22F
受教了
05/01 23:50, 22F
文章代碼(AID): #186QDNUF (CMWang)
討論串 (同標題文章)
本文引述了以下文章的的內容:
8
40
完整討論串 (本文為第 2 之 2 篇):
4
22
8
40
文章代碼(AID): #186QDNUF (CMWang)