Re: [閒聊] 統計學

看板BaseballXXXX作者 (大珠小珠落玉盤)時間2年前 (2023/11/28 01:57), 編輯推噓2(201)
留言3則, 2人參與, 2年前最新討論串3/3 (看更多)
※ 引述《alex8725 (近鉄バファローズ魂不滅)》之銘言: : 其實這個解讀是錯的 : 正確的解讀是 : 「多次抽樣的情況下,約有95%的抽樣結果,其正負兩個標準差的信賴區間有包含 : 真值」 這個是正確的信賴區間解讀方式沒有問題 : 你問我這兩個有什麼差?我也不知道 : 但我以前老師說絕對不能這樣解讀 : 好像是因為p-hat跟p都是真值沒有機率可言吧? 這邊就稍微有點問題了, p是一個未知母體參數所以是當成常數沒有問題。 但p_hat是p的一個估計量,也是一個統計量, 所以p_hat仍為一個隨機變數, 那既然是一個隨機變數就一定有一個機率分布, 所以信賴區間就是透過p_hat加減乘除一些東西後再造出一個統計量, 然後讓這個統計量符合某些我們已知的分布,之後再移項, 才有辦法造出統計學課本上看到的信賴區間。 那信賴區間要怎麼解讀呢? 這個問題可以參考 Introduction to Mathematical Statistics by Hogg, McKean, and Craig. 一書內所提到的解釋方式 https://imgur.com/jyBgWHC.jpg
簡單來說就是把每次抽樣、造區間都當成一次伯努力試驗, 在抽樣之前我們當然不知道抽樣後所算出來的區間到底有沒有包含p, 也就是抽樣前的區間具有隨機性, 所以在抽樣之前我們就可以說「我們抽樣前所造出來的區間包含p的機率為(1-α)」, 這邊抽樣前所造出來的區間是指統計學課本上所看到的那些公式, 就如同投擲一枚公正的硬幣, 我們在投擲硬幣前不可能知道投擲後的硬幣會出現正面還是反面, 投擲前硬幣出現的結果具有隨機性, 我們在投擲前就可以說出現正面的機率為0.5, 但一旦投擲後不是出現正面就是反面, 所以我們不會說投擲後出現正面的機率為0.5。 透過信賴區間的定義得知以上敘述是沒問題的, 即抽樣前我們造出來的區間(兩個統計量)包含p的機率為(1-α)。 這邊要注意的是我們前面提到統計量仍為一個隨機變數, 所以在抽樣之前要算機率是沒有問題的。 前面又提到我們把每次抽樣、造區間當成一次伯努力試驗, 所以重複抽樣、造區間n次可以視為服從二項分布的隨機變數, 而二項分布的期望值為 n*p (此處的p為二項分布的參數,非我們要估計的p), 因此信賴區間可以解釋成「抽樣100次,約有 100*(1-α) 個區間包含真正的母體參數p」 又或者是「我們有 (1-α)*100% 的信心說真正的p落在這個區間內」。 -- Passion Brothers https://i.imgur.com/7idT3ui.gif
-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.166.140.183 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/BaseballXXXX/M.1701107875.A.0A0.html

11/28 02:11, 2年前 , 1F
推 我考試都寫最後那個
11/28 02:11, 1F

11/28 02:13, 2年前 , 2F
乾我居然半夜在複習幾年前考研的東西
11/28 02:13, 2F

11/28 08:37, 2年前 , 3F
推 好專業!感覺機率的存在造就了推論統計的博大精深
11/28 08:37, 3F
文章代碼(AID): #1bPDYZ2W (BaseballXXXX)
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 3 之 3 篇):
2
9
文章代碼(AID): #1bPDYZ2W (BaseballXXXX)