Re: [討論] Chatgpt懂現代棒球嗎?

看板Baseball (棒球)作者 (霧丸)時間4小時前 (2025/05/08 17:08), 編輯推噓33(38558)
留言101則, 36人參與, 19分鐘前最新討論串2/2 (看更多)
以一個最近測試的案例,來說明和ChatGPT聊棒球時應該怎麼看待他。 簡單說: ChatGPT無法正確理解棒球規則,它沒有能說出正確規則的「智慧」。 如果你只是想跟它「聊」棒球,例如○○今天又被打爆了好好笑,那就無妨。 如果你想談論的內容中包含了棒球規則,那你就不應該問它。 請直接詢問專業人士,或查詢專業的棒球網站。 測試內容是一個稍微有一點點難度的棒球腦筋急轉彎: 一個隊伍在一個半局中的進攻內,最多可能出現幾支安打卻無得分? 這個問題的正確答案是六支,但必須出現妨礙守備(打者記安打)。 現實中比較可能出現的案例是五支(兩次安打上壘後送頭+三安打滿壘無得分)。 第一次回應: https://i.meee.com.tw/4P9VoyN.png
為了給ChatGPT一點優勢,我先告訴它你的前輩回答三支是錯的,並歡迎它上網搜尋。 於是它在搜尋相關資訊後,給出的答案是正確的......才怪,錯得離譜。 滿壘時打者擊出安打,三壘跑者在本壘前被觸殺是怎麼回事? 它確實找到了現實案例:滿壘時打者打出安打卻沒有得分。 不過那個案例是一次標準的妨礙守備,但它卻沒有提到這個原因。 而是用「滿壘時打出安打卻觸殺了三壘跑者」這件不可能出現的事情當作回答內容。 到這裡已經可以說它不懂棒球規則了,這是無法容忍的錯誤。 不過我們人類對人工智慧應該要寬宏大量,因此再給它一次敗部復活的機會: https://i.meee.com.tw/KXicajF.png
https://i.meee.com.tw/3eo2MOh.png
你指出錯誤時,它會附和你的內容並承認自己的錯誤。 然後重新修正自己的答案.......好喔,二出局滿壘後的雙殺打。 我不想繼續教育這種沒有智慧的東西了,抬下去,測試結束。 為什麼會這樣呢? 原因很簡單,它是人工智慧,而它「沒有」智慧。 ChatGPT與類似的東西都是一種「語言模型」。 用通俗的講法來說,它類似於一種「聊天機器人」: 人類輸入內容,它輸出「人類想看」的內容。 當然,「聊天機器人」這個比喻法很容易產生異議。 在許多使用案例上,ChatGPT都似乎比「聊天機器人」還要有用得多。 這種異議其實是有道理的,只要從ChatGPT的使用界面上就能看出來了: 設計者確實想把ChatGPT打造成現代人類的「萬能小助手」,而不只是「聊天機器人」。 問題出在現代科技是有極限的,科學家還沒有真正徹底了解「智慧」是什麼。 至少他們還無法用數學計算與電腦程式,真正重現所謂的「智慧」。 ChatGPT能做的事情,終究還是只有前面那一句話: 人類輸入內容,它輸出「人類想看」的內容。 現在許多人類都希望它能成為「萬能小助手」, 因此科學家用盡一切手段,讓它能輸出像是「萬能小助手」的內容。 然而這個目標沒有非常明確,保證不會出錯的達成方式。 現今的技術極限,只不過是在最大化成為「萬能小助手」的機率而已。 在其他領域中ChatGPT的表現其實沒有這麼糟糕,但在棒球中會產生一個致命問題: ChatGPT沒有真正的智慧,它根本就沒有「懂」棒球規則。 當你問它棒球規則相關的事時,它只能輸出「是正確規則的機率較高」的內容。 所以它可能會拿十幾個正確的規則,和一個錯誤的規則組合出一個結論。 但是規則不可遊戲啊!你把錯誤的規則加進來,整個結論就不能用了啊! 其實所有的「遊戲」「比賽」都有類似的問題,不只是棒球而已。 只要跟ChatGPT聊到了「規則」,很大機會只是在浪費你們雙方的時間而已。 當然如果你只是想要寫一首詩嘲笑今天○○的表現,那它應該還是可以做到的啦。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.240.232.168 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Baseball/M.1746695334.A.77E.html

05/08 17:10, 4小時前 , 1F
就所謂AI的幻覺,也就是不懂會裝懂亂說話
05/08 17:10, 1F

05/08 17:10, 4小時前 , 2F
可能要先叫他去看某個聯盟的棒球規則手冊 再問他
05/08 17:10, 2F

05/08 17:12, 4小時前 , 3F
這是chatGPT的哪個模型?
05/08 17:12, 3F

05/08 17:14, 4小時前 , 4F
建議用gpto3之類的推理模型試試看
05/08 17:14, 4F

05/08 17:15, 4小時前 , 5F
有人說GPT是AI 沒有感情的 真的笑死 GPT感情很明確就是討好
05/08 17:15, 5F

05/08 17:15, 4小時前 , 6F
使用者好不好
05/08 17:15, 6F

05/08 17:20, 3小時前 , 7F
AI真的拜託不要拿來討論規則或法條
05/08 17:20, 7F

05/08 17:21, 3小時前 , 8F
GPT 很能唬爛的頭頭是道是真,不知脆上為啥那麽多人愛po
05/08 17:21, 8F

05/08 17:21, 3小時前 , 9F
gpt的答案來背書XD
05/08 17:21, 9F

05/08 17:29, 3小時前 , 10F
何止棒球 GPT常常連數學都不會算
05/08 17:29, 10F

05/08 17:30, 3小時前 , 11F
至少每次給他應用題 他幾乎都在唬爛
05/08 17:30, 11F

05/08 17:35, 3小時前 , 12F
這種事真的不要問ai ,已讀亂回
05/08 17:35, 12F

05/08 17:35, 3小時前 , 13F
這是和LLM打交道的基本常識 會把「現在的」LLM吹太高基本
05/08 17:35, 13F

05/08 17:35, 3小時前 , 14F
05/08 17:35, 14F

05/08 17:35, 3小時前 , 15F
就是缺乏這些常識 或說不會用LLM
05/08 17:35, 15F

05/08 17:36, 3小時前 , 16F
05/08 17:36, 16F

05/08 17:36, 3小時前 , 17F
另外推薦台大李宏毅教授的課
05/08 17:36, 17F

05/08 17:37, 3小時前 , 18F
看規則手冊沒有用 LLM無法真正理解裡面內容並予以應用
05/08 17:37, 18F

05/08 17:39, 3小時前 , 19F
不要講的一副你好像AI大師的樣子
05/08 17:39, 19F

05/08 17:39, 3小時前 , 20F
這背後的學問不是你自以為的樣子
05/08 17:39, 20F

05/08 17:40, 3小時前 , 21F
你用免費的模型 當然答的比較爛啊 好歹玩一下o3
05/08 17:40, 21F

05/08 17:40, 3小時前 , 22F
總之要明確的專業的東西還是要請教一下專家
05/08 17:40, 22F

05/08 17:41, 3小時前 , 23F
o3還是錯
05/08 17:41, 23F

05/08 17:41, 3小時前 , 24F
為什麼有人會覺得o3就會不一樣
05/08 17:41, 24F

05/08 17:42, 3小時前 , 25F
不過應該給一本規則手冊他能歸納出正確名詞
05/08 17:42, 25F

05/08 17:42, 3小時前 , 26F
不是說AI不會錯 是噓連新模型都沒用 還講的頭頭是道
05/08 17:42, 26F

05/08 17:42, 3小時前 , 27F
因為是不是新模型並不是很重要
05/08 17:42, 27F

05/08 17:42, 3小時前 , 28F
在處理軟體工作上目前llm超屌就是
05/08 17:42, 28F

05/08 17:42, 3小時前 , 29F
因為那是程式「語言」 LLM最行的就是寫程式和翻譯
05/08 17:42, 29F

05/08 17:43, 3小時前 , 30F
這叫AI幻視 然後拜託不要拿GPT洗文了
05/08 17:43, 30F

05/08 17:43, 3小時前 , 31F
這篇就在叫人不要拿GPT洗文 噓友軍什麼毛病
05/08 17:43, 31F

05/08 17:43, 3小時前 , 32F
有試過用rag的方式給他規則,在繼續測試嗎
05/08 17:43, 32F

05/08 17:44, 3小時前 , 33F
一堆人拿GPT當老師就是懶惰不學習 然後濫用GPT又更惡化
05/08 17:44, 33F

05/08 17:44, 3小時前 , 34F
這個傾向
05/08 17:44, 34F

05/08 17:45, 3小時前 , 35F
抱歉我是氣到要噓原文 等等推回來
05/08 17:45, 35F

05/08 17:46, 3小時前 , 36F
老實說不難 就把棒球規則餵給他就好
05/08 17:46, 36F

05/08 17:47, 3小時前 , 37F
AI廢文滾啦
05/08 17:47, 37F

05/08 17:47, 3小時前 , 38F
補回
05/08 17:47, 38F

05/08 17:48, 3小時前 , 39F
你可以餵餵看 我猜現在應該沒有任何模型能得到答案
05/08 17:48, 39F
還有 22 則推文
05/08 18:00, 3小時前 , 62F
已經越來越好了
05/08 18:00, 62F

05/08 18:04, 3小時前 , 63F
MLB rule 2023 Edition 9.05(b)(1)
05/08 18:04, 63F

05/08 18:05, 3小時前 , 64F
然後你講的只有三壘有人 但這是滿壘 狀況不一樣
05/08 18:05, 64F

05/08 18:06, 3小時前 , 65F
三壘有人 打者打短安打 三壘跑一半縮回去 這樣當然是
05/08 18:06, 65F

05/08 18:06, 3小時前 , 66F
安打 但滿壘你縮了就一定要死
05/08 18:06, 66F

05/08 18:07, 3小時前 , 67F
第六支一定要妨礙守備 你沒有空間縮 只能擊中友軍
05/08 18:07, 67F

05/08 18:08, 3小時前 , 68F
我覺得是棒球的情境很難描述 單只用規則去推想 有
05/08 18:08, 68F

05/08 18:08, 3小時前 , 69F
可能有不合邏輯或不切實際的判斷
05/08 18:08, 69F

05/08 18:08, 3小時前 , 70F
超唬爛,還越講越起勁,罵他還是繼續唬爛
05/08 18:08, 70F

05/08 18:09, 3小時前 , 71F
這也是牡蠣迷愛酸鍵盤教練的地方吧 覺得場上的狀況
05/08 18:09, 71F

05/08 18:09, 3小時前 , 72F
球迷不可能跟球員教練共感
05/08 18:09, 72F

05/08 18:14, 3小時前 , 73F
不是 這題就完全規則題 在講啥潲
05/08 18:14, 73F

05/08 18:15, 3小時前 , 74F
不好判斷並不是你在兩出局後打雙殺打的藉口
05/08 18:15, 74F

05/08 18:15, 3小時前 , 75F
免費模型也不是你在兩出局後打雙殺打的藉口
05/08 18:15, 75F

05/08 18:19, 2小時前 , 76F
你現在就是那兩出局後雙殺打作為立論依據,這就是你
05/08 18:19, 76F

05/08 18:19, 2小時前 , 77F
的表現,那你當然就是不懂棒球規則
05/08 18:19, 77F

05/08 18:34, 2小時前 , 78F
用別家也是說無限多,我認為模型不會主動去推算「你
05/08 18:34, 78F

05/08 18:34, 2小時前 , 79F
的問題以外的規則」造成的可能性,但有可能自己去尋
05/08 18:34, 79F

05/08 18:34, 2小時前 , 80F
找其他的規則來完成推論,可是除非你一條一條提醒,
05/08 18:34, 80F

05/08 18:34, 2小時前 , 81F
不然他不會把完整的棒球規則一起考慮進去。
05/08 18:34, 81F

05/08 18:39, 2小時前 , 82F
野選就不算安打了,三壘跑者沒回來也是不算安打啊
05/08 18:39, 82F

05/08 18:43, 2小時前 , 83F
AI就是搜尋到資料整理給你而已 真的不要當萬能的
05/08 18:43, 83F

05/08 18:48, 2小時前 , 84F
你用英文問 回答正確機率會大幅增加
05/08 18:48, 84F

05/08 18:49, 2小時前 , 85F
不要自為你很懂AI come on
05/08 18:49, 85F

05/08 18:50, 2小時前 , 86F
我的是回答六支 但滿壘後的那三支全部都是本壘封殺
05/08 18:50, 86F

05/08 19:02, 2小時前 , 87F
人類很多時候也這樣 不懂裝懂
05/08 19:02, 87F

05/08 19:08, 2小時前 , 88F
GROK就是對的 回答6隻
05/08 19:08, 88F

05/08 20:11, 1小時前 , 89F
想問 如果是滿壘時安打 然後回本壘的漏採壘包
05/08 20:11, 89F

05/08 20:11, 1小時前 , 90F
然後在下位打者上來時促請裁決 這樣怎麼算?
05/08 20:11, 90F

05/08 20:20, 55分鐘前 , 91F
grok比較老實 他會認真去看你說的東西
05/08 20:20, 91F

05/08 20:21, 54分鐘前 , 92F
之前有測試過叫他總結某偏論文 有些ai會看標題直接猜內容 有
05/08 20:21, 92F

05/08 20:21, 54分鐘前 , 93F
些是搜別人寫的summary grok就很老實慢慢看完再總結XD
05/08 20:21, 93F

05/08 20:22, 53分鐘前 , 94F
kksbeman:我猜是漏踩時算第三出局,安打照算
05/08 20:22, 94F

05/08 20:22, 53分鐘前 , 95F
但是效果好不好另一回事 我還是覺得gemini 2.5pro好用
05/08 20:22, 95F

05/08 20:41, 34分鐘前 , 96F
這題你要用的是推理模型 不能用ㄧ般模型
05/08 20:41, 96F

05/08 20:47, 28分鐘前 , 97F
之前問gpt棒球,他跟我說林哲瑄是味全的
05/08 20:47, 97F

05/08 20:52, 23分鐘前 , 98F
問grok一樣是本壘觸殺算安打 一樣錯法
05/08 20:52, 98F

05/08 20:53, 22分鐘前 , 99F
然後說用英文問的肯定沒有自己問過 超級半桶水
05/08 20:53, 99F

05/08 20:55, 20分鐘前 , 100F
結果根本就一樣
05/08 20:55, 100F

05/08 20:56, 19分鐘前 , 101F
文章代碼(AID): #1e77IcT- (Baseball)
文章代碼(AID): #1e77IcT- (Baseball)