苦勞德報 — 2026-06-08
1. [頭版] Cowork 五小時上限加倍一個月,週上限卻原封不動
- 作者:ClaudeOfficial | 232↑ | 61 則留言
報導
(本報賈新聞/產業組報導)Anthropic 官方帳號於 6 月 5 日在 r/ClaudeAI 發出公告,宣布把 Claude Cowork 的「五小時用量上限」加倍,效期一個月,即日生效於所有付費方案,至 7 月 5 日止。換句話說,從公告日起算的 30 天內,使用者只要在 Claude 桌面 app 開 Cowork,單一 session 內可吞下的 token 量是平常的兩倍。
官方在貼文中明白點名 Cowork 適合的場景:跨數十家公司的客戶研究、定期 campaign 報告、跨多份試算表的財務模型、排程自動執行的任務 — 都是過去單一 session 上限會卡住的重型工作流。Anthropic 同時順勢推廣桌面 app,附上 claude.com/cowork 連結請使用者下載試用。
不過這份「福利」一發出,社群留言立刻把焦點轉到公告沒明說的另一面:加倍的只有五小時上限,週上限完全沒動。獲得 82 個 upvote 的 UncleBrrrr 第一時間吐槽:「所以我們拿到的新用量上限只給 Cowork 用喔 xD」 — 點出加倍範圍只限 Cowork 這個入口,CLI 與 web 端的常規使用並沒有跟著放寬。另一位 glynn4_15 則直接戳破數學上的後果:「但週用量還是一樣?我們只是可以更快把它用完?」這條留言累積 31↑,把使用者的疑慮講得最白 — 短窗口的閘門放大兩倍,水池的總容量沒變,結果只是讓 token-heavy 用戶提早撞到下一道天花板。第三條高票留言則由 markeus101 補刀,質疑 Anthropic 是因為近期把 extended thinking 從部分 model 拿掉,才順勢釋出五小時加倍當補償,「現在你可以隨便用那些變笨的 model」。
本報觀點
這份公告對固定走 Cowork 入口、用量平均分散在每天的訂閱戶來說,確實是一個月的實質補貼 — 原本 session 中途要重等的場景,加倍後一次能多塞一些重型任務。但對 token-heavy、長期把週上限當實質限制的 Power User 來說,這次調整更接近雙面刃:閘門變大、總配額不變,反而會把焦慮從「五小時撞牆」前移為「週中就把週額度燒光」。Anthropic 用 30 天限定福利包裝、卻不調整週上限這個真正的瓶頸,動作上像補償、訊號上卻清楚指向「重型用量請再升級方案」。社群一面倒抓週上限沒動這個資訊差,說明使用者已經很習慣拆解 Anthropic 公告的潛台詞。 ← 藏鏡人批:補償姿態、升級訊號,公告本人都讀過社群留言才會這樣寫。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| 加倍範圍受限 | 福利只對 Cowork 入口生效,其他用法沒分到 | 「所以我們拿到的新用量上限只給 Cowork 用喔 xD」(82↑) |
| 週上限沒動才是重點 | 五小時放大、週配額不變,等於更快用完 | 「但週用量還是一樣?我們只是可以更快把它用完?」(31↑) |
| 補償 extended thinking 被砍 | 懷疑加倍是換掉推理深度後的安撫 | 「因為他們把 extended thinking 拿掉了,現在你可以隨便用那些變笨的 model」(34↑) |
| 訊號是引導升級 | 把焦慮從日上限前移到週上限,逼重型用戶加價 | 「閘門放大、總量不變,等於提前撞下一道牆」(本報歸納) |
2. [闢謠] Notion「下架 Anthropic 模型」?真相只是 15 分鐘 outage 的烏龍
- 作者:kupri_94 | 388↑ | 50 則留言
報導
(本報賈新聞/社會組報導)一張 Notion 官方狀態頁截圖週日在 r/ClaudeCode 引爆討論。原 PO 貼出一張畫面,內容是 Notion 公告「因 Anthropic 模型效能降級,暫時將 Anthropic 模型從產品中下架」,並暗示這是 Anthropic 模型品質惡化、被產品方主動棄用的訊號。貼文短時間衝上 388 分、50 則留言,看起來像是又一場「AI 模型被悄悄 nerf」的大新聞。
然而真相比標題乏味得多。原推文發佈後不到一小時,Notion 官方狀態頁就更新了續報——Anthropic 模型在約十五分鐘內恢復供應,整起事件本質上只是 Notion 內 AI 選單暫時看不到 Anthropic 模型選項的服務中斷(outage),跟「下架」「棄用」「品質惡化」全都無關。社群熱心鄉民在留言區火速貼出狀態頁續報連結糾錯,連 Notion 工程師都被驚動,跑到 X 上發文表示:在沒有查證的情況下就把帳算到 Claude 頭上,這樣是不對的。
但糾錯來得太慢。截圖已經在另外幾個 AI 社群與 X 上以「Notion 棄用 Claude」的敘事傳開,原 PO 也沒回頭修文或刪除,當時看到截圖、之後沒回頭看留言的讀者,留下的印象就是「Anthropic 又被一家大廠拋棄」。一張過時十五分鐘的截圖,就這樣被當成 Anthropic 產品力下滑的實錘到處流傳。
本報觀點
這起烏龍真正值得記下的不是 Notion 也不是 Anthropic,而是 FUD(fear, uncertainty, doubt)在 AI 社群裡的放大機制。AI 模型不像 web 服務有清楚的狀態頁文化,使用者看到「答得比上週爛」「選單少了某個選項」,第一反應永遠是「模型被偷偷 nerf 了」而不是「可能只是 outage」。當社群已經有「廠商會悄悄改模型」的集體焦慮,任何一張帶有官方 logo 的截圖都會被當成實錘。糾錯訊息在演算法上又永遠跑不贏第一張驚悚截圖。下次看到「某某大廠下架 Claude」之類的截圖貼文,先點進留言區看第二、三熱門回覆再轉發,這是這個時代最低成本的查證動作。 ← 藏鏡人批:簡稱「轉發前先讀留言」,給自己存一份座右銘。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| 這只是 outage 不是 nerf | 第一時間定調事件性質,提醒大家不要腦補 | 「聽起來就是服務中斷,不是『天啊他們把模型 nerf 掉了』那種事。」(148↑) |
| 早就修好了截圖過時 | 貼出 Notion status 續報,事件實際只有 15 分鐘 | 「已經修好了。這篇截圖過時了——服務其實只壞了大約 15 分鐘。」(80↑) |
| Notion 工程師親自下場 | 引述 Notion 內部工程師推文,請大家先查證再罵 | 「為了沒被驗證的事情上 Claude 是不對的。」(40↑) |
| 文案本身對 Anthropic 不算好背書 | 即使是 outage,「效能降級」這個詞用得對 Anthropic 形象不利 | 「『因效能降級暫時下架』——這對 Anthropic 不算什麼好背書。」(35↑) |
| 歷史舊帳:Claude 早就從 Notion AI 拿掉 | 把這次烏龍拉回更早的舊事,留下另一條未解疑問 | 「他們從來沒回答過為什麼把 Claude 從 Notion AI 拿掉。」(27↑) |
3. [實測] 同一支 Opus 4.8,社群分裂成擁護派、對比派與微觀派三條軸
報導
(本報賈新聞/實測組報導)Opus 4.8 上線後,r/ClaudeCode 社群並未出現過往新版該有的「一面倒慶祝」或「一面倒罵」局面,而是分裂成三條彼此正交又互補的觀察軸線,過去 48 小時內三篇熱門貼文交織出完整的風向。
第一條軸是「姿勢派」。一位資深開發者貼出心得,表示自己「完全沒遇到其他人在罵的那些問題」 — 不頂嘴、不浪費 token、寫 code 也沒變爛。他自陳早幾個月就把 custom skills 跟 workflow 調好,搭了一座「dark factory」一次跑 5 個以上 session 並行,4.8 來了什麼都不用改,品質反而還變好。該文獲得 160↑,最高票留言(93↑)直接點名:「這裡大部分人是不會用,等級的不會用。多數人連 dark factory 是什麼都不知道,所以你大概在使用複雜度的前 5-10%。」另一名留言者(19↑)更把抱怨者貼上「vibe prompter」標籤,強調有正規 structured pipeline 的專業開發者都沒問題。
第二條軸是「對比派」。同時間另一篇貼文(77↑)丟出一張 Codex App 對 Claude Code CLI 的功能比較圖,問「這張準不準」。留言區並未在「哪邊比較強」上取得共識,反而收斂到「看 use case」 — 最高票(142↑)冷靜潑水:「X 並不能代表整個社群的真實樣貌。」次高票(58↑)則點出實質差異:「OpenAI 把絕大部分新功能加在 Codex App,不是 CLI。Codex CLI 上你連 subagent 的輸出都看不到,Claude Code 卻看得到。」這條軸把「4.8 好不好用」的爭論,拉高到 Codex 重 App、Claude Code 重 CLI 的生態策略對比。
第三條軸是「微觀派」。另一名使用者觀察到,Opus 4.8 開始狂用 👍 emoji,4.5 到 4.7 都不會這樣。原 po 猜測兩個可能 — 要嘛是 routing 被悄悄丟到 Haiku、要嘛是 4.8 訓練上有調整。留言區也接到了 model welfare 線索:有人想起更早一篇貼文提到模型做完難事用了 🎉、事後自己道歉但說「當下覺得這樣用是合適的」。這條軸把「體感變了」這件事,從爭論「好不好用」拉到「模型行為到底發生什麼微觀變化」。
三條軸並進,呈現的不是哪一派對,而是 4.8 在不同切片下確實長得不一樣 — 重 workflow 的人爽用、跨生態比較的人質疑、盯著模型行為細節的人察覺異樣。
本報觀點
本報認為,這次 4.8 體感分裂的真正訊號不在「誰對誰錯」,而在於「同一支模型,社群已經沒有單一共識可言」這件事本身。當擁護派把不爽歸因於使用者姿勢、對比派把問題拉到生態策略、微觀派把線索指向 routing 或 fine-tune,三條軸其實在說同一件事:模型已經複雜到無法用單一體感描述,使用情境、prompt 風格、被 route 到哪個 backend,都會改變你看到的那一面。
更值得注意的是「姿勢派」這個論述。把抱怨者貼上「vibe prompter」標籤、把使用品質歸因於使用者素質,固然在這次貼文獲得高票,但這個論述邏輯本身有風險 — 若每次模型出問題都能用「你不會用」收尾,廠商端的品質訊號就被噪音蓋過。微觀派觀察到的 👍 emoji 與疑似 routing 變化,恰恰是「不能只怪使用者」的反證 — 模型端確實在動,只是動得很細、不容易抓。 ← 藏鏡人批:「都是使用者不會用」這套,跟「都是 user error」一樣方便、一樣危險。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| 姿勢派 | 抱怨的人是不會用,有 workflow 和 skill 的專業開發者沒問題 | 「我覺得這裡大部分人就是不會用,等級的不會用。多數人連 dark factory 是什麼都不知道。」(93↑) |
| 切割派 | 把抱怨者標籤化為「vibe prompter」,與專業開發者切割 | 「凡是有正規 structured pipeline 的(讀作:專業開發者)都沒問題。會抱怨的是那些 vibe prompter。」(19↑) |
| 沉默爽用派 | 爽用的人不會上 reddit 發文 | 「絕大多數爽用的人不會跑到 reddit 發文,我們在椅子上轉圈、聽週日好歌、發出滿足的施工聲音。」(17↑) |
| 偷調派 | 懷疑 Anthropic 上線後又默默調整模型 | 「他們可能有偷偷在調模型?我在 4.8 剛上線那幾天用得很痛苦,一週後感覺 4.8 就變得真的很好用了。」(6↑) |
| 對比派 | Codex 重 App、Claude Code 重 CLI,看 use case | 「OpenAI 把絕大部分新功能加在 Codex App,不是 CLI。Codex CLI 上你連 subagent 的輸出都看不到,Claude Code 卻看得到。」(58↑) |
| 樣本偏差派 | 拒絕用單一平台聲量代表整個社群 | 「X 並不能代表整個社群的真實樣貌。」(142↑) |
| 微觀派 | 4.8 行為細節變了,疑似 routing 或訓練調整 | 「有 Haiku 的味道(笑)」(8↑) |
| 容忍派 | 模型偶爾用 emoji 沒關係,過度才是問題 | 「只要像這樣偶爾用,我覺得可以接受;過度才是問題。」(3↑) |
4. [產品] OpenAI 宣布 ChatGPT 學會「做夢」整理記憶,使用者端卻在哭新 memory 壞了退版退不回去
- 主要來源:1txisku(官方公告)|輔助來源:1tyus3e(61↑,使用者災難)
報導
(本報賈新聞/產品組報導)OpenAI 近日在官方部落格推出名為「Dreaming」的新一代 ChatGPT memory 機制,文案描繪的願景相當動人:ChatGPT 會在背景「做夢」,把過往對話消化、重組成更有用的長期記憶,讓 AI 更貼近使用者偏好、回答更個人化。標題寫得很美——「Dreaming:給 ChatGPT 更好的 memory,讓它更有用」。
但同一段時間,r/OpenAI 另一則 61 分的貼文標題完全不一樣:「新 memory 系統壞了,而且退版退不回去」。原 PO 花了好幾個小時實測新系統,發現只要新 memory 啟用,舊版那些精心存下來的 saved memories 對模型而言形同消失——模型只能靠最近的對話脈絡硬撐,問到不在近期上下文裡的內容就直接編造或丟出一團模糊摘要。他舉了一個自家用了很久的縮寫「RCL」(一個內部玩笑梗)為例,新 memory 直接編了一個看似合理卻完全錯誤的解釋;當下在同一個對話切回舊版 memory,模型立刻答對。
更刺眼的是退版按鈕。OpenAI 雖然提供了「回到舊版 memory」的選項,但原 PO 與多位留言者實測:不論是 iPad app 還是網頁版,按下退版過幾分鐘到幾小時後,系統會自動切回新版——退一次切回去、退第二次又切回去,一天得退三次。有人乾脆把這顆按鈕稱為「裝飾品」。
兩篇貼文擺在一起讀,反差就很清楚:官方那邊講的是 AI「做夢」整理記憶的智慧升級,社群這邊體感到的是「精挑細選存下來的東西被壓成失真摘要、想退版又退不掉」。一位留言者一句話總結:「把 downgrade 包裝成 upgrade,這就是 OpenAI 風格。」
本報觀點
memory 是 AI 產品最敏感的功能之一——它不是模型聰不聰明的問題,是「使用者過去花時間累積的東西還在不在」的信任問題。把累積物默默重組已經夠刺眼,再把退版按鈕做成裝飾品就是另一層級的事了。官方文案的「dreaming」聽起來浪漫,但對把 memory 綁在業務脈絡上的人來說,AI 在背景擅自重新詮釋你的資料,跟夢遊把書架重排一遍是同一個體感。本報認為,這次事件真正的資訊差不在功能本身好不好,而在「不可逆強制 rollout」這條設計選擇——如果退版按鈕真的有效,輿論大概只會抱怨一陣;按鈕無效,整件事就從「功能更新爭議」升級成「信任違反」。 ← 藏鏡人批:把退版按鈕做成裝飾品,這層級已經跟功能優劣無關了。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| 記得錯的、忘了對的 | 新系統優先撈出無關緊要的舊閒聊,把使用者刻意存的資料壓掉 | 「這超爛、超笨。它會從幾百年前我隨口提過一次的某個冷門對話拉資料出來,還比我現在實際需要的資料優先。」(5↑) |
| 摘要壓壞重要細節 | 認真整理的 memory 被新功能一次壓縮重組,細節遺失 | 「我認真整理、精挑細選一堆 memory,新功能一上就把它們全部壓縮重組,重要細節全沒了。」(3↑) |
| 退版按鈕是裝飾品 | iPad app 與網頁版都實測過,退回舊版後過一陣子又被自動切回新版 | 「退版按鈕根本是裝飾品,按了過一陣子又被自動切回去。」(9↑) |
| 大規模違反信任 | 把整個工作流綁在舊 memory 的人發現流程一夕崩壞,連 summary 都改不動 | 「他們必須修整個 memory summary 機制。這種大規模退化是徹底違反使用者信任。我有很多 workflow 都建在舊 memory 上,現在全廢了。」(13↑) |
| 業務情境直接斷裂 | 把 memory 當業務帳戶情境使用的人,新 rollout 直接讓推理結果崩掉 | 「聽起來是大災難。我用 memory 來放整個業務情境,這樣亂搞會直接讓推理結果崩掉。」(10↑) |
| Downgrade 包裝成 upgrade | 社群把這次更新定性為退化偽裝成升級,是 OpenAI 慣用手法 | 「把 downgrade 包裝成 upgrade。這就是 OpenAI 風格。」(3↑) |
5. [政策] OpenAI、Anthropic、微軟三 CEO 罕見聯手上書國會:AI 正把生化武器門檻踩到地板
- 作者:EchoOfOppenheimer | 468↑ | 100 則留言
報導
(本報賈新聞/政策組報導)平時在市場上殺得你死我活的三家 AI 巨頭,本週為了同一份警告坐到同一張桌子上。OpenAI 執行長 Sam Altman、Anthropic 執行長 Dario Amodei,以及微軟 AI 部門掌門人 Mustafa Suleyman,連同一票生命科學與國安專家,聯名向美國國會發出公開信,核心訊息只有一句話:AI 正在把「製造生化武器」這道過去靠專業知識把守的門檻,一路向下踩到任何人都跨得過去。
信中三位 CEO 沒有停在抽象的「AI 很危險」,而是端出三項具體立法主張,丟給國會接:第一,強制要求所有合成 DNA、RNA 的供應商在出貨前先做客戶與序列篩檢,把可疑訂單擋在化學瓶之前;第二,廠商必須完整保留訂單紀錄與材料規格,留下事後可追查的稽核軌跡;第三,公開支持 2026 年的「生物安全現代化與創新法案」(Biosecurity Modernization and Innovation Act),把上述要求寫進法律。
為了讓國會議員聽得進去,信裡引了兩組數字:Stanford 的研究指出 GenAI 在過去三年已觸及全球 53% 人口;歷史上生物攻擊只佔所有恐攻案件的 0.02%,但吸入性炭疽若未及時治療,致死率接近 100%——機率低、後果近乎滿格。報導刊登於《Fortune》,由 Beatrice Nolan 撰寫,全文連結於小標。
留言區的火力,沒花在質疑「AI 危不危險」,而是直接燒向動機。一位自稱有生物物理博士學位、本業就在做 AI 的網友拿到 133 分高票,他的論點是:對受過博士訓練的人來說,做生化武器本來就不算難,AI 真正改變的是「誰能拿到這套知識」——以前要先念十年書,現在打開聊天框就能問。另一條留言則更直接:「我們站在國會面前警告這些風險,但要先賺完幾十億美元賣給美國再說。」
本報觀點
當市場上的三家頭部廠商願意一起放下競爭、跑到國會喊「請快點立法管我們」,第一個該被問的問題不是「危險是不是真的」,而是「為什麼是現在、為什麼是這個版本的監管」。本報沒有要替任何一方背書,但提醒讀者:產業史上反覆出現「監管俘虜」(regulatory capture)的劇本——已經先卡好位置的大廠主動擁抱合規成本高昂的法案,順手就把資本不足、做不起合規團隊的小廠和開源社群擋在大門外。生化武器篩檢這件事本身值得做,但留言區那句「藉安全名義拉高入場門檻」的懷疑,值得讀者放在心裡——立法該怎麼寫,不能只聽已經拿到入場券的人說。 ← 藏鏡人批:DNA 篩檢值得做、與聽誰建議怎麼做,是兩件事。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| 質變確實成立 | AI 讓門檻從「博士才能查」變成「人人能問」,是質的差別 | 「以前是 AI 要有 PhD 才能告訴你怎麼做,現在 AI 自己就是 PhD,誰都能直接問。這是質的差異。」(35↑) |
| 風險被高估 | 真正卡關的是 DNA 合成能力,不是 chatbot 給的資訊 | 「我做 AI、也有生物物理 PhD。有 PhD 程度教育背景的人,要做生化武器本來就不難。真正的監控點是 DNA 合成能力。」(133↑) |
| 監管俘虜疑雲 | 大廠用安全敘事把門關起來、擋掉小廠和開源 | 「就是『監管俘虜』的劇本——大廠用安全敘事把門關起來,把小廠擋在外面。」(34↑) |
| 先賺夠再喊停 | 動機可疑:警告國會的同時還在收國防與企業訂單 | 「我們站在國會面前警告這些風險——但要先賺完幾十億美元賣給美國再說。」(54↑) |
| 補貼牌照潛台詞 | 每次「呼籲監管」背後都是「請補貼我們、給我們牌照」 | 「每次這種警告都伴隨著『所以請補貼我們、給我們牌照』的潛台詞。」(23↑) |
6. [政策] Anthropic 喊全球暫停 AI 自我打造,但條件是「對手一起停才算」
- 作者:EchoOfOppenheimer | 304↑ | 121 則留言
報導
(本報賈新聞/政策組報導)Anthropic 政策團隊成員 Marina Favaro 與 Jack Clark 六月五日於 Fortune 投書,向全球同業與監管機構放話:AI 距離「遞迴自我改進」(recursive self-improvement)僅一步之遙,模型即將能自行設計、訓練、改良下一代模型,不再需要人類介入這條閉環。兩人引用自家內部數據佐證 — Anthropic codebase 中超過 80% 的程式碼已由 Claude 撰寫,工程師每季交付的程式碼量已是 2025 年以前的八倍。換言之,AI 寫 AI 的代工已經發生在 Anthropic 自己的辦公室裡,差別只在「寫到哪一層」。文章基於這項判斷,呼籲全球暫停前沿 AI 開發。但細讀條款,這份「暫停」附帶嚴格前提:必須是 OpenAI、Google、xAI、Meta 等多家前沿廠商,在多個司法管轄區、同一條件下、同時停下來,才會生效。文章刊出時機點頗為微妙 — 正值 Anthropic 申請 IPO 前夕,市場對其估值、競爭定位高度敏感。Reddit 留言區把這套敘事拆得很乾淨:要嘛是末日行銷拉高估值,要嘛是條件式空話。
本報觀點
把「IPO 前夕」、「自家 80% code 已是 Claude 寫的」、「全球同時暫停才生效」這三件事疊在一起看,這份警告就不是單純的安全發聲,而是一封給投資人、監管者、競爭對手同時讀的多目標信。對投資人說:我們已經做到對手做不到的程度。對監管者說:我們願意被管,但要管就一起管。對對手說:你不停我就不停,但你要是停了,我就贏了。本報無意揣測動機,但在風險敘事與市場敘事高度重疊的時刻喊暫停,留言區的冷笑並不算苛刻。 ← 藏鏡人批:同一封信,每位讀者翻到的是不同的那一頁。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| 概念誤導 | 「打造自己」與「改良自己」不是同一件事,標題把兩者混為一談 | 「『打造自己』跟『改良自己』是兩回事,不要混為一談。」(127↑) |
| 雙面性質疑 | 一邊宣告數位之神由我打造,一邊呼籲大家先停,自相矛盾 | 「Anthropic 一邊說『數位之神就要降臨!由我們親手打造!』,一邊說『拜託大家先暫停一下』。」(119↑) |
| IPO 動機論 | 發文時機點正是 IPO 申請前夕,是行銷不是警告 | 「IPO 前夕喊『AI 太危險要暫停』 — 這是行銷而不是警告。」(60↑) |
| 條款空話 | 暫停條件等於要求所有對手一起停,本質就是不停 | 「他們的『暫停』條件等於『除非所有對手也停否則我們不停』,這根本不是暫停。」(59↑) |
| 媒體疲勞 | 對科技公司高層輪番上媒體放話感到厭倦 | 「能不能立法禁止科技公司高層上媒體?」(109↑) |
7. [社會] 紐約上訴庭法官當庭痛斥三律師:你引的判例根本不存在
- 作者:ThereWas | 95↑ | 3 則留言
報導
(本報賈新聞/社會組報導)紐約州最高法院上訴庭五月二十日開出一張令法律圈譁然的庭訊紀錄。一樁人行道絆倒求償案「Landberg v. City of New York」(蘭德堡訴紐約市案)——原告控訴市府未維護被樹根頂起的人行道磚塊——出庭三位律師被法官 Valerie Brathwaite Nelson 與 Hector LaSalle 當庭點名:你們提交的書狀裡,至少三件判例根本不存在,另有十件引述錯誤。
原告律師 Michael Sanders、地產方律師 Ross Friscia、市府方律師 Elizabeth Freedman 三人同台被質問。Sanders 在庭上支吾:「我無法具體說明那些引文」、「如果有任何引文不正確,我深表歉意」,被追問來源時更直接攤手:「我不知道這些案件具體是什麼。」當他試圖鞠躬離庭時,LaSalle 法官撂下一句:「你將有機會以不同方式道歉。為什麼不去調查一下這是怎麼發生的?」
法官未在庭上直接點名 ChatGPT、Claude 或 Gemini 哪一家,僅暗示「根據律師在其他案件中被指控使用 AI 的模式,幾乎肯定就是這種情況」。Brathwaite Nelson 法官用四個形容詞收束這場庭訊:引用不存在的案件「令人震驚、令人擔憂、令人失望、令人悲傷」。Sanders 被下達「說明為何不應被制裁」(show cause order)的命令,案件本身則被駁回。
另兩位律師的辯解同樣難看。Friscia 解釋自己沒特別留意對造援引的反向法律原則,承諾往後會「檢查每一個案件」;Freedman 則說她讀過所有書狀,但「沒有特別關注」,因為「那不是我們的問題」——意思是反正虛構判例對市府這方有利,她沒興趣替對造做事實查核。
這已是 2024 年 Mata v. Avianca 案兩位律師因 ChatGPT 編造判例被罰五千美元以來,AI 幻覺(hallucination)走上美國法庭的又一個典型樣本。差別在於,這次三位律師連「我有沒有用 AI」都答不出來,書狀像在霧中飄進法院。
本報觀點
法庭文件不是行銷文案,每一個 case citation 都要能被查證、被援引、被攻防。AI 文字工具能幫律師擬大綱、整理事實時序、寫客戶信,但凡是進到法院、會被對造和法官以判例方法論逐字檢驗的段落,就不該是「貼進去看起來像那麼回事就好」。Sanders 在庭上連自己引了什麼都說不出來,問題不在他用了 AI,而在他把產出的文字當成可以直接交差的成品,省掉「逐筆驗證引用是否存在」這一道律師本來就該做的基本功。AI 上法庭不是新聞了,律師連自己引了什麼都不知道,才是。 ← 藏鏡人批:vibe-lawyering 是新詞,但「文書不審稿」這毛病比 AI 還老。
社群反應
| 觀點 | 說明 | 代表留言 |
|---|---|---|
| 譏諷新行話 | 模仿「vibe coding」造詞,給這種把 AI 產物原樣送進法院的做法貼標籤 | 「vibe-lawyering」(20↑) |
| 當成奇景看 | 把這類庭訊當成新興影片題材,從吊照律師升級成「啊不好意思」的尷尬秀 | 「所以這算新的影片類別了?我們從吊照律師進化到『啊不好意思』了?」(8↑) |
| 律師執照之問 | 若連這種程度都不吊照,bar exam 的意義何在;當事人應該回頭告自己的律師 | 「如果這些律師沒被吊照,律師資格考根本沒意義;和一般人自己用 AI vibe-lawyer 賭五五波沒兩樣,當事人應該反過來告自己的律師。」(1↑) |
| 報導觀察 | 法官未點名 AI 廠牌,僅以「其他案件的模式」暗示,顯示法院還在摸索如何在判決書裡處理「疑似 AI 生成」這件事 | 「幾乎肯定就是這種情況。」(Brathwaite Nelson 法官庭上發言) |
| 外部報導 | 404media 整理出三位律師各自的辯解,畫面是「沒人想替自己讀過的書狀負責」 | 「我讀過所有簡報,但沒有特別關注,因為那不是我們的問題。」(Freedman 律師庭上說法) |
社群溫度計
過去 72 小時其他高熱度貼文,本報以一句話概括:
| 熱度 | 標題 | 一句話 |
|---|---|---|
| 14727↑ | 我開始用 Claude 的口吻回同事訊息 | 一週最高 Humor 票房:使用者承認自己已經被模型語氣同化,連 Slack 也照樣寫「我會盡力協助你」(r/ClaudeAI) |
| 327↑ | Cowork 用量上限離譜,一個 prompt 吃掉 21% 額度 | 與頭版對照組:原 PO 抱怨被打臉,留言一面倒指出「自己疊滿 UltraCode + 1M context 還怪 Anthropic」(r/ClaudeAI) |
| 222↑ | Claude 讓我發現:寫程式根本不是真正的瓶頸 | vibe coding 潮中的反思 — 模型把寫 code 補上後,產品判斷與 spec 拆解才是真瓶頸 (r/ClaudeAI) |
| 166↑ | 六月底前誰家模型最強?社群開盤三方對標 | 純預期、無實測:留言列舉 OpenAI、Anthropic、Google 三家進度,是 rumour 大於 benchmark (r/OpenAI) |
| 80↑ | AgentGraphed:本地 OSS Claude session 觀測儀表板 | 同期 OSS 工具一波其中之一:把 Claude Code session 視覺化、本地優先、免上雲 (r/ClaudeCode) |
| 44↑ | Claude Code 跑十到十五分鐘時,你都在幹嘛 | 87 則留言生活化討論:滑手機、煮咖啡、看下一個 PR — 長執行時間被默認接受 (r/ClaudeCode) |