2025年12月28日 星期日

使用購買書籍訓練AI是"transformative" - 合理使用 - Bartz v. Anthropic PBC (N.D. Cal. June 23, 2025)

使用購買書籍訓練AI"transformative"屬於合理使用 - Bartz v. Anthropic PBC (N.D. Cal. June 23, 2025) 

  

案件資訊: 

原告:ANDREA BARTZ and KIRK WALLACE JOHNSON(獨立)與ANDREA 

BARTZ, INC., CHARLES GRAEBER, and MJ + KJ, INC.(獨立與集體訴訟代表) 

被告:ANTHROPIC PBC 

日期:October 17, 2025 

  

本案例涉及的議題是AI公司從盜版網站下載受到著作權保護的書籍的數位內容,同時AI公司也有合法購買書籍,而為了要數位化還將書籍破壞後掃描為數位檔案,上述行為是否屬於合理使用(fair use)範疇? 

  

本案被告Anthropic公司(https://www.anthropic.com/)發展Claude Opus人工智慧模型(https://www.anthropic.com/claude/opus),這個模型經初步理解是一種輔助電腦程式運作與運行企業流程的AI系統,列舉ANTHROPIC的美國專利US11734509,提出一種可控制基於風格的文字轉換方法,在此方法中,經選擇轉換文字的至少一組書寫風格規格、語言特徵權重,運用非監督式神經網路演算產生經風格轉換的文字,請求項1如下: 

1. A computer-implemented method, comprising: 

selecting at least one set of style specifications for transforming at least a portion of input text, the at least one set of style specifications comprising: one or more target writing style domains selected from a plurality of writing style domains; weights for at least a portion of the target writing style domains representing relative impact of the target writing style domains for transformation of at least a portion of the input text; and weights for at least a portion of a set of linguistic aspects for transformation of at least a portion of the input text; and 

generating one or more style-transformed output texts based at least in part on the at least one set of style specifications utilizing at least one unsupervised neural network; 

wherein the method is carried out by at least one processing device. 


基於本案「Bartz v. Anthropic PBC」訴訟,可知Anthropic公司開發的AI系統的訓練文本包括本案原告書商的書籍內容,書籍作者於August 19, 2024集體向法院對Anthropic公司提出著作權侵權告訴,認為被告在訓練Claude大型語言模型(LLM)的訓練數據包括合法取得與盜版內容,北卡地院於2025623日作出「是否Anthropic取得訓練數據的行為屬於合理使用?」的簡易判決(summary judgment)。 

  

判斷合理使用考量的4個因子: 

1. The purpose and character of the use, including whether such use is of a commercial nature or is for nonprofit educational purposes;(使用的目的與特性,是商業本質或是非營利教育目的) 

2. The nature of the copyrighted work;(使用受著作權保護作品的本質) 

3. The amount and substantiality of the portion used in relation to the copyrighted work as a whole; and(使用受到著作權保護的作品的量與實質性) 

4. The effect of the use upon the potential market for or value of the copyrighted work.(對於受著作權保護的作品的潛在市場的影響) 

  

北卡地院法官稱使用著作權保護的內容訓練LLM為「驚人的變形(transformative,應指輸入的文本轉變為具有驚人差異的輸出)」,並涉及合理使用的第一個因子,法院將模型訓練類比為人類閱讀與學習,但其目的基本上又不是相同的,作者寫作的目的是提供讀者娛樂或是教育的目的;反之,被告Anthropic將書籍轉換為數位數據,其中包括購買實體書籍、掃描、破壞紙本後,儲存為可搜尋且內部使用的數位數據 


  

關於法官判定被告行為涉及合理使用的第一個因子的非合理使用決定中,主要意見是: 

  1. 使用的書籍副本用途是訓練LLM 


  1. 被告將所獲取的副本用於建立其中央圖書庫(central library),但因為其中包括合法購買與盜版的書籍內容,所以需要分開判斷:將購買書籍轉換為數位檔案,Anthropic主張這部分僅用於訓練LLM,因此屬於變形(transformative),法院也判定將紙本書轉為數位檔案為節省空間且提供搜尋功能這是屬於「transformative/變形」,也就為factor one合理使用 


  1. 對於盜版的書籍,法院同意原告,認為應該需要付費取得書籍,不能因為有任何正當理由(bad faith)而隨意獲取內容。 



  1. 即便被告主張這部分用途也是形成”transformative”(變形),然而,法院引述最高法院曾經作出的意見,要求法院判斷事物時,應超越用戶的主觀意圖,而關注作品的客觀用途。因此判決要求被告應付費合法取得書籍。 


  1. 特別看到的,被告還拉”Google”下水,因為Google Books也是免費取得書籍內容,法院認為Google提供的是讓讀者參考,以至於建議租借或購買,但原告意圖並不是這樣。 

  

(重要)(編按,所述"transformative"的意思是,當作品有被「轉換/變化」成新的作品,已經脫離原本著作精神,而不是"接續"或是"加入新的東西"而已,應該是不同於原作品而有新的表達、意思或信息。評估作品是否「transformative」或是「derivative」(轉換或衍生),法院考量的是原作品(primary work)與二次作品(secondary work)的目的,其中判斷的是,二次作品(secondary work)是否與原作品(primary work)有基本的差異與新穎的部份(fundamentally different and new)。) 

  

根據法院意見,被告Anthropic也使大量盜版書籍訓練LLM,若是以購賣書籍訓練AI是合理使用,使用盜版書籍的訓練則非合理使用,基於上述意見,以及被告的使用意圖,同意雙方以15億美元作為和解金額。 


  

  

可參考: 

-合理使用著作權標的的四個判斷因素 - Oracle America, Inc. v. Google LLC (Fed. Cir. 2018)https://enpan.blogspot.com/2018/03/oracle-america-inc-v-google-llc-fed-cir.html 

-處理人家拍的照片是否是合理使用? - The Andy Warhol Foundation v. Goldsmith (U.S. Court of Appeals, 2nd Circuit)https://enpan.blogspot.com/2021/04/andy-warhol-foundation-v-goldsmith-us.html 

-美國Copyright Office的生成式AI與著作權報告(1)https://enpan.blogspot.com/2025/06/copyright-officeai1.html 

-用於訓練AI的資料的著作權侵權與合理使用議題 - Thomson Reuters v. ROSS (District Court of Delaware [2023])https://enpan.blogspot.com/2025/06/ai-thomson-reuters-v-ross-district.html 

  

my two cents: 

從法院和解協議過程可學習到一些功課,包括法院著作權合理使用的判斷、各方風險與時間成本的評估,加上未來的訴訟應該是很冗長,也考慮到各方律師的專業,當一切條件滿足後,即可進行和解協議,然而,本案又涉及集體訴訟,以下內容提到出集體訴訟和解的各方考量,在訓練AI的角度來想,每件作品之間是平等的,也獲得相同的賠償,其他細節就是每件作品的權利人、共同作者還是單一作者等,都是賠償細節。 



  

北卡地院和解協議(MEMORANDUM OPINION ON PRELIMINARY APPROVAL OF CLASS ACTION SETTLEMENT(中文翻譯:集體訴訟和解協議的初步同意備忘錄)):https://cases.justia.com/federal/district-courts/california/candce/3:2024cv05417/434709/437/0.pdf?ts=1761158790(備份:https://app.box.com/s/lyndwj8anlc8ijbgmizc1viekc3nidur 

  

Ron 


沒有留言: