2025年6月30日 星期一

AI實現的發明的所有權討論

想要探討ownership of AI-enabled Design議題,查到Marks & Clerk(https://www.marks-clerk.com)的專文:「IP ownership of AI-generated designs(https://www.marks-clerk.com/insights/latest-insights/102jvso-ip-ownership-of-ai-generated-designs/)」,感覺就是我要的答案,在此作些筆記與回響。

本篇文章要討論的就是AI實現的發明誰有資格成為所有權人(專利)?

英國:

對於之前有名的AI:Dabus是否可以申請專利的議題,UK最高法院作出決定是,Dabus並不能成為專利發明人,理由是Dabus不是"人",因此創作AI的Dr. Thaler就不能成為專利申請案的被授權人。這裡也提到,如過去知悉的,南非接受了以Dabus為發明人的申請案,這裡提到此南非案未被審查(編按,經查網路資料,多數報導是有獲准南非專利,且Dr. Thaler成為專利權人。)

美國:

除了過去一些報導外,本篇提到「Pannu v. Iolab Corp. test」(案例連結如下),如果發明人是機器,則無法滿足Pannu v. Iolab Corp. test」對發明概念以特定重要的方式實現(reduction to practice)發明的人的要求。

- 專利申請中新增的特徵產生共同發明人爭議 - Pannu v. Iolab Corp. (Fed. Cir. 1998)https://enpan.blogspot.com/2023/05/pannu-v-iolab-corp-fed-cir-1998.html)。

"一件發明可能僅由一個""的概念開始,開發過程往往會有其他人參與,因此發明人是誰總是與整個研發歷程有關,專利權以申請專利範圍表示,"inventorship"主要的判斷原則是誰對其中任一權利範圍具有"實質貢獻"..."

澳洲:

可參考:https://spoor.com/dabus-the-rise-of-the-inventive-machines/,其中報導了Dabus在各國的狀態,在此特別整理了Dabus專利申請案在澳洲的狀態。

PCT進入澳洲:PCT/IB2019/057809
專利申請日:9 September 2020
申請號:2019363177

原本澳洲專利局副局長(Deputy Commissioner of Patents)否決此申請案,理由是Dabus是機器,而不是法律上的人。

之後Dr. Thaler成功提出司法複審(judicial review),澳洲聯邦法院在30 July 2021的判決認為,依照澳洲專利法,AI系統或裝置可以成為發明人,因為"inventor"就是一個代名詞,可以是人或物,甚至舉例說,controller, dishwasher都是人或物的代名詞,並且專利法並沒有反對機器可以是發明人,加上專利法中規定某"人/person"可從發明人取得("derive")專利權,這個"derivation"是可更廣的解釋,而非限定在授權或是轉移專利權的解釋。(編按,這是典型的沒有規定不可以就是可以的解釋,當inventor可以是機器時,就可以將權利derive給人,這裡解釋不能限制成assign或是transfer權利。)

我們過去的知識停留在上述30 July 2021的判決,但本篇繼續追蹤,本案經上訴到"全聯邦法院(full Federal Court)"於13 April 2022推翻了以上聯邦法院的判決,認為AI並不能是法律上的發明人,認為發明人應該是自然人。

Dr. Thaler嘗試跳過"全聯邦法院",而想要直接上訴到高等法院(High Court),在11 November 2022,高等法院否決上訴,認為高等法院不適合審理此議題(應該是法院認為這是有煽動性的議題,動詞用"agitated"。)如此,目前,全世界除了南非外,應該都不同意Dabus可以是發明人

my two cents:(updated on July 1, 2025)
跟一些朋友、客戶討論相關案例時,認為以上幾乎是引發全球討論的議題是Dr. Thaler刻意想衝擊各國司法,故意想掀起新的議題討論,確實是這類議題的先驅(不能說唯一),雖不能賦予AI專利權蠻合理的,但也可怪法律跟不上實際人們"提早"面對的問題。再者,本篇參考的文章也說到,UK法院認為,如果Dr. Thaler自己列為發明人,將Dabus技術當作實踐發明(食物容器)的工具,而不是直接講(或是主觀認為)所有都是AI自己長出來的樣子,情況將會不一樣,並且也應該會有一定的歷史地位。

可參考之前報導(需要注意的是,案例常常被推翻,本部落格就已知的去更新,但不見得有追到最新進度):
- 英國最高法院否決A.I.發明人 - [2023] UKSC 49(https://enpan.blogspot.com/2024/01/ai-2023-uksc-49.html
A.I.發明人Dabus的申請案以及澳洲聯邦法院案例(https://enpan.blogspot.com/2021/08/aidabus.html
- 專利申請中新增的特徵產生共同發明人爭議 - Pannu v. Iolab Corp. (Fed. Cir. 1998)(https://enpan.blogspot.com/2023/05/pannu-v-iolab-corp-fed-cir-1998.html

Ron

2025年6月24日 星期二

AI專利適格性講座-分享版

AI專利適格性講座-分享版


Ron

2025年6月21日 星期六

英國Getty Images v Stability AI的法官意見(關於商標商譽減損) - Getty Images v. Stability AI (Court of Appeal, 2025)

之前報導英國高等法院於14/01/2025的判決,可參考:英國Getty Images v Stability AI案討論(https://enpan.blogspot.com/2025/06/getty-images-v-stability-ai.html),...(忽略過程) 本案經上訴由英國上訴法院的法官提出自己的意見(Court of Appeal on Appeal from the High Court of Justice, 16th June 2025),藉此只是想看看法官對於生成式AI議題的看法。


本案源起Getty Images代替50000名創作者向Stability AI提起"著作權、資料庫權與商標權"等侵權告訴,主要理由就是Stability AI訓練Stability Diffusion使用Getty Images了未經授權的資料,並且Stability Diffusion輸出的影像還包括了相同或相似Getty Images的商標。

原告商標侵權主張:

並認為Stability Diffusion生成圖片減損了商標的聲譽:

Getty Images一再修改上訴狀,就是想盡辦法說服法官Stability AI毫無節制地使用Getty Images與第三方影像訓練Stability Diffusion
,並藉此生成不當影像,因此傷害了Getty Images長久以來建立的聲譽。

當然法官不見得會考量原告所有言論,因為部分可能涉及其他法律範疇(如AI生成影像涉及色情、暴力等不當內容)。並且(法官也有相似的想法),原告通過非尋常的框架拐彎抹角地描述其主張,可能是希望通過輿論影響判決,畢竟這是這幾年許多內容擁有者重視的議題(這是我的猜想)。

當然,Getty Images還是強調其主張的是說明Stability AI生成了合法與違法內容,並且也非直指Stability AI本身涉及刑事犯罪,而是主張Stability AI所建設的系統將讓使用者可以不當運用產生不當內容。

(法官在判決中還花了一些篇幅解釋原告用語)

目前,審理本案的兩位法官分別提出了自己的判斷,但都決定撤銷上訴,主要理由是原告設定的訴訟議題在用語上並非能夠證明其減損了原告商標商譽,這也表示AI生成不當影像不見得是原本設計的意圖,如色情影像。


Ron

2025年6月17日 星期二

EUIPO eSearch使用範例

https://euipo.europa.eu/eSearch/


Advanced檢索:

以擁有人"FERRARI S.P.A."檢索的結果:

點入其中一個設計,顯示申請歷程:申請後,就完成登記,接著就是等著過期。

圖式:

Design information

Owner

可以圖找圖(商標與設計)

設計:

商標:

Ron

2025年6月16日 星期一

英國Getty Images v Stability AI案討論

本篇討論英格蘭與威爾斯高等"商業與財產"法院對於「Getty Images v. Stability AI」的判決,平行訴訟也在美國進行(可參考:https://www.bakerlaw.com/getty-images-v-stability-ai/):

英國高等法院智慧財產審理案件資訊:

原告:Getty Images (US) Inc.等
被告:Stability AI LTD
事由:原告Getty Images向法院提告Stability AI非法使用其一千兩百萬張影像
判決日期:
14 January, 2025

Getty Images在倫敦法院向Stability AI提出著作權告訴。

https://www.gettyimages.co.uk/?language=en-gb

https://stability.ai/

Stability AI是設在英國倫敦的AI影像生成服務的公司(但其算力由德國慕尼黑的大學與在紐約的科技公司運行),Getty Images是設於美國西雅圖的圖庫公司,在2023年宣稱Stability AI的"Stable Diffusion"的AI影像生成器侵害其圖庫的著作權,因為大量使用Getty Images圖庫影像訓練AI,於是提出"著作權、資料庫權與商標權"等侵權告訴。

特別地,Getty Images律師告訴法院說明這並非創意與科技產業的訴訟,而是希望兩者能協同合作,因為創意作品對於AI的成功有關鍵的影響。提起訴訟是因為AI公司並未獲得授權使用,甚至是因為Stability AI為了快速上市而不在乎影像取得的正當性,也不在乎內容是否被保護或是不適合(如色情影像)。

Stability AI則是主張Getty Images提出告訴是對整個生成式AI產業構成威脅,而且Stability AI利用影像訓練生成式AI在世界各地都發生,並承認在訓練時使用的影像中,至少有些影像是來自Getty Images,但並不與特定影像相同,且僅有一小部分生成的內容會與Getty Images影像相似。

訴訟的主張包括:
1.被告下載至英國伺服器或電腦中用於訓練Stable Diffusion的影像使用了受到著作權保護的內容,因此主張被告因為直接連結到受到存取限制的內容,應成立直接侵權
2.被告進口預訓練的Stable Diffusion軟體至英國,因此主張被告進口侵權產品(副本)。
3.由Stable Diffusion產生的合成影像因為重製了受到著作權保護的內容的實質部分,因此侵權成立。

Getty Images事實上是代表了50000個將作品專屬授權給Getty Images的著作權人,這些人的創作成為訓練Stable Diffusion的資料,Getty Images即代表這些著作權人進行侵權訴訟與要求損害賠償。

Stability AI向法院提出答辯書,其中說明Stable Diffusion如何訓練與開發,以及如何運行回應使用者的prompts,並且特別主張在生成式AI生成影像是依照使用者的提示語(prompt),因此將不會使用任何受到著作權保護的影像,針對影像提示語,由使用者輸入影像,接著依照提示語輸出的影像是輸入影像的重製,並沒有侵害他人著作權。

目前英國高等法院對本案的意見是,並沒有同意由Gettt Images代表其中眾多著作權人進行訴訟,但對於訴訟雙方之間複雜的議題,在此時有許多亟待解決的問題。

判決原文:https://www.judiciary.uk/wp-content/uploads/2025/01/Getty-Images-and-others-v-Stability-AI-14.01.25.pdf

資料參考:
https://www.bakerlaw.com/getty-images-v-stability-ai/
https://www.bakerlaw.com/services/artificial-intelligence-ai/case-tracker-artificial-intelligence-copyrights-and-class-actions/

https://apnews.com/article/getty-images-stability-ai-copyright-trial-stable-diffusion-580ba200a3296c87207983f04cda4680

https://www.hsfkramer.com/notes/ip/2025-01/navigating-representative-actions-takeaways-from-getty-images-v-stability-ai

https://www.simmons-simmons.com/en/publications/cmbk5e155006cubvw9ho9r5wn/getty-images-v-stability-ai-a-prelude-to-the-long-awaited-trial

Ron 

2025年6月15日 星期日

用於訓練AI的資料的著作權侵權與合理使用議題 - Thomson Reuters v. ROSS (District Court of Delaware [2023])

本篇討論「Thomson Reuters v. ROSS」的Delaware地方法院判決,路透社自己的報導:Thomson Reuters wins AI copyright 'fair use' ruling against one-time competitor(https://www.reuters.com/legal/thomson-reuters-wins-ai-copyright-fair-use-ruling-against-one-time-competitor-2025-02-11/),說明法院判決著作權法不允許(如本案ROSS)可以使用他人內容建立競爭的AI為基礎的法律系統。

本篇報導是法官BIBAS針對2023年對本案簡易判決意見的回顧與檢討,但也是直指目前法院對這類議題(運用他人的內容訓練AI模型)的看法。內容需要花時間理解,因為法院的意見很有“解釋空間”,並且法官意見也挺模稜兩可,加上我對內容意見的理解也十分頭痛,以及本議題充滿爭議,因此有興趣者應該找到原文判決來理解。

本案法官BIBAS在一開始引用了一句名言:a smart man knows when he is right; a wise man knows when he is wrong. 但法官謙虛地表示智慧不總是找到他,但他嘗試擁抱,即便來得比較晚(因為在此備忘錄中他反悔了2023年的一些決定)。

Thomson Reuters擁有最大的法律平台-Westlaw,讓一般使用者付費使用,其中除了一般大眾可使用的判例與法規外(經過組織),還有經過編輯的內容與註釋(如判決摘要與關鍵點等),著作權屬於Thomson Reuters。


ROSS開發使用AI的法律研究搜尋引擎,不意外地,在訓練AI搜尋工具時,需要大量的數據以訓練AI可以回答法律問題的法律答案,ROSS曾經想向Westlaw授權使用資料庫,但被拒絕。因此轉向去取得其他來源的數據,如LegalEase與BulkMemos。

特別地,LegalEase運用Westlaw內容建立自己法律問答的資料庫,LegalEase賣給ROSS兩萬多筆備忘錄用來訓練AI搜尋工具;另一方面,BulkMemos使用Westlaw的註釋建立律師問答資料庫,ROSS也運用BulkMemos訓練自己的AI。顯然,ROSS即便不直接使用Westlaw,但是訓練AI搜尋工具的數據仍是間接使用了Westlaw的內容。

導致Thomson Reuters向ROSS提出著作權侵權訴訟(May 2020)。

這件有趣的議題是,因為Westlaw的數據來源是一般大眾可取得的法律訴訟資料,其中具有著作權的內容是針對訴訟與判決所加註的內容。因此,對於原告Thomson Reuters來說,必須證明其擁有了哪些有效的著作權,以及證明ROSS複製了什麼被保護的著作權原創?

事實證明,因為Thomson Reuters對其擁有的內容已經進行註冊,因此擁有Westlaw中被保護的內容的著作權(經過著作權註冊的內容是明確有效的著作權證明),只是本次訴訟是針對Westlaw中的註釋,而非整體,而著作權保護的是“原創”,即便Westlaw註釋內容已經註冊著作權,但被告仍是可以反駁這些被保護內容“非原創”

被告ROSS主張的是所使用的內容多數是通過電腦程式完成,且其中比較高階的主題都是基於法律學校的課程。

不過著作權保護的“原創”也不是多麼高的門檻(與著作人多麼努力產生無關)。

一般可知,針對訴訟文件的註釋都很短,而其中法院的見解也不能主張著作權(可參考:法院意見不能用來主張著作權的1888年意見 - Banks v. Manchester, 128 U.S. 244 (1888)https://enpan.blogspot.com/2025/06/1888-banks-v-manchester-128-us-244-1888.html

據此可知,非政府機關的Thomson Reuters對其資料中法院意見並不擁有著作權,但其中註釋有其原創(來自提煉、綜合或解釋/distilling, synthesizing, or explaining),可主張著作權

再者,基於著作權法對於“原創”的判斷標準並不高,因此,即便Westlaw中以電腦程式進行管理與提供一些高階題目如學校教科書內容,仍有其最低程度的原創(不用太努力得出的內容也是原創)。

上述討論已經確立Westlaw包括原創內容與不可主張著作權的部分,接著的問題是,被告有否使用其中原創內容,這就涉及事實問題:

Actual copying:法院的工作要一則則比對是否有侵權事實,這也與訓練AI的實際過程有關,有些在某些階段被拋棄,有些則繼續使用...


Substantial similarity:這是要檢驗“後製作品”實質上用了哪些受著作權保護的“原創”內容?判斷的基準是由“產品”的一般使用者(ordinary user)認為與受到著作權保護的作品為實質相似,這裡也認為律師、法官都算是Westlaw(法律平台)的註釋的一般使用者,所以法官
BIBAS本人就可以判斷是否ROSS實質上使用了Westlaw的註釋,也相信陪審團應該也是。

結果,如Appendix A,法官認為ROSS使用的BulkMemos中的法律問題與Westlaw實質一樣,但也不是每個部分都實質一樣,如關於註釋的內容實質一樣,但對於案例的意見就不相同。

法官駁回被告4個"不侵權"主張的意見:
關於侵權,ROSS主張其“無辜侵權(innocent infringement)”,這避免不了侵權判定,主要是希望排除或減少損害賠償,但如果著作權人曾經發出著作權通知,就不成立無辜侵權,本案原告是有發出過通知,因此ROSS主張的無辜侵權並不成立。

ROSS主張Thomson Reuters濫用著作權(copyright misuse),法官澄清“濫用著作權”是當著作權人將著作權當作武器而危害到公眾利益時使用,也就是被告可以“濫用著作權”主張原告“anti-competitive behavior(反競爭行為)”的抗辯理由,而本案報告並未能證明原告濫用著作權。

另外,法院也駁回ROSS主張原告主張著作權的內容的想法都很接近,以至於它們的結合不應該有著作權,但法官不同意,因為法官認為並非所有想法很接近,反而是有許多方式可以表達對法律的觀點,因此原告創作的內容可主張著作權(copyrightable)。

ROSS提出「scenes à faire defense」抗辯,原告主張著作權內容的衍生內容(法律註釋)屬於作品本質的常見元素(stock element)作為抗辯,舉例:歷史小說中落難的少女("落難少女"是這類小說常見的元素,藉此對比本案Westlaw中法律註釋)。但法官認為,法律意見並不需要簡化到Thomson Reuters作的註釋或是分類成一些關鍵數字,因此Westlaw中的註釋(headnote)並不通常。

最後,關於著作權法中「合理使用(fair use)」的抗辯,考量是否「合理使用」原創的四個因素:
(Factor 1) the use’s purpose and character, including whether it is commercial or nonprofit;(使用原創的目的與特點,是否是商業或非營利用途?)
(Factor 2) the copyrighted work’s nature;(著作權作品的本質)
(Factor 3) how much of the work was used and how substantial a part it was relative to the copyrighted work’s whole; and(使用多少內容,相對著作權作品的全部,實質使用內容的比例為何?)
(Factor 4) how Ross’s use affected the copyrighted work’s value or potential market.(就本案而言,ROSS的使用如何影響著著作權作品的價值或是潛在市場?)

其中Factor 1與4是本案判定ROSS非合理使用的理由。

Factor 1:
(1)ROSS自己也承認,ROSS使用Westlaw被著作權保護的內容(其中的法律註釋)是商業用途,且沒有付出相應的費用。

(2)ROSS使用Westlaw內容並不具變革性/轉換性(not transformative),也就是ROSS使用Westlaw內容經過幾次處理都仍有高度相似的目的。例如,ROSS使用Thomson Reuters的註釋成為訓練AI搜尋工具的資料,並與Westlaw競爭,其中面對用戶提出的問題,ROSS的搜尋工具只從資料庫找到相關的司法意見,這樣就不是生成式AI,而僅是複製Westlaw內容

其中有趣的爭論是,即便ROSS爭辯其執行電腦程式並未讓Westlaw中法律註釋出現在其最終產品,而僅在中間處理步驟時複製Westlaw內容,這是屬於「合理使用」沒錯。不過,本案並非是複製電腦程式碼的著作權問題,縱使ROSS運用這些料有經過數值化處理再餵給AI,ROSS使用Westlaw註釋內容使得他能夠輕易地建構出法律搜尋工具,如此,ROSS的動作並非是變革性的(not transformative),並非屬於"合理使用"的範疇

補充,上述「中間複製/intermediate copying」的合理使用是基於競爭創新,以及為了達到特定功能但沒有其他表示方式時,為達特定目的,複製是合理的需要。


(3)由於Thomson Reuters曾拒絕ROSS使用其資料庫,但ROSS仍自他人間接取得Westlaw內容,使其行為屬於惡意(bad faith)。然而,即便行為不屬於惡意,上述兩點已經可知ROSS的行為非合理使用。

Factor 2:
Westlaw中針對法條與案例的註釋的創造性(creativity)確實不高,但仍具有創造性的元素,只是沒那麼高而已。如此,此因素是偏向ROSS,只是Factor 2對於本案“合理使用”的判斷影響並不大。

Factor 3:
法院判定是否“合理使用”時,考量了被告使用內容的量("the quantity of the materials used")以及內容的品質與重要性("their quality and importance")。ROSS產品提供給其用戶的是司法意見,並非Westlaw的註釋,Westlaw註釋是用來訓練AI,並沒有讓Westlaw註釋公諸於大眾,其輸出與原創僅有一些相關。此因素是偏向ROSS。

Factor 4:
此因素討論被告ROSS的抄襲是否影響著作權價值與潛在市場,無疑地是判定被告是否“合理使用”最重要因素。不僅考量原本著作權人現有的市場,也要考慮潛在的發展,現有市場是法律研究平台,而現在知道後續潛在市場是「訓練法律AI的資料」。

如此,可知Thomson Reuters將可以將其資料用於訓練AI,並可販售註釋內容作為訓練資料。但ROSS可以證明並非如此。

綜合上述4個factors分析,法官駁回ROSS合理使用的抗辯。

總體上,法院否決被告ROSS的不侵權主張


參考資料:

Ron

2025年6月14日 星期六

法院意見不能用來主張著作權的1888年意見 - Banks v. Manchester, 128 U.S. 244 (1888)

在看一個AI著作權案的時候,看到法院引用了這件1888年的案例,也是法院意見不具備著作權(屬於public domain)的公知常識

這件最高法院判決的簡要說明(Syllabus)也是短到可以直接貼出不違和。

其中提到,州(或指國家)最高法院作出案例的法院意見或決定,包括其中簡要說明與註釋,代表州政府的法院書記(reporter of the court)並不擁有著作權。

法官以其司法專業作出的意見並非是法律規定的作者或其擁有者,而州政府/國家將成為法院意見的受讓人,即擁有者。

衡平法案限制被告(本案例)不構成著作權侵權(不能主張著作權),並撤回原告告訴。


Banks v. Manchester, 128 U.S. 244 (1888)

Syllabus

In a hearing on bill and answer, allegations of new matter in the answer are to be taken as true.

Where the judge of the Supreme Court of a state prepares the opinion or decision of the court, the statement of the case and the syllabus or headnote, and the reporter of the court takes out a copyright for such matter in his name "for the state," the copyright is invalid.

A copyright, as it exists in the United States, depends wholly on the legislation of Congress.

The judge who, in his judicial capacity, prepares the matter above mentioned is not its author or proprietor in the sense of § 4952 of the Revised Statutes, so that the state can become his assigns and take out a copyright for such matter.

Bill in equity to restrain the defendant from infringing the plaintiffs' copyright. The defendant answered, and the complainants demurred to the answer. Decree dismissing the bill, from which plaintiffs appealed. The case is stated in the opinion of the court.

另一件:

GEORGIA ET AL. v. PUBLIC.RESOURCE.ORG, INC. (2000)
經查,2000年也有一件最高法院意見作出一致的判決 - Georgia et al. v. Public.Resource.Org, Inc. (2020)(https://www.supremecourt.gov/opinions/19pdf/18-1150_7m58.pdf)。

著作權法保障原創作者對其創作擁有壟斷權利,但政府對其編輯的法規與官方聲明並不能成為著作權法中規定的作者。此案爭點是「Official Code of Georgia Annotated (OCGA)(喬治亞州法典註釋)」,其中包括該州法規的文字與註釋,其中有法院意見的摘要與官方人員的法律說明等。特別的是,其中註釋由Matthew Bender & Co., Inc.公司提供,這是著名法律平台LexisNexis事業群的一個分部,其與州政府有份合約,所產生的註釋的著作權均歸喬治亞州政府所有

在本案中,喬治亞州政府向本案被告“PRO/Public Resource Org, Inc.”發出停止與終止信(cease-and-desist letters),認為PRO侵害OCGA(針對註釋)的著作權,PRO反訴,認為OCGA屬於公共領域(public domain)。

本案地方法院判決是主張州政府可以主張OCGA著作權,因為註釋並非法條原有。

第七法院(Seventh Circuit)基於government edicts doctrine(政府法令原則)否決地院判決。

最高法院最終判決州政府不能主張OCGA中註解的著作權!!!

2000年最高法院意見Georgia et al. v. Public.Resource.Org, Inc. (2020)(https://www.supremecourt.gov/opinions/19pdf/18-1150_7m58.pdf

Ron



2025年6月12日 星期四

101與112(f)筆記

這是從核准通知摘錄下來的內容,可做為101與112(f)筆記(給我自己看的)。


(僅摘錄部份)

從這份核准通知可知patent is a right,審查委員不僅是發出核准通知而已,而且是善盡審查委員的責任,找了前案(核准通知仍鉅細靡遺地比對專利範圍與4件檢索到的先前技術),並進行技術比對後作出的核准通知,並無濫用核駁專利的權力。

Ron

美國Copyright Office的生成式AI與著作權報告(1)

美國版權局:https://www.copyright.gov/

早在2023年美國聯邦記事(federal register March 16, 2023)就已經探討審查與註冊包含以AI技術生成的著作的政策。

到了上個月(May 2025),看到美國版權局發表「著作權與AI」的報告,這裡筆記第三部分 - Generative AI Training (pre-publication)  。


PART 3
Copyright and AI:https://www.copyright.gov/ai/Copyright-and-Artificial-Intelligence-Part-3-Generative-AI-Training-Report-Pre-Publication-Version.pdf


討論議題一:著作權保護的內容如何以及為何用於發展生成式人工智慧模型(generative AI model)?(以下為根據報告內容整理的重點)

I. 建立生成式AI的機器學習
機器學習的基本概念是使用輸入資料與期待的輸出資料形成的訓練集(training data)建立一個數學模型(statistical model),通過數學演算法學習歷史數據的特徵建立的模型能執行預測,經比對實際數據後,調整學習得出的模型,使之預測數據愈來愈接近實際數據。

根據以上簡單描述機器學習的概念,生成式AI是運用"使用神經網路(neural network)建立模型的機器學習演算法"生成的AI模型,神經網路的功能由參數(parameters/結構/數值)描述,用於定義輸入資料與輸出資料之間的映射關係(mapping of inputs to outputs),大量的參數形成神經網路計算高複雜度轉換演算的權重(weights)。(在此一提的是,一開始神經網路中各節點連結關係賦予隨機數值(權重),也不會產生/預測什麼有意義的資訊(與期待輸出值差很大),但隨之反覆地運算並調節權重,改善效能得出使神經網路轉換出貼近期待輸出值的權重值)最終,得出可以反映從訓練集中學習的模式(pattern)的神經網路的權重,並可將訓練好的權重建立的模型應用在產品中,不過其中運用的訓練集也面臨著作權人的檢視。

II. 訓練生成式AI模型所需的資料
所謂「生成式AI/Generative AI」是一種數學模型,以語言模型為例,可以根據「前言」計算出各種「後語」的機率後,從中(機率最高者)決定「後語」,並可依據提示語(prompts)繼續生成一連串內容。

生成式AI的運作是估算出"tokens"(代碼)的機率而決定輸出的文字,其中運用了通過事先賦予數值的字詞,也就是將語言轉換成數值形式,如向量值,所述代碼就是連接著每兩個向量值,通過代碼機率的演算決定/預測轉換輸出的字詞。

然而,生成式AI,如語言模型(language model),訓練過程需要使用大量文字、影像與聲音,如影像模型,訓練過程需要大量的文字與影像。訓練時需要將文字、影像與聲音轉換成代碼(tokens),這些訓練集(training data)引起著作權爭議。

III.訓練模型與訓練資料的關係
可以從各種來源取得訓練集(training data),常見的就是以爬蟲程式(web crawlers)從網路上下載公眾可取得的資料以及原本就存在的資料庫,如wikipedia、專利資料庫等,也包括圖書館、書本的檔案,還有特別經過授權取得的資料。

從各種來源取得的資料需要通過一個組織程序(curation process,包括篩選/filtering、清洗/cleaning與編譯/compiling)預備成為訓練模型的訓練集。

訓練模型的過程包括訓練階段(training phase,還可分為pre-training, post-training, fine-tuning)與記憶階段(Memorization)。

在此一提的是,OpenAI稱在訓練階段耗費最大量的運算與儲存資源,以教導模型語言、文法與推理;在記憶階段並不是複製資料,而模型中的權重僅是大量反映出訓練代碼中資料統計關係的數值串。(不過,新聞與媒體聯盟(News/Media Alliance)認為,如果是這樣,為何AI生成的內容會是逐字一樣的內容,不論其中運算做了什麼,效果與記憶與保存是一樣的。)

當然,生成式AI不可能自己隨意生成內容,一定是訓練過程決定其輸出應為正確且貼近原意,因此生成(同過數值演算、模式/pattern設定)的內容應該要與原本來源一致或接近才對。這也導致了著作權爭議。

IV.在生成式AI系統中部署模型
在實際應用時,使用者不會直接與數學模型互動,這些模型是部署在AI系統中,其提供了軟體工具與使用者介面(如ChatGPT APP/webpage)。

模型輸出與其使用了什麼訓練集有關,並讓模型運作時仍擷取除了原本訓練集以外的內容,如擷取增強生成(retrieval-augmented generation,RAG)技術,許多模型運用搜尋引擎使用RAG,也就是在模型運行時,產生系統執行的查詢(query)將最高排序的結果以擴展的提示語回饋給模型,再輸出給使用者。

舉例來說,當詢問一個問題給生成式AI,生成式AI助理(Claude)即詢問外部搜尋引擎,取得搜尋結果的前幾名,如取自一些網站的文章,生成問題的答案。上述在訓練語部署生成式AI時取得的資料與內容,都是用來強化模型的能力。

基於以上描述為何生成式AI會涉及著作權保護的內容,包括訓練模型用的資料與部署模型時運用的外部資料。

討論議題二:是否有侵權行為?

著作權法(Copyright Act)賦予著作權人的權利包括再製(reproduce)、散布(distribute)、公開展演(publicly perform)與公開展示(publicly display)其創作,並及於衍生的創作(derivative works)(編按,參考我國著作權法:利用衍生著作之人,應取得衍生著作及原著作之著作財產權人之授權)。

建立侵權的表面證據(prima facie case of infringement)有兩個要件:(1)有效著作權的所有人身分(ownership of a valid copyright);(2)複製原創作品的構成要素(copying of constituent elements of the work that are original)。

建立與部署生成式AI的幾個階段中可能會使用"有著作權保護的內容",可能涉及多種侵害他人權利的法規,建立與部署生成式AI的幾個階段包括:(1)資料收集和管理(Data Collection and Curation);(2)訓練(training);(3)擷取增強生成(RAG);(4)輸出(output)。

(1)資料收集和管理(Data Collection and Curation)
在此階段是要建立訓練模型的訓練集(training dataset),包括下載資料、轉換資料成為不同格式的內容,例如向量演算、篩選內容以及修改,將會觸及內容的「重製權(right of reproduction),即便有許多資料在蒐集後會被拋棄(但有可能保留在資料庫),都可能面臨侵權的問題。

(2)訓練(training)
在訓練模型之前,建立的訓練集會有「重製權」的爭議,在訓練過程中,其中內容同樣會被批次(in batches)重製,或有一段時間持有被著作權保護的內容,面臨著作權侵權的疑慮;訓練過程也將迭代地更新模型的權重(weights)以優化效能,權重會涵蓋訓練集中有著作權保護的內容,因此最終使用這些權重的人(如OpenAI的企業客戶)都有可能涉及著作權爭議。

舉例來說,生成式AI會根據使用者輸入的提示語(prompts)而生成圖案,即便生成式AI再厲害,也不會無中生有(有學者提出:"a model is not a magical portal that pulls fresh information from some parallel universe into out own."),因此這些圖案可能與訓練過程中使用的訓練集中的影像一致,也就觸及著作權侵權的議題。


另外有人主張,很多數位檔案是被加密與壓縮儲存的,這些內容不會被直接理解,因此直接侵權的內容應該是固定的、可被理解、重製或被傳遞的。

進一步地,模型中的"權重"記憶從訓練集的特定表示式(經過抽象化/abstraction或是轉換),因此有人主張模型中的權重並不直接包含訓練集的內容,而是通過抽象化過程從資料集學習/萃取資訊,不能表示被保護原始內容,但這樣仍可能侵害「衍生著作權(derivative work right)」。

在案例"Kadrey v. Meta Platforms"中,法院認為Llama模型侵犯衍生著作的主張是沒有意義的,但是,這是因為法院認定模型中運用的資料是經過抽象化的資訊,而此案例中的原告並沒有主張模型"可能會"吐出(spit out)被著作權保護的真實內容,或是輸出與原始著作權保護內容足夠相似的內容

在案例"Andersen v. Stability AI"中,法院否決了第三方(非原告或被告)提出撤銷訴訟的請願,此第三方並未參與模型的訓練過程,但下載並使用已經被訓練好的模型模型中事實上具有以特定格式存在的原始內容的副本或被保護的元件,因此,此案法院的判斷並同於上述Kadrey案中認為訓練與操作存在實質差異的決定。

USPTO基於以上法院意見,認為,判斷模型的權重是否涉及「重製權」或是「衍生著作權」,需要判斷是否模型保存或是記憶從原始內容得出實質可被保護的表示內容("substantial protectable expression from the work at issue"),從以上意見可知,在準備訓練集時使用的內容以及訓練模型都涉及"重製權",而使用最終得出的權重中僅實質相似的內容則會侵害著作權。

(3)擷取增強生成(RAG)
基本上,RAG會有兩種工作方式,第一種是AI開發者複製內容到擷取資料庫(retrieval database),生成式AI系統會存取資料庫以取得需要的內容,並隨著使用者的提示語(prompts)提供給AI模型;第二種則是生成式AI系統從外部來源(搜尋引擎或網站)取得內容。如此,RAG同樣會涉及著作權中的重製權。

RAG是許多的AI產品重要的特徵,如此,RAG的使用將涉及內容擁有者的利害關係,也就是有侵害著作權的疑慮。

(4)輸出(output)
生成式AI會輸出與原始著作權保護內容相似的內容,使用者也可以證明生成式AI可以產生接近電影內容的畫面、角色或是文字,這樣輸出的內容可能侵害重製權以及衍生著作權。

有些人認為,基於輸出內容的形式與其受眾,生成式AI將涉及公眾展示與演示的權利。

(後續將繼續筆記正當使用/合理使用/fair use)
判斷是否合理使用的幾個因素:
(1) the purpose and character of the use, including whether such use is of a commercial nature or is for nonprofit educational purposes;
(2) the nature of the copyrighted work;
(3) the amount and substantiality of the portion used in relation to the copyrighted work as a whole; and
(4) the effect of the use upon the potential market for or value of the copyrighted work.

Ron

2025年6月6日 星期五

解釋專利範圍 - 不能事後在舉發階段持對己有利之解釋 - 最高行政法院110年度上字第717號判決

本篇討論TIPO指定涉及「解釋專利範圍」的法院案例 - 最高行政法院110年度上字第717號判決。

案件資訊:
上訴人/專利權人:Meir Avganim
被上訴人:經濟部智慧財產局
參加人/舉發人:英格馬有限公司
系爭專利:I473931

案件始於本案參加人對系爭專利I473931(梯形安全插槽的安全鎖)提起舉發,案件經舉發成立後且訴願維持原判後,專利權人提起上訴,案件經智慧財產及商業法院109年度行專訴字第54號行政判決 - 駁回上訴後,繼續上訴至最高行政法院。

系爭專利範圍與圖式:



系爭專利發明所欲解決的問題:
針對習知技術之「矩形安全插槽」,係3x7毫米並且具有一可旋轉之T形條閉鎖元件,例如,20,造成許多複雜的問題,不夠堅固而且在某方面容易破裂。習知技術機械裝置的另一項缺點係為閉鎖元件20必須在該件器械側面24的後面旋轉,因而妨礙到其他內部組件。系爭專利提出一種電子器械的安全鎖,藉由該安全鎖至少可避免某些習知技術之缺點。


根據本案於智慧財產及商業法院判決,在解釋專利範圍時,認為系爭專利請求項1中未界定「凹腔」為「梯形凹腔」,且經參酌系爭專利說明書記載之說明與圖式,皆為「非梯形」結構,因此認定所述「凹腔」並不限於「梯形」單一形狀

如圖14,其中凹腔標示為52,法院認為「第14圖顯示凹腔52,在鎖銷148向內滑動後,其尖端至凹腔底部仍會留有些微空隙可知,系爭專利僅須「大體上填補」凹腔」,認為不應僅將「填補」一詞解釋為「填滿」整個凹腔



根據以上爭議元件的解釋(跳過細節比對,可參閱原文,連結在下方),法院判定:系爭專利請求項1為所屬技術領域中具有通常知識者依證據2之技術內容所能輕易完成,故證據2等已證明系爭專利請求項1不具進步性,另與證據3, 4組合仍可證明系爭專利請求項1不具進步性。判決駁回上訴人在原審之訴

另有議題是舉發法條之適用,也就是舉發引用法條應以專利核准日的適用法條為準(核准時專利法)。專利法第71條第3項:發明專利權得提起舉發之情事,依其核准審定時之規定

這裡要說的是,顯然是被舉發人主張法院引用法條有誤,但因為條文內容相同(本案應採用102年1月1日施行之專利法),高等行政法院認為不因此而認為違法。


因此,最高行政法院判決維持原審判決 - 舉發成立。


重點補充:
法院註解解釋專利範圍的原則:
(1)以申請專利範圍為準。
(2)得審酌說明書與圖式,用以了解發明之目的、作用及效果。
(3)不得將說明書及圖式之限制條件讀入申請專利範圍(除非明確表示申請專利範圍應限於實施例及圖式)。
(4)基於申請專利範圍與說明書的描述解釋專利範圍,而難以事後在舉發階段才持對己有利之限縮解釋。

解釋「凹腔」:
本案因申請專利範圍並未界定「凹腔」為「梯形凹腔」,部分圖式也顯示「非梯形」之結構,可認「凹腔」並不限於「梯形」單一形狀,顯然是以更廣的方式解釋「凹腔」,不能如專利權人所稱應解釋為「梯形凹腔」,


解釋「填補」:非指「填滿」。

法院認為,根據申請專利範圍與說明書的描述,有以上用語的"更廣"的解釋,難以事後在舉發階段才持對己有利之限縮解釋。最高行政法院認為原審解釋並無違背法令。

結論:原判決並無上訴人所指違背法令之情形,上訴意旨指摘原判決違背法令,求予廢棄,為無理由,應予駁回。


Ron