參考Forbes的文章「How To Patent Artificial Intelligence And Machine Learning Models」,十分有興趣,就做些筆記,其中描述也有我自己的一點點心得(加入我自己的詮釋)。
文章開宗明義提到,恭喜你,AI專利並不是那麼容易取得!
這裡也有我常與客戶分享的,要申請AI相關專利,重要也是比較難的問題是"講清楚"~就是文章中建議要揭露「what, why, when and how」,揭露的程度就是讓相關領域一般技術人員可以理解並據以實施,雖這是一個模糊的規範,但就是要求揭露一定程度的細節(重點一)。
另一個比較艱難的問題是,AI相關專利並沒有特定結構,而是一些功能的組合,相關機器學習的模型要取得專利並不容易。
本篇內容將AI發明分成「監督型」與「非監督型」的學習模型。
-----------------------------------------
取得「監督型(supervised learning model)」學習模型的專利,這類學習模型有人類介入,就是人類作為老師來訓練AI模型,因此相關描述需要刻意排除人類的角色,可將人類的行為轉換為機器的動作。(重點二)
AI相關發明是由電腦實現的發明(CII),也就是軟體發明,自然就受到電腦相關專利的規範,因此,說開了,"AI"僅是一個很夯的名詞,但是實質內容就是一個形式軟體程序的展現,也十分"合理地"會面對專利適格性(patently eligible)的質疑。
我覺得本篇提供很有用的資訊是,要取得AI相關發明的專利,先克服101議題,也就是建議提到特定硬體(重點三),例如,以影像處理為例,可提供機器學習時需要的數據的輸入(或取得)方式,如掃描機、感測器、攝影機等,還建議表示這些數據取得是自動取得或是控制機器取得、取得內容的範圍、有基於任何特定事件嗎?(重點四)
以上僅舉例,主要是要根據AI涉及的發明領域,總是有特定取得數據的管道(系統或裝置)。
取得數據後,一般會傳輸到特定電腦系統/雲端系統中,並儲存在儲存器、資料庫或記憶體中,這部分如果不講清楚,就是一般常用手段而已。文中建議發明人可以提供一些評估,例如傳送到雲端伺服器或是本地端伺服器有何差異,是否會影響AI訓練的效能、可用性等?(重點五)
再以影像處理為例,在AI訓練之前,會有些前置處理作業,如判斷影像的重要性、分類、影像標籤(labeled image)、如何形成影像的標籤等,建議揭露相關資訊。我想,在每一個AI相關發明中,都有其特殊性,其中之一就是對數據的前置作業的特殊性。(重點六)
-----------------------------------------
取得「非監督型(unsupervised learning model)」學習模型的專利,這類AI模型訓練過程沒有人類介入,而特別需要深度學習的技術(deep learning)(重點七)。
同樣地,上述針對監督型學習模型的揭露要求也適用這類AI發明。(重點八)
在非監督式學習過程,取得的大量數據之間並沒有已知關聯性,因此需要通過電腦程序識別數據的特徵,常見應用在於異常檢測(anomaly detection)以及學習數據之間的關聯性,例如取得原本以為關聯不大的數據之間的關聯性。(重點九)
取得學習數據的方式十分重要,需要揭示,如感測器的設置、取得數據的管道與方法等。不同數據應有不同的取得數據的管道與數據特性。(重點十)
-----------------------------------------
有一種AI相關發明是要強化學習模型(reinforcement learning model),AI模型應用在特定用途中,之後藉著學習AI模型在特定應用下產出的數據,進行評分,並反饋優化特定應用下的AI模型。(重點十一)
例如ChatGPT,在自然語言聊天與搜尋應用下取得強大的成果,其中可以持續優化AI模型的原因之一就是有大量使用者反饋的資訊。
現在常見有採用ChatGPT(或其他)的自然語言處理的能力的應用,這類應用並非自行開發AI機器人,而是使用已知的AI模型,因此相關專利應著重在應用的方法、系統等,揭露內容自然就是具備新穎性與進步性的內容,與專利適格性應無太大的關係。(重點十二)
以專利標的而言,應用AI模型的機器人(如聊天機器人、客服機器人、智能幫手,或是運用在特定系統中的智能模型)就是可專利的標的。(重點十三)
Ron
沒有留言:
張貼留言