Newsletter
人工智慧之著作權法律專題:
生成式AI的著作權侵權風險
一、前言
近年來,產業界紛紛傾力研發AI(Artificial Intelligence,即人工智慧)技術的相關應用,其中,聊天機器人ChatGPT更於2022年開放使用者免費使用,大幅提升了生成式AI工具的近用性。生成式AI能自動回答使用者提出的問題、協助翻譯、整理資料,甚至能夠生成文本、圖片、音樂,已經對人類的創作模式和社會分工等整體社會層面產生影響。然而,生成式AI之所以能產出高品質的作品,也是基於蒐集社會上的既有著作,透過AI技術訓練而成。在創作有價的概念逐漸受到重視的現在,AI工具開發商大量運用受著作權保護的創作訓練AI,是否應先向著作權人取得授權?如沒有經過授權,得否援引著作權法上的合理使用原則排除著作權侵害?此議題涉及了原著作權人、AI工具開發商、AI工具利用者之間的利益分配,引起廣泛的爭論。
二、利用著作訓練AI模型可能侵害著作財產權人「重製權」
相較於美國近期已有多起著作權人對AI工具開發商提起的侵權訴訟,台灣尚無類似訴訟案件。
著作權業務主管機關智慧財產局率先於2018年針對AI的著作權議題作成的函釋中,說明在AI只是創作者的工具的情形下,創作完成之作品仍有作者「原創性」及「創作性」之投入,而非單純機器或系統產生之成果,該作品則屬於受著作權法保護之著作。隨後,智慧財產局於2022、2023年陸續闡明對生成式AI模型(如生成文字之ChatGPT、生成圖像之Midjourney及生成影片之Pictory)的開發者蒐集提供大量資料給AI模型訓練學習的行為,涉及「重製」原始著作之行為,除有著作權法第44條至第65條合理使用之情形外,應取得著作財產權人之同意或授權,始得為之。智慧財產局也表示,生成式AI模型以演算法利用網路上之該等著作進行學習不屬於著作權法第44條至第63條規定之適用情形,需參酌本法第65條第2項所定的合理使用四個判斷因素依個案綜合判斷,尚無一定之標準。
依著作權法第3條第1項第5款「重製」的定義,指以印刷、複印、錄音、錄影、攝影、筆錄或其他方法直接、間接、永久或暫時之重複製作。ChatGPT等生成式AI工具開發商尚未公開其龐大的語料庫是如何建構並用以訓練AI,若生成式AI的語料庫是透過網路爬蟲,擷取、複製所有可能出現於公開網路的既有著作而建立,則如上述智慧財產局函釋見解所述,涉及重製行為;但若AI模型是如人類一般,僅瀏覽閱讀既有著作,或對既有著作整理解析成抽象的參數供AI模型進行訓練,而不涉及既有著作的複製和儲存,是否構成著作權法定義的「重製」行為,仍值得深思。
三、結論
現行法上的著作合理使用抗辯能否適用於大量利用他人著作作為AI訓練資料庫尚待進一步討論。台灣目前尚未有生成式AI利用他人著作而生的著作權侵權訴訟,而法院對於第65條第2項的合理使用判斷標準向來均綜合考量所有因素並依個案情形判斷,AI開發者得合理使用他人著作訓練AI模型的自由空間為何?仍須仰賴法院判決予以釐清。同時,智慧財產局已計畫提出與國際接軌的指引,除了上述的智慧財產局函釋以外,進一步闡釋訓練資料的合理使用範圍等重要新興議題,值得持續關注。