文/北京集佳知識產權代理有限公司 潘曉松
近年來,隨著人工智能(AI)技術的快速發(fā)展,美國專利商標局(USPTO)針對專利主題適格性(subject matter eligibility),即專利客體問題發(fā)布了更新指導,以應對AI相關權利要求評估的挑戰(zhàn)。本文基于USPTO 2024年7月發(fā)布的更新指導以及2024年12月底發(fā)布的培訓材料中的Example 48、即“語音分離”判例,對主題適格性問題進行了探討。
一、法律框架:AI發(fā)明背景下的Alice/Mayo測試
根據相關指導和培訓材料的指示,所有AI相關的軟件發(fā)明都必須通過源于最高法院判例的Alice/Mayo兩步法測試:
1.第一步(Step 2A, Prong One):權利要求是否“指向”(directed to)一個司法例外,如自然法則、自然現象或抽象概念。在AI領域,最常見的抽象概念包括“數學概念”(如數學關系、公式、算法)和“精神過程”(如人類可以通過思維完成的觀察、評估、判斷)。
2.第二步(Step 2A, Prong Two & Step 2B):如果第一步的答案為是,那么權利要求是否包含“顯著更多”(significantly more)的要素,從而將這個抽象概念轉化為具體的、具有創(chuàng)造性的應用。
USPTO的最新指南強調,在評估第二步之前,審查員應首先在第一步的第二個分支(Prong Two)中判斷:權利要求作為一個整體,是否將司法例外“整合”(integrates)到了一個“具體的實踐應用”(practical application)中?如果答案是肯定的,那么該權利要求就不再被視為“指向”抽象概念,從而直接滿足101條的要求,無需進入更為嚴格的Step 2B分析。
二、Example 48詳細分析:基于AI的語音分離和識別
Example 48標題為“使用深度神經網絡的語音分離”,描述了一個在嘈雜環(huán)境中分離混合語音信號的系統、例如虛擬會議。該發(fā)明使用一種人工神經網絡(深度神經網絡,DNN),用包含較少說話者的混合語音信號對其進行訓練,訓練后的網絡可分離更多聲源的語音信號。
1.不具主題適格性的權利要求1(Claim 1)
權利要求1描述了一個語音分離的方法,包括:
(a)接收包含多個不同聲源sn(其中n∈{1,…,N})語音的混合語音信號x;
(b)使用短時傅里葉變換將所述混合語音信號x轉換為時間-頻率域的頻譜圖,并獲取特征表示X,其中X對應于所述混合語音信號x的頻譜圖和從所述混合語音信號x中提取的時間特征;
(c)使用深度神經網絡(DNN)通過公式V=fθ(X)確定嵌入向量V,其中V=fθ(X)是所述混合語音信號x的全局函數。
USPTO的分析:該權利要求被認定為“指向”抽象概念,因而不具備主題適格性。
?步驟(b)中的傅里葉變換是純粹的數學計算。
?步驟(c)中明確限定了一個數學公式,用于計算嵌入向量,這同樣屬于數學概念。
?雖然權利要求中提到了“接收信號”和使用“DNN”,但被認為是高度概括性的。接收數據僅僅是常規(guī)的“數據收集活動”(data gathering),而使用通用的DNN來執(zhí)行數學計算,則被視為“應用它”(apply it)的指令,即將抽象的數學公式應用在一個通用計算環(huán)境上。
核心結論:權利要求1的整體內容僅僅是描述了一系列的數學運算,從一個信號計算出另一個數據(嵌入向量),并未限定如何利用這個計算結果去解決實際的“語音分離”技術問題。因此,未能將抽象的數學概念整合到具體的實踐應用中。
2.具備主題適格性的權利要求2(Claim 2)——從抽象計算到具體技術實現
權利要求2是在權利要求1的基礎上進一步限定的方法,增加了以下步驟:
(d)將所述嵌入向量V劃分為與不同聲源sn對應的聚類;
(e)對所述聚類應用二進制掩碼,以生成帶掩碼的聚類;
(f)從所述帶掩碼的聚類中合成語音波形,其中每個語音波形對應于不同的聲源sn;
(g)組合所述語音波形以生成混合語音信號x’,具體為:將與不同聲源sn對應的語音波形拼接,排除目標聲源ss的語音波形,使得所述混合語音信號x’包含來自不同聲源sn的語音波形,且不包含來自目標聲源ss的語音波形;
(h)將所述混合語音信號x’傳輸至遠程位置存儲。
USPTO的分析:該權利要求被認定為具備適格性。
?步驟(h)中的“傳輸”屬于無關緊要的“非解決方案相關活動”。
?步驟(f)和(g)通過記載 “深度神經網絡如何輔助聚類分配以匹配混合語音信號中識別的聲源,隨后將這些聚類合成為時域中的分離語音波形,并轉換為排除非目標聲源音頻的混合語音信號”,體現了說明書中討論的改進。
權利要求2的技術方案解決了“分離同類語音源的語音”的問題,且無需預先知曉說話者數量或進行說話者特定訓練。
這些步驟體現了說明書中描述的改進。因此,該權利要求指向對現有計算機技術或語音分離技術的改進,且已將抽象概念整合為實際應用。
總結:Example 48代表了AI下§ 101分析的關鍵進步,AI往往涉及數學模型,風險抽象,該判例強調了記載(recitation)例外與涉及(involve)例外的區(qū)分。權利要求1明確記載數學概念,而權利要求2同樣涉及數學概念但突出了整體權利要求分析,相關培訓材料中指出,需要評估各個限定特征之間的相互關聯(例如權利要求2的步驟(f)和(g))。同時,也提醒申請人,應強調解決的技術問題,而非僅結果。
參考資料:
1.Reminders on evaluating subject matter eligibility of claims under 35 U.S.C. 101;
2.2024 Guidance Update on Patent Subject Matter Eligibility, Including on Artificial Intelligence