2024年3月30日消息,據國家知識產權局公告,湯臣倍健股份有限公司申請一項名為“醫療文本意圖識別方法、裝置、電子設備和存儲介質“,公開號CN117786075A,申請日期為2023年12月。
專利摘要顯示,本發明公開了一種醫療文本意圖識別方法、裝置、電子設備和存儲介質,包括:將待識別醫療文本輸入語言模型中,在語言模型輸出當前時間步的多個候選詞元時,通過調用接口調用集束搜索算法搜索出在醫療字典樹中的候選詞元構成當前時間步的、概率排序在前的N個候選詞元序列,從最后一個時間步的N個候選詞元序列中確定出概率最高的候選詞元序列,將概率最高的候選詞元序列所構成的語句確定為待識別醫療文本的意圖語句,實現了通過醫療字典樹指導語言模型輸出符合醫療領域的意圖語句,且通過集束搜索算法從多個候選詞元序列中篩選出概率最高的序列生成意圖語句,提高了意圖語句所表達意圖的準確性和專業性,通過意圖可以準確響應醫療場景的咨詢業務。
在線咨詢