站在新的一個十年,智能人機交互、多模態融合、結合領域需求的 NLP 解決方案建設、知識圖譜結合落地場景等將會有突破性變化。
1 智能人機交互
語言模型將在智能人機交互中扮演更重要的角色,形成更豐富的形式,混合 100 種語言的多語言語言模型,以及融合圖像-文本和語音-文本多模態語言模型將嶄露頭角,在不同語言、不同模態、不同領域的小樣本場景下帶來全面的能力提升。
多語言交互從不同語言理解上升到不同文化的理解,通過跨文化理解技術深入當地文化實現地道的對話交互。
以在線文本為核心的交互方式將全面轉變為結合視頻、圖像、語音、文本的多模態人機交互。
基于數據驅動的對話狀態跟蹤和對話策略將逐漸替代規則式策略,使得多輪對話技術進一步演進,帶來更自然的對話體驗。
知識圖譜將廣泛融入問答和對話的各類深度學習模型,通過先驗知識及推理能力的融入,使得模型更為白盒化,在對話的理解和生成過程中帶來更好的可控性和可解釋性。
對話系統在小樣本情況下的冷啟動能力提升帶來應用構建成本的大幅下降,對話系統從主要為大體量的客戶服務,拓展為更普惠的、廣泛的支持海量規模、各行業的小企業及小商家,并進一步走向海外,使得更多不同國家、不同語言和不同文化的用戶進入智能服務時代。
2 多模態融合
隨著 5G 和邊緣計算的逐步成熟和普及,將帶來視頻、圖像、文本、語音等模態的全面融合,語言模型朝著多模態融合的方向發展,在在線場景下實現混合模態的理解,將能融合理解用戶經過多輪對話發送的圖片、語音和文字內容,并以多模態的形式進行回復;
對話系統產品中將全面實現多模態交互能力,直播和 IOT 大屏交互將全面應用視頻+圖像+文本多模態技術帶來豐富的交互體驗,流暢的全雙工語音對話機器人將被普遍應用,實現邊聽邊想、邊聽邊猜、主動搶話等類人交互能力。
在語音交互場景下通過聲學信號+文字信號,識別用戶交流中的情緒變化, 在 IOT 互動場景下實現基于攝像頭、麥克風的擬態生命;
3 結合領域需求的NLP解決方案建設
過去 NLP 算法多以平臺/API 的方式輸出通用模型,相應地也在各種云上建立了通用 NLP 算法平臺(Amazon Comprehend,微軟 Azure Text Analytics,谷歌云 Natural Language,阿里 NLP,百度 NLP 等)。
但是在業務場景中,每種場景領域都有自己的特定的需求,產生了相應的場景數據。通用模型結合場景數據進行領域自適應訓練,從而輸出的領域定制模型會更好地滿足業務需求。
4 知識圖譜結合落地場景
面向新的一個十年,通過 NLP 和知識圖譜兩大核心技術來構建行業知識圖譜,機器能夠通過知識圖譜挖掘隱性關系,洞察“肉眼”無法發現的關系和邏輯,用于最終的業務決策,實現更深層次的業務場景落地。從發展方向來說,可以分為下面幾個方面:
優化知識抽取能力:結合已有的知識和 NLP 技術能力進一步提高非結構化數據理解能力,應用預訓練語言模型、信息抽取、實體鏈接等相關的技術,對非結構化及半結構化數據進行抽取和轉換,形成知識圖譜形式的知識,以及和知識圖譜里面的結構化的知識進行鏈接。
與行業知識沉淀:在行業知識圖譜解決方案實際的落地過程中,面臨重重挑戰,行業知識圖譜的構建,本身就需要數據積累和基于業務場景的數據理解,而構建和積累行業知識圖譜,將是認知智能時代的核心競爭力。在行業數據構建時,對知識的準確性要求非常高,實體通常需要較多且具有行業意義。需要針對多源異構數據融合,基于可動態變化的“概念—實體—屬性—關系”數據模型,對各種類型的數據進行抽象建模。
智能可信的知識推理:基于過去已知知識進行知識推理,理解行業事件知識驅動知識推理傳導,利用行業規則邏輯結合深度模型進行推理,使其能夠在業務的推理和輔助決策上帶來更加智能化的體驗。
以上是我們對于 NLP 技術過去一年發展的回顧和今年趨勢的思考。一家之言難免疏漏或者以偏概全。拋磚引玉,希望能夠得到更多同學們的思考和指正。比爾·蓋茨曾說過,“語言理解是 人工智能 皇冠上的明珠”。要達到這樣的高度,還需要技術和應用上的突破發展期待在下一個十年的開始,我們一起讓 NLP 技術發展更加迅速,應用場景更加豐富,推動認知智能的發展更進一步。
機器人招商 Disinfection Robot 機器人公司 機器人應用 智能醫療 物聯網 機器人排名 機器人企業 機器人政策 教育機器人 迎賓機器人 機器人開發 獨角獸 消毒機器人品牌 消毒機器人 合理用藥 地圖 |