4月27日至30日,2023中國家電及消費電子博覽會(AWE2023)在上海新國際博覽中心盛大啟幕。作為亞洲規模最大,全球前三甲家電及消費電子展覽會,AWE向來備受國內外一眾家電廠商的重視,而探境作為人工智能領域冉冉升起的“芯”星,攜最新的離線NLP解決方案閃亮登場。
自然語言處理(Natural Language Processing)對于人機交互的好處毋須贅述,但讓人疑惑的是即使NLP技術已與家電緊密結合,但智能家電的市場占有率仍然較低,且產品粘性也遠不及預期。
這是因為多數家電廠商采用的在線NLP技術,必須依賴于云端算力,配置維護難度極高,如Wi-Fi經常斷網、下載各類APP、要進行各種繁瑣操作等,復雜程度讓人望而卻步,其響應速度及隱私泄漏等問題也是飽受詬病。
而端側NLP方案可為用戶帶來更好體驗。端側NLP技術,即不依賴云端算力,通過端側芯片來實現自然語言理解的方案。它讓自然語義從云端下移到了端側,用戶與家電之間的交互就像日常對話,并且不需要依賴APP或中控,無需配置,通電即用。與云端相比,端側NLP還擁有更快的響應速度和更好的隱私保護,屬于更為普世的“百姓智能”。
據了解,探境離線NLP算法采用了與ChatGPT同源的transformer AI算法,挖掘出自然語言表達中所蘊含的信息,全面提升模型對于領域內語言信息的理解能力,提供更合理的反饋和決策支持。
探境離線NLP方案是基于芯片的端側方案,也就是將NLP模型部署到終端設備上,模型可以在本地設備上進行推理,減少了通信延遲和數據傳輸成本,具有低功耗、高性能、低延遲、數據隱私保護、網絡獨立性、可擴展性等優勢。
以空調為例,若用戶想要打開空調為例,可以隨意表達自己的意圖,“幫我開一下空調”、“把空調開開吧”、“我要開空調”無需記憶固定的命令詞,即可實現對空調的開機控制,此外,像制冷、制熱等模式控制、風速、風向控制等,均可以通過自然語義實現,整個過程像日常對話一樣,更具人性化。
即使是在有噪聲干擾的情況下,探境NLP也能夠準確識別。這要得益于探境專為終端智能設計的AI語音算法,能夠有效解決遠場識別、低誤喚醒率、噪聲干擾、地域口音、詞語泛化等痛點。
同時,借助于跨語種語音表征引擎CLAIR與海量語料支持的弱監督預訓練技術,讓無論是濃重的方言口音,或輕靈稚嫩的童音,也都可以輕輕松松識別到。
“我要最小風速下的制冷模式”,“幫我調到最小風制冷”,“制冷風吹最小風”。對NLP有所涉獵的讀者,可以在視頻中敏銳察覺到探境NLP的這類控制方式,在語音方案層面,它被稱為多意圖識別(multi?intent)。
“幫我倒杯水拿到桌子上”,“去買點白菜再買點土豆”在生活場景中,這樣的一句話中包含多個意思的表達方式十分常見。
多意圖識別,即針對匹配的多個意圖進行處理,對識別出的用戶多個意圖來動態調整后續的話術流程,減少對話輪次,顯而易見,這樣貼地氣的方案,能夠為家電廠商實現更多功能與場景的賦能,為用戶帶來更加人性與智能的體驗。
然而在端側方案中,能夠貼心的為用戶提供這樣的方案卻十分稀少。因為這意味著對于語音識別和語義識別的雙重挑戰。多意圖的語音組合種類多,識別難度大,同時交互內容中含有的信息更豐富,容易誤識別或者漏識別,相對于單意圖,同一句話多意圖之間要考慮邏輯關系,處理更復雜。
正因如此,說離線NLP是自然語言識別方案從在線到離線的一次進化,那么離線NLP從單一意圖到多意圖識別則是質的跳躍。
事實上,“溫度+時間”、“亮度+時間”、“水量+溫度”、“電機轉速+時間+溫度”…在現實生活場景中,用戶需要進行多意圖組合控制的產品不勝枚舉,多意圖方案可以應用到飲水機、風扇、空氣炸鍋等各類小家電品類。
筆者在現場體驗后發現,無論用戶表達的是“開燈”、“開一下燈”、“幫我開開燈”還是“太亮了,調暗一點”、 “暖色光最亮”等,皆可實現想要的光線效果。
尤其難能可貴的是,探境離線NLP多意圖識別方案,已在空調、照明等多個領域實現落地,是真正經過大規模商業化驗證的成熟離線NLP方案。對于廠家而言,不必再顧慮技術驗證及市場接受度,直接與采用探境軟硬化一體的Turn-key方案就在短時間內實現家電產品的智能化。
如中國家電網總編呂盛華所言:“智能化是家電行業發展的重要趨勢之一,通過人機交互、智能控制,全場景智慧生活離消費者越來越近,這或將改寫家電市場現狀和行業格局,而這背后的決定因素,不是家電廠商,不是產業鏈,而是用戶?!?
對于探境而言,離線NLP的歷史使命就是賦能家電廠家,背后是貼合用戶真實訴求,去偽求真,為家電廠商提供適合用戶需求的方案,才能一起改寫家電行業的交互未來,共同走向新的“破繭時刻”。