言在此而意在彼!運用AI技術力,揭露語意的弦外之音

作者:Morty Lai

人類語言博大精深,科學家一直嘗試著讓電腦變得和人類一樣,具有感知、學習與協助決策的能力。自然語言處理(Natural Language Processing,NLP)成為近年來熱門且挑戰性十足的研究領域。但是,人類語言的博大精深,有辦法教會電腦理解嗎?尤其一詞多義的雙關語是運用詞的多義和同音條件,有意使語句具有雙重意義,言在此而意在彼的修辭方式。例如「這樣吃牛肉麵的話會很難吃」,在這個句子中的「難吃」可解釋為方法不對「很困難」進食,或指味道不好。這些不僅讓人類說話時要花上心思理解的修辭方式,以現在電腦處理的方式有可能最後產生的語言模型,並沒有邏輯、因果與知識。

在利用大型語言模型(Large Language Model,LLM)作為自動化輿情洞察報告的核心時,模型的語義理解能力對於報告的準確性有相當的影響。考量到網路輿情的龐大數量和多元來源,以及包含的各種表達方式,模型必須能夠正確地理解輿情內容,才能提供精準洞見。分析「蘋果」這一詞彙的網路輿情時,若不能夠妥善地分辨揪竟是農產品,還是電子產品,則也許會產生不盡理想的分析內容。因此,在建立自動化輿情洞察報告服務時,先對模型的理解能力進行全面評估是不可或缺的,這是讓輿情洞察內容能夠更為準確和可靠的事前工作。

若要了解模型理解力,可以藉由評測語意和邏輯一致性的方式,觀察模型對於多樣的表達方式以及複雜概念的認知程度。常見的語意和邏輯一致性,可以分成4種類型,分別是:

  1. 語意等價性(Semantic equivalence):對於相同的語意,可以用不同的語句進行表述,若模型有較佳的認知能力,則可對於不同語句,但相同語意的內容,給予一致的回應。
  2. 否定與對立性(Negation property):對於不同語意的內容,可能語句僅有微小的差異,例如:小明在上(放)學的途中,僅有一字之差,卻表示不同的語意。
  3. 對稱性(Symmetric property):在包含兩個語句的問題或描述中,即便這兩個語句的順序發生交換,所給予的回答應當保持一致。例如,「蘋果很好吃」與「蘋果用起來很順手」中的「蘋果」是否指同一概念;再將兩個語句先後順序對換為「蘋果用起來很順手」與「蘋果很好吃」,此時句中的「蘋果」是否指同一概念。根據對稱性原則,這兩個問題應該得到類似的回答。
  4. 遞移性(Transitive property):遞移性是指邏輯推理的遞移關係,以邏輯表達的方式敘述,可以視為,若a則b且若b則c皆成立,則若a則c也應該成立。一樣以「蘋果」來做遞移性測試,並可觀察同樣一句「蘋果很好用」,會被視為產品或工具,但也可能被視為農產品。由此可見,遞移性測試對於語言模型有相當的挑戰。

在完成理解力的相關評測後,一個直覺的疑問就是,如何讓模型有更好的理解力?常見的運用策略有以下三種,分別是「提示設計」、「少樣學習(few-shot learning)」和「模型尺寸提升」。提示設計指的是針對特定任務,嘗試使用多樣化的提示內容,以獲得更佳的回應效果。相關研究顯示,透過提示設計來增進語義與邏輯的一致性存在著相當的挑戰。因為,從實驗的統計數據來看,這種方法在提升一致性方面很難達到統計學上的顯著差異。另一方面,少樣本學習是常用於增加準確度的方法之一,但是對於一致性的相關評測,並不一定有正向的幫助。最後,可以嘗試使用參數更多的大型語言模型。在多數的任務中,更大的語言模型通常都有更好的表現,而在語義與邏輯的一致性的部份評測也不例外,GPT4的表現顯著優於ChatGPT。

大數據股份有限公司始終專注於提供精確的網路輿情分析,為了對已有服務持續進行品質的監控與提升,我們對於最新技術的運用與探索永不停歇。為了提供最優質的服務,我們整合了多種AI技術、30億筆輿情數據,以及多樣化的軟體工程技術。在《KEYPO大數據關鍵引擎》和最新「GPT智能輿情分析」功能,提供使用者可以迅速、準確地掌握網路輿情、市場趨勢及競爭對手動態,更能夠從中挖掘出深層次的原因和影響,協助企業品牌擬訂精準行銷策略,從而迅速抓住潛在消費者目光。

想了解更多全台首創結合「GPT 智能輿情分析」的《 KEYPO 大數據關鍵引擎》輿情分析系統強大功能了嗎?請立即與我們聯絡以取得更多資訊。

Image by rawpixel.com on Freepik