大家都不懂你的心?大數據和AI其實都知道你在想什麼!

作者:Morty Lai

有天在社群看到一位朋友留言説「看吧!」,此刻你覺得他想表達什麼?是讚賞的意味,抑或是嘲諷的語氣?科技發展至今,人們已逐漸深刻體會到「科技來自人性」,AI、機器人了解人類的心情已不再是電影裡的虛構內容,雖然情緒不是那麼容易透過詞語理解,但隨著經年累月運用演算法訓練機器,情感運算產品也朝向多元化發展,分析人們的喜怒哀樂,提供最「貼心」的資訊。自然語言處理(Natural Language Processing,縮寫NLP)是近年來受到廣泛關注的技術領域,應用在網路輿情分析、智慧助理、語言翻譯等各種應用場景。在輿情分析中,通過對輿情文本進行情緒判別,可以快速准確地了解大眾對某個事件或話題的情感傾向,協助企業品牌和政府機構準備相對應的決策和應對方式。

OpenAI旗下的ChatGPT是基於深度學習技術的自然語言處理模型,能廣泛使用在機器翻譯、文本生成和情緒判別等任務。然而,ChatGPT可能不是網路輿情的情緒判別最佳選擇,因為ChatGPT的訓練資料是透過大量的通用語言資料進行,因此可能無法完全滿足特定領域的需求。在這種情況下,可以使用BERT或ERNIE等其他自然語言處理模型進行微調。2019年Google正式推出的BERT演算法(Bidirectional Encoder Representations from Transformers)是與自然語言處理相關的深度學習算法,在推理、問答等多個領域都有傑出的表現。BERT的特點之一是,它同時考慮上下文之間的關聯,並且不僅僅是以單向方式去預測生成的文本內容。此外,BERT還使用了多層Transformer編碼器,將句子表示為一個向量,從而解決了長句子的問題。在訓練時,BERT採用了遮罩語言模型(Masked Language Model)和下一句預測(Next Sentence Prediction)兩種目標,進一步提高了模型的能力。例如用口語化的句子「明天天氣如何」,和較為正式的關鍵字用法「明日降雨機率」,Google 搜尋結果第一個列出的,都是使用者所在位置的降雨機率預報。

在中文的自然語言處理領域中,百度所推出的ERNIE(Enhanced Representation through kNowledge IntEgration)是特別針對中文語言結構進行優化。相比於其他語言,中文詞語常常有很多歧義,同一個詞語在不同上下文中有不同的含義,需要對上下文有足夠的理解才能在中文領域中有更好的表現。ERNIE的一個特點是加入了知識型編碼器(Knowledgeable Encoder,縮寫K-Encoder),以結合知識圖譜的資訊,讓模型可以學習到實體與關聯。此外,在訓練時,ERNIE考慮了短句、實體等不同層面,以提升模型對於詞語與上下文的理解能力。綜上所述,ERNIE在中文的表現上相對於BERT有更好的表現。

雖然情緒辨識AI相關應用如火如荼發展,但人類表達情緒的方式,除了會因人而異,也會因情境而異,未全盤考量可能導致出現錯誤判讀。近年來,台灣網路上的言論風波不斷,引起了各界的關注,也凸顯了對網路輿情分析的需求。《KEYPO大數據關鍵引擎》是大數據股份有限公司旗下一套結合擁有每月處理上千億中文數據,超過30億筆大數據輿情資料庫,最新「GPT智能輿情分析」功能運用先進的自然語言處理技術,實現真正的自動化輿情洞察報告生成功能。使用者可以迅速、準確地掌握網路輿情、市場趨勢及競爭對手動態,更能夠從中挖掘出深層次的原因和影響,協助企業品牌擬訂精準行銷策略,從而迅速抓住潛在消費者目光。

想了解更多全台首創結合「GPT 智能輿情分析」的《 KEYPO 大數據關鍵引擎》輿情分析系統強大功能了嗎?請立即與我們聯絡以取得更多資訊。

Image by Freepik