ChatGPT崛起，大量文本分析的自動化摘要成為市場最佳助攻方案

作者：Morty Lai

傳統式的輿情監測需要耗費大量的人力進行蒐集、分析與摘要網路上數以萬計的新聞資訊、社群言論，隨著科技進步，網路輿情分析工具越來越能即時且精確地提供專業輿情分析師或行銷人員所需要的資訊，主要方式是透過自動化摘要(Automatic Summarization)快速地了解大量文本的重點內容，進而更容易理解和評估公眾對特定主題或事件的觀點，並識別出重要時事的趨勢和網路聲量變化，以便讓輿情分析師或行銷人員及時做出相對應的策略建議與調整。

自動化摘要目前已成為網路輿情分析和自然語言處理（Natural Language Processing，NLP）的關鍵課題，在其研究領域中主要可分為抽取式摘要(Extractive Summarization)和生成式摘要(Abstractive Summarization)兩種不同類型。「抽取式摘要」是透過機器學習、詞頻、關鍵詞重要性分析等技術，從原始文本中直接提取重要訊息並組合成摘要，以保留原始文本的準確性和一致性，同時以簡潔的摘要方式呈現。「生成式摘要」則是利用機器學習或深度學習模型等技術，根據文本的語義和結構生成全新的摘要內容，不僅僅是原始文本的重組，而是根據理解的內容生成新的表達方式。在表1中，以Apple Vision Pro特色介紹為例展示抽取式摘要和生成式摘要的差異。我們可以觀察到，抽取式摘要的句子都是直接從原始內容中提取的，而生成式摘要則會使用相似的詞語進行改寫。無論是抽取式摘要還是生成式摘要，人工智慧已經取得了顯著的成果，並有著廣泛的應用。

那在自動化摘要中，哪些原因扮演著重要的因素呢？在ChatGPT崛起的時代，人人都想運用它來進行自動化摘要，不過在處理大量文本的情況下，這並不是一個直接且簡單的解決方案。首先，自動化摘要需要處理龐大的文本數據，通常會伴隨著許多雜訊，這些雜訊可能會對摘要品質產生語句謬誤或負面影響。舉例來說，廣告訊息、抽獎留言和連結網址等都是常見的雜訊。若在進行大量文本的自動化摘要時將這些雜訊納入考量，生成的摘要內容很可能會含有許多不重要的訊息，進而影響摘要的品質。此外，ChatGPT本身有文本長度使用限制，這使得自動化摘要在處理大量文本時面臨技術上的挑戰。因此，對於大量文本的自動化摘要，需要解決雜訊處理和文本長度限制，才能快速提供準確且可靠的內容。

另一方面，自動化摘要的品質與提示工程(Prompt engineering)也有著密切相關性。在生成摘要時，提示工程給予AI模型度提示和指導訊息，以提升生成內容的品質和符合度。近期有學者對於ChatGPT已經使用不同的提示內容進行評測，結果顯示提示內容對ChatGPT的摘要品質有明顯影響。以ChatGPT進行摘要處理為例，在提示中加入精簡或宣傳等不同詞語，就能生成截然不同的寫作風格的摘要內容。由此可知，在進行大量文本的自動化摘要時，除了需要克服軟體工程和技術挑戰外，提示工程的相關設計也至關重要，需要兩者兼具才能運用AI模型生成更準確和全面的摘要內容。

大數據公司憑藉過往在AI模型、軟體工程和提示工程方面的經驗與技術，整合海量文本資訊，並結合生成式AI – ChatGPT，推出全台首創結合「ChatGPT 智能輿情分析」《KEYPO大數據關鍵引擎》提供快速且精確地洞察分析輿情報告功能。無論是企業、品牌還是公眾人物，都可以透過《KEYPO大數據關鍵引擎》的「ChatGPT 智能輿情分析」一鍵產出輿情分析報告，獲得更即時的第一手網路聲量洞察內容，讓原本需要數小時或數天的分析洞察過程縮短至數分鐘，為企業品牌帶來更即時且客觀的解析。

想了解更多全台首創結合「ChatGPT 智能輿情分析」的《 KEYPO 大數據關鍵引擎》輿情分析系統強大功能了嗎？請立即與我們聯絡以取得更多資訊。

Image by Freepik