如何提高GPT生成式技術的效能,產出更精確的內容?

作者:Morty Lai

2022 年底 ChatGPT 聊天機器人推出後,它理解文字和產出內容的能力顛覆了全世界人類的想像,上線後僅短短 5 天內就超過 100 萬人註冊使用。這一切始於生成式人工智慧 (Generative AI) 的技術,其應用場景從 ChatGPT 可以針對使用者問題給予相應的自然流暢且具體的回覆,翻譯文章、撰寫論文、劇本、小說,甚至是寫電腦程式碼等 B2C 需求轉移到 B2B 的輿情分析、智能客服、行銷科技、健康助理等,以及 B2G 場景,從單點爆發轉為串聯式應用,並為發展許久的物聯網、智慧城市注入新動能。

在網路輿情分析服務中,陸續推出相關 GPT 技術應用。為了充分發揮 GPT 生成式技術優勢、提高內容精確度與降低應用成本,必需採取明智的使用策略。由於 ChatGPT 計費方式與提示內容和產生內容的數量呈正相關,因此,提示內容的設計方式是影響效能與成本的重要因素之一。同時,當提供 ChatGPT 相關服務時,善加利用已產生的內容也能減少 ChatGPT 的使用次數,進一步節省成本。根據上述概念,史丹佛研究團隊提出三項關於ChatGPT的使用策略:提示調整(Prompt adaptation)、大型語言模型近似(LLM approximation)和大型語言模型串聯(LLM cascade)。

提示調整是指透過設計良好的提示內容,避免加入與產生冗餘的資訊,並能更精確地生成所需內容。在進行大量輿情分析時,可以運用多樣的自然語言處理技術,事先對海量資料進行去重複、精簡化和雜訊過濾等處理。接下來,根據分析服務的類型,先將預處理後的資訊與合適的提示內容結合,再交由 ChatGPT 生成分析內容。相較於直接將所有資料交由 ChatGPT 分析,若能運用良好的提示調整策略,不僅能獲得更精準的分析內容,也能夠節省資源並更快地完成。舉例來說,假設希望 ChatGPT 能參考已知的故事情節和寓意,並基於不同的故事情節提供相應的寓意。一種直觀的自動化方法是,在每次提示中都包含一個已知故事情節和其寓意,再附上一個需要生成寓意的故事情節。然而,在實際應用中,我們可以根據字數的限制,僅提供已知故事情節和寓意,然後列舉多個需要生成寓意的故事情節。範例中可見,提示包含「國王的新衣」的故事情節和寓意,以及「賣火柴的小女孩」和「夜鶯」的故事情節。如此一來,我們可以從 ChatGPT 的回覆中,同時獲得這兩個故事情節的寓意。通過簡單的提示調整可以減少 ChatGPT 的使用次數,並且獲得所需的多個故事寓意。

大型語言模型近似策略則可以視為對 ChatGPT 產生內容的再利用。在大量且持續的輿情分析工作中,部份分析的資料內容可能相當相似。在繁複的分析流程中,並非每個步驟都需要再次使用 ChatGPT 來生成內容,而是可以直接使用先前已生成的資訊。如此一來,在擁有大量或頻繁的分析需求時,就能避免 ChatGPT 大量產生相似的內容,從而顯著減少 ChatGPT 的使用量。此外,將生成的資訊用於訓練資料,也是一個值得探索的方法。這樣可以提供資料對於既有的模型進行微調,進而改善模型的效果。隨著分析需求的提升,大型語言模型近似的策略越能發揮更大的效用。當接收到另一個提示內容為「提供故事的潛在涵義」時,可以運用文字探勘相關技術進行內容比對,確認是否存在相似內容。若有相似內容存在,則可以將之前獲得的相關內容返回。我們看到了「提供故事的寓意」這一表述,而非「提供故事的潛在含義」。透過內容相似度的比對,我們得以確定「潛在含義」與「寓意」在此指涉同一概念,即便向 ChatGPT 提出詢問,所獲得的回應亦會極為相似。同時,在前一範例和以下範例,我們可觀察到,對於「故事的寓意」以及「故事的潛在含義」的探問,所獲得的回覆呈現相近之特點。

最後一個策略是大型語言模型串聯,顧名思義就是使用多個大型語言模型。隨著大型語言模型的發展,不同的語言模型在各種任務上都有不同的表現,目前仍未出現一個全面領先的語言模型。此外,不同語言模型的計費方式也各有差異。舉例來說,對於輿情分析中常見的情緒分析任務, ChatGPT 並不是效能最好的模型;相反,若使用專注於情緒分析的模型,則能獲得更高的準確度,並可能不需要花費任何費用。針對不同的任務,選擇適合的語言模型至關重要,才能同時提升效能並降低費用。在同時考量成本與品質的情況下,可以採用 GPT-3.5 和 GPT-4 的混用方式。在前面的範例中,都是使用 GPT-3.5 產生「賣火柴的小女孩」故事寓意,而下面的範例則是由 GPT-4 產生。比較前後兩個範例的內容,可以發現品質差異不大。由此可知,對於部分的任務而言,使用 GPT-3.5 足以產生高品質的內容。

儘管上述策略近期才被提出,但大數據(股)公司技術中心團隊早已深入研究、運用及開發相關技術與策略,以提供企業品牌在網路聲量、輿情分析獲取快速且高品質的服務。特別是在《KEYPO大數據關鍵引擎》的全新「GPT智能輿情分析」功能中,我們同時運用了多樣策略,提供可靠且穩定的自動化分析服務功能。此外,持續進行研究與開發,並不斷優化或提出全新行銷解方,以應對市場變化去調整,才能在長期使用下,持續創造最佳效益。

想了解更多全台首創結合「GPT 智能輿情分析」的《 KEYPO 大數據關鍵引擎》輿情分析系統強大功能了嗎?請立即與我們聯絡以取得更多資訊。

Image by  Freepik