如何提高GPT生成式技術的效能，產出更精確的內容？

作者：Morty Lai

2022 年底 ChatGPT 聊天機器人推出後，它理解文字和產出內容的能力顛覆了全世界人類的想像，上線後僅短短 5 天內就超過 100 萬人註冊使用。這一切始於生成式人工智慧 (Generative AI) 的技術，其應用場景從 ChatGPT 可以針對使用者問題給予相應的自然流暢且具體的回覆，翻譯文章、撰寫論文、劇本、小說，甚至是寫電腦程式碼等 B2C 需求轉移到 B2B 的輿情分析、智能客服、行銷科技、健康助理等，以及 B2G 場景，從單點爆發轉為串聯式應用，並為發展許久的物聯網、智慧城市注入新動能。

在網路輿情分析服務中，陸續推出相關 GPT 技術應用。為了充分發揮 GPT 生成式技術優勢、提高內容精確度與降低應用成本，必需採取明智的使用策略。由於 ChatGPT 計費方式與提示內容和產生內容的數量呈正相關，因此，提示內容的設計方式是影響效能與成本的重要因素之一。同時，當提供 ChatGPT 相關服務時，善加利用已產生的內容也能減少 ChatGPT 的使用次數，進一步節省成本。根據上述概念，史丹佛研究團隊提出三項關於ChatGPT的使用策略：提示調整(Prompt adaptation)、大型語言模型近似(LLM approximation)和大型語言模型串聯(LLM cascade)。

提示調整是指透過設計良好的提示內容，避免加入與產生冗餘的資訊，並能更精確地生成所需內容。在進行大量輿情分析時，可以運用多樣的自然語言處理技術，事先對海量資料進行去重複、精簡化和雜訊過濾等處理。接下來，根據分析服務的類型，先將預處理後的資訊與合適的提示內容結合，再交由 ChatGPT 生成分析內容。相較於直接將所有資料交由 ChatGPT 分析，若能運用良好的提示調整策略，不僅能獲得更精準的分析內容，也能夠節省資源並更快地完成。舉例來說，假設希望 ChatGPT 能參考已知的故事情節和寓意，並基於不同的故事情節提供相應的寓意。一種直觀的自動化方法是，在每次提示中都包含一個已知故事情節和其寓意，再附上一個需要生成寓意的故事情節。然而，在實際應用中，我們可以根據字數的限制，僅提供已知故事情節和寓意，然後列舉多個需要生成寓意的故事情節。範例中可見，提示包含「國王的新衣」的故事情節和寓意，以及「賣火柴的小女孩」和「夜鶯」的故事情節。如此一來，我們可以從 ChatGPT 的回覆中，同時獲得這兩個故事情節的寓意。通過簡單的提示調整可以減少 ChatGPT 的使用次數，並且獲得所需的多個故事寓意。

大型語言模型近似策略則可以視為對 ChatGPT 產生內容的再利用。在大量且持續的輿情分析工作中，部份分析的資料內容可能相當相似。在繁複的分析流程中，並非每個步驟都需要再次使用 ChatGPT 來生成內容，而是可以直接使用先前已生成的資訊。如此一來，在擁有大量或頻繁的分析需求時，就能避免 ChatGPT 大量產生相似的內容，從而顯著減少 ChatGPT 的使用量。此外，將生成的資訊用於訓練資料，也是一個值得探索的方法。這樣可以提供資料對於既有的模型進行微調，進而改善模型的效果。隨著分析需求的提升，大型語言模型近似的策略越能發揮更大的效用。當接收到另一個提示內容為「提供故事的潛在涵義」時，可以運用文字探勘相關技術進行內容比對，確認是否存在相似內容。若有相似內容存在，則可以將之前獲得的相關內容返回。我們看到了「提供故事的寓意」這一表述，而非「提供故事的潛在含義」。透過內容相似度的比對，我們得以確定「潛在含義」與「寓意」在此指涉同一概念，即便向 ChatGPT 提出詢問，所獲得的回應亦會極為相似。同時，在前一範例和以下範例，我們可觀察到，對於「故事的寓意」以及「故事的潛在含義」的探問，所獲得的回覆呈現相近之特點。

最後一個策略是大型語言模型串聯，顧名思義就是使用多個大型語言模型。隨著大型語言模型的發展，不同的語言模型在各種任務上都有不同的表現，目前仍未出現一個全面領先的語言模型。此外，不同語言模型的計費方式也各有差異。舉例來說，對於輿情分析中常見的情緒分析任務， ChatGPT 並不是效能最好的模型；相反，若使用專注於情緒分析的模型，則能獲得更高的準確度，並可能不需要花費任何費用。針對不同的任務，選擇適合的語言模型至關重要，才能同時提升效能並降低費用。在同時考量成本與品質的情況下，可以採用 GPT-3.5 和 GPT-4 的混用方式。在前面的範例中，都是使用 GPT-3.5 產生「賣火柴的小女孩」故事寓意，而下面的範例則是由 GPT-4 產生。比較前後兩個範例的內容，可以發現品質差異不大。由此可知，對於部分的任務而言，使用 GPT-3.5 足以產生高品質的內容。

儘管上述策略近期才被提出，但大數據(股)公司技術中心團隊早已深入研究、運用及開發相關技術與策略，以提供企業品牌在網路聲量、輿情分析獲取快速且高品質的服務。特別是在《KEYPO大數據關鍵引擎》的全新「GPT智能輿情分析」功能中，我們同時運用了多樣策略，提供可靠且穩定的自動化分析服務功能。此外，持續進行研究與開發，並不斷優化或提出全新行銷解方，以應對市場變化去調整，才能在長期使用下，持續創造最佳效益。

想了解更多全台首創結合「GPT 智能輿情分析」的《 KEYPO 大數據關鍵引擎》輿情分析系統強大功能了嗎？請立即與我們聯絡以取得更多資訊。

Image by Freepik