AI Explained in 10 Minutes: Prompt, Agent, MCP & Function Calling

  

影片旨在解釋AI領域中的幾個關鍵概念,包括Agent、MCP、Prompt和Function Calling [00:25].

核心概念

  • Prompt(提示詞)
    • User Prompt:用戶向AI模型發送的訊息或問題 [00:46].
    • System Prompt:描述AI角色、性格、背景資訊和語氣等,讓AI的回應更具個性化和針對性 [01:58]. System Prompt通常由系統預設,但在某些應用中(如ChatGPT的自定義功能)用戶可以進行偏好設定,這些偏好會自動成為System Prompt的一部分 [02:29].
  • AI Agent(AI代理)
    • 負責在AI模型、工具和最終用戶之間進行溝通協調的程序,目的是讓AI能夠自動完成任務 [03:13].
    • Agent Tool是提供給AI調用的函數或服務 [04:18].
    • AutoGPT是第一個嘗試讓AI自己執行任務的開源項目,它通過將工具函數註冊到System Prompt中,讓AI模型根據用戶請求調用這些工具 [03:07].
  • Function Calling(函數調用)
    • 大型模型製造商(如OpenAI的ChatGPT、Cloud、Gemini)推出的一項新功能,旨在標準化AI工具的描述和AI調用工具時的回應格式 [05:07].
    • 工具的描述(如名稱、功能、參數)都使用JSON對象定義,並從System Prompt中分離出來,使得AI模型能更精確地理解和調用工具 [05:24].
    • Function Calling的優點在於降低了開發難度,節省了Token開銷,並提高了AI調用工具的可靠性 [06:26].
    • 儘管有這些優點,Function Calling目前還沒有統一的標準,不同廠商的API定義各異,且許多開源模型尚不支持,因此System Prompt和Function Calling兩種方式並存 [06:43].
  • MCP
    • 一個通訊協議,專門規範Agent和工具服務(Agent Tool Service)之間的互動 [07:45].
    • 運行工具服務的稱為MCP Server,調用它的Agent稱為MCP Client [07:54].
    • MCP規定了MCP Server如何與MCP Client溝通,以及MCP Server提供哪些接口,例如查詢工具功能描述、參數格式等 [08:07].
    • MCP Server還可以提供數據(類似文件讀寫服務,稱為resource)或提示詞模板(稱為prompt) [08:21].
    • MCP本身與AI模型無關,它只負責幫助Agent管理工具、資源和提示詞,不關心Agent使用哪個模型 [08:43].

整體流程 當用戶向AI Agent(或MCP Client)提出請求時(例如查詢女朋友肚子疼怎麼辦) [09:03],AI Agent會將問題包裝成User Prompt。接著,Agent通過MCP協議從MCP Server獲取所有工具資訊 [09:13]. 這些工具資訊會被轉換成System Prompt或Function Calling格式,並與User Prompt一起發送給AI模型 [09:19]. AI模型可能會調用特定工具(如網頁瀏覽工具WBSE)來搜索答案 [09:32]. Agent收到請求後,通過MCP協議調用MCP Server中的WBSE工具,WBSE訪問網站並將內容返回給Agent,Agent再轉發給AI模型 [09:43]. AI模型根據網頁內容和自身的判斷生成最終答案,例如「多喝熱水」 [09:59],最後由Agent將結果展示給用戶 [10:03].

影片指出,這些概念並非互相取代,而是像齒輪一樣共同構成AI運作的完整體系 [10:19].

Comments