AI (人工智慧): 伺服器

關於

Agent DVR 完全整合了 AI 伺服器,如 DeepStack AI、CodeProject AI、PlateRecognizer.com、Claude、Gemini、OpenAI (ChatGPT) 以及本地 LLM,如 Ollama、vLLM 和 LM Studio,以添加智能警報過濾、物體識別、場景識別和智能事件控制。

除了 DeepStack 和 CodeProject AI,您還可以使用其他支持相同 API 的 AI 伺服器:

物體識別與計算機視覺
雲端 AI 服務
本地 AI 伺服器 (LLMs)
注意:雲端 AI 服務需要 API 金鑰,並可能產生使用費用。本地 AI 伺服器運行在您自己的硬體上,並保持數據私密,但需要更多系統資源。

設置人工智慧

AI 伺服器清單

設置 AI 伺服器,請在主 Agent DVR 用戶界面的左上角點擊 圖標。然後在 配置 下點擊 設置,從下拉菜單中選擇 AI 伺服器,並點擊 配置

Agent DVR 集成了 CodeProject.AI,用於各種 AI 功能,包括物體識別、人臉識別、ALPR(自動車牌識別)和超高清晰度(增強)。PlateRecognizer.com 也支援作為 ALPR 提供者。CodeProject.AI 是開源的、免費的,並且與大多數平台兼容。

首先,為您的平台安裝一個 AI 伺服器,然後通過點擊 配置 按鈕,再點擊 添加 來將 Agent DVR 連接到它。

您可以根據需要向 Agent 添加多個 AI 伺服器。Agent 中的攝像機可以配置為為每個功能使用不同的 AI 伺服器,或者您可以為所有任務使用一個 AI 伺服器。

警告:AI 處理可能會消耗大量資源。請確保您的電腦有足夠的能力運行它。
配置您的伺服器
  • 名稱: 為您的伺服器命名,例如 Cat Catcher。
  • AI 伺服器 URL: 輸入您的 AI 伺服器的 URL,例如 http://localhost:32168/
  • API 金鑰: 如果設置了,請輸入您的金鑰(可選)。
  • 超時: 伺服器請求的超時時間(秒)。
  • 重試延遲: 在重新嘗試失敗的對該伺服器的請求之前的時間(秒)。

點擊 確定 以保存您的設置。

使用 OpenAI

設置 OpenAI("Chat GPT")以回答有關您的視頻鏈路中發生的事情的問題,請前往伺服器設置 - AI 伺服器,並在 Ask AI 下選擇 "Open AI"。

  • URL: 輸入服務的 URL。默認為 "https://api.openai.com/v1/chat/completions"。
  • OpenAI API 金鑰: 在註冊 OpenAI 後,前往 API 金鑰頁面 並生成一個新的秘密金鑰。將此金鑰複製並粘貼到指定的字段中。
  • 模型: 指定要使用的模型。默認為 gpt-4o。OpenAI 可能會在以後刪除或更改此模型。
  • 最大標記: 這將設置每個請求的最大標記使用量。如果遇到問題,請檢查 /logs.html 中的日誌,因為這可能與標記使用有關。

一旦配置了 OpenAI,請參考 Ask AI 以獲取有關如何使用它回答有關您攝像機鏈路中發生的事情的一般問題的說明。

使用Claude

設置Claude AI以回答有關您的視頻鏈路中發生的事情的問題,請前往伺服器設置 - AI伺服器,並在“問AI”下選擇“Claude”。

  • 網址: 輸入服務的網址。默認值為"https://api.anthropic.com/v1/messages"。
  • Claude API金鑰: 註冊Claude後,訪問API金鑰頁面並創建一個新的秘密金鑰。將此金鑰複製並粘貼到字段中。
  • 版本: 指定要使用的版本。默認值為 2023-06-01。這可能會被Anthropic在某些時候移除或更改。
  • 模型: 指定要使用的模型。撰寫時的默認值為 claude-3-sonnet-20240229
  • 最大令牌: 這控制每個請求的最大令牌消耗。如果出現問題,請檢查/logs.html中的日誌,因為這可能與令牌消耗有關。

一旦配置了Claude,請查看問AI以了解如何使用它來識別攝像機鏈路中的一般情景。

使用雙子座

設置Gemini以回答有關您視頻鏈路中發生情況的問題,請前往伺服器設置 - AI伺服器,並在「問AI」下選擇「Gemini」。

  • URL: 輸入服務的URL。默認為"https://generativelanguage.googleapis.com"。
  • Gemini API金鑰: 註冊Gemini後,訪問API金鑰頁面並創建一個新的秘密金鑰。將此金鑰複製並粘貼到字段中。
  • 版本: 指定要使用的版本。默認為v1beta。這可能會被Google在某些時候移除或更改。
  • 模型: 指定要使用的模型。撰寫時的默認值為gemini-1.5-flash
  • 最大令牌: 這控制每個請求的最大令牌花費。如果出現問題,請檢查/logs.html中的日誌,因為這可能與令牌花費有關。

配置Gemini後,請參見問AI以了解如何使用它來識別攝像機鏈路中的一般情景。

使用其他 LLM 伺服器

v6.5.3.0+ 開始,您可以使用自己的本地 LLM 伺服器(如 vLLM、Ollama 和 LM Studio)來描述 Agent DVR 從您的攝影機捕獲的圖像,並在警報事件中回答有關您視頻流中發生的事情的問題。請參見 AI 描述詢問 AI

要配置本地 AI 伺服器,請轉到伺服器設置 - AI 伺服器,然後單擊您想使用的 LLM 旁邊的配置按鈕(Ollama、vLLM 或 LM Studio)。

  • URL: 指定您的 LLM 伺服器運行的端點。默認 URL 為:
    • Ollama: http://localhost:11434/api/chat
    • vLLM: http://localhost:8000/v1/chat/completions
    • LM Studio: http://localhost:1234/v1/chat/completions
  • API 金鑰: 如果您的 LLM 伺服器需要身份驗證,請在此輸入 API 金鑰。大多數本地伺服器不需要此項,除非特別配置。
  • 模型: 選擇用於圖像分析的視覺能力模型。您必須已經在您的 LLM 伺服器中下載並加載此模型。流行的選擇包括:
    • LLaVA 模型(通用視覺)
    • Qwen2-VL(高性能)
    • Llama 3.2 視覺(Meta 最新)
  • 溫度: 控制響應中的創造力與準確性(0.0-1.0)。較低的值(0.3-0.4)會產生更具事實性和一致性的描述。較高的值(0.6-0.8)會生成更多樣化和創造性的響應。建議:安全攝影機分析使用 0.4。
  • 最大標記數: AI 響應中的最大單詞/標記數。較高的值允許更詳細的描述,但生成所需時間較長。建議:詳細圖像分析使用 300-500,簡短描述使用 150-250。
  • top_p: 通過限制詞彙選擇來控制響應的多樣性(0.0-1.0)。較低的值使用更常見的單詞,較高的值允許更多樣化的詞彙。建議:0.9 以獲得準確性和自然語言的良好平衡。
  • top_k: 限制模型從最有可能的 K 個下一個單詞中選擇。較低的值(20-40)會產生更集中化的響應,較高的值(80-100)允許更多變化。建議:50 以獲得可靠的圖像描述。
注意: 您必須單獨安裝和配置所選的 LLM 伺服器。在配置 Agent DVR 之前,請確保您已下載具備視覺能力的模型。為了獲得最佳的安全攝影機效果,請使用至少 7B 參數的模型,並確保您的系統具有足夠的 VRAM(建議 5GB 以上)。

使用 PlateRecognizer.com

要在Agent DVR中配置LPR(ANPR或車牌識別),請前往 - AI設置的Server設置,然後在Plate Recognizer下輸入詳細信息。在Plate Recognizer上註冊免費試用。無需信用卡。

  • URL: 輸入服務的URL。默認為"https://api.platerecognizer.com/v1/plate-reader/",或者如果您自己擁有服務器,可以使用自己的服務器。
  • Token: 在註冊Plate Recognizer後,訪問帳戶頁面並複製API Token
  • Regions: 保留默認值或輸入地區的CSV列表。
  • Config: 如果需要,請輸入文檔中的其他配置值。

管理 AI 模組

AI 模組

在上面提到的 AI 伺服器清單中,您可以選擇配置、測試、編輯和移除 AI 伺服器。點擊配置 按鈕以顯示所選伺服器上可用或已安裝的模組。

Agent DVR 從您的伺服器檢索當前的模組清單,並提供用於安裝、卸載、配置和測試每個模組的用戶界面。對於所有預設的 CodeProject.UI 模組提供支援,儘管 Agent DVR 只使用其中的一部分。

建議僅安裝一個物體識別模組選項。請查看每個模組的描述以確定最適合您系統的模組。

要在 Agent DVR 中使用自動車牌識別 (ALPR)、超級解析度或人臉識別,您需要從此頁面安裝相應的模組。通常,這些模組的默認設置就足夠了,但您可以通過點擊每個模組下的 圖標來進行配置。