Trí tuệ nhân tạo: Máy chủ

Về chúng tôi

Agent DVR tích hợp hoàn toàn với các máy chủ AI như DeepStack AI, CodeProject AI, PlateRecognizer.com, Claude, Gemini, OpenAI (ChatGPT) và các LLM địa phương như Ollama, vLLM và LM Studio để thêm lọc cảnh báo thông minh, nhận diện đối tượng, nhận diện cảnh và điều khiển sự kiện thông minh.

Ngoài DeepStack và CodeProject AI, bạn cũng có thể sử dụng các máy chủ AI khác hỗ trợ cùng API:

Nhận diện đối tượng & Thị giác máy tính

https://codeproject.github.io/ - Máy chủ xử lý AI dựa trên GPU/CPU đa nền tảng
https://docs.platerecognizer.com/ - Máy chủ nhận diện biển số (API dựa trên web)
https://github.com/runningman84/docker-coral-rest-server - Các mô hình Tensorflow-lite trên RPi (hoặc Linux/Mac) với sự tăng tốc từ USB Coral
https://github.com/robmarkcole/coral-pi-rest-server/ - Các mô hình Tensorflow-lite trên bộ tăng tốc USB Coral thông qua ứng dụng Flask
https://github.com/xnorpx/blue-candle - Máy chủ nhận diện đối tượng siêu nhỏ

Dịch vụ AI Đám mây

https://platform.openai.com/ - API OpenAI (ChatGPT, GPT-4 Vision) cho phân tích hình ảnh và trò chuyện
https://console.anthropic.com/ - API Anthropic Claude cho lý luận nâng cao và hiểu hình ảnh
https://ai.google.dev/ - API Google Gemini cho khả năng AI đa phương thức
https://docs.anthropic.com/ - Tài liệu API Claude
https://platform.openai.com/docs/ - Tài liệu API OpenAI
https://ai.google.dev/gemini-api/docs - Tài liệu API Gemini

Máy chủ AI Địa phương (LLMs)

https://ollama.com/ - Ollama: Chạy các mô hình ngôn ngữ lớn tại chỗ
https://docs.vllm.ai/ - vLLM: Suy diễn và phục vụ LLM với thông lượng cao
https://lmstudio.ai/ - LM Studio: Ứng dụng máy tính để bàn dễ sử dụng cho các LLM địa phương
https://github.com/ollama/ollama - Kho lưu trữ GitHub của Ollama
https://github.com/vllm-project/vllm - Kho lưu trữ GitHub của vLLM

Ghi chú: Các dịch vụ AI đám mây yêu cầu khóa API và có thể phát sinh chi phí sử dụng. Các máy chủ AI địa phương chạy trên phần cứng của bạn và giữ dữ liệu riêng tư nhưng yêu cầu nhiều tài nguyên hệ thống hơn.

Thêm mô hình AI

Để thêm các tệp mô hình của riêng bạn vào Agent DVR, hãy đi tới Cài đặt Máy chủ > Cài đặt AI và nhấp vào Cấu hình dưới Mô hình AI. Agent đi kèm với hai mô hình được xây dựng sẵn đã được tối ưu hóa hiệu suất cho Agent DVR.

Trước khi bạn cấu hình một mô hình, bạn sẽ cần thêm nó vào thư mục Mô hình của Agent DVR. Thư mục này thường nằm ở Agent/Media/Models/ONNX (đường dẫn có thể thay đổi tùy theo hệ điều hành). Đường dẫn đầy đủ sẽ được hiển thị trên trang Thêm Mô hình nếu bạn không chắc chắn. Agent sử dụng các mô hình .onnx. Bạn có thể chuyển đổi các định dạng mô hình AI khác sang ONNX bằng cách sử dụng các công cụ Python.

Ngay khi bạn đã xây dựng và sao chép mô hình, việc thêm nó vào Agent rất đơn giản - nhấp để thêm một mô hình:

Tên: Đặt tên cho mô hình của bạn - điều này có thể là bất cứ thứ gì bạn thích.
Tệp Mô hình: Chọn tên tệp mô hình mà bạn đã sao chép vào thư mục.
Nhãn: Nhập danh sách các nhãn (hoặc "lớp") mà mô hình của bạn tìm kiếm theo định dạng CSV mà không có dấu ngoặc kép (các khoảng trắng sẽ tự động được cắt bỏ).
Bố cục: Chọn xem mô hình của bạn là NCHW hay NHWC. Hầu hết các mô hình là NCHW nếu bạn không chắc chắn.
Thứ tự Kênh: Chọn xem mô hình của bạn muốn hình ảnh ở định dạng RGB hay BGR. Hầu hết các mô hình sử dụng RGB. Nếu mô hình của bạn là kênh đơn (đen trắng), điều này sẽ bị bỏ qua.
Chuẩn hóa: Chọn cách dữ liệu nên được chuẩn hóa trước khi được sử dụng trong mô hình của bạn. Hầu hết các mô hình sử dụng chuẩn hóa 0-1 (chia giá trị pixel cho 255).
Đệm Hình ảnh: Điều này kiểm soát xem hình ảnh có nên được kéo dài đến kích thước đầu vào hay được đệm bằng các thanh đen. Thông thường, tốt hơn là đệm hình ảnh để đảm bảo độ chính xác.
Có NMS: Đánh dấu điều này nếu mô hình của bạn đã thực hiện Non-Maximum Suppression bên trong. Nếu không, Agent sẽ tự thực hiện NMS. NMS kiểm soát cách các hình chữ nhật kết quả được lọc.
NMS Mặc định: Đặt giới hạn chồng chéo cho NMS (mặc định là 45% chồng chéo).

Ngay khi bạn đã thêm mô hình của mình, nó sẽ có sẵn để sử dụng trong tab Nhận diện Đối tượng của thiết bị của bạn. Nếu bạn gặp vấn đề, bạn có thể quay lại cấu hình mô hình và thực hiện các thay đổi. Agent cũng hỗ trợ tải lại tệp mô hình, vì vậy bạn có thể sao chép nó bằng một phiên bản mới trong khi nó đang chạy.

Cài đặt Máy chủ AI

Để thiết lập máy chủ AI, hãy nhấp vào biểu tượng ở góc trên bên trái của giao diện chính Agent DVR. Sau đó nhấp vào Cài đặt dưới Cấu hình, chọn Cài đặt AI từ menu thả xuống, và nhấp vào Cấu hình dưới Máy chủ AI.

Agent DVR tích hợp với CodeProject.AI cho nhiều tính năng AI khác nhau bao gồm nhận diện đối tượng, nhận diện khuôn mặt, ALPR (Nhận diện Biển số Tự động), và siêu phân giải (tăng cường). PlateRecognizer.com cũng được hỗ trợ như một nhà cung cấp ALPR. CodeProject.AI là mã nguồn mở, miễn phí, và tương thích với hầu hết các nền tảng.

Để bắt đầu, hãy cài đặt một máy chủ AI cho nền tảng của bạn và kết nối Agent DVR với nó bằng cách nhấp vào nút Cấu hình và sau đó Thêm.

Bạn có thể thêm nhiều máy chủ AI vào Agent DVR tùy theo nhu cầu. Các camera trong Agent DVR có thể được cấu hình để sử dụng các máy chủ AI khác nhau cho mỗi chức năng, hoặc bạn có thể sử dụng một máy chủ AI cho tất cả các tác vụ.

Cảnh báo: Xử lý AI có thể tốn tài nguyên. Đảm bảo máy tính của bạn có đủ sức mạnh để chạy nó.

Cấu hình máy chủ của bạn

Tên: Đặt tên cho máy chủ của bạn, ví dụ: Cat Catcher.
URL Máy chủ AI: Nhập URL của máy chủ AI của bạn, ví dụ: http://localhost:32168/
API Key: Nhập khóa của bạn nếu đã thiết lập (tùy chọn).
Thời gian chờ: Thời gian chờ tính bằng giây cho các yêu cầu đến máy chủ.
Thời gian trì hoãn thử lại: Thời gian tính bằng giây trước khi thử lại một yêu cầu không thành công đến máy chủ này.

Nhấp vào OK để lưu cài đặt của bạn.

Sử dụng OpenAI

Để thiết lập OpenAI ("Chat GPT") để trả lời câu hỏi về những gì đang xảy ra trong luồng video của bạn, điều hướng đến Cài đặt Máy chủ - Máy chủ AI và chọn "Open AI" trong mục Hỏi AI.

URL: Nhập URL cho dịch vụ. Mặc định là "https://api.openai.com/v1/chat/completions".
OpenAI API Key: Sau khi đăng ký với OpenAI, truy cập vào Trang Khóa API và tạo một khóa bí mật mới. Sao chép và dán khóa này vào trường được chỉ định.
Model: Chỉ định mô hình sẽ được sử dụng. Mặc định là gpt-4o. OpenAI có thể loại bỏ hoặc thay đổi điều này sau này.
Max Tokens: Điều này thiết lập việc sử dụng mã thông báo tối đa cho mỗi yêu cầu. Nếu gặp vấn đề, kiểm tra các nhật ký tại /logs.html vì có thể liên quan đến việc sử dụng mã thông báo.

Khi OpenAI đã được cấu hình, tham khảo Hỏi AI để biết hướng dẫn về cách sử dụng nó để trả lời các câu hỏi chung về những gì đang xảy ra trong luồng camera của bạn.

Sử dụng Claude

Để thiết lập Claude AI để trả lời câu hỏi về những gì đang xảy ra trong luồng video của bạn, điều hướng đến Cài đặt Máy chủ - Máy chủ AI và chọn "Claude" dưới Ask AI.

URL: Nhập URL đến dịch vụ. Mặc định là "https://api.anthropic.com/v1/messages".
Khóa API Claude: Sau khi đăng ký cho Claude, truy cập vào Trang Khóa API và tạo một khóa bí mật mới. Sao chép và Dán khóa này vào trường.
Phiên bản: Chỉ định phiên bản để sử dụng. Mặc định là 2023-06-01. Điều này có thể được loại bỏ hoặc thay đổi vào một thời điểm nào đó bởi Anthropic.
Mô hình: Chỉ định mô hình để sử dụng. Mặc định vào thời điểm viết là claude-3-sonnet-20240229.
Số mã thông báo tối đa: Điều này điều khiển số mã thông báo tối đa cho mỗi yêu cầu. Kiểm tra các nhật ký tại /logs.html nếu bạn gặp vấn đề vì có thể liên quan đến việc tiêu thụ mã thông báo.

Sau khi đã cấu hình Claude, xem Ask AI để biết cách sử dụng nó để nhận dạng các tình huống chung trong luồng camera của bạn.

Sử dụng Gemini

Để thiết lập Gemini để trả lời câu hỏi về những gì đang xảy ra trong luồng video của bạn, điều hướng đến Cài đặt Máy chủ - Máy chủ AI và chọn "Gemini" dưới Ask AI.

URL: Nhập URL vào dịch vụ. Mặc định là "https://generativelanguage.googleapis.com".
Gemini API Key: Sau khi đăng ký Gemini, truy cập Trang API Keys và tạo một khóa bí mật mới. Sao chép và dán khóa này vào trường.
Phiên bản: Chỉ định phiên bản để sử dụng. Mặc định là v1beta. Điều này có thể được loại bỏ hoặc thay đổi vào một thời điểm nào đó bởi Google.
Mô hình: Chỉ định mô hình để sử dụng. Mặc định vào thời điểm viết là gemini-1.5-flash.
Số lượng Token Tối đa: Điều này điều khiển số lượng token tối đa cho mỗi yêu cầu. Kiểm tra các nhật ký tại /logs.html nếu bạn gặp vấn đề vì có thể liên quan đến việc tiêu token.

Sau khi đã cấu hình Gemini, xem Ask AI để biết cách sử dụng nó để nhận diện các tình huống chung trong luồng camera của bạn.

Sử dụng các máy chủ LLM khác

Từ v6.5.3.0+, bạn có thể sử dụng các máy chủ LLM cục bộ của riêng mình (như vLLM, Ollama và LM Studio) để mô tả các hình ảnh mà Agent DVR ghi lại từ camera của bạn trong các sự kiện Alert và trả lời các câu hỏi về những gì đang xảy ra trong các luồng video của bạn. Xem AI Describe và Ask AI.

Để cấu hình một máy chủ AI cục bộ, hãy đi tới Cài đặt Máy chủ - AI Servers và nhấp vào nút Cấu hình bên cạnh LLM mà bạn muốn sử dụng (Ollama, vLLM hoặc LM Studio).

URL: Chỉ định điểm cuối nơi máy chủ LLM của bạn đang chạy. Các URL mặc định là:
- Ollama:
```
http://localhost:11434/api/chat
```
- vLLM:
```
http://localhost:8000/v1/chat/completions
```
- LM Studio:
```
http://localhost:1234/v1/chat/completions
```
API Key: Nếu máy chủ LLM của bạn yêu cầu xác thực, hãy nhập khóa API ở đây. Hầu hết các máy chủ cục bộ không yêu cầu điều này trừ khi được cấu hình cụ thể.
Model: Chọn mô hình có khả năng thị giác để sử dụng cho phân tích hình ảnh. Bạn phải đã tải xuống và nạp mô hình này vào máy chủ LLM của bạn. Các lựa chọn phổ biến bao gồm:
- Mô hình LLaVA (thị giác đa mục đích)
- Qwen2-VL (hiệu suất cao)
- Llama 3.2 Vision (phiên bản mới nhất của Meta)
Temperature: Kiểm soát sự sáng tạo so với độ chính xác trong các phản hồi (0.0-1.0). Các giá trị thấp hơn (0.3-0.4) tạo ra các mô tả chính xác, nhất quán hơn. Các giá trị cao hơn (0.6-0.8) tạo ra các phản hồi đa dạng, sáng tạo hơn. Được khuyến nghị: 0.4 cho phân tích camera an ninh.
Max Tokens: Số lượng từ/tokens tối đa trong phản hồi của AI. Các giá trị cao hơn cho phép mô tả chi tiết hơn nhưng mất nhiều thời gian hơn để tạo ra. Được khuyến nghị: 300-500 cho phân tích hình ảnh chi tiết, 150-250 cho các mô tả ngắn gọn.
top_p: Kiểm soát sự đa dạng của phản hồi bằng cách giới hạn lựa chọn từ vựng (0.0-1.0). Các giá trị thấp hơn sử dụng các từ phổ biến hơn, các giá trị cao hơn cho phép từ vựng đa dạng hơn. Được khuyến nghị: 0.9 để cân bằng tốt giữa độ chính xác và ngôn ngữ tự nhiên.
top_k: Giới hạn mô hình chọn từ K từ tiếp theo có khả năng xảy ra nhất. Các giá trị thấp hơn (20-40) tạo ra các phản hồi tập trung hơn, các giá trị cao hơn (80-100) cho phép sự đa dạng hơn. Được khuyến nghị: 50 cho các mô tả hình ảnh đáng tin cậy.

Ghi chú: Bạn phải cài đặt và cấu hình máy chủ LLM đã chọn của mình riêng biệt. Đảm bảo bạn đã tải xuống một mô hình có khả năng thị giác trước khi cấu hình Agent DVR. Để có kết quả tốt nhất với camera an ninh, hãy sử dụng các mô hình có ít nhất 7B tham số và đảm bảo hệ thống của bạn có đủ VRAM (khuyến nghị 5GB+).

Sử dụng PlateRecognizer.com

Để cấu hình LPR (ANPR hoặc Nhận dạng Biển số) trong Agent DVR, hãy vào Cài đặt Máy chủ - Cài đặt AI và nhập chi tiết dưới Plate Recognizer. Đăng ký dùng Thử nghiệm Miễn phí tại Plate Recognizer. Không cần thẻ tín dụng.

URL: Nhập URL đến dịch vụ. Mặc định là "https://api.platerecognizer.com/v1/plate-reader/", hoặc sử dụng máy chủ riêng nếu tự lưu trữ.
Token: Sau khi đăng ký Plate Recognizer, truy cập Trang Tài khoản và sao chép Token API.
Vùng: Để trống cho mặc định hoặc nhập danh sách CSV của vùng.
Cấu hình: Nhập các giá trị cấu hình bổ sung từ tài liệu nếu cần.

Sử dụng DoubleTake

DoubleTake là một nền tảng mã nguồn mở cung cấp một API thống nhất để xử lý nhận diện khuôn mặt bằng:

CompreFace
Amazon Rekognition
DeepStack
CodeProject.AI Server
Facebox

Bạn sẽ cần cài đặt và cấu hình DoubleTake với các tùy chọn nhận diện khuôn mặt mà bạn ưa thích.

Khi DoubleTake đã được thiết lập, mở Agent DVR và đi đến Cài đặt Máy chủ - AI Servers và nhấp vào nút Cấu hình bên cạnh DoubleTake.

Nhập URL đến máy chủ doubletake của bạn (ví dụ: http://localhost:3000/) và mật khẩu của bạn nếu đã được thiết lập.

Nhấp OK sau đó chỉnh sửa một camera và đi đến Nhận diện Khuôn mặt. Đặt tùy chọn Máy chủ AI thành DoubleTake và cấu hình nhận diện khuôn mặt theo nhu cầu.

Quản lý các Mô-đun AI

Trong danh sách máy chủ AI (được tham chiếu ở trên), bạn có các tùy chọn để cấu hình, kiểm tra, chỉnh sửa và xóa máy chủ AI. Nhấn vào nút cấu hình để hiển thị các module có sẵn hoặc đã được cài đặt trên máy chủ đã chọn.

Agent DVR truy xuất danh sách module hiện tại từ máy chủ của bạn và cung cấp giao diện người dùng để cài đặt, gỡ cài đặt, cấu hình và kiểm tra từng module. Hỗ trợ được cung cấp cho tất cả các module CodeProject.UI mặc định, mặc dù Agent DVR chỉ sử dụng một phần nhỏ của chúng.

Đề nghị chỉ cài đặt một trong các tùy chọn module Nhận diện Đối tượng. Xem xét mô tả của mỗi module để xác định phù hợp nhất với hệ thống của bạn.

Để sử dụng ALPR (Nhận diện Biển số tự động), Super Resolution hoặc Nhận diện Khuôn mặt trong Agent DVR, bạn cần cài đặt module tương ứng từ trang này. Thông thường, cài đặt mặc định đủ cho các module này, nhưng bạn có thể cấu hình chúng bằng cách nhấn vào biểu tượng dưới mỗi module.

Ngôn ngữ