Tại chỗ hay đám mây? Hai kiến trúc triển khai để tích hợp tổng đài AI giọng nói — chọn thế nào, kết nối ra sao
Khi doanh nghiệp triển khai tổng đài AI giọng nói, câu hỏi đầu tiên của IT và bảo mật thường không phải 'có chính xác không' mà là 'dữ liệu khách hàng và bản ghi có rời khỏi trung tâm dữ liệu không', 'kết nối vào PBX hiện có thế nào'. Qubby cung cấp cùng một dịch vụ container theo hai cách: suy luận AI luôn chạy trên đám mây, khác biệt chỉ ở nơi media, bản ghi, dữ liệu khách hàng lưu trú và ai vận hành.

Khi một doanh nghiệp triển khai tổng đài AI giọng nói, câu hỏi đầu tiên của bộ phận IT và bảo mật thường không phải "nó chính xác đến đâu". Đó là hai câu thực tế hơn: "Dữ liệu khách hàng và bản ghi cuộc gọi có rời khỏi trung tâm dữ liệu của chúng tôi không?" và "Nó kết nối thế nào vào hệ thống điện thoại đã dùng nhiều năm?"
Câu trả lời của Qubby: cùng một dịch vụ đóng gói container, cung cấp theo hai cách — triển khai tại chỗ trong trung tâm dữ liệu riêng của khách hàng, hoặc đám mây do Qubby quản lý. Trong cả hai, suy luận giọng nói AI chạy trên mô hình đa phương thức giọng nói Qubby trên đám mây; khác biệt thực sự chỉ ở nơi media, bản ghi và dữ liệu khách hàng lưu trú và ai vận hành.
Kiến trúc 1: Tại chỗ — dữ liệu không rời khỏi tòa nhà
Toàn bộ dịch vụ được triển khai qua Docker trong IDC riêng của khách hàng. SIP trunk kết thúc bên trong trung tâm dữ liệu, và AI đăng ký làm máy nhánh trên mạng nội bộ của PBX hiện có — vì là bắt tay trong cùng mạng nội bộ một cơ sở, độ trễ giọng nói là thấp nhất có thể.
Điểm mấu chốt là luồng dữ liệu: bản ghi cuộc gọi, nhật ký cuộc gọi và dữ liệu cá nhân khách hàng đều ở lại mạng nội bộ. Lưu lượng ra ngoài duy nhất là luồng "suy luận AI", thoát ra có mã hóa TLS qua tường lửa/proxy. Mọi media giọng nói khác đều ở lại nội bộ.

Phù hợp nhất cho tài chính, y tế, chính phủ và doanh nghiệp lớn có yêu cầu nghiêm ngặt về lưu trú dữ liệu và tuân thủ — chủ quyền dữ liệu vẫn trong tay bạn.
Kiến trúc 2: Đám mây quản lý Qubby — không phải vận hành trung tâm dữ liệu
Toàn bộ dịch vụ chạy trên AWS do Qubby quản lý, đa vùng (Đài Loan, có thể thêm Nhật Bản và vùng khác). Global Accelerator định tuyến đến điểm vào gần nhất, ALB + chứng chỉ xử lý kết thúc HTTPS. Mô-đun tổng đài đám mây của chúng tôi đăng ký làm IP Phone (máy nhánh) qua mạng tới PBX của khách hàng qua VPN — vì qua mạng, độ trễ cao hơn một chút so với tại chỗ.
Dữ liệu (vai trò/cấu hình/nhật ký cuộc gọi) nằm trên Firestore đám mây, bản ghi trên S3, cấu hình trong bộ nhớ đệm Redis; giám sát, cập nhật và mở rộng đều do Qubby xử lý.

Phù hợp nhất cho doanh nghiệp muốn ra mắt nhanh, mở rộng linh hoạt và không muốn xây dựng, vận hành trung tâm dữ liệu — mở tài khoản, kết nối SIP trunk và hoạt động.
Cốt lõi tích hợp: AI cắm vào PBX của bạn, không thay thế nó
Cả hai kiến trúc dùng chính xác cùng các mô-đun dịch vụ: tổng đài (asterisk), điều khiển cuộc gọi (sidecar), lõi giọng nói AI (backend), bảng điều khiển vận hành (admin-console), công cụ tạo luồng AI (ivr-builder-api) và tổng đài giọng nói web (share-web, tùy chọn).
Tích hợp gói gọn trong một thao tác: AI đăng ký làm một "máy nhánh" trên PBX hiện có của bạn — không động đến tổng đài, số máy hay máy nhánh hiện có. Khác biệt chỉ ở cách máy nhánh đó kết nối: tại chỗ, SIP trunk vào trung tâm dữ liệu và máy nhánh đi qua mạng nội bộ; trên đám mây, máy nhánh đăng ký qua mạng bằng VPN.
Một bảng để chọn kiến trúc của bạn
| Khía cạnh | Tại chỗ IDC | Đám mây quản lý Qubby |
|---|---|---|
| Lưu trú dữ liệu | Bản ghi/nhật ký/dữ liệu cá nhân ở lại DC riêng, chỉ suy luận AI ra ngoài | Dữ liệu lưu trên Firestore/S3 đám mây (Qubby quản lý) |
| Độ trễ giọng nói | Thấp nhất: máy nhánh AI và PBX đăng ký trong mạng nội bộ cùng cơ sở | Hơi cao hơn: máy nhánh AI đăng ký qua mạng (VPN) |
| Bảo mật/tuân thủ | Phù hợp nhất với yêu cầu lưu trú dữ liệu nội bộ | Theo tuân thủ của nhà cung cấp đám mây (cần đánh giá xuyên biên giới) |
| Trách nhiệm vận hành | Khách hàng cung cấp cơ sở/phần cứng/mạng, Qubby cung cấp container và cập nhật | Qubby quản lý toàn bộ (giám sát/cập nhật/mở rộng) |
| Khả năng mở rộng | Giới hạn bởi dung lượng vật lý, mở rộng phải mua phần cứng | Nhanh và linh hoạt (đa vùng/mở rộng ngang) |
| Thời gian triển khai | Lâu hơn: dựng cơ sở/mở mạng/danh sách trắng tường lửa | Nhanh nhất: mở tài khoản + kết nối SIP trunk là hoạt động |
| Mô hình chi phí | CAPEX cơ sở/phần cứng + giấy phép; sở hữu lâu dài | OPEX thuê bao/theo lượng dùng; không đầu tư phần cứng |
Cả hai đều kết nối tới mô hình đa phương thức giọng nói Qubby trên đám mây để suy luận; bản tại chỗ chỉ gửi "luồng AI duy nhất" này ra ngoài có mã hóa, giữ mọi thứ khác trong nội bộ.
Bắt đầu bằng PoC đám mây, rồi chuyển mượt sang tại chỗ
Vì cả hai kiến trúc dùng chung chính xác các mô-đun dịch vụ, bạn có thể chứng minh giá trị nhanh bằng một PoC đám mây quản lý, rồi chuyển mượt sang triển khai tại chỗ chính thức — không phải làm lại. Nếu yêu cầu tuân thủ của bạn nghĩa là ngay cả suy luận AI cũng không được ra khỏi mạng, có thể đánh giá tùy chọn "LLM tại chỗ/mô hình giọng nói riêng" (cần lập kế hoạch tính toán riêng).
Dù bạn ưu tiên chủ quyền dữ liệu hay tốc độ ra mắt, bản chất của tích hợp là như nhau: để AI cắm vào hệ thống điện thoại hiện có như một máy nhánh, phần còn lại giao cho Qubby. Để đánh giá kiến trúc nào phù hợp với cơ sở và điều kiện tuân thủ của bạn, hãy trao đổi với chuyên gia tư vấn của chúng tôi.
