Tôi dành thời gian mổ xẻ kiến trúc Claude Code của Anthropic — hệ thống AI Agent mạnh nhất hiện tại — để rút ra những bài học mà bất kỳ ai cũng có thể áp dụng, kể cả khi bạn không biết viết code.
Chatbot vs Agent — Khác nhau ở cái gì?
Đa số mọi người đang dùng AI theo kiểu Chatbot: bạn hỏi một câu, AI trả lời một câu, xong. Giống như hỏi đường một người lạ — họ chỉ tay rồi đi mất.
AI Agent thì khác. Nó không chỉ trả lời — nó tự làm. Nó đọc tài liệu, thực hiện các bước, kiểm tra kết quả, và nếu sai thì tự sửa rồi làm lại. Giống như bạn thuê một nhân viên thông minh: giao việc xong, họ tự xử lý từ A đến Z.
Agent giống bạn nói với đầu bếp "nấu cho tôi tô phở": đầu bếp tự đi chợ, tự nấu, nếm thử, chỉnh gia vị, nếm lại, rồi bưng ra bàn. Bạn chỉ cần ngồi chờ ăn.
Bên Trong Mỗi Lần Agent Hành Động
Mỗi lần Agent "làm một việc" (ví dụ: sửa file, chạy lệnh), nó không chỉ bấm nút rồi xong. Bên trong có hàng loạt bước kiểm tra — giống như nhân viên ngân hàng chuyển tiền phải qua nhiều lớp xác minh.
AI Cũng Cần "Suy Nghĩ Kỹ" Trước Khi Làm
Bạn có bao giờ gặp kiểu nhân viên "chưa nghe xong đã chạy đi làm" không? AI cũng vậy — nếu không bắt nó suy nghĩ trước, nó sẽ hành động vội và mắc lỗi.
Claude Code có một cơ chế gọi là Extended Thinking (Suy nghĩ mở rộng). Trước mỗi hành động, AI dành một "ngân sách" lên tới hàng chục ngàn từ để lập luận nội bộ — giống bác sĩ đọc hồ sơ, phân tích, rồi mới kê toa.
Hay hơn nữa: AI không chỉ suy nghĩ một lần. Nó suy nghĩ xen kẽ — sau mỗi lần hành động, nó dừng lại suy xét kết quả, rồi mới quyết định bước tiếp theo.
Bộ Não Agent: Từ "Điều Lệ Công Ty" Đến "Sở Thích Cá Nhân"
Nhiều người nghĩ system prompt (lệnh hệ thống cho AI) chỉ là một câu ngắn kiểu "Bạn là trợ lý AI hữu ích". Sai hoàn toàn.
Trong Claude Code, system prompt là hàng ngàn dòng chỉ dẫn được lắp ráp tự động từ nhiều nguồn khác nhau mỗi lần AI nhận lệnh. Giống như mỗi sáng đi làm, nhân viên không chỉ nhớ "tôi làm ở phòng kế toán" — họ còn nhớ quy định công ty, quy trình của team, thói quen của sếp, và ghi chú riêng của mình.
Tầng 1: Nội quy công ty (đi làm đúng giờ, mặc đồng phục).
Tầng 2: Quy trình của dự án được phân công.
Tầng 3: Văn hóa team (họp sáng thứ 2, báo cáo qua Slack).
Tầng 4: Sếp trực tiếp thích báo cáo bằng bullet point, không thích email dài.
Tầng 5: Nhưng dự án đặc biệt này sếp lại muốn báo cáo chi tiết.
Tại Sao Không Để AI "Muốn Làm Gì Thì Làm"?
Tưởng tượng bạn đưa chìa khóa nhà cho thợ sửa ống nước rồi đi vắng. Thợ muốn đập tường, đổ nước, thay ống — tùy ý. Nguy hiểm không? Rất nguy hiểm.
Claude Code xử lý vấn đề này bằng cách không bao giờ cho AI chạm trực tiếp vào hệ thống. Thay vào đó, AI chỉ được "nói ra ý định" (ví dụ: "tôi muốn sửa dòng 42 của file X, đổi từ A thành B"). Hệ thống trên máy bạn sẽ kiểm tra ý định đó, rồi CHÍNH NÓ mới thực hiện.
• Đừng cho AI chạy lệnh SQL trực tiếp trên database khách hàng.
• Thay vào đó, tạo các "công cụ chuyên biệt" với đầu vào/đầu ra rõ ràng.
Ví dụ: thay vì cho AI viết SQL tuỳ ý, chỉ cho nó dùng tool "Cập nhật trạng thái đơn hàng (mã đơn, trạng thái mới)" — không hơn, không kém.
An Toàn: "Cấm Trước, Cho Phép Sau"
Đây là triết lý bảo mật mà mọi doanh nghiệp dùng AI cần thuộc lòng: Deny-First — liệt kê những gì CẤM trước, phần còn lại mới xét cho phép.
Claude Code có 3 lớp bảo vệ chồng lên nhau:
Lớp 1 (Tool) — Giao dịch viên chỉ có nút "Chuyển tiền dưới 100 triệu", không có nút "Chuyển tiền tùy ý".
Lớp 2 (Phân quyền) — Chuyển trên 50 triệu phải có trưởng phòng duyệt.
Lớp 3 (Sandbox) — Toàn bộ hệ thống chạy trong mạng nội bộ, không kết nối ra ngoài.
"Lái" Agent Giữa Chừng — Không Cần Dừng Lại
Nếu bạn giao việc cho nhân viên, và nửa chừng phát hiện họ đi sai hướng, bạn sẽ làm gì? Hét "DỪNG LẠI!" rồi bắt làm lại từ đầu? Hay nhẹ nhàng nhắn tin "ơ, thay đổi một chút nhé"?
Claude Code cho phép bạn can thiệp giữa lúc Agent đang chạy. Bạn gõ thêm chỉ dẫn, và chỉ dẫn đó sẽ được tiếp nhận ngay ở bước kế tiếp — không mất công việc đã làm.
Bộ Nhớ Có Hạn — Kỹ Năng Quan Trọng Nhất
Đây là bí mật mà ít người biết: AI không nhớ gì giữa các lần gọi. Mỗi lần Agent hành động, nó phải đọc lại TOÀN BỘ lịch sử cuộc trò chuyện từ đầu. Giống như một nhân viên bị mất trí nhớ mỗi sáng — phải đọc lại tất cả email cũ trước khi làm việc.
Giải pháp thực tế:
2. Bắt đầu mới thường xuyên: Mỗi task mới nên mở cuộc trò chuyện mới. Đừng bắt AI nhớ 50 task cũ.
3. Dùng "bộ nhớ ngoài": Thay vì nhồi tất cả vào prompt, hãy viết tài liệu (file CLAUDE.md) để AI đọc khi cần — giống ghi chú trên giấy thay vì nhớ trong đầu.
"Chia Việc" Cho Nhân Viên Phụ
Khi gặp việc quá khó hoặc quá dài, Agent chính sẽ không tự làm. Nó sẽ gọi một "Agent phụ" (Sub-agent), giao việc, rồi đứng chờ kết quả.
Cơ chế này gọi là Orchestrator - Worker (Người chỉ huy và Thợ).
MCP — Ổ Cắm Chung Cho Mọi Dịch Vụ
Claude Code dùng một giao thức gọi là MCP (Model Context Protocol). Hãy hiểu đơn giản: đây là một cái "ổ cắm điện tiêu chuẩn" mà Anthropic tạo ra.
Bất kỳ công ty nào (Google, Slack, GitHub, Database...) chỉ cần tạo ra một cái "phích cắm" chuẩn MCP, là AI có thể kết nối và sử dụng dịch vụ đó ngay lập tức mà không cần viết code riêng.
Quy trình triển khai AI Agent theo ISO 42001
Mọi kiến thức trên sẽ trở nên vô nghĩa nếu không có một quy trình quản trị bài bản. Dưới đây là bảng so sánh AI Agent truyền thống và AI Agent được quản trị theo tiêu chuẩn ISO 42001 (Tiêu chuẩn Quản trị AI Quốc tế).
| Tiêu chí | Kiểu "Tự phát" | Kiểu ISO 42001 (Chuẩn) |
|---|---|---|
| Quyền truy cập | Cấp quyền rộng (Admin) cho tiện | Least Privilege (Quyền tối thiểu) |
| Kiểm soát | Để AI tự chạy, thỉnh thoảng check | Human-in-the-loop (Luôn có người duyệt) |
| Bảo mật | Tin tưởng nhà cung cấp | Deny-First & OS Sandbox |
| Lưu trữ | Không ghi log hoặc log sơ sài | Full Audit Trail (Ghi lại mọi ý định) |
| Trách nhiệm | "Tại AI nó làm thế" | Accountability (Con người chịu trách nhiệm) |
Phần Bonus: Quy Trình 7 Bước — Xây AI Agent cho Doanh Nghiệp
Tổng hợp từ toàn bộ bài học trên, đây là quy trình bạn có thể áp dụng ngay:
Bước 1 — Viết "CLAUDE.md" cho dự án
Ghi rõ: công ty dùng stack gì, quy tắc đặt tên, folder structure, quy trình deploy. Đây là "não bộ" của Agent.
Bước 2 — Thiết kế Tool Set
Liệt kê 5-10 hành động Agent cần làm. Mỗi tool có input/output rõ ràng, KHÔNG cho chạy lệnh thô.
Bước 3 — Viết Deny Rules trước
Liệt kê những gì TUYỆT ĐỐI KHÔNG được làm (xóa DB, gửi tiền, truy cập data nhạy cảm). Deny-first, allow-second.
Bước 4 — Thiết kế vòng lặp linh hoạt
Cho model tự chọn tool tiếp theo. Tín hiệu dừng = không còn tool call. Đừng hardcode bước cứng.
Bước 5 — Bật Extended Thinking cho task khó
Task quan trọng → budget thinking cao. Task đơn giản → model nhẹ, thinking thấp. Tối ưu chi phí.
Bước 6 — Quản lý Context thông minh
Clear session thường xuyên. Dùng sub-agent cho task lớn. Tận dụng prompt caching. Theo dõi token usage.
Bước 7 — Kết nối MCP khi cần mở rộng
Thêm MCP server cho từng service (Supabase, GitHub, Slack…). Chỉ kết nối khi thật sự cần — mỗi server tốn token.
Kết luận
Kiến trúc của Claude Code không chỉ là một thành tựu về lập trình. Nó là minh chứng cho một triết lý thiết kế AI mới: Thông minh thôi chưa đủ, phải An toàn và Có thể kiểm soát.
Hy vọng những mổ xẻ trên đã giúp các anh chị làm kinh doanh, vận hành có một cái nhìn "X-ray" xuyên thấu vào bên trong những con AI Agent long lanh ngoài kia. Chúng ta không cần học code để làm chủ AI, nhưng chúng ta NHẤT ĐỊNH phải hiểu logic vận hành của nó để không bị bỏ lại phía sau — và quan trọng hơn, để không rước họa vào thân.
Về Tác Giả & X5 Academy
Nguyễn Thế Trung
Founder Franchise VN & X5 Academy.
Chuyên gia tư vấn vận hành tinh gọn (Lean) và chuyển đổi số bằng AI cho các chuỗi nhượng quyền và doanh nghiệp SMEs.
[!TIP] Khám phá năng lực mới của bạn:
Nếu bạn muốn tự tay xây dựng những hệ thống AI Agent an toàn, thực chiến cho riêng mình, hãy tham khảo các khóa học tại X5 Academy. Chúng tôi không dạy code, chúng tôi dạy tư duy làm chủ công nghệ.
