AI Agent Thực Sự Hoạt Động Như Thế Nào? — Giải Mã Kiến Trúc Claude Code

Tôi dành thời gian mổ xẻ kiến trúc Claude Code của Anthropic — hệ thống AI Agent mạnh nhất hiện tại — để rút ra những bài học mà bất kỳ ai cũng có thể áp dụng, kể cả khi bạn không biết viết code.

Chatbot vs Agent — Khác nhau ở cái gì?

Đa số mọi người đang dùng AI theo kiểu Chatbot: bạn hỏi một câu, AI trả lời một câu, xong. Giống như hỏi đường một người lạ — họ chỉ tay rồi đi mất.

AI Agent thì khác. Nó không chỉ trả lời — nó tự làm. Nó đọc tài liệu, thực hiện các bước, kiểm tra kết quả, và nếu sai thì tự sửa rồi làm lại. Giống như bạn thuê một nhân viên thông minh: giao việc xong, họ tự xử lý từ A đến Z.

Agent lặp đi lặp lại cho đến khi kết quả đạt yêu cầu — giống nhân viên tự giác.

🍳 Ví dụ đời thường

Chatbot giống bạn hỏi Google "cách nấu phở": nó đưa công thức, bạn tự nấu.
Agent giống bạn nói với đầu bếp "nấu cho tôi tô phở": đầu bếp tự đi chợ, tự nấu, nếm thử, chỉnh gia vị, nếm lại, rồi bưng ra bàn. Bạn chỉ cần ngồi chờ ăn.

💡 Điểm mấu chốt

Agent dừng lại khi nào? Khi nó cảm thấy "xong rồi, không cần làm thêm gì nữa". Trong kỹ thuật, tín hiệu dừng là: AI không gọi thêm công cụ nào → tức là nó đã hoàn thành.

Bên Trong Mỗi Lần Agent Hành Động

Mỗi lần Agent "làm một việc" (ví dụ: sửa file, chạy lệnh), nó không chỉ bấm nút rồi xong. Bên trong có hàng loạt bước kiểm tra — giống như nhân viên ngân hàng chuyển tiền phải qua nhiều lớp xác minh.

Chỉ ~15% là "thực thi", 85% là kiểm tra — giống cách ngân hàng xử lý một giao dịch chuyển tiền.

📌 Bài học cho doanh nghiệp

Khi triển khai AI trong công ty, đừng chỉ nghĩ "AI làm được gì". Hãy nghĩ "AI bị kiểm soát thế nào". Một hệ thống tốt phải có nhiều lớp kiểm tra hơn lớp thực thi — y hệt cách ngân hàng vận hành: 1 lệnh chuyển tiền phải qua 8-10 bước xác minh.

AI Cũng Cần "Suy Nghĩ Kỹ" Trước Khi Làm

Bạn có bao giờ gặp kiểu nhân viên "chưa nghe xong đã chạy đi làm" không? AI cũng vậy — nếu không bắt nó suy nghĩ trước, nó sẽ hành động vội và mắc lỗi.

Claude Code có một cơ chế gọi là Extended Thinking (Suy nghĩ mở rộng). Trước mỗi hành động, AI dành một "ngân sách" lên tới hàng chục ngàn từ để lập luận nội bộ — giống bác sĩ đọc hồ sơ, phân tích, rồi mới kê toa.

Hay hơn nữa: AI không chỉ suy nghĩ một lần. Nó suy nghĩ xen kẽ — sau mỗi lần hành động, nó dừng lại suy xét kết quả, rồi mới quyết định bước tiếp theo.

AI suy nghĩ giữa mỗi bước — giống bác sĩ phân tích sau mỗi lần xét nghiệm.

🏥 Ví dụ đời thường

Bác sĩ giỏi không bao giờ nghe triệu chứng xong là kê toa ngay. Họ: nghe bệnh nhân kể → suy nghĩ → cho xét nghiệm máu → nhận kết quả → suy nghĩ lại → cho siêu âm → suy nghĩ lại → rồi mới kê toa. Cái "suy nghĩ lại sau mỗi bước" này chính là sức mạnh của AI Agent.

💡 Đánh đổi

Suy nghĩ sâu hơn = kết quả tốt hơn, nhưng tốn tiền hơn. Giống việc bạn không cần thuê luật sư để viết email thông thường. Bài toán là: việc quan trọng → cho AI "budget suy nghĩ" lớn. Việc đơn giản → tiết kiệm.

Bộ Não Agent: Từ "Điều Lệ Công Ty" Đến "Sở Thích Cá Nhân"

Nhiều người nghĩ system prompt (lệnh hệ thống cho AI) chỉ là một câu ngắn kiểu "Bạn là trợ lý AI hữu ích". Sai hoàn toàn.

Trong Claude Code, system prompt là hàng ngàn dòng chỉ dẫn được lắp ráp tự động từ nhiều nguồn khác nhau mỗi lần AI nhận lệnh. Giống như mỗi sáng đi làm, nhân viên không chỉ nhớ "tôi làm ở phòng kế toán" — họ còn nhớ quy định công ty, quy trình của team, thói quen của sếp, và ghi chú riêng của mình.

5 tầng tri thức — càng xuống dưới càng cụ thể. Tầng dưới có thể "ghi đè" tầng trên.

🏢 Ví dụ đời thường

Một nhân viên mới vào công ty sẽ tiếp nhận kiến thức theo đúng 5 tầng này:
Tầng 1: Nội quy công ty (đi làm đúng giờ, mặc đồng phục).
Tầng 2: Quy trình của dự án được phân công.
Tầng 3: Văn hóa team (họp sáng thứ 2, báo cáo qua Slack).
Tầng 4: Sếp trực tiếp thích báo cáo bằng bullet point, không thích email dài.
Tầng 5: Nhưng dự án đặc biệt này sếp lại muốn báo cáo chi tiết.

📌 Áp dụng ngay

Tạo một file gọi là CLAUDE.md (hoặc AGENTS.md) đặt ở thư mục gốc dự án. Viết rõ 5 tầng tri thức. Đây là cách biến "kiến thức trong đầu mọi người" thành "tài liệu AI đọc được". Không cần biết code — chỉ cần biết ghi chú.

Tại Sao Không Để AI "Muốn Làm Gì Thì Làm"?

Tưởng tượng bạn đưa chìa khóa nhà cho thợ sửa ống nước rồi đi vắng. Thợ muốn đập tường, đổ nước, thay ống — tùy ý. Nguy hiểm không? Rất nguy hiểm.

Claude Code xử lý vấn đề này bằng cách không bao giờ cho AI chạm trực tiếp vào hệ thống. Thay vào đó, AI chỉ được "nói ra ý định" (ví dụ: "tôi muốn sửa dòng 42 của file X, đổi từ A thành B"). Hệ thống trên máy bạn sẽ kiểm tra ý định đó, rồi CHÍNH NÓ mới thực hiện.

AI chỉ "yêu cầu", máy bạn mới "thực hiện" — giống hợp đồng ủy quyền có giám sát.

📌 Nguyên tắc vàng khi triển khai AI

AI chỉ được "yêu cầu", không được "tự làm".
• Đừng cho AI chạy lệnh SQL trực tiếp trên database khách hàng.
• Thay vào đó, tạo các "công cụ chuyên biệt" với đầu vào/đầu ra rõ ràng.
Ví dụ: thay vì cho AI viết SQL tuỳ ý, chỉ cho nó dùng tool "Cập nhật trạng thái đơn hàng (mã đơn, trạng thái mới)" — không hơn, không kém.

An Toàn: "Cấm Trước, Cho Phép Sau"

Đây là triết lý bảo mật mà mọi doanh nghiệp dùng AI cần thuộc lòng: Deny-First — liệt kê những gì CẤM trước, phần còn lại mới xét cho phép.

Claude Code có 3 lớp bảo vệ chồng lên nhau:

3 lớp bảo vệ — như két sắt: khóa mã số + chìa khóa + phòng an ninh.

🏦 Ví dụ đời thường

Một ngân hàng không cho giao dịch viên tự ý chuyển tiền. Thay vào đó:
Lớp 1 (Tool) — Giao dịch viên chỉ có nút "Chuyển tiền dưới 100 triệu", không có nút "Chuyển tiền tùy ý".
Lớp 2 (Phân quyền) — Chuyển trên 50 triệu phải có trưởng phòng duyệt.
Lớp 3 (Sandbox) — Toàn bộ hệ thống chạy trong mạng nội bộ, không kết nối ra ngoài.

🏛️ Liên kết ISO 42001

Triết lý "Deny-First" hoàn toàn phù hợp với Clause 6 (Lập kế hoạch rủi ro) và Clause 8 (Kiểm soát vận hành) của ISO 42001. Tiêu chuẩn này yêu cầu: xác định rủi ro AI → đánh giá mức độ → triển khai biện pháp kiểm soát. "Cấm trước, cho phép sau" chính là hình thức kiểm soát rủi ro chủ động nhất.

"Lái" Agent Giữa Chừng — Không Cần Dừng Lại

Nếu bạn giao việc cho nhân viên, và nửa chừng phát hiện họ đi sai hướng, bạn sẽ làm gì? Hét "DỪNG LẠI!" rồi bắt làm lại từ đầu? Hay nhẹ nhàng nhắn tin "ơ, thay đổi một chút nhé"?

Claude Code cho phép bạn can thiệp giữa lúc Agent đang chạy. Bạn gõ thêm chỉ dẫn, và chỉ dẫn đó sẽ được tiếp nhận ngay ở bước kế tiếp — không mất công việc đã làm.

🚗 Ví dụ đời thường

Bạn đặt xe công nghệ đến sân bay. Giữa đường bạn nhắn tài xế: "Ghé qua ATM rút tiền trước nhé." Tài xế không cần quay về điểm đón — anh ta chỉ điều chỉnh lộ trình ngay tại đoạn đang chạy.

💡 Tại sao điều này quan trọng?

Trong thực tế, yêu cầu công việc LUÔN thay đổi giữa chừng. Một hệ thống AI tốt phải cho phép con người "lái" bất kỳ lúc nào mà không phá vỡ tiến trình. Đây không phải tính năng "nice to have" — đây là yêu cầu bắt buộc cho môi trường doanh nghiệp.

Bộ Nhớ Có Hạn — Kỹ Năng Quan Trọng Nhất

Đây là bí mật mà ít người biết: AI không nhớ gì giữa các lần gọi. Mỗi lần Agent hành động, nó phải đọc lại TOÀN BỘ lịch sử cuộc trò chuyện từ đầu. Giống như một nhân viên bị mất trí nhớ mỗi sáng — phải đọc lại tất cả email cũ trước khi làm việc.

Mỗi bước, bộ nhớ AI tăng dần. Khi gần đầy, hệ thống tự tóm tắt lịch sử cũ.

Giải pháp thực tế:

📌 3 Mẹo quản lý bộ nhớ AI

1. Giữ gọn: Chỉ đưa thông tin THẬT SỰ liên quan vào cuộc trò chuyện. Đừng paste cả file 500 dòng khi chỉ cần sửa 3 dòng.
2. Bắt đầu mới thường xuyên: Mỗi task mới nên mở cuộc trò chuyện mới. Đừng bắt AI nhớ 50 task cũ.
3. Dùng "bộ nhớ ngoài": Thay vì nhồi tất cả vào prompt, hãy viết tài liệu (file CLAUDE.md) để AI đọc khi cần — giống ghi chú trên giấy thay vì nhớ trong đầu.

"Chia Việc" Cho Nhân Viên Phụ

Khi gặp việc quá khó hoặc quá dài, Agent chính sẽ không tự làm. Nó sẽ gọi một "Agent phụ" (Sub-agent), giao việc, rồi đứng chờ kết quả.

Cơ chế này gọi là Orchestrator - Worker (Người chỉ huy và Thợ).

Mô hình Chỉ huy - Thợ: Agent chính điều phối các Agent phụ chuyên biệt.

🎬 Ví dụ đời thường

Giống như một đạo diễn điện ảnh. Đạo diễn không tự cầm máy quay, không tự diễn, không tự chỉnh sáng. Đạo diễn giao việc cho quay phim, diễn viên, kỹ thuật, rồi gom tất cả lại thành một bộ phim hoàn chỉnh.

📌 Ứng dụng quản trị

Nếu bạn muốn AI làm một việc phức tạp (ví dụ: lập kế hoạch kinh doanh), đừng bắt 1 con AI làm từ đầu đến cuối. Hãy chia ra: 1 con chuyên nghiên cứu thị trường → 1 con chuyên tính toán tài chính → 1 con chuyên viết lách. Kết quả sẽ tốt hơn gấp 10 lần.

MCP — Ổ Cắm Chung Cho Mọi Dịch Vụ

Claude Code dùng một giao thức gọi là MCP (Model Context Protocol). Hãy hiểu đơn giản: đây là một cái "ổ cắm điện tiêu chuẩn" mà Anthropic tạo ra.

Bất kỳ công ty nào (Google, Slack, GitHub, Database...) chỉ cần tạo ra một cái "phích cắm" chuẩn MCP, là AI có thể kết nối và sử dụng dịch vụ đó ngay lập tức mà không cần viết code riêng.

MCP đóng vai trò như cổng USB: một cổng cho hàng ngàn thiết bị.

🔌 Ví dụ đời thường

Trước khi có cổng USB, mỗi thiết bị (chuột, bàn phím, máy in) có một kiểu lỗ cắm riêng. Từ khi có USB (ổ cắm chung), việc kết nối trở nên cực kỳ đơn giản. MCP chính là "cổng USB" cho trí tuệ nhân tạo.

Quy trình triển khai AI Agent theo ISO 42001

Mọi kiến thức trên sẽ trở nên vô nghĩa nếu không có một quy trình quản trị bài bản. Dưới đây là bảng so sánh AI Agent truyền thống và AI Agent được quản trị theo tiêu chuẩn ISO 42001 (Tiêu chuẩn Quản trị AI Quốc tế).

Bảng so sánh: Cách tiếp cận AI Agent

Tiêu chí	Kiểu "Tự phát"	Kiểu ISO 42001 (Chuẩn)
Quyền truy cập	Cấp quyền rộng (Admin) cho tiện	Least Privilege (Quyền tối thiểu)
Kiểm soát	Để AI tự chạy, thỉnh thoảng check	Human-in-the-loop (Luôn có người duyệt)
Bảo mật	Tin tưởng nhà cung cấp	Deny-First & OS Sandbox
Lưu trữ	Không ghi log hoặc log sơ sài	Full Audit Trail (Ghi lại mọi ý định)
Trách nhiệm	"Tại AI nó làm thế"	Accountability (Con người chịu trách nhiệm)

🚀 Lời khuyên cuối cùng

Đừng đợi đến khi công ty có 100 nhân viên mới nghĩ đến quản trị AI. Hãy bắt đầu ngay từ Agent đầu tiên bạn xây dựng. Theo đúng tinh thần Lean, hãy xây dựng một hệ thống "nhỏ nhưng chuẩn" hơn là "lớn nhưng lỏng lẻo".

Phần Bonus: Quy Trình 7 Bước — Xây AI Agent cho Doanh Nghiệp

Tổng hợp từ toàn bộ bài học trên, đây là quy trình bạn có thể áp dụng ngay:

Quy trình thực chiến

Bước 1 — Viết "CLAUDE.md" cho dự án
Ghi rõ: công ty dùng stack gì, quy tắc đặt tên, folder structure, quy trình deploy. Đây là "não bộ" của Agent.

Bước 2 — Thiết kế Tool Set
Liệt kê 5-10 hành động Agent cần làm. Mỗi tool có input/output rõ ràng, KHÔNG cho chạy lệnh thô.

Bước 3 — Viết Deny Rules trước
Liệt kê những gì TUYỆT ĐỐI KHÔNG được làm (xóa DB, gửi tiền, truy cập data nhạy cảm). Deny-first, allow-second.

Bước 4 — Thiết kế vòng lặp linh hoạt
Cho model tự chọn tool tiếp theo. Tín hiệu dừng = không còn tool call. Đừng hardcode bước cứng.

Bước 5 — Bật Extended Thinking cho task khó
Task quan trọng → budget thinking cao. Task đơn giản → model nhẹ, thinking thấp. Tối ưu chi phí.

Bước 6 — Quản lý Context thông minh
Clear session thường xuyên. Dùng sub-agent cho task lớn. Tận dụng prompt caching. Theo dõi token usage.

Bước 7 — Kết nối MCP khi cần mở rộng
Thêm MCP server cho từng service (Supabase, GitHub, Slack…). Chỉ kết nối khi thật sự cần — mỗi server tốn token.

Kết luận

Kiến trúc của Claude Code không chỉ là một thành tựu về lập trình. Nó là minh chứng cho một triết lý thiết kế AI mới: Thông minh thôi chưa đủ, phải An toàn và Có thể kiểm soát.

Hy vọng những mổ xẻ trên đã giúp các anh chị làm kinh doanh, vận hành có một cái nhìn "X-ray" xuyên thấu vào bên trong những con AI Agent long lanh ngoài kia. Chúng ta không cần học code để làm chủ AI, nhưng chúng ta NHẤT ĐỊNH phải hiểu logic vận hành của nó để không bị bỏ lại phía sau — và quan trọng hơn, để không rước họa vào thân.

Về Tác Giả & X5 Academy

Nguyễn Thế Trung
Founder Franchise VN & X5 Academy.
Chuyên gia tư vấn vận hành tinh gọn (Lean) và chuyển đổi số bằng AI cho các chuỗi nhượng quyền và doanh nghiệp SMEs.

[!TIP] Khám phá năng lực mới của bạn:
Nếu bạn muốn tự tay xây dựng những hệ thống AI Agent an toàn, thực chiến cho riêng mình, hãy tham khảo các khóa học tại X5 Academy. Chúng tôi không dạy code, chúng tôi dạy tư duy làm chủ công nghệ.

👉 Xem danh sách khóa học AI thực chiến

# AI Agent# Claude Code# Architecture# ISO 42001# Automation