Load Balancer là gì? Thông tin chi tiết từ A – Z
- Tháng Ba 14, 2026
- Posted by: Nguyen Viet Loc
- Category: Kiến Thức AWS
Bạn đã bao giờ thắc mắc làm thế nào mà các siêu ứng dụng như Facebook, Shopee hay Netflix có thể chịu đựng được hàng triệu lượt truy cập cùng lúc mà không bị sập? Bí mật nằm ở một “người nhạc trưởng” thầm lặng mang tên Load Balancer.
Vậy chính xác Load Balancer là gì? Bài viết này của CodeStar Academy sẽ giải phẫu chi tiết cơ chế hoạt động, 5 lợi ích cốt lõi, đồng thời phân tích sâu về 9 loại Load Balancer và các thuật toán định tuyến mà mọi Kỹ sư Hệ thống, DevOps đều phải nắm vững.
Load Balancer là gì?
Load Balancer (Bộ cân bằng tải) là một thiết bị phần cứng hoặc một giải pháp phần mềm đóng vai trò phân phối đồng đều lưu lượng truy cập mạng (Traffic) trên Internet đến một nhóm các máy chủ ở phía sau (gọi là Server Pool hoặc Backend Servers).
Mục tiêu tối thượng của Load Balancer là đảm bảo không có bất kỳ máy chủ nào phải làm việc quá sức (quá tải) trong khi các máy chủ khác lại ngồi chơi. Bằng cách san sẻ gánh nặng này, hệ thống sẽ tối ưu hóa được tài nguyên, giảm thiểu thời gian phản hồi (độ trễ) và đảm bảo ứng dụng luôn trong trạng thái sẵn sàng phục vụ người dùng 24/7.

Cơ chế hoạt động của Load Balancer
Hãy tưởng tượng Load Balancer như một anh cảnh sát giao thông đứng ở ngã tư. Thay vì để tất cả xe cộ (Traffic) dồn vào một con đường nhỏ (Máy chủ), anh cảnh sát sẽ quan sát và điều hướng xe cộ chia đều ra các làn đường đang thông thoáng.
Quy trình hoạt động diễn ra theo các bước sau:
- Người dùng nhập URL vào trình duyệt. Yêu cầu này không đi thẳng tới máy chủ web mà sẽ đi đến địa chỉ IP của Load Balancer trước.
- Load Balancer thực hiện Health Check (Kiểm tra sức khỏe) liên tục đối với các máy chủ phía sau. Nếu phát hiện một máy chủ bị treo hoặc báo lỗi, nó sẽ lập tức gạch tên máy chủ đó ra khỏi danh sách phục vụ.
- Dựa trên các Thuật toán cân bằng tải đã được cài đặt, Load Balancer chọn ra máy chủ khỏe mạnh và rảnh rỗi nhất để chuyển tiếp yêu cầu của người dùng đến đó.
- Máy chủ xử lý xong sẽ gửi kết quả trả ngược lại cho Load Balancer.
- Cuối cùng, Load Balancer đóng vai trò đại diện, gửi kết quả đó về cho trình duyệt của người dùng.

5 Lợi ích khi sử dụng Load Balancer
- Tính Sẵn Sàng Cao (High Availability): Đây là giá trị lớn nhất. Nếu bạn chỉ có 1 server, server sập đồng nghĩa với website sập. Nhưng với Load Balancer và 3 server, nếu 1 server cháy ổ cứng, 2 server còn lại lập tức gánh vác mà người dùng không hề hay biết.
- Khả Năng Mở Rộng Vô Hạn (Scalability): Đến mùa Sale, Traffic tăng gấp 10 lần? Bạn chỉ cần cắm thêm máy chủ mới vào hệ thống. Load Balancer sẽ tự động nhận diện và bắt đầu chia việc cho máy chủ mới mà không cần phải tắt hệ thống để cấu hình.
- Tối Ưu Trải Nghiệm Người Dùng: Tránh tình trạng nghẽn cổ chai, giúp website load cực nhanh, giảm tỷ lệ thoát trang do chờ đợi lâu.
- Tăng Cường Bảo Mật (WAF & SSL Offloading): Load Balancer hiện đại có thể làm nhiệm vụ giải mã chứng chỉ SSL (Giảm tải CPU cho các máy chủ web) và hoạt động như một bức tường lửa chặn đứng các cuộc tấn công DDoS.
- Bảo Trì Không Gián Đoạn (Zero Downtime): Khi cần cập nhật code, bạn có thể rút tạm 1 server ra khỏi Load Balancer, cập nhật xong rồi cắm lại. Cứ thế làm xoay vòng, hệ thống sẽ không bao giờ bị gián đoạn.
Phân loại các mô hình Load Balancer phổ biến nhất
Có nhiều cách để phân loại bộ cân bằng tải, dưới đây là những loại mà giới công nghệ thường xuyên sử dụng:
Phân loại theo Tầng mạng (Mô hình OSI)
| Tiêu Chí | Layer 4 Load Balancer | Layer 7 Load Balancer |
| Tầng hoạt động | Tầng giao vận (Transport Layer) | Tầng ứng dụng (Application Layer) |
| Cách định tuyến | Chỉ nhìn vào IP đích/nguồn và Port (TCP/UDP) để chia tải. Không quan tâm nội dung bên trong gói tin. | Có thể “bóc” gói tin ra để xem nội dung (HTTP Header, URL, Cookie) rồi mới quyết định chia tải. |
| Tốc độ | Cực kỳ nhanh (Do xử lý đơn giản). | Chậm hơn một chút (Do phải phân tích nội dung). |
| Ứng dụng | Game Server, hệ thống Streaming, Database. | Định tuyến Microservices, điều hướng dựa trên URL (VD: /api sang server A, /images sang server B). |
Phân loại theo hình thức triển khai
- Hardware Load Balancer: Thiết bị phần cứng đắt tiền, to bằng cái tủ lạnh (Ví dụ: Thiết bị của hãng F5 Networks). Thường dùng cho các Data Center của ngân hàng, viễn thông.
- Software Load Balancer: Các phần mềm cài trên máy chủ Linux như Nginx, HAProxy. Miễn phí, linh hoạt và được dùng rất phổ biến.
- Cloud Load Balancer: Dịch vụ ảo hóa do AWS, Google Cloud cung cấp. Chỉ việc click chuột là dùng, tự động mở rộng theo lưu lượng.
Các loại Load Balancer riêng biệt trên AWS (Elastic Load Balancing – ELB)
- Application Load Balancer (ALB): Chuyên trị Layer 7 (HTTP/HTTPS). Thích hợp nhất cho Web App và Microservices.
- Network Load Balancer (NLB): Chuyên trị Layer 4 (TCP/UDP). Dùng cho ứng dụng cần hiệu năng cực độ, hàng triệu request/giây với độ trễ siêu thấp.
- Gateway Load Balancer (GWLB): Chuyên dùng để triển khai và quản lý các thiết bị tường lửa ảo của bên thứ ba.
- Classic Load Balancer (CLB): Thế hệ cũ, hiện AWS khuyên không nên dùng cho dự án mới.
Các thuật toán Cân bằng tải cốt lõi (Load Balancing Algorithms)
Load Balancer không chia tải bừa bãi. Nó phải tuân theo các thuật toán do bạn cài đặt:
- Round Robin (Xoay vòng): Đơn giản nhất. Khách 1 vào Server A, khách 2 vào Server B, khách 3 vào Server C… Cứ thế xoay vòng đều tăm tắp. Phù hợp khi tất cả máy chủ có sức mạnh cấu hình y hệt nhau.
- Weighted Round Robin (Xoay vòng có trọng số): Server A có 32GB RAM, Server B chỉ có 8GB RAM. Bạn sẽ cấu hình đánh “trọng số” cho Server A cao gấp 4 lần Server B. Load Balancer sẽ ưu tiên đẩy nhiều việc hơn cho Server A.
- Least Connection (Ít kết nối nhất): Chuyển traffic vào máy chủ hiện đang có ít kết nối đang hoạt động nhất. Thuật toán này rất thông minh, giúp tránh tình trạng một máy chủ bị “kẹt” bởi các request xử lý lâu.
- Least Response Time (Thời gian phản hồi nhanh nhất): Đo lường xem server nào đang trả kết quả về nhanh nhất thì tấp traffic vào server đó.
- IP Hash (Băm địa chỉ IP): Dựa vào địa chỉ IP của khách hàng để tạo ra một mã băm. Mã băm này đảm bảo: Nếu khách hàng A đã từng kết nối vào Server số 2, thì những lần F5 làm mới trang sau đó, khách hàng A vẫn sẽ bị ép dính vào Server số 2 (Rất quan trọng cho chức năng Giỏ hàng để không bị mất Session).
Phân biệt Load Balancer và Reverse Proxy
Rất nhiều người nhầm lẫn hai khái niệm này vì các phần mềm như Nginx có thể làm cả hai.
- Load Balancer: Chuyên gia “chia bài”. Mục đích chính là chia đều Traffic cho nhiều máy chủ phía sau để chống quá tải. Nếu chỉ có 1 máy chủ backend thì Load Balancer vô tác dụng.
- Reverse Proxy: Là một “đại diện”. Nó đứng che chắn cho máy chủ nội bộ. Nó có thể đứng trước chỉ 1 máy chủ duy nhất để làm nhiệm vụ bảo mật, ẩn IP thật, nén dữ liệu hoặc Caching (bộ nhớ đệm).
Lời Kết
Load Balancer không chỉ là một công cụ, nó là một tư duy kiến trúc nền tảng mà bất kỳ hệ thống quy mô lớn nào cũng phải dựa vào. Nắm vững khái niệm Load Balancer là gì, phân biệt được Layer 4 với Layer 7, và biết cách áp dụng thuật toán phù hợp sẽ giúp bạn xây dựng nên những hệ thống “bất tử”, có khả năng phục vụ hàng triệu người dùng cùng lúc.
Đặc biệt, trong kỷ nguyên Điện toán đám mây, các bộ cân bằng tải trên AWS (ALB, NLB) đã được nâng tầm lên một đẳng cấp mới với khả năng tự động hóa hoàn toàn.
Bạn đã sẵn sàng làm chủ hạ tầng Cloud và tự tay thiết kế các hệ thống cân bằng tải chuẩn doanh nghiệp?
Hãy tham gia Khóa học AWS thực chiến dành cho người mới tại CodeStar Academy.
- Đội ngũ giảng viên là các chuyên gia Cloud Architect với hơn 10 năm kinh nghiệm.
- Lộ trình bài bản, thực hành Lab trực tiếp trên AWS chiếm >70% thời lượng.
- Tự tay cài đặt EC2, cấu hình Application Load Balancer kết hợp Auto Scaling để thấy website tự động “đẻ” thêm server khi bị quá tải.
Đừng bỏ lỡ cơ hội nâng cấp sự nghiệp! Đăng ký ngay khóa học AWS tại CodeStar Academy hôm nay để nhận ưu đãi học phí cực tốt!
