Thuật toán Minimax + Alpha-Beta Pruning là gì? Giải thích dễ hiểu kèm demo chơi Tic-Tac-Toe

10/11/2025 0 47 8 phút đọc

Demo

Trong các trò chơi đối kháng hai người như tic-tac-toe, cờ caro hay cờ vua đơn giản, một chiến lược kinh điển để xây dựng AI là giả định cả hai bên đều chơi tối ưu, rồi chọn nước đi tốt nhất dựa trên việc “nhìn trước vài bước”. Thuật toán Minimax chính là công cụ làm việc đó: nó duyệt cây trạng thái trò chơi, xen kẽ lượt của người chơi cần tối đa hóa điểm số (Max) và người chơi cần tối thiểu hóa điểm số (Min). Tuy nhiên, nếu duyệt toàn bộ cây thì số trạng thái có thể tăng rất nhanh. Alpha-Beta Pruning giúp ta cắt bỏ sớm những nhánh chắc chắn không thể ảnh hưởng tới kết quả cuối cùng, từ đó tăng tốc Minimax đáng kể mà vẫn giữ nguyên tính tối ưu.

Mục lục

Minimax là gì?
Alpha-Beta Pruning: tăng tốc Minimax
Mô hình demo: AI chơi Tic-Tac-Toe
Demo Minimax + Alpha-Beta Pruning bằng JavaScript
Demo: Thuật toán Minimax + Alpha-Beta trên Tic-Tac-Toe
Giải thích ngắn gọn đoạn code Minimax + Alpha-Beta
1. Biểu diễn bàn cờ và kiểm tra thắng/thua
2. Hàm Minimax với Alpha-Beta Pruning
3. AI chọn nước đi dựa trên Minimax

Trong bài viết này, chúng ta sẽ:

Hiểu Minimax đang cố gắng giải bài toán gì.
Nắm được ý tưởng Max/Min và hàm đánh giá trạng thái.
Thấy Alpha-Beta Pruning cắt bớt được những nhánh vô nghĩa.
Xem demo trực quan Minimax + Alpha-Beta trên trò chơi Tic-Tac-Toe bằng JavaScript.

Minimax là gì?

Minimax là một thuật toán dùng cho các trò chơi hai người dạng zero-sum game (tổng điểm hai bên luôn bằng 0, bên này được thì bên kia mất). Ta giả định:

Một bên là Max: luôn cố gắng tối đa hóa điểm số.
Bên còn lại là Min: luôn cố gắng tối thiểu hóa điểm số.

Ý tưởng cơ bản:

Xây dựng cây trò chơi: mỗi node là một trạng thái bàn cờ, các cạnh là những nước đi hợp lệ.
Lá của cây (trạng thái kết thúc) được gán điểm:
- Max thắng: điểm dương (ví dụ +10).
- Min thắng: điểm âm (ví dụ -10).
- Hòa: 0.
Khi lan ngược từ lá lên:
- Tại node là lượt Max → chọn giá trị lớn nhất trong các con.
- Tại node là lượt Min → chọn giá trị nhỏ nhất trong các con.
Node gốc (trạng thái hiện tại) sẽ có một điểm Minimax. Nước đi tương ứng với con có điểm tốt nhất sẽ là lựa chọn tối ưu.

Alpha-Beta Pruning: tăng tốc Minimax

Nhược điểm của Minimax “thuần” là phải duyệt gần như toàn bộ cây trò chơi, rất tốn thời gian khi số trạng thái lớn. Alpha-Beta Pruning giúp cắt bỏ bớt các nhánh chắc chắn không thể cải thiện kết quả, nhờ hai giá trị:

Alpha (α): điểm tốt nhất Max đã thấy.
Beta (β): điểm tốt nhất Min đã thấy.

Trong quá trình duyệt:

Tại node của Max: nếu tìm được giá trị ≥ β, Min sẽ không bao giờ chọn nhánh này, vì vậy các nhánh còn lại có thể bỏ qua.
Tại node của Min: nếu tìm được giá trị ≤ α, Max sẽ không chọn nhánh này, nên cũng có thể bỏ qua.

Điều quan trọng là: Alpha-Beta Pruning không thay đổi kết quả Minimax tối ưu, mà chỉ giảm số lượng node phải duyệt, giúp thuật toán chạy nhanh hơn rất nhiều.

Mô hình demo: AI chơi Tic-Tac-Toe

Để trực quan, ta sử dụng trò chơi Tic-Tac-Toe (XO) trên bàn cờ 3×3:

Bạn là X.
AI là O.
Sau mỗi nước của bạn, AI sẽ tính toán và chọn nước đi tối ưu bằng Minimax + Alpha-Beta.

Trong demo:

Bàn cờ 3×3 hiển thị dưới dạng lưới.
Bạn click vào ô trống để đánh X.
AI tự động đánh O bằng thuật toán.
Khu vực “Log” hiển thị chi tiết quá trình AI duyệt và cắt tỉa.

Demo Minimax + Alpha-Beta Pruning bằng JavaScript

Demo: Thuật toán Minimax + Alpha-Beta trên Tic-Tac-Toe

Bạn chơi X, AI chơi O. Mỗi khi tới lượt AI, thuật toán Minimax + Alpha-Beta sẽ duyệt và chọn nước đi tối ưu.

Kết quả

Chưa có kết quả. Bạn đi trước với X.

Log thuật toán

Sẵn sàng. Click vào một ô để đánh X.

Giải thích ngắn gọn đoạn code Minimax + Alpha-Beta

1. Biểu diễn bàn cờ và kiểm tra thắng/thua

Bàn cờ Tic-Tac-Toe 3×3 được biểu diễn bằng một mảng 1 chiều có 9 phần tử:

var board = ["", "", "", "", "", "", "", "", ""];

Mỗi ô có thể là:

"": ô trống.
"X": nước đi của người chơi.
"O": nước đi của AI.

Hàm checkWinner(b) sẽ kiểm tra tất cả các hàng, cột và đường chéo để xem có bên nào thắng hay không. Nếu không còn ô trống mà vẫn chưa ai thắng thì trả về "draw" (hòa):

function checkWinner(b) {
    const lines = [
        [0,1,2],[3,4,5],[6,7,8],      // hàng
        [0,3,6],[1,4,7],[2,5,8],      // cột
        [0,4,8],[2,4,6]               // chéo
    ];
    for (const [a, c, d] of lines) {
        if (b[a] && b[a] === b[c] && b[a] === b[d]) return b[a]; // "X" hoặc "O"
    }
    if (b.every(x => x !== "")) return "draw"; // không còn ô trống
    return null; // chưa kết thúc
}

2. Hàm Minimax với Alpha-Beta Pruning

Hàm minimax nhận vào:

b: trạng thái bàn cờ hiện tại.
depth: độ sâu trong cây (dùng để điều chỉnh điểm).
isMax: nếu là true thì đang tới lượt Max (X), ngược lại là Min (O).
alpha, beta: hai ngưỡng dùng để cắt tỉa nhánh.

Đầu tiên, nếu trạng thái hiện tại đã kết thúc (X thắng, O thắng, hoặc hòa), ta trả về điểm:

X thắng: 10 - depth (thắng càng sớm càng tốt).
O thắng: depth - 10 (AI muốn X bị thua, nên điểm âm).
Hòa: 0.

function minimax(b, depth, isMax, alpha, beta) {
    var result = checkWinner(b);
    if (result === "X") return 10 - depth;
    if (result === "O") return depth - 10;
    if (result === "draw") return 0;

    if (isMax) {
        var best = -Infinity;
        for (var i = 0; i < 9; i++) {
            if (b[i] === "") {
                b[i] = "X";
                var score = minimax(b, depth + 1, false, alpha, beta);
                b[i] = "";
                best = Math.max(best, score);
                alpha = Math.max(alpha, best);
                if (beta <= alpha) {
                    break; // cắt nhánh nếu không cần xét thêm
                }
            }
        }
        return best;
    } else {
        var bestMin = Infinity;
        for (var j = 0; j < 9; j++) {
            if (b[j] === "") {
                b[j] = "O";
                var scoreMin = minimax(b, depth + 1, true, alpha, beta);
                b[j] = "";
                bestMin = Math.min(bestMin, scoreMin);
                beta = Math.min(beta, bestMin);
                if (beta <= alpha) {
                    break; // cắt nhánh nếu không cần xét thêm
                }
            }
        }
        return bestMin;
    }
}

Phần if (beta <= alpha) break; chính là chỗ Alpha-Beta Pruning phát huy tác dụng: khi nhận ra rằng các nhánh còn lại không thể cho kết quả tốt hơn, ta dừng duyệt những nhánh đó để tiết kiệm thời gian.

3. AI chọn nước đi dựa trên Minimax

Khi tới lượt AI (O), ta thử đặt O vào từng ô trống, tính điểm Minimax cho mỗi lựa chọn, rồi chọn nước đi có điểm nhỏ nhất (vì O là Min, muốn tối thiểu hóa điểm):

function aiMove() {
    var bestScore = Infinity;
    var bestMove = null;

    log("AI bắt đầu chạy Minimax + Alpha-Beta...");

    for (var i = 0; i < 9; i++) {
        if (board[i] === "") {
            board[i] = "O";
            var score = minimax(board, 0, true, -Infinity, Infinity);
            board[i] = "";
            log("Thử ô " + (i + 1) + " → điểm = " + score + ".");
            if (score < bestScore) {
                bestScore = score;
                bestMove = i;
            }
        }
    }

    board[bestMove] = "O";
    log("AI đánh O vào ô " + (bestMove + 1) + ".");
    renderBoard();

    var winner = checkWinner(board);
    if (winner) {
        endGame(winner);
        return;
    }

    currentPlayer = "X";
    updateResult("Tới lượt bạn.");
}

Nhờ cách đánh giá này, AI sẽ luôn chọn được nước đi không thua (trên Tic-Tac-Toe chuẩn 3×3). Nếu người chơi đi sai, AI có thể tận dụng để giành chiến thắng.

Hủy

Không có bình luận.

Facebook Pinterest Youtube Wordpress Github

Công cụ viết lách

Viết truyện dài? Quản lý thế giới toàn diện

Bản đồ quan hệ, trình viết bản thảo, truyện tương tác nhánh. 16+ thể loại. Không đăng ký.

Quan hệ Viết bản thảo Nhánh rẽ 16+ Thể loại

Mở Init Inkstone →

Công cụ miễn phí

Chia sẻ code & ghi chú tức thì

Syntax highlighting, khóa pass, tự hủy sau đọc, chia sẻ QR. Không cần đăng ký.

15+ NN Khóa Pass Tự hủy QR

Dùng Init Note →

Người Qua Đường 1 tuần trước

Trong Init Note

dùng ngon
Người Qua Đường 1 tuần trước

Trong Init Background Eraser

tạm ổn
Người Qua Đường 1 tuần trước

Trong Init Magick Studio

quá mạnh
Người Qua Đường 1 tuần trước

Trong Init Pixel Art

hay đó chứ
Người Qua Đường 1 tuần trước

Trong Init Upscaler

dùng ổn
Người Qua Đường 1 tuần trước

Trong Init Code Flex — Biến đoạn code bình thường thành tác phẩm nghệ thuật chỉ trong vài cú click

mượt
Người Qua Đường 1 tuần trước

Trong Server là gì? Khác gì với một chiếc PC mạnh?

👍👍👍
Người Qua Đường 1 tuần trước

Trong Giám sát WordPress với InitTop: Từ MySQL monitoring đến full-stack observability

tool có vẻ hữu ích
Người Qua Đường 1 tuần trước

Trong Ý nghĩa của các HTTP header trong một request thực tế

<3 <3 <3
Người Qua Đường 1 tuần trước

Trong Tăng tốc độ truy vấn cơ sở dữ liệu trong WordPress với Index WP MySQL For Speed

cái này có find & replace mà quên Revert Index cái là lỗi liền luôn, dùng cần cẩn thận

100% Riêng tư

Chuyển đổi ảnh không giới hạn ngay trên trình duyệt

Engine ImageMagick WASM. Không upload, không server, dữ liệu không rời thiết bị.

100+ Định dạng Batch ZIP WASM Không Upload

Mở Init Magick Studio →

Thuật toán Minimax + Alpha-Beta Pruning là gì? Giải thích dễ hiểu kèm demo chơi Tic-Tac-Toe

Minimax là gì?

Alpha-Beta Pruning: tăng tốc Minimax

Mô hình demo: AI chơi Tic-Tac-Toe

Demo Minimax + Alpha-Beta Pruning bằng JavaScript

Demo: Thuật toán Minimax + Alpha-Beta trên Tic-Tac-Toe

Kết quả

Log thuật toán

Giải thích ngắn gọn đoạn code Minimax + Alpha-Beta

1. Biểu diễn bàn cờ và kiểm tra thắng/thua

2. Hàm Minimax với Alpha-Beta Pruning

3. AI chọn nước đi dựa trên Minimax

Bình luận

Công cụ trực tuyến

Minimax là gì?

Alpha-Beta Pruning: tăng tốc Minimax

Mô hình demo: AI chơi Tic-Tac-Toe

Demo Minimax + Alpha-Beta Pruning bằng JavaScript

Demo: Thuật toán Minimax + Alpha-Beta trên Tic-Tac-Toe

Kết quả

Log thuật toán

Giải thích ngắn gọn đoạn code Minimax + Alpha-Beta

1. Biểu diễn bàn cờ và kiểm tra thắng/thua

2. Hàm Minimax với Alpha-Beta Pruning

3. AI chọn nước đi dựa trên Minimax

Bài Viết Liên Quan

Bình luận

Công cụ trực tuyến

Đăng nhập