B-Tree là gì? Cấu trúc dữ liệu đứng sau sức mạnh của Database Index

2 tháng 0 7 6 phút đọc

Khi làm việc với cơ sở dữ liệu, đặc biệt là các hệ quản trị như MySQL, PostgreSQL hay SQL Server, chắc chắn sẽ có lúc gặp khái niệm INDEX và nghe nhắc đến B-Tree. Đây là một trong những cấu trúc dữ liệu quan trọng nhất trong thế giới database hiện đại, giúp tăng tốc độ truy vấn từ vài giây xuống chỉ còn vài mili giây.

B-Tree là gì? Cấu trúc dữ liệu đứng sau sức mạnh của Database Index

Mục lục

B-Tree là gì?
Cấu trúc của B-Tree
Vì sao B-Tree phù hợp với Database?
Cách B-Tree hoạt động trong INDEX
Độ phức tạp của B-Tree
B-Tree và B+Tree khác nhau thế nào?
Khi nào INDEX B-Tree hoạt động tốt?
Khi nào B-Tree không hiệu quả?
Ưu điểm của B-Tree
Nhược điểm của B-Tree
Kết luận

Nếu không có B-Tree, mỗi lần tìm dữ liệu, hệ quản trị cơ sở dữ liệu có thể phải quét toàn bộ bảng để kiểm tra từng dòng một. Nhưng nhờ cơ chế tổ chức dữ liệu cực kỳ thông minh của B-Tree, database có thể tìm kiếm, sắp xếp và truy xuất dữ liệu với hiệu suất rất cao ngay cả khi bảng chứa hàng triệu bản ghi.

B-Tree là gì?

B-Tree (Balanced Tree) là một cấu trúc dữ liệu dạng cây tự cân bằng, được thiết kế để tối ưu việc đọc và ghi dữ liệu trên ổ đĩa.

Khác với Binary Search Tree thông thường chỉ có tối đa 2 nhánh con, mỗi node trong B-Tree có thể chứa nhiều key và nhiều node con cùng lúc. Điều này giúp chiều cao của cây thấp hơn rất nhiều, từ đó giảm số lần truy cập ổ đĩa.

Đây chính là lý do B-Tree được sử dụng rộng rãi trong:

Database Index
File System
Storage Engine
Distributed Database
Search Engine

Cấu trúc của B-Tree

Một B-Tree bao gồm nhiều node. Mỗi node có thể chứa:

Nhiều key
Nhiều con trỏ tới node con
Dữ liệu hoặc địa chỉ dữ liệu

Ví dụ một node có thể chứa:

[10 | 20 | 30]

Điều này có nghĩa:

Node con bên trái chứa giá trị nhỏ hơn 10
Node giữa chứa giá trị từ 10 đến 20
Node tiếp theo chứa giá trị từ 20 đến 30
Node cuối chứa giá trị lớn hơn 30

Nhờ việc chứa nhiều key trong cùng một node, B-Tree giảm đáng kể độ sâu của cây.

Vì sao B-Tree phù hợp với Database?

Trong database, tốc độ truy cập dữ liệu phụ thuộc rất nhiều vào số lần đọc ổ đĩa.

Nếu cây quá cao, hệ thống phải đọc nhiều block dữ liệu hơn. B-Tree giải quyết vấn đề này bằng cách:

Giữ cây luôn cân bằng
Giảm chiều cao cây
Tăng số lượng key trên mỗi node
Tối ưu cho block storage

Ví dụ:

Binary Tree có thể cần hàng chục lần truy cập
B-Tree chỉ cần 3 đến 4 lần truy cập để tìm dữ liệu trong hàng triệu record

Cách B-Tree hoạt động trong INDEX

Khi tạo INDEX trong MySQL:

CREATE INDEX idx_email ON users(email);

Database sẽ xây dựng một B-Tree cho cột email.

Mỗi key trong cây sẽ lưu:

Giá trị email
Con trỏ tới dòng dữ liệu thật

Khi truy vấn:

SELECT * FROM users WHERE email = '[email protected]';

Database không cần quét toàn bộ bảng nữa. Nó chỉ việc đi qua các node của B-Tree để tìm đúng vị trí dữ liệu.

Độ phức tạp của B-Tree

Các thao tác chính đều có độ phức tạp rất tốt:

Tìm kiếm: O(log n)
Insert: O(log n)
Delete: O(log n)

Đây là hiệu năng cực kỳ lý tưởng cho hệ thống dữ liệu lớn.

B-Tree và B+Tree khác nhau thế nào?

Trong thực tế, phần lớn database hiện đại dùng B+Tree thay vì B-Tree truyền thống.

Điểm khác biệt chính:

B-Tree có thể lưu dữ liệu ở mọi node
B+Tree chỉ lưu dữ liệu ở leaf node
Các leaf node của B+Tree được liên kết với nhau

Điều này giúp:

Range Query nhanh hơn
ORDER BY hiệu quả hơn
Duyệt tuần tự tối ưu hơn

Ví dụ:

SELECT * FROM products WHERE price BETWEEN 100 AND 500 ORDER BY price;

B+Tree xử lý truy vấn kiểu này cực kỳ hiệu quả.

Khi nào INDEX B-Tree hoạt động tốt?

B-Tree INDEX đặc biệt mạnh trong các trường hợp:

Tìm kiếm bằng dấu =
So sánh lớn hơn nhỏ hơn
BETWEEN
ORDER BY
LIKE ‘text%’

Ví dụ:

WHERE age > 18
WHERE created_at BETWEEN ...
ORDER BY username

Khi nào B-Tree không hiệu quả?

Một số trường hợp khiến INDEX B-Tree hoạt động kém:

LIKE ‘%text’
Function trên column
Data cardinality thấp
OR quá nhiều điều kiện

Ví dụ:

WHERE LOWER(username) = 'admin'
WHERE email LIKE '%gmail.com'

Trong các trường hợp này, database thường khó tận dụng INDEX hiệu quả.

Ưu điểm của B-Tree

Tìm kiếm cực nhanh
Tự cân bằng
Tối ưu cho ổ đĩa
Hỗ trợ range query mạnh
Hiệu quả với dữ liệu lớn

Nhược điểm của B-Tree

Tốn thêm dung lượng lưu INDEX
Insert và Update có thể chậm hơn
Cần bảo trì và tối ưu INDEX
Không phù hợp cho full-text search

Kết luận

B-Tree là nền tảng cốt lõi phía sau hầu hết hệ thống INDEX trong database hiện đại. Nhờ khả năng tự cân bằng và tối ưu truy cập ổ đĩa, cấu trúc này giúp cơ sở dữ liệu xử lý hàng triệu bản ghi với tốc độ cực nhanh.

Hiểu rõ B-Tree không chỉ giúp tối ưu SQL tốt hơn mà còn giúp lập trình viên nắm được cách database thực sự vận hành phía sau các câu truy vấn hằng ngày.

Hủy

Không có bình luận.

Facebook Pinterest Youtube Wordpress Github

Công cụ viết lách

Viết truyện dài? Quản lý thế giới toàn diện

Bản đồ quan hệ, trình viết bản thảo, truyện tương tác nhánh. 16+ thể loại. Không đăng ký.

Quan hệ Viết bản thảo Nhánh rẽ 16+ Thể loại

Mở Init Inkstone →

Công cụ miễn phí

Chia sẻ code & ghi chú tức thì

Syntax highlighting, khóa pass, tự hủy sau đọc, chia sẻ QR. Không cần đăng ký.

15+ NN Khóa Pass Tự hủy QR

Dùng Init Note →

Người Qua Đường 1 tuần trước

Trong Init Note

dùng ngon
Người Qua Đường 1 tuần trước

Trong Init Background Eraser

tạm ổn
Người Qua Đường 1 tuần trước

Trong Init Magick Studio

quá mạnh
Người Qua Đường 1 tuần trước

Trong Init Pixel Art

hay đó chứ
Người Qua Đường 1 tuần trước

Trong Init Upscaler

dùng ổn
Người Qua Đường 1 tuần trước

Trong Init Code Flex — Biến đoạn code bình thường thành tác phẩm nghệ thuật chỉ trong vài cú click

mượt
Người Qua Đường 1 tuần trước

Trong Server là gì? Khác gì với một chiếc PC mạnh?

👍👍👍
Người Qua Đường 1 tuần trước

Trong Giám sát WordPress với InitTop: Từ MySQL monitoring đến full-stack observability

tool có vẻ hữu ích
Người Qua Đường 1 tuần trước

Trong Ý nghĩa của các HTTP header trong một request thực tế

<3 <3 <3
Người Qua Đường 1 tuần trước

Trong Tăng tốc độ truy vấn cơ sở dữ liệu trong WordPress với Index WP MySQL For Speed

cái này có find & replace mà quên Revert Index cái là lỗi liền luôn, dùng cần cẩn thận

100% Riêng tư

Chuyển đổi ảnh không giới hạn ngay trên trình duyệt

Engine ImageMagick WASM. Không upload, không server, dữ liệu không rời thiết bị.

100+ Định dạng Batch ZIP WASM Không Upload

Mở Init Magick Studio →

B-Tree là gì? Cấu trúc dữ liệu đứng sau sức mạnh của Database Index

B-Tree là gì?

Cấu trúc của B-Tree

Vì sao B-Tree phù hợp với Database?

Cách B-Tree hoạt động trong INDEX

Độ phức tạp của B-Tree

B-Tree và B+Tree khác nhau thế nào?

Khi nào INDEX B-Tree hoạt động tốt?

Khi nào B-Tree không hiệu quả?

Ưu điểm của B-Tree

Nhược điểm của B-Tree

Kết luận

Bình luận

Công cụ trực tuyến

B-Tree là gì?

Cấu trúc của B-Tree

Vì sao B-Tree phù hợp với Database?

Cách B-Tree hoạt động trong INDEX

Độ phức tạp của B-Tree

B-Tree và B+Tree khác nhau thế nào?

Khi nào INDEX B-Tree hoạt động tốt?

Khi nào B-Tree không hiệu quả?

Ưu điểm của B-Tree

Nhược điểm của B-Tree

Kết luận

Bài Viết Liên Quan

Bình luận

Công cụ trực tuyến

Đăng nhập