Ngày nay, hầu hết các framework hiện đại đều hỗ trợ ORM. Cụ thể như Laravel có Eloquent – một công cụ mạnh mẽ và cực kỳ tiện lợi. Nhưng chính sự “dễ dùng” ấy lại dễ khiến ta quên mất một điều cốt lõi: đằng sau là những câu SQL đang được thực thi.
Nếu không hiểu bản chất của SQL, ta có thể viết ra những truy vấn chạy được nhưng lại không tối ưu. Có lúc chúng ta bối rối vì không hiểu tại sao một câu truy vấn lại chậm, hoặc sửa tới sửa lui mà vẫn không đạt được kết quả mong muốn.
Hôm nay, mình chia sẻ một vài trải nghiệm về thứ tự thực thi SQL – một kiến thức tưởng chừng đơn giản, nhưng nếu nắm vững thì sẽ giúp bạn chủ động hơn rất nhiều khi viết và tối ưu truy vấn.
LIMIT
mà truy vấn vẫn chậm?WHERE
?ON
của JOIN
hay trong WHERE
?Nhìn vào cú pháp:
SELECT ... FROM ... WHERE ...
…nhiều người dễ nghĩ rằng SQL sẽ xử lý tuần tự theo cách viết: SELECT
→ FROM
→ WHERE
. Nhưng thực tế, SQL là ngôn ngữ khai báo (declarative), không phải ngôn ngữ thủ tục.
Câu truy vấn bạn viết ra sẽ được DBMS (Hệ quản trị CSDL) chuyển đổi và thực thi theo thứ tự logic sau:
1. FROM
2. ON
3. JOIN
4. WHERE
5. GROUP BY
6. HAVING
7. SELECT
8. DISTINCT
9. ORDER BY
10. LIMIT (TOP)
Hiểu thứ tự này là nền tảng để lý giải nhiều vấn đề hiệu năng.
Ví dụ đoạn code Eloquent:
User::where('status', 1)
->orderBy('created_at', 'desc')
->limit(10)
->get();
Câu lệnh trên hoàn toàn đúng cú pháp, nhưng khi áp dụng với bảng users
có 2 triệu records, bạn sẽ thấy tốc độ truy vấn khá chậm.
Lý do: LIMIT
chỉ được áp dụng sau khi dữ liệu đã được lọc và sắp xếp xong. Nếu bạn sắp xếp (ORDER BY
) theo một cột không nằm trong index, hệ thống phải sort toàn bộ tập dữ liệu trước, rồi mới chọn ra 10 records đầu tiên.
👉 Để LIMIT
hiệu quả hơn:
ORDER BY
nếu không thực sự cần thiết.SELECT price * quantity AS total
FROM orders
WHERE total > 1000;
Câu trên sẽ gây lỗi. Vì sao?
Vì WHERE
được thực hiện trước SELECT
, nên alias total
chưa được tạo ra tại thời điểm đó.
Tuy nhiên, nếu viết:
SELECT price * quantity AS total
FROM orders
ORDER BY total DESC;
…thì lại chạy bình thường vì ORDER BY
được thực hiện sau SELECT, lúc này alias đã tồn tại.
💡 Ghi nhớ: Alias chỉ dùng được ở các bước sau SELECT, như ORDER BY
hay HAVING
.
Giả sử bạn viết:
SELECT ...
FROM orders o
JOIN users u ON o.user_id = u.id AND u.status = 1
So với:
SELECT ...
FROM orders o
JOIN users u ON o.user_id = u.id
WHERE u.status = 1
Về mặt logic, kết quả giống nhau. Nhưng về hiệu năng, thì lại khác nhau đáng kể.
ON
sẽ lọc dữ liệu ngay trong quá trình JOIN, giảm lượng dữ liệu trung gian.WHERE
sẽ lọc sau khi JOIN xong, khiến hệ thống phải xử lý thêm dữ liệu không cần thiết.👉 Kinh nghiệm cá nhân: Luôn ưu tiên lọc sớm – giảm tải sớm. Nhất là khi JOIN nhiều bảng lớn, tối ưu từng bước là điều cần thiết.
Trong những truy vấn lồng nhau (subquery), thỉnh thoảng hay gặp tình huống là dồn hết điều kiện vào WHERE
ở bên ngoài.
NÊN LÀ : tối ưu từ trong ra ngoài, thu hẹp tập dữ liệu trong từng truy vấn con. Mỗi subquery càng nhỏ, càng cụ thể thì DBMS càng dễ tối ưu.
ORM như Eloquent giúp chúng ta viết code nhanh chóng và dễ đọc hơn. Nhưng đừng quên rằng mỗi câu Eloquent bạn viết đều sẽ được dịch ra SQL – và nếu bạn không hiểu rõ cơ chế thực thi, bạn đang viết SQL một cách “vô thức”, phó mặc hiệu năng cho framework xử lý.
Để viết một câu SQL tốt, bạn nên:
Nguồn: viblo
You need to login in order to like this post: click here
YOU MIGHT ALSO LIKE