Hướng Dẫn Toàn Diện: Giải Toán Bằng Excel Với Các Hàm Thống Kê, Xác Suất và Hồi Quy

by Thầy Đông · January 15, 2026

Rate this post

Việc giải toán, đặc biệt là các bài toán liên quan đến thống kê, xác suất hay phân tích dữ liệu, có thể trở nên đơn giản và hiệu quả hơn rất nhiều khi chúng ta biết cách tận dụng sức mạnh của Microsoft Excel. Bài viết này sẽ cung cấp một cái nhìn chi tiết về các hàm Excel hỗ trợ đắc lực cho giải toán bằng excel, bao gồm các nhóm hàm thống kê cơ bản, các hàm phân phối xác suất phức tạp và công cụ cho phân tích tương quan, hồi quy tuyến tính. Nắm vững các hàm này sẽ giúp bạn xử lý dữ liệu, đưa ra nhận định chính xác và hoàn thành các bài tập, dự án học tập, nghiên cứu một cách chuyên nghiệp.

Đề Bài: Giới Thiệu Các Hàm Excel Hỗ Trợ Giải Toán

Tài liệu gốc cung cấp danh sách chi tiết các hàm Excel được phân loại theo ba nhóm chính, phục vụ cho các mục đích giải toán khác nhau: Nhóm hàm về Thống Kê, nhóm hàm về Phân Phối Xác Suất, và nhóm hàm về Tương Quan và Hồi Quy Tuyến Tính. Mỗi hàm đi kèm với mô tả ngắn gọn về chức năng và cách sử dụng cơ bản.

Phân Tích Yêu Cầu

Bài viết này tập trung vào việc làm rõ cách các hàm Excel có thể được áp dụng để giải quyết các vấn đề toán học trong thực tế và học tập. Yêu cầu là trình bày một cách có hệ thống các hàm này, giúp người đọc hiểu rõ chức năng của từng hàm, từ đó có thể áp dụng chúng để phân tích dữ liệu, kiểm định giả thuyết, dự báo xu hướng và giải quyết các bài toán phức tạp khác. Mục tiêu là biến Excel thành một công cụ mạnh mẽ cho việc giải toán bằng excel.

Kiến Thức/Nền Tảng Cần Dùng

Excel cung cấp một bộ công cụ phong phú để xử lý các tác vụ toán học và thống kê. Dưới đây là ba nhóm hàm chính mà chúng ta sẽ khám phá:

1. Nhóm Hàm Về Thống Kê

Nhóm này bao gồm các hàm dùng để mô tả và tóm tắt tập dữ liệu, đo lường sự biến thiên và phân bố của dữ liệu.

AVEDEV (number1, number2, …): Tính trung bình độ lệch tuyệt đối của các điểm dữ liệu so với trung bình của chúng. Đây là thước đo về sự biến đổi của tập số liệu.
$\text{AVEDEV}(d_1, d_2, \ldots)$
AVERAGE(number1, number2, …): Tính trung bình cộng của các giá trị.
$\text{AVERAGE}(d_1, d_2, \ldots)$
AVERAGEA(number1, number2, …): Tính trung bình cộng của các giá trị, bao gồm cả giá trị logic (TRUE=1, FALSE=0) và văn bản (0).
$\text{AVERAGEA}(d_1, d_2, \ldots)$
AVERAGEIF (range, criteria1): Tính trung bình cộng của các giá trị trong một phạm vi thỏa mãn một điều kiện nhất định.
$\text{AVERAGEIF}(\text{vùng}, \text{điều kiện})$
AVERAGEIFS (range, criteria1, criteria2, …): Tính trung bình cộng của các giá trị trong một phạm vi thỏa mãn nhiều điều kiện.
$\text{AVERAGEIFS}(\text{vùng1}, \text{điều kiện1}, \text{vùng2}, \text{điều kiện2}, \ldots)$
COUNT (value1, value2, …): Đếm số lượng ô chứa số trong danh sách các đối số.
$\text{COUNT}(v_1, v_2, \ldots)$
COUNTA(value1, value2, …): Đếm số lượng ô có chứa giá trị (không rỗng) trong danh sách các đối số.
$\text{COUNTA}(v_1, v_2, \ldots)$
COUNTBLANK(range): Đếm số lượng ô rỗng trong một phạm vi.
$\text{COUNTBLANK}(\text{vùng})$
COUNTIF(range, criteria): Đếm số lượng ô thỏa mãn một điều kiện cho trước trong một phạm vi.
$\text{COUNTIF}(\text{vùng}, \text{điều kiện})$
COUNTIFS (range1, criteria1, range2, criteria2, …): Đếm số lượng ô thỏa mãn nhiều điều kiện cho trước.
$\text{COUNTIFS}(\text{vùng1}, \text{điều kiện1}, \text{vùng2}, \text{điều kiện2}, \ldots)$
DEVSQ (number1, number2, …): Tính tổng bình phương độ lệch của các điểm dữ liệu so với trung bình mẫu của chúng.
$\text{DEVSQ}(d_1, d_2, \ldots)$
FREQUENCY(data_array, bins_array): Tính tần suất xuất hiện của các giá trị trong một phạm vi dữ liệu, phân loại theo các khoảng xác định. Hàm này thường được sử dụng dưới dạng công thức mảng.
$\text{FREQUENCY}(\text{mảng_dữ_liệu}, \text{mảng_khoảng})$
GEOMEAN(number1, number2, …): Trả về trung bình nhân của một dãy các số dương. Thường dùng để tính mức tăng trưởng trung bình.
$\text{GEOMEAN}(d_1, d_2, \ldots)$
HARMEAN(number1, number2, …): Trả về trung bình điều hòa (nghịch đảo của trung bình cộng) của các số.
$\text{HARMEAN}(d_1, d_2, \ldots)$
KURT (number1, number2, …): Tính độ nhọn (kurtosis) của tập số liệu, biểu thị mức độ “nhọn” hoặc “phẳng” của một phân phối so với phân phối chuẩn.
$\text{KURT}(d_1, d_2, \ldots)$
LARGE(array, k): Trả về giá trị lớn nhất thứ k trong một tập số liệu.
$\text{LARGE}(\text{mảng}, k)$
MAX (number1, number2, …): Trả về giá trị lớn nhất trong một tập giá trị.
$\text{MAX}(v_1, v_2, \ldots)$
MAXA(number1, number2, …): Trả về giá trị lớn nhất của một tập giá trị, bao gồm cả giá trị logic và văn bản.
$\text{MAXA}(v_1, v_2, \ldots)$
MEDIAN(number1, number2, …): Tính giá trị trung vị của các số.
$\text{MEDIAN}(d_1, d_2, \ldots)$
MIN(number1, number2, …): Trả về giá trị nhỏ nhất trong một tập giá trị.
$\text{MIN}(v_1, v_2, \ldots)$
MINA(number1, number2, …): Trả về giá trị nhỏ nhất của một tập giá trị, bao gồm cả giá trị logic và văn bản.
$\text{MINA}(v_1, v_2, \ldots)$
MODE(number1, number2, …): Trả về giá trị xuất hiện nhiều nhất trong một mảng giá trị (mode).
$\text{MODE}(d_1, d_2, \ldots)$
PERCENTILE(array, k): Tìm phân vị thứ k của các giá trị trong một mảng dữ liệu.
$\text{PERCENTILE}(\text{mảng}, k)$
PERCENTRANK (array, x, significance): Trả về thứ hạng tương đối (tính bằng phần trăm) của một giá trị trong một mảng dữ liệu.
$\text{PERCENTRANK}(\text{mảng}, x, \text{độ_chính_xác})$
PERMUT (number, number_chosen): Trả về số hoán vị có thể có của một tập hợp các đối tượng.
$\text{PERMUT}(\text{tổng_số}, \text{chọn_số})$
QUARTILE(array, quart): Tính điểm tứ phân vị của tập dữ liệu.
$\text{QUARTILE}(\text{mảng}, \text{tứ_phân_vị})$
RANK(number, ref, order): Tính thứ hạng của một số trong danh sách các số.
$\text{RANK}(\text{số}, \text{tham_chiếu}, \text{thứ_tự})$
SKEW (number1, number2, …): Trả về độ lệch (skewness) của phân phối, mô tả sự không đối xứng của phân phối quanh giá trị trung bình.
$\text{SKEW}(d_1, d_2, \ldots)$
SMALL (array, k): Trả về giá trị nhỏ nhất thứ k trong một tập số liệu.
$\text{SMALL}(\text{mảng}, k)$
STDEV(number1, number2, …): Ước lượng độ lệch chuẩn trên cơ sở mẫu.
$\text{STDEV}(d_1, d_2, \ldots)$
STDEVA(value1, value2, …): Ước lượng độ lệch chuẩn trên cơ sở mẫu, bao gồm cả giá trị logic và văn bản.
$\text{STDEVA}(v_1, v_2, \ldots)$
STDEVP (number1, number2, …): Tính độ lệch chuẩn dựa trên toàn bộ tập hợp.
$\text{STDEVP}(d_1, d_2, \ldots)$
STDEVPA (value1, value2, …): Tính độ lệch chuẩn dựa trên toàn bộ tập hợp, bao gồm cả giá trị logic và văn bản.
$\text{STDEVPA}(v_1, v_2, \ldots)$
VAR(number1, number2, …): Trả về phương sai dựa trên mẫu.
$\text{VAR}(d_1, d_2, \ldots)$
VARA (value1, value2, …): Trả về phương sai dựa trên mẫu, bao gồm cả giá trị logic và văn bản.
$\text{VARA}(v_1, v_2, \ldots)$
VARP(number1, number2, …): Trả về phương sai dựa trên toàn bộ tập hợp.
$\text{VARP}(d_1, d_2, \ldots)$
VARPA (value1, value2, …): Trả về phương sai dựa trên toàn bộ tập hợp, bao gồm cả giá trị logic và văn bản.
$\text{VARPA}(v_1, v_2, \ldots)$
TRIMMEAN (array, percent): Tính trung bình của các giá trị bên trong một tập dữ liệu, sau khi loại bỏ một tỷ lệ phần trăm các giá trị ở đầu và cuối.
$\text{TRIMMEAN}(\text{mảng}, \text{tỷ_lệ})$

2. Nhóm Hàm Về Phân Phối Xác Suất

Nhóm này cung cấp các hàm để tính toán xác suất và các giá trị liên quan đến nhiều loại phân phối xác suất khác nhau, rất hữu ích cho việc phân tích rủi ro và mô hình hóa.

BETADIST(x, alpha, beta, A, B): Trả về giá trị của hàm mật độ xác suất tích lũy beta.
$\text{BETADIST}(x, alpha, beta, A, B)$
BETAINV(probability, alpha, beta, A, B): Trả về nghịch đảo của hàm mật độ xác suất tích lũy beta.
$\text{BETAINV}(\text{xác_suất}, alpha, beta, A, B)$
BINOMDIST (number_s, trials, probability_s, cumulative): Trả về xác suất của các lần thử thành công trong phân phối nhị thức.
$\text{BINOMDIST}(\text{số_thành_công}, \text{tổng_số_thử}, \text{xác_suất_thành_công}, \text{tích_lũy})$
CHIDIST (x, degrees_freedom): Trả về xác suất một phía của phân phối chi-squared.
$\text{CHIDIST}(x, \text{bậc_tự_do})$
CHIINV(probability, degrees_freedom): Trả về nghịch đảo của xác suất một phía của phân phối chi-squared.
$\text{CHIINV}(\text{xác_suất}, \text{bậc_tự_do})$
CHITEST(actual_range, expected_range): Trả về giá trị xác suất từ phân phối chi-squared và số bậc tự do tương ứng.
$\text{CHITEST}(\text{phạm_vi_thực_tế}, \text{phạm_vi_kỳ_vọng})$
CONFIDENCE(alpha, standard_dev, size): Tính khoảng tin cậy cho kỳ vọng lý thuyết.
$\text{CONFIDENCE}(alpha, \text{độ_lệch_chuẩn}, \text{kích_thước_mẫu})$
CRITBINOM (trials, probability_s, alpha): Trả về giá trị nhỏ nhất mà phân phối nhị thức tích lũy lớn hơn hoặc bằng giá trị tiêu chuẩn.
$\text{CRITBINOM}(\text{tổng_số_thử}, \text{xác_suất_thành_công}, alpha)$
EXPONDIST(x, lambda, cumulative): Tính phân phối mũ. Thường dùng để mô phỏng thời gian giữa các biến cố.
$\text{EXPONDIST}(x, lambda, \text{tích_lũy})$
FDIST(x, degrees_freedom1, degrees_freedom2): Tính phân phối xác suất F. Thường dùng để so sánh phương sai giữa hai tập dữ liệu.
$\text{FDIST}(x, \text{bậc_tự_do1}, \text{bậc_tự_do2})$
FINV(probability, degrees_freedom1, degrees_freedom2): Tính nghịch đảo của phân phối xác suất F.
$\text{FINV}(\text{xác_suất}, \text{bậc_tự_do1}, \text{bậc_tự_do2})$
FTEST (array1, array2): Trả về kết quả của một phép thử F để xác định xem hai mẫu có các phương sai khác nhau hay không.
$\text{FTEST}(\text{mảng1}, \text{mảng2})$
FISHER (x): Trả về phép biến đổi Fisher tại x.
$\text{FISHER}(x)$
FISHERINV (y): Tính nghịch đảo phép biến đổi Fisher.
$\text{FISHERINV}(y)$
GAMMADIST(x, alpha, beta, cumulative): Trả về phân phối tích lũy gamma.
$\text{GAMMADIST}(x, alpha, beta, \text{tích_lũy})$
GAMMAINV (probability, alpha, beta): Trả về nghịch đảo của phân phối tích lũy gamma.
$\text{GAMMAINV}(\text{xác_suất}, alpha, beta)$
GAMMLN(x): Tính logarit tự nhiên của hàm gamma.
$\text{GAMMLN}(x)$
HYPGEOMDIST(number1, number2, …): Trả về phân phối siêu bội (xác suất của một số lần thành công nhất định trong một mẫu rút ra mà không hoàn lại).
$\text{HYPGEOMDIST}(\text{số_thành_công_mẫu}, \text{kích_thước_mẫu}, \text{số_thành_công_tổng_thể}, \text{kích_thước_tổng_thể})$
LOGINV(probability, mean, standard_dev): Tính nghịch đảo của hàm phân phối tích lũy lognormal.
$\text{LOGINV}(\text{xác_suất}, \text{trung_bình}, \text{độ_lệch_chuẩn})$
LOGNORMDIST (x, mean, standard_dev): Trả về phân phối tích lũy lognormal.
$\text{LOGNORMDIST}(x, \text{trung_bình}, \text{độ_lệch_chuẩn})$
NEGBINOMDIST(number_f, number_s, probability_s): Trả về phân phối nhị thức âm (xác suất có number_f lần thất bại trước khi đạt number_s lần thành công).
$\text{NEGBINOMDIST}(\text{số_thất_bại}, \text{số_thành_công}, \text{xác_suất_thành_công})$
NORMDIST(x, mean, standard_dev, cumulative): Trả về phân phối chuẩn (normal distribution).
$\text{NORMDIST}(x, \text{trung_bình}, \text{độ_lệch_chuẩn}, \text{tích_lũy})$
NORMINV(probability, mean, standard_dev): Tính nghịch đảo phân phối tích lũy chuẩn.
$\text{NORMINV}(\text{xác_suất}, \text{trung_bình}, \text{độ_lệch_chuẩn})$
NORMSDIST (z): Trả về hàm phân phối tích lũy chuẩn tắc (trung bình 0, độ lệch chuẩn 1).
$\text{NORMSDIST}(z)$
NORMSINV(probability): Tính nghịch đảo của hàm phân phối tích lũy chuẩn tắc.
$\text{NORMSINV}(\text{xác_suất})$
POISSON(x, mean, cumulative): Trả về phân phối Poisson (xác suất của một số sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định).
$\text{POISSON}(x, \text{trung_bình}, \text{tích_lũy})$
PROB(x_range, prob_range, lower_limit, upper_limit): Tính xác suất của các giá trị trong một phạm vi nằm giữa hai giới hạn.
$\text{PROB}(\text{phạm_vi_x}, \text{phạm_vi_xác_suất}, \text{giới_hạn_dưới}, \text{giới_hạn_trên})$
STANDARDIZE(x, mean, standard_dev): Trả về giá trị chuẩn hóa (z-score) của một giá trị.
$\text{STANDARDIZE}(x, \text{trung_bình}, \text{độ_lệch_chuẩn})$
TDIST(x, degrees_freedom, tails): Trả về xác suất của phân phối Student (phân phối t).
$\text{TDIST}(x, \text{bậc_tự_do}, \text{đuôi})$
TINV (probability, degrees_freedom): Trả về giá trị t của phân phối Student.
$\text{TINV}(\text{xác_suất}, \text{bậc_tự_do})$
TTEST (array1, array2, tails, type): Tính xác suất kết hợp với phép thử Student.
$\text{TTEST}(\text{mảng1}, \text{mảng2}, \text{đuôi}, \text{loại})$
WEIBULL (x, alpha, beta, cumulative): Trả về phân phối Weibull. Thường sử dụng trong phân tích độ tin cậy.
$\text{WEIBULL}(x, alpha, beta, \text{tích_lũy})$
ZTEST (array, x, sigma): Trả về xác suất một phía của phép thử z.
$\text{ZTEST}(\text{mảng}, x, sigma)$

3. Nhóm Hàm Về Tương Quan và Hồi Quy Tuyến Tính

Nhóm này giúp phân tích mối quan hệ giữa các biến, dự báo xu hướng và xây dựng mô hình tuyến tính.

CORREL (array1, array2): Tính hệ số tương quan giữa hai mảng để xác định mối quan hệ tuyến tính giữa hai biến.
$\text{CORREL}(\text{mảng1}, \text{mảng2})$
COVAR(array1, array2): Tính hiệp phương sai giữa hai mảng dữ liệu.
$\text{COVAR}(\text{mảng1}, \text{mảng2})$
FORECAST(x, known_y’s, known_x’s): Tính toán hoặc dự đoán một giá trị tương lai bằng phương pháp hồi quy tuyến tính.
$\text{FORECAST}(x, \text{y_biết}, \text{x_biết})$
GROWTH(known_y’s, known_x’s, new_x’s, const): Tính toán sự tăng trưởng dự kiến theo hàm mũ.
$\text{GROWTH}(\text{y_biết}, \text{x_biết}, \text{x_mới}, \text{hằng_số})$
INTERCEPT(known_y’s, known_x’s): Tìm điểm giao nhau của đường hồi quy tuyến tính với trục y.
$\text{INTERCEPT}(\text{y_biết}, \text{x_biết})$
LINEST(known_y’s, known_x’s, const, stats): Tính toán các tham số thống kê cho một đường hồi quy tuyến tính bằng phương pháp bình phương tối thiểu. Hàm này thường được sử dụng dưới dạng công thức mảng.
$\text{LINEST}(\text{y_biết}, \text{x_biết}, \text{hằng_số}, \text{thống_kê})$
LOGEST(known_y’s, known_x’s, const, stats): Tính toán các tham số cho một đường cong hàm mũ phù hợp với dữ liệu. Hàm này thường được sử dụng dưới dạng công thức mảng.
$\text{LOGEST}(\text{y_biết}, \text{x_biết}, \text{hằng_số}, \text{thống_kê})$
PEARSON (array1, array2): Tính hệ số tương quan momen tích Pearson (r).
$\text{PEARSON}(\text{mảng1}, \text{mảng2})$
RSQ (known_y’s, known_x’s): Tính bình phương hệ số tương quan momen tích Pearson (R-squared).
$\text{RSQ}(\text{y_biết}, \text{x_biết})$
SLOPE (known_y’s, known_x’s): Tính hệ số góc của đường hồi quy tuyến tính.
$\text{SLOPE}(\text{y_biết}, \text{x_biết})$
STEYX (known_y’s, known_x’s): Trả về sai số chuẩn của giá trị y dự đoán đối với mỗi giá trị x trong hồi quy.
$\text{STEYX}(\text{y_biết}, \text{x_biết})$
TREND(known_y’s, known_x’s, new_x’s, const): Trả về các giá trị theo xu thế tuyến tính.
$\text{TRend}(\text{y_biết}, \text{x_biết}, \text{x_mới}, \text{hằng_số})$

Hướng Dẫn Giải Chi Tiết

Để áp dụng các hàm này trong việc giải toán bằng excel, bạn cần xác định rõ loại bài toán và dữ liệu bạn đang có.

Đối với bài toán thống kê mô tả:
- Nếu cần tính trung bình, hãy dùng AVERAGE.
- Để đo lường sự phân tán, STDEV (cho mẫu) hoặc STDEVP (cho tổng thể) là lựa chọn phù hợp. VAR và VARP cho phương sai.
- Để tìm giá trị lớn nhất/nhỏ nhất, sử dụng MAX và MIN.
- Để đếm số lượng phần tử thỏa mãn điều kiện, COUNTIF hoặc COUNTIFS là công cụ đắc lực.
Đối với bài toán xác suất:
- Xác định loại phân phối (nhị thức, chuẩn, Poisson, v.v.).
- Sử dụng các hàm tương ứng như BINOMDIST, NORMDIST, POISSON để tính xác suất tích lũy hoặc xác suất tại một điểm.
- Các hàm ...INV (ví dụ: NORMINV, CHIINV) giúp tìm giá trị dựa trên xác suất cho trước, hữu ích trong việc xác định ngưỡng hoặc giá trị tới hạn.
Đối với bài toán tương quan và hồi quy:
- Để xem hai biến có mối quan hệ tuyến tính hay không, dùng CORREL để tính hệ số tương quan.
- Nếu muốn dự đoán một giá trị dựa trên mối quan hệ tuyến tính, FORECAST là hàm bạn cần.
- SLOPE và INTERCEPT giúp xác định phương trình đường hồi quy tuyến tính y = mx + b.
- RSQ cho biết mức độ phù hợp của mô hình hồi quy với dữ liệu.

Mẹo kiểm tra:
Luôn kiểm tra lại các tham số đầu vào của hàm. Đảm bảo phạm vi dữ liệu (range, array) chính xác và các điều kiện (criteria) được thiết lập đúng. Đối với các hàm công thức mảng như FREQUENCY hay LINEST, hãy chắc chắn bạn đã nhập chúng đúng cách.

Lỗi hay gặp:

Sử dụng nhầm hàm cho mẫu và tổng thể (ví dụ: STDEV thay vì STDEVP).
Nhập sai định dạng dữ liệu hoặc tham số.
Quên bọc các công thức toán học trong hoặc sử dụng sai cú pháp KaTeX.
Áp dụng sai hàm cho loại phân phối hoặc bài toán cụ thể.

Đáp Án/Kết Quả

Việc áp dụng thành thạo các hàm thống kê, xác suất và hồi quy trong Excel sẽ mang lại kết quả chính xác và nhanh chóng cho các bài toán từ cơ bản đến nâng cao. Bạn có thể dễ dàng tính toán các đại lượng thống kê, ước lượng xác suất, kiểm định giả thuyết và xây dựng mô hình dự báo, từ đó nâng cao hiệu quả học tập và làm việc.

Conclusion

Tóm lại, Microsoft Excel là một công cụ vô cùng mạnh mẽ cho việc giải toán bằng excel, đặc biệt là trong các lĩnh vực thống kê, xác suất và phân tích dữ liệu. Bằng cách làm chủ các hàm được liệt kê trong bài viết này, từ các hàm thống kê cơ bản như AVERAGE, STDEV đến các hàm phức tạp hơn về phân phối xác suất và hồi quy như NORMDIST, FORECAST, bạn sẽ có khả năng phân tích dữ liệu một cách chuyên sâu, đưa ra các quyết định dựa trên bằng chứng và giải quyết hiệu quả các bài toán học thuật cũng như thực tế.

Ngày chỉnh sửa nội dung mới nhất January 15, 2026 by Thầy Đông

Thầy Đông

Thầy Đông – Giảng viên Đại học Công nghiệp Hà Nội, giáo viên luyện thi THPT
Thầy Đông bắt đầu sự nghiệp tại một trường THPT ở quê nhà, sau đó trúng tuyển giảng viên Đại học Công nghiệp Hà Nội nhờ chuyên môn vững và kinh nghiệm giảng dạy thực tế. Với nhiều năm đồng hành cùng học sinh, thầy được biết đến bởi phong cách giảng dạy rõ ràng, dễ hiểu và gần gũi. Hiện thầy giảng dạy tại dehocsinhgioi, tiếp tục truyền cảm hứng học tập cho học sinh cấp 3 thông qua các bài giảng súc tích, thực tiễn và giàu nhiệt huyết.