1.1. Số gần đúng – Sai số
a) Số gần đúng
Trong đo đạc và tính toán, ta thường chỉ nhận được các số gần đúng.
Ví dụ:
a) Người ta thường lấy \(\pi \) xấp xỉ 3,14. Khi đó 3,14 là một số gần đúng của số đúng \(\pi \)
b) Cho số \(\overline a = 2,17369266494051…\), thì số \(a = 2,1737\) là một số gần đúng của số đúng \(\overline a \)
b) Sai số của số gần đúng
*Sai số tuyệt đối
Nếu a là số gần đúng của số đúng \(\overline a \) thì \({\Delta _a} = \left| {\overline a – a} \right|\) được gọi là sai số tuyệt đối của số gần đúng a. |
---|
Chú ý: Sai số tuyệt đối của số gần đúng nhận được trong một phép đo đạc, tính toán càng bé thì kết quả của phép đo đạc, tính toán đó càng chính xác.
*Độ chính xác của một số gần đúng
Ta nói a là số gần đúng của số đúng \(\overline a \) với độ chính xác d nếu \({\Delta _a} = \left| {\overline a – a} \right| \le d\) và quy ước viết gọn là \(\overline a = a \pm d\) |
---|
Nhận xét: Nếu \({\Delta _a} \le d\) thì số đúng \(\overline a \) nằm trong đoạn \(\left[ {a – d;a + d} \right]\). Bởi vậy, d càng nhỏ thì ai lệch của số gần đúng a so với số đúng \(\overline a \) càng ít. Điều đó giải thích vì sao d được gọi là độ chính xác của số gần đúng.
*Sai số tương đối
Tỉ số \({\delta _a} = \frac{{{\Delta _a}}}{{\left| a \right|}}\) được gọi là sai số tương đối của số gần đúng a. |
---|
Nhận xét
+ Nếu \(\overline a = a \pm d\) thì \({\Delta _a} \le d\). Do đó \({\delta _a} \le \frac{{{\Delta _a}}}{{\left| a \right|}}\). Vì vậy, nếu \(\frac{d}{{\left| a \right|}}\) càng bé thì chất lượng của phép đo đạc hay tính toán càng cao.
+ Người ta thường viết sai số tương đối dưới dạng phân trăm. Chẳng hạn, trong phép đo thời gian Trái Đất quay một vòng xung quanh Mặt Trời thì sai số tương đối không vượt quá \(\frac{{\frac{1}{4}}}{{365}} = \frac{1}{{1460}} \approx 0,068\% \).
c) Số quy tròn, quy tròn số gần đúng
Khi quy tròn một số nguyên hoặc một số thập phân đến một hàng nào đó thì số nhận được gọi là số quy tròn của số ban đầu. |
---|
Nhận xét: Khi thay số đúng bởi số quy tròn đến một hàng nào đó thì sai số tuyệt đối của số quy tròn không vượt quá nửa đơn vị của hàng quy tròn. Như vậy, độ chính xác của số quy tròn bằng nửa đơn vị của hàng quy tròn.
Từ nhận xét trên ta có thể viết số quy tròn của số gần đúng căn cứ vào độ chính xác cho trước.
1.2. Các số đặc trưng đo xu thế trung tâm cho mẫu số liệu không ghép nhóm
a) Số trung bình cộng (số trung bình)
* Định nghĩa
Số trung bình cộng của một mẫu n số liệu thống kê bằng tổng của các số liệu chia cho số các số liệu đó. Số trung bình cộng của mẫu số liệu \({x_1},{x_2},…,{x_n}\) bằng \(\bar x = \frac{{{x_1} + {x_2} + … + {x_n}}}{n}\). |
---|
* Ý nghĩa
Trong thực tiễn, để tìm hiểu một đối tượng thống kê ta đưa ra tiêu chí thống kê và tiến hành thu thập nhiễu lần số liệu thống kê theo tiêu chí đó, tạo thành mẫu số liệu. Căn cứ vào mẫu số liệu đó, ta rút ra những kết luận có ích về đối tượng thống kê. Để kết luận rút ra phản ánh đúng đắn bản chất của đối tượng, ta cần nhận biết được hình thái và xu thế thay đổi của mẫu số liệu. Với cách nhìn nhận như thế, số trung bình cộng của mẫu số liệu có ý nghĩa sau:
Khi các số liệu trong mẫu ít sai lệch với số trung bình cộng, ta có thể giải quyết được vấn đề trên bằng cách lấy số trung bình cộng làm đại diện cho mẫu số liệu.
Chẳng hạn, để dự báo lượng mưa trong tháng 8 tại Hà Nội người ta tiến hành đo lượng mưa của từng ngày trong tháng 8 tại Hà Nội, ta được mẫu số liệu gồm 31 số liệu. Số trung bình cộng của mẫu số liệu đó được xem như lượng mưa trung bình tháng 8 của Hà Nội. Thống kê lượng mưa trung bình tháng 8 của Hà Nội trong nhiều năm liên tiếp sẽ cho ta những dự báo (ngày càng chính xác hơn) lượng mưa trung bình tháng 8 của Hà Nội trong những năm sắp tới.
b) Trung vị
*Định nghĩa
Sắp thứ tự mẫu số liệu gồm n số liệu thành một dãy không giảm (hoặc không tăng). + Nếu n là lẻ thì số liệu đứng ở vị trí thứ \(\frac{{n + 1}}{2}\) (số đứng chính giữa) gọi là trung Vị. + Nếu n là chẵn thì số trung bình cộng của hai số liệu đứng ở vị trí thứ \(\frac{n}{2}\) và \(\frac{n}{2} + 1\) gọi là trung vị. Trung vị kí hiệu là \({M_e}\). |
---|
*Ý nghĩa
Nếu những số liệu trong có sự chênh lệch lớn thì ta nên chọn thêm trung vị làm diện cho mẫu số liệu đó nhằm điều chỉnh một số hạn chế khi sử dụng số trung bình cộng. Những kết luận về đối tượng thống kê rút ra khi đó sẽ tin cậy hơn.
c) Tứ phân vị
*Định nghĩa
Sắp thứ tự mẫu số liệu gồm é số liệu thành một dãy không giảm. Tứ phân vị của mẫu số liệu trên là bộ ba giá trị: tứ phân vị thứ nhất, tứ phân vị thứ hai và tứ phân vị thứ ba; ba giá trị này chia mẫu số liệu thành bốn phần có số lượng phản tử bằng nhau. + Tứ phân vị thứ hai \({Q_2}\) bằng trung vị. + Nếu X là số chẵn thì tứ phân vị thứ nhất \({Q_1}\) bằng trung vị của nửa dãy phía dưới và tứ phân vị thứ ba \({Q_3}\) bằng trung vị của nửa dãy phía trên. + Nếu X là số lẻ thì tứ phân vị thứ nhất \({Q_1}\) bằng trung vị của nửa dãy phía dưới (không bao gồm \({Q_2}\)) và tứ phân vị thứ ba \({Q_3}\) bằng trung vị của nửa dãy phía trên (không bao gồm \({Q_2}\)). |
---|
*Ý nghĩa
+ Trong thực tiễn, có những mẫu số liệu mà nhiễu số liệu trong mẫu đó vẫn còn sự chênh lệch lớn so với trung vị. Ta nên chọn thêm những số khác cùng làm đại diện cho mẫu đó. Bằng cách lấy thêm trung vị của từng dãy số liệu tách ra bởi trung vị của mẫu nói trên, ta nhận được tứ phân vị đại diện cho mẫu số liệu đó.
+ Bộ ba giá trị \({Q_1},{Q_2},{Q_3}\) trong tứ phân vị phản ánh độ phân tán của mẫu số liệu. Nhưng mỗi giá trị \({Q_1},{Q_2},{Q_3}\) lại đo xu thế trung tâm của phần số liệu tương ứng của mẫu đó.
d) Mốt
*Định nghĩa
Mốt của mẫu số liệu là giá trị có tần số lớn nhất trong bảng phân bố tân số và kí hiệu là \({M_0}\). |
---|
Chú ý: Một mẫu số liệu có thể có một hoặc nhiều mốt.
*Ý nghĩa
Mốt của một mẫu số liệu đặc trưng cho số lần lặp đi lặp lại nhiều nhất tại một vị trí của mẫu số liệu đó. Dựa vào mốt, ta có thể đưa ra những kết luận (có ích) về đối tượng thống kê.
1.3. Các số đặc trưng đo mức độ phân tán cho mẫu số liệu không ghép nhóm
a) Khoảng biến thiên, khoảng tứ phân vị
*Định nghĩa
+ Trong một mẫu số liệu, khoảng biến thiên là hiệu số giữa giá trị lớn nhất và giá trị nhỏ nhất của mẫu số liệu đó. Ta có thể tính khoảng biến thiên R của mẫu số liệu theo công thức sau: \(R = {x_{{\rm{max}}}} – {x_{\min }}\) trong đó \({x_{{\rm{max}}}}\) là giá trị lớn nhất, \({x_{\min }}\) là giá trị nhỏ nhất của mẫu số liệu đó. + Giả sử \({Q_1},{Q_2},{Q_3}\) là tứ phân vị của mẫu số liệu. Ta gọi hiệu \({\Delta _Q} = {Q_3} – {Q_1}\) là khoảng tứ phân vị, của mẫu số liệu đó. |
---|
*Ý nghĩa
+ Ý nghĩa của khoảng biến thiên: Khoảng biến thiên của mẫu số liệu phản ánh sự “đao động”, “sự dàn trải” của các số liệu trong mẫu đó. Khoảng biến thiên được sử dụng trong nhiều tình huống thực tiễn, chẳng hạn: tìm ra sự phân tán điểm kiểm tra của một lớp học hay xác định phạm vi giá cả của một dịch vụ …
+ Theo cách nhìn như ở trong vật lí, ở đó biên độ dao động phản ánh khoảng cách từ điểm cân bằng đến điểm xa nhất của dao động, nếu coi số trung bình cộng là “điểm cân bằng” của mẫu số liệu thì khoảng biến thiên của mẫu số liệu có thể xem như hai lần biên độ đao động của các số trong mẫu đó quanh điểm cân bằng.
+ Trong các đại lượng đo mức độ phân tán của mẫu số liệu, khoảng biến thiên là đại lượng dễ hiểu, dễ tính toán và tương đối tốt đối với các mẫu số liệu nhỏ. Tuy nhiên, do khoảng biến thiên chỉ sử dụng hai giá trị \({x_{{\rm{max}}}}\) và \({x_{\min }}\) của mẫu số liệu nên đại lượng đó chưa diễn giải đầy đủ sự phân tán của các số liệu trong mẫu. Ngoài ra, giá trị của khoảng biến thiên sẽ bị ảnh hưởng bởi các giá trị bất thường của mẫu số liệu đó. Trong những trường hợp như vậy, khoảng biến thiên của mẫu số liệu không phản ánh chính xác độ dàn trải của mẫu số liệu.
+ Ý nghĩa của khoảng tứ phân vị: Khoảng tứ phân vị là một đại lượng cho biết mức độ phân tán của nửa giữa mẫu số liệu và có thể giúp xác định các giá trị bất thường của mẫu số liệu đó. Khoảng tứ phân vị thường được sử dụng thay cho khoảng biến thiên vì nó loại trừ hầu hết giá trị bất thường của mẫu số liệu.
b) Phương sai
*Định nghĩa
Cho mẫu số liệu thống kê có n giá trị \({x_1},{x_2},….,{x_n}\) và số trung bình cộng là \(\overline x \). Ta gọi số \({s^2} = \frac{{{{\left( {{x_1} – \overline x } \right)}^2} + {{\left( {{x_2} – \overline x } \right)}^2} + … + {{\left( {{x_n} – \overline x } \right)}^2}}}{n}\) là phương sai của mẫu số liệu trên. |
---|
*Ý nghĩa
Phương sai là số đặc trưng đo mức độ phân tán của mẫu số liệu.
c) Độ lệch chuẩn
*Định nghĩa
Căn bậc hai của phương sai gọi là độ lệch chuẩn của mẫu số liệu thống kê. |
---|
Nhận xét: Vì đơn vị đo của phương sai là bình phương đơn vị đo của số liệu thống kê, trong khi độ lệch chuẩn lại có cùng đơn vị đo với số liệu thống kê, nên khi càn chú ý đến đơn vị đo thì ta sử dụng độ lệch chuẩn.
*Ý nghĩa
Cũng như phương sai, khi hai mẫu số liệu thống kê có cùng đơn vị đo và có số trung bình cộng bằng nhau (hoặc xấp xỉ nhau), mẫu số liệu nào có độ lệch chuẩn nhỏ hơn thì mức độ phân tán (so với số trung bình cộng) của các số liệu trong mẫu đó sẽ thấp hơn. Độ lệch chuẩn là số đặc trưng đo mức độ phân tán của mẫu số liệu thống kê có cùng đơn vị đo.
d) Tính hợp lí của số liệu thống kê
Ta có thể sử dụng các số đặc trưng đo mức độ phân tán cho mẫu số liệu không ghép nhóm để chỉ ra được những số liệu bất thường của mẫu số liệu đó. Ta thường sử dụng khoảng tứ phân vị để xác định số liệu bất thường của mẫu số liệu. Cụ thể như sau:
Giả sử \({Q_1},{Q_2},{Q_3}\) là tứ phân vị của mẫu số liệu và hiệu \({\Delta _Q} = {Q_3} – {Q_1}\) là khoảng tứ phân vị của mẫu số liệu đó. Một giá trị trong mẫu số liệu được coi là một giá trị bất thường, nếu nó nhỏ hơn \({Q_1} – \frac{3}{2}{\Delta _Q}\) hoặc lớn hơn \({Q_3} + \frac{3}{2}{\Delta _Q}\). Như vậy, khoảng tứ phân vị cho ta cách nhận ra giá trị bất thường của mẫu số liệu.
1.4. Xác suất của biến cố trong một số trò chơi đơn giản
a) Xác suất của biến cố trong trò chơi tung đồng xu
Xác suất của biến cố A, kí hiệu P(A), là tỉ số giữa số các kết quả thuận lợi cho biến cố A và số phần tử của không gian mẫu \(\Omega \):
\(P\left( A \right) = \frac{{n\left( A \right)}}{{n\left( \Omega \right)}}\).
ở đó n(A), n(\(\Omega \)) lần lượt là số phần tử của hai tập hợp A và \(\Omega \).
b) Xác suất của biến cố trong trò chơi gieo xúc xắc
Xác suất của biến cố C, kí hiệu P(C), là tỉ số giữa số các kết quả thuận lợi cho biến cố C và số phân tử của không gian mẫu \(\Omega \):
\(P\left( C \right) = \frac{{n\left( C \right)}}{{n\left( \Omega \right)}}\).
ở đó n(C), n(\(\Omega \)) lần lượt là số phần tử của hai tập hợp C và \(\Omega \).
1.5. Xác suất của biến cố
a) Một số khái niệm về xác suất
*Phép thử ngẫu nghiên và không gian mẫu
+ Có những phép thử mà ta không thể đoán trước được kết quả của nó, mặc dù đã biết tập hợp tất cả các kết quả có thể có của phép thử đó. Những phép thử như thế gọi là phép thử ngẫu nhiên (gọi tắt là phép thử). + Tập hợp \(\Omega \) các kết quả có thể xảy ra của một phép thử gọi là không gian mẫu của phép thử đó. |
---|
Ví dụ: Một hộp có 3 chiếc thẻ cùng loại, mỗi thẻ được ghỉ một trong các số 1, 2, 3; hai thẻ khác nhau thì ghi hai số khác nhau. Rút ngẫu nhiên một chiếc thẻ từ trong hộp, ghi lại số của thẻ được rút ra và bỏ lại thẻ đó vào hộp. Xét phép thử “Rút ngẫu nhiên liên tiếp hai chiếc thẻ trong hộp”. Hãy cho biết không gian mẫu của phép thử đó.
Giải
Không gian mẫu của phép thử trên là tập hợp \(\Omega \) = {(1; 1); (1; 2); (1; 3); (2; 1); (2; 2); (2; 3); (3; 1); (3; 2); (3; 3)}. ở đó, chẳng hạn (1 ; 2) là kết quả “Lần thứ nhất rút ra thẻ ghi số 1, lần thứ hai rút ra thẻ ghi số 2”.
*Biến cố
Biếu cố ngẫu nhiên (gọi tắt là biến cố) là một tập con của không gian mẫu. |
---|
Chú ý: Vì sự kiện chỉ ra tính chất đặc trưng cho các phần tử của một biến cố nên ta cũng, gọi sự kiện là biến cố. Chẳng hạn: Sự kiện “Kết quả của hai lần tung là giống nhau” trong phép thử “Tung một đồng xu hai lần liên tiếp” là một biến cố.
*Biến cố không. Biến cố chắc chắn
Xét phép thử T với không đìan mẫu \(\Omega \). Mỗi biến cố là một tấp coh của tập hợp \(\Omega \). Vì thể, tập rỗng \(\emptyset \) cũng là một biến cố, gọi là biến cố không thể (gọi tắt là biến cố không). Còn tập hợp \(\Omega \) gọi là biến cố chắc chắn.
Chẳng hạn, khi gieo một xúc xắc, biến cố “Mặt xuất hiện có 7 chấm” là biến cố không, còn biến cố “Mặt xuất hiện có số chấm không vượt quá 6” là biến cố chắc chắn.
*Biến cố đối
Xét phép thử T với không gian mẫu là \(\Omega \). Giả sử A là một biến cố. Như vậy, A là tập con của tập hợp \(\Omega \). Ta xét tập con \(\Omega \)\A là phản bù của A trong \(\Omega \).
Tập con \(\Omega \)\A xác định một biến có, gọi là biến cố đối của biến cố A, kí hiệu là \(\overline A \). |
---|
Chẳng hạn, khi gieo ngẫu nhiên một xúc xắc một lần, biến cố “Mặt xuất của xúc xắc có số chấm là số là” là biến cế đối củn hiến cố “Mặtt xuất hiện của xúc xắc có số xắc có số chấm là số lẻ” là biến cố đối của biến cố “Mặt xuất hiện của xúc xắc có số chấm là số chẵn”.
Chú ý: Nếu biến cố A được mô tả dưới dạng mệnh để toán học \(Q\) thì biến cố đối \(A\) được mô tả bằng mệnh đề phủ định của mệnh đề \(Q\) (tức là mệnh đề \(\overline Q \)).
*Xác suất của biến cố
Xác suất của biến cố A, kí hiệu là P(A), bằng tỉ số \(\frac{{n\left( A \right)}}{{n\left( \Omega \right)}}\), ở đó n(A), n(\(\Omega \)) lần lượt là số phần tử của hai tập hợp A và \(\Omega \). Như vậy: \(P\left( A \right) = \frac{{n\left( A \right)}}{{n\left( \Omega \right)}}\). |
---|
b) Tính chất của xác suất
+ \(P\left( \emptyset \right) = 0;P\left( \Omega \right) = 1;\)
+ \(0 \le P\left( A \right) \le 1\) với mỗi biến cố A;
+ \(P\left( {\overline A } \right) = 1 – P\left( A \right)\) với mỗi biến cố A.
c) Nguyên lí xác suất bé
Qua thực nghiệm và quan sát thực tế, người ta thấy rằng các biến cố có xác suất bé sẽ gần như không xảy ra trong phép thử. Chẳng hạn, mỗi chuyến bay đều có một xác suất rất bé bị xảy ra tai nạn. Nhưng trên thực tế, tai nạn của một chuyến bay sẽ không xảy ra. Từ đó, ta thừa nhận nguyên lí sau đây, gọi là nguyên lí xác suất bé: Nếu một biến cố ngẫu nhiên có xác suất rất bé thì thực tế có thể cho rằng trong một phép thử biến cố đó sẽ không xảy ra.
Tuy nhiên, một xác suất như thế nào được xem là bé phải tuỳ thuộc vào từng bài toán cụ thể. Ví dụ như xác suất để dù không mở là 0,01 (dùng cho nhảy dù) thì cũng không thể coi là bé và không thể dùng loại đù đó. Nhưng nếu xác suất để tàu về ga chậm là 0,01 thì lại có thẻ xem là tàu về ga đúng giờ.