Các phương pháp trình bày dữ liệu thống kê. Biểu diễn đồ họa của dữ liệu thống kê


Giá trị của phương pháp đồ thị trong việc phân tích và tổng quát hóa dữ liệu là rất lớn. Trước hết, hình ảnh đồ họa cho phép kiểm soát độ tin cậy của các chỉ số thống kê, vì khi được trình bày trên biểu đồ, chúng cho thấy rõ hơn những điểm không chính xác hiện có liên quan đến sự hiện diện của lỗi quan sát hoặc bản chất của hiện tượng đang nghiên cứu. Với sự trợ giúp của hình ảnh đồ họa, có thể nghiên cứu các mô hình phát triển của một hiện tượng, để thiết lập các mối quan hệ hiện có. Việc so sánh dữ liệu đơn giản không phải lúc nào cũng có thể nắm bắt được sự hiện diện của các mối quan hệ nhân quả, đồng thời, biểu diễn đồ họa của chúng giúp xác định các mối quan hệ nhân quả, đặc biệt là trong trường hợp thiết lập các giả thuyết ban đầu, sau đó có thể phát triển thêm.

Biểu đồ thống kê- đây là một bản vẽ trong đó các tập hợp thống kê được đặc trưng bởi các chỉ số nhất định được mô tả bằng các hình ảnh hoặc dấu hiệu hình học có điều kiện. hình ảnh đồ họa là tập hợp các điểm, đường và hình thể hiện dữ liệu thống kê. các yếu tố phụ trợđồ họa là:

    Trường đồ thị là một phần của mặt phẳng chứa các hình ảnh đồ họa. Trường biểu đồ có các kích thước nhất định, phụ thuộc vào mục đích của nó.

    Các mốc không gian của đồ thị được thiết lập dưới dạng hệ thống các lưới tọa độ. Hệ tọa độ là cần thiết để đặt các ký hiệu hình học trong trường đồ thị. Cả hai hệ tọa độ hình chữ nhật và cực đều được sử dụng.

    Các mốc tỷ lệ được sử dụng để so sánh hiển thị đồ họa của đối tượng và kích thước thực tế của nó. Các mốc tỷ lệ được thiết lập bằng hệ thống thước tỷ lệ hoặc ký hiệu tỷ lệ.

    Giải thích biểu đồ bao gồm giải thích đối tượng được biểu thị bằng biểu đồ (tên) và ý nghĩa ngữ nghĩa của từng dấu hiệu được sử dụng trên biểu đồ.

Biểu đồ thống kê được phân loại theo mục đích (nội dung), phương pháp xây dựng và bản chất của hình ảnh đồ họa (Hình 1).

Hình.1. Phân loại biểu đồ thống kê

Theo phương pháp xây dựng hình ảnh đồ họa, có:

    sơ đồ- biểu diễn đồ họa của dữ liệu thống kê, thể hiện rõ ràng mối quan hệ giữa các giá trị được so sánh.

    bản đồ thống kê

Có các loại biểu đồ chính sau: đường, thanh, dải, khu vực, hình vuông, hình tròn, đường cong.

biểu đồ đườngđược sử dụng để mô tả động lực học, tức là đánh giá sự biến đổi của hiện tượng theo thời gian. Trục hoành hiển thị các khoảng thời gian hoặc ngày tháng và tọa độ hiển thị các mức của một loạt động lực. Một số biểu đồ có thể được đặt trên một biểu đồ, cho phép bạn so sánh động lực của các chỉ báo khác nhau hoặc một chỉ báo cho các khu vực hoặc quốc gia khác nhau.

Hình.2. Động lực nhập khẩu ô tô du lịch tại Liên bang Nga

cho 2006-1q. 2010

biểu đồ thanh có thể được sử dụng:

    phân tích động thái của các hiện tượng kinh tế - xã hội;

    đánh giá việc thực hiện quy hoạch;

    đặc điểm của sự biến đổi trong chuỗi phân phối;

    để so sánh không gian (so sánh giữa các vùng lãnh thổ, quốc gia, doanh nghiệp);

    để nghiên cứu cấu trúc của hiện tượng.

Các cột được đặt gần hoặc riêng biệt ở cùng một khoảng cách. Chiều cao của các cột phải tỷ lệ thuận với các giá trị số của các mức tính năng.

Hình 3. Động lực chia sẻ của Belarus trong kim ngạch thương mại của Liên bang Nga với các nước SNG

Để đặc trưng cho cấu trúc của các hiện tượng kinh tế - xã hội được sử dụng rộng rãi biểu đồ tròn. Để xây dựng nó, vòng tròn phải được chia thành các phần theo tỷ lệ trọng lượng riêng của các phần trong tổng thể tích. Tổng khối lượng riêng bằng 100%, tương ứng với tổng khối lượng của hiện tượng đang nghiên cứu.

Hình.4. Phân bố địa lý kim ngạch thương mại giữa Liên bang Nga và các nước CIS

biểu đồ thanh bao gồm các hình chữ nhật được sắp xếp theo chiều ngang (sọc).

Đôi khi để phân tích so sánh theo khu vực, các quốc gia sử dụng sơ đồ ký hiệu hình(sơ đồ các hình hình học). Các sơ đồ này phản ánh kích thước của đối tượng nghiên cứu phù hợp với kích thước khu vực của nó.

bản đồ thống kêđược sử dụng để đánh giá sự phân bố địa lý của các hiện tượng và phân tích so sánh theo lãnh thổ.

Bản đồ thống kê bao gồm bản đồ và bản đồ. Sự khác biệt giữa chúng nằm ở cách hiển thị số liệu thống kê trên bản đồ.

bản đồ cho thấy sự phân bố theo lãnh thổ của tính trạng đang được nghiên cứu trong các khu vực riêng biệt và được sử dụng để xác định các kiểu phân bố này. Bản đồ được chia thành nền và điểm. Các bản đồ nền có mật độ màu khác nhau đặc trưng cho cường độ của bất kỳ chỉ số nào trong một đơn vị lãnh thổ. Trên bản đồ chấm, mức độ của hiện tượng đã chọn được mô tả bằng các dấu chấm.

bản đồ- đây là sự kết hợp của bản đồ địa lý hoặc sơ đồ của nó với sơ đồ. Nó cho phép bạn phản ánh các chi tiết cụ thể của từng khu vực trong sự phân bố của hiện tượng đang nghiên cứu, các đặc điểm cấu trúc của nó.

Hiện tại, nhiều gói phần mềm đồ họa máy tính đã được phát triển, chẳng hạn như Excel, Statgraf, Statistica.

Dữ liệu thống kê nên được trình bày theo cách mà chúng có thể được sử dụng. Có 3 hình thức trình bày dữ liệu thống kê chính:

1) văn bản - bao gồm dữ liệu trong văn bản;

2) dạng bảng - trình bày dữ liệu dưới dạng bảng;

3) đồ họa - biểu thức của dữ liệu dưới dạng biểu đồ.

Dạng văn bản được sử dụng khi có một lượng nhỏ dữ liệu số.

Dạng bảng được sử dụng thường xuyên nhất, vì đây là dạng trình bày dữ liệu thống kê hiệu quả hơn. Không giống như các bảng toán học, theo các điều kiện ban đầu, cho phép thu được kết quả này hoặc kết quả khác, các bảng thống kê cho biết ngôn ngữ của các con số về các đối tượng đang nghiên cứu.

bảng thống kê- Đây là một hệ thống các hàng và cột, trong đó các thông tin thống kê về các hiện tượng kinh tế - xã hội được trình bày theo một trình tự và mối liên hệ nhất định.

Bảng 2. Ngoại thương của Liên bang Nga 2000 - 2006, tỷ đô la

Mục lục 2000 2001 2002 2003 2004 2005 2006
kim ngạch ngoại thương 149,9 155,6 168,3 280,6 368,9 468,4
Xuất khẩu 101,9 107,3 135,9 183,2 243,6 304,5
Nhập khẩu 44,9 53,8 76,1 97,4 125,3 163,9
cán cân thương mại 60,1 48,1 46,3 59,9 85,8 118,3 140,7
kể cả:
với nước ngoài
xuất khẩu 90,8 86,6 90,9 114,6 210,1 261,1
nhập khẩu 31,4 40,7 48,8 77,5 103,5 138,6
cán cân thương mại 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Ví dụ, trong bảng. 2 trình bày thông tin về ngoại thương của Nga, sẽ không hiệu quả để thể hiện ở dạng văn bản.

Phân biệt môn họcThuộc tính bảng thống kê. Chủ đề chỉ ra đối tượng được đặc trưng - đơn vị dân số, hoặc nhóm đơn vị hoặc toàn bộ tổng thể. Trong vị ngữ, đặc điểm của chủ đề được đưa ra, thường ở dạng số. Bắt buộc tiêu đề bảng, cho biết dữ liệu trong bảng thuộc về danh mục nào và thời gian nào.

Theo tính chất của đối tượng, bảng thống kê được chia thành đơn giản, nhómtổ hợp. Trong chủ đề của một bảng đơn giản, đối tượng nghiên cứu không được chia thành các nhóm, nhưng một danh sách tất cả các đơn vị dân số được đưa ra hoặc toàn bộ dân số được chỉ định (ví dụ: Bảng 11). Trong chủ đề của bảng nhóm, đối tượng nghiên cứu được chia thành các nhóm theo một thuộc tính và vị ngữ cho biết số lượng đơn vị trong các nhóm (tuyệt đối hoặc theo tỷ lệ phần trăm) và các chỉ số tóm tắt cho các nhóm (ví dụ: Bảng 4). Trong chủ đề của bảng kết hợp, dân số được chia thành các nhóm không phải theo một mà theo một số tiêu chí (ví dụ: Bảng 2).

Khi xây dựng các bảng, bạn phải được hướng dẫn bởi những điều sau đây quy tắc chung.

1. Chủ đề của bảng nằm ở phần bên trái (ít thường xuyên hơn - phía trên) và vị ngữ - ở bên phải (ít thường xuyên hơn - thấp hơn).

2. Tiêu đề cột ghi tên chỉ tiêu và đơn vị tính.

3. Dòng cuối cùng hoàn thành bảng và nằm ở cuối bảng, nhưng đôi khi nó là dòng đầu tiên: trong trường hợp này, dòng thứ hai được viết là “bao gồm”, và các dòng tiếp theo chứa các thành phần của dòng tổng.

4. Dữ liệu số được ghi với độ chính xác như nhau trong mỗi cột, chữ số của số nằm dưới chữ số, phần nguyên cách nhau bằng dấu phẩy phân số.

5. Không được có các ô trống trong bảng: nếu dữ liệu bằng 0 thì đặt dấu “–” (dấu gạch ngang); nếu không biết dữ liệu thì ghi “không có thông tin” hoặc ghi dấu “…” (dấu chấm lửng). Nếu giá trị số mũ không bằng 0, nhưng chữ số có nghĩa đầu tiên xuất hiện sau mức độ chính xác được chấp nhận, thì 0,0 được ghi lại (ví dụ: nếu mức độ chính xác 0,1 được chấp nhận).

Đôi khi các bảng thống kê được bổ sung bằng các biểu đồ khi mục tiêu là nhấn mạnh một số tính năng của dữ liệu, để so sánh chúng. Hình thức đồ họa là hình thức trình bày dữ liệu hiệu quả nhất về mặt nhận thức của họ. Với sự trợ giúp của các biểu đồ, khả năng hiển thị các đặc điểm của cấu trúc, động lực học, mối quan hệ của các hiện tượng và sự so sánh của chúng đã đạt được.

đồ thị thống kê- đây là những hình ảnh có điều kiện về các giá trị số và tỷ lệ của chúng thông qua các đường kẻ, hình dạng hình học, hình vẽ hoặc biểu đồ địa lý. Dạng đồ họa tạo điều kiện thuận lợi cho việc xem xét dữ liệu thống kê, làm cho chúng trực quan, biểu cảm và có thể nhìn thấy được. Tuy nhiên, biểu đồ có những hạn chế nhất định: trước hết, một biểu đồ không thể bao gồm nhiều dữ liệu như nó có thể chứa trong một bảng; Ngoài ra, biểu đồ luôn hiển thị dữ liệu được làm tròn - không chính xác, nhưng gần đúng. Như vậy, biểu đồ chỉ dùng để thể hiện tình hình chung chứ không thể hiện chi tiết. Hạn chế cuối cùng là sự phức tạp của âm mưu. Nó có thể được khắc phục bằng máy tính cá nhân (ví dụ: "Trình hướng dẫn sơ đồ" từ gói Microsoft OfficeExcel).

Theo phương pháp xây dựng đồ họa, chúng được chia thành sơ đồ, bản đồsơ đồ biểu đồ.

Cách phổ biến nhất để biểu diễn dữ liệu bằng đồ họa là các biểu đồ, thuộc các loại sau: tuyến tính, xuyên tâm, tán xạ, phẳng, thể tích, xoăn. Loại sơ đồ phụ thuộc vào loại dữ liệu được trình bày và nhiệm vụ xây dựng. Trong mọi trường hợp, biểu đồ phải có tiêu đề đi kèm - bên trên hoặc bên dưới trường biểu đồ. Tiêu đề cho biết chỉ báo nào được hiển thị, cho lãnh thổ nào và trong thời gian nào.

Biểu đồ đường được sử dụng để biểu diễn các biến định lượng: đặc điểm của sự thay đổi giá trị của chúng, động lực học, mối quan hệ giữa các biến. Biến thể dữ liệu được phân tích bằng cách sử dụng khu vực phân phối, tích lũy(nhỏ hơn đường cong) và xin lỗi(đường cong "lớn hơn"). Đa giác phân phối được thảo luận trong Chủ đề 4 (ví dụ: Hình 5.). Để xây dựng một tích lũy, các giá trị của tính năng biến được vẽ dọc theo trục hoành và tọa độ là tổng tần số hoặc tần số tích lũy (từ f1đến ∑ f). Để xây dựng một ogive, tổng số tần số tích lũy được đặt trên trục y theo thứ tự ngược lại (từ ∑ f trước f1). Tích lũy và ogive theo Bảng. 4. mô tả trong hình. 1.

Cơm. 1. Cộng trừ phân bổ hàng hóa theo trị giá hải quan

Việc sử dụng biểu đồ đường trong phân tích xu hướng được đề cập trong Chủ đề 5 (ví dụ: Hình 13) và việc sử dụng chúng để phân tích liên kết trong Chủ đề 6 (ví dụ: Hình 21). Chủ đề 6 cũng đề cập đến việc sử dụng biểu đồ phân tán (ví dụ: Hình 20).

Biểu đồ đường được chia nhỏ thành một chiều, được sử dụng để biểu diễn dữ liệu trên một biến duy nhất và hai chiều- cho hai biến. Ví dụ về biểu đồ đường một chiều là đa giác phân phối và biểu đồ hai chiều là đường hồi quy (ví dụ: Hình 21).

Đôi khi, với những thay đổi lớn trong chỉ báo, thang logarit được sử dụng. Ví dụ: nếu các giá trị của chỉ báo thay đổi từ 1 đến 1000, thì điều này có thể gây khó khăn khi vẽ đồ thị. Trong những trường hợp như vậy, chúng chuyển sang logarit của các giá trị chỉ báo, giá trị này sẽ không khác nhau nhiều: lg 1 = 0, lg 1000 = 3.

Ở giữa phẳng Biểu đồ thanh (biểu đồ) được phân biệt theo tần suất sử dụng, trong đó chỉ báo được trình bày dưới dạng thanh, chiều cao tương ứng với giá trị của chỉ báo (ví dụ: Hình 4).

Tỷ lệ diện tích của một hình hình học cụ thể với giá trị của chỉ báo làm cơ sở cho các loại sơ đồ phẳng khác: hình tam giác, Quảng trường, hình hộp chữ nhật. Bạn cũng có thể sử dụng phép so sánh diện tích của hình tròn - trong trường hợp này, bán kính của hình tròn được đặt.

biểu đồ dải trình bày các chỉ số ở dạng hình chữ nhật kéo dài theo chiều ngang và nếu không thì giống như biểu đồ thanh.

Trong số các sơ đồ phẳng, nó thường được sử dụng biểu đồ tròn, được sử dụng để minh họa cấu trúc của dân số được nghiên cứu. Toàn bộ tập hợp được lấy là 100%, nó tương ứng với tổng diện tích của hình tròn, diện tích của các cung tương ứng với các phần của tập hợp. Hãy xây dựng sơ đồ ngành về cơ cấu ngoại thương của Liên bang Nga năm 2006 theo Bảng. 2 (xem hình 2). Khi sử dụng các chương trình máy tính, các sơ đồ ngành được xây dựng ở dạng ba chiều, nghĩa là không phải ở hai mà ở ba mặt phẳng (xem Hình 3).

Cơm. 2. Biểu đồ tròn đơn giản 3. Biểu đồ tròn 3D

Biểu đồ xoăn (hình ảnh) nâng cao độ rõ nét của hình ảnh, vì chúng bao gồm hình ảnh của chỉ báo được hiển thị, kích thước tương ứng với kích thước của chỉ báo.

Khi vẽ biểu đồ, mọi thứ đều quan trọng như nhau - lựa chọn đúng hình ảnh đồ họa, tỷ lệ, tuân thủ các quy tắc thiết kế biểu đồ. Những vấn đề này được đề cập chi tiết hơn trong và.

Bản đồ và bản đồ được sử dụng để mô tả các đặc điểm địa lý của các hiện tượng đang được nghiên cứu. Chúng cho thấy vị trí của hiện tượng đang được nghiên cứu, cường độ của nó trong một lãnh thổ nhất định - trong một nước cộng hòa, khu vực, khu kinh tế hoặc hành chính, v.v. Việc xây dựng bản đồ và bản đồ được xem xét trong tài liệu đặc biệt, chẳng hạn.

1. Khái niệm thống kê

Thống kê là một trong những ngành kiến ​​thức lâu đời nhất phát sinh trên cơ sở hạch toán kinh tế. Sự xuất hiện của nó gắn liền với nhu cầu của xã hội về các loại thông tin.

Người ta tin rằng thuật ngữ thống kê xuất phát từ các từ tiếng Latinh stato (trạng thái) và trạng thái (vị trí, trạng thái).

Theo nghĩa rộng, thống kê được hiểu là một môn khoa học nghiên cứu các hiện tượng khối lượng và tính quy luật của chúng từ quan điểm định lượng.

Lý thuyết chung về thống kê là một khoa học về phương pháp luận, khoa học về phương pháp có thể áp dụng để xác định các mẫu trong bất kỳ lĩnh vực nào mà kết luận dựa trên quan sát hàng loạt, trong đó có sự thay đổi của một dấu hiệu trong các phần tử riêng lẻ của tổng thể, trong đó các mẫu chung chỉ có thể tự biểu hiện thông qua việc loại bỏ lẫn nhau tính ngẫu nhiên trong các đơn vị riêng lẻ. .

2. Thống kê như một khoa học

2.1 Các cách phát triển số liệu thống kê

Sự phát triển của thống kê như một khoa học đã đi theo hai hướng:

Hướng đầu tiên bắt nguồn từ Đức và được gọi là nghiên cứu nhà nước hoặc trường mô tả. Đại diện của trường này coi nhiệm vụ chính của họ là mô tả các điểm tham quan của tiểu bang mà không phân tích các mô hình và mối quan hệ giữa chúng. Người sáng lập trường phái miêu tả là nhà bác học người Đức Hermann Konring.

Hướng thứ hai trong sự phát triển của thống kê bắt nguồn từ Anh, và nó được gọi là số học chính trị. Các đại diện của trường này coi nhiệm vụ chính của họ là tiết lộ, trên cơ sở một số lượng lớn các quan sát, các quy luật và mối tương quan khác nhau của các hiện tượng được nghiên cứu. Người sáng lập trường là William Petty.

2.2 Môn thống kê và các khái niệm cơ bản

Nhà toán học người Bỉ Adolphe Ketie đã tóm tắt thông tin lý thuyết từ các nghiên cứu về nhà nước và công việc thực tế của các đại diện của trường phái số học chính trị. Ông cũng cho định nghĩa về chủ đề của thống kê - đây là những hiện tượng quần chúng gắn liền với đời sống của xã hội và con người.Ông cũng nhìn thấy trong số liệu thống kê một công cụ nhận thức xã hội.

Đặc điểm nổi bật của hiện tượng khối lượng:

1. Mỗi phần tử của tập hợp vừa có những nét riêng hoặc nét riêng, vừa có nét chung hoặc nét giống nhau.

2. Không thể có được đặc điểm của một trong các yếu tố của hiện tượng khối lượng trên cơ sở đặc điểm của các yếu tố khác.

Định nghĩa: Các hiện tượng khối lượng được thống kê nghiên cứu dưới dạng một tập hợp các đơn vị có chất lượng giống nhau nhưng có các đặc điểm riêng khác nhau được gọi là các tập hợp thống kê. Dựa trên điều này, chúng ta có thể nói rằng chủ đề của thống kê là các tập hợp thống kê khác nhau, nghiên cứu về chúng có liên quan đến đặc tính định lượng và xác định các mẫu vốn có của chúng. Tổng thể thống kê là một trong những khái niệm chính của khoa học thống kê. Nó cũng được liên kết với các khái niệm như: một đơn vị dân số. Định nghĩa: Các phần tử, tập hợp tạo thành tập hợp đang nghiên cứu, được gọi là đơn vị. Dấu hiệu của đơn vị quần thể:

Mỗi đơn vị dân số có thể được đặc trưng bởi các loại tính năng định tính và định lượng khác nhau.

Nếu một thuộc tính nhất định có các giá trị khác nhau đối với một số đơn vị dân số, thì điều này được gọi là biến thể. Định nghĩa: Một mẫu được xác định trên cơ sở quan sát hàng loạt, nghĩa là được biểu hiện trong một khối lượng lớn các hiện tượng thông qua việc khắc phục tính ngẫu nhiên cố hữu của từng yếu tố riêng lẻ của nó, được gọi là quy luật thống kê. Nhiệm vụ chính của thống kê là trừu tượng hóa cái ngẫu nhiên và xác định cái điển hình, thường xuyên.

Có ba cách để xác định các mẫu:

1. hợp lý;

2. theo kinh nghiệm;

3. dựa vào quy luật số lớn.


2.3 Phương pháp thống kê

Quan sát hàng loạt, phân nhóm và tóm tắt kết quả, tính toán và phân tích các chỉ số khái quát hóa. Tất cả điều này cùng nhau đưa ra phương pháp thống kê.

3. Quan sát thống kê

3.1 Quan sát thống kê với tư cách là một giai đoạn nghiên cứu thống kê. Kế hoạch quan sát thống kê

Quan sát thống kê là giai đoạn đầu tiên của nghiên cứu thống kê.

Định nghĩa: Quan sát thống kê là tập hợp các dữ liệu khối lượng lớn được tổ chức một cách khoa học về các quá trình, hiện tượng đang nghiên cứu, được thực hiện theo một chương trình đã thiết kế sẵn.

Yêu cầu dữ liệu hàng loạt:

Số liệu thống kê phải đầy đủ. Mỗi hiện tượng có một loạt các tính năng liên quan đến nhau. Tính đầy đủ của dữ liệu cung cấp phạm vi bảo hiểm của các tính năng quan trọng nhất cần thiết để có được kết luận khách quan. Nếu dữ liệu quan sát thống kê đề cập đến các khoảng thời gian, lãnh thổ khác nhau thì cần đảm bảo khả năng so sánh của chúng. Khả năng so sánh của thông tin thống kê có nghĩa là tính thống nhất của các đơn vị đo lường, ước tính chi phí, ranh giới của các lãnh thổ hành chính, đặc điểm thời gian, v.v. Trước khi bắt đầu quan sát thống kê, cần thiết lập quy trình thực hiện. Để làm điều này, một kế hoạch giám sát chi tiết được phát triển, bao gồm:

1. Phần chương trình và phương pháp:

2. phần tổ chức.

1. Vấn đề chương trình và phương pháp của kế hoạch quan sát.

Phần này của kế hoạch nên bao gồm:

a) mục đích và mục tiêu của quan sát:

b) đối tượng và đơn vị khảo sát;

c) chương trình giám sát.

Chương trình quan sát là một danh sách các câu hỏi dự kiến ​​sẽ được trả lời trong quá trình khảo sát. Chương trình nên được phân biệt bởi tính đầy đủ của thông tin và phạm vi bảo hiểm. Từ ngữ của các câu hỏi phải ngắn gọn và rõ ràng nhất có thể, loại trừ sự thiếu chính xác và mơ hồ trong câu trả lời, nếu cần thiết, một gợi ý được đưa ra để giải thích và hiểu câu hỏi một cách thống nhất. Phần phương pháp luận chương trình của quan sát chỉ ra các công cụ cụ thể của nghiên cứu thống kê, tức là. các biểu mẫu, trong đó phải có câu trả lời cho các câu hỏi đã đặt ra, cũng như hướng dẫn điền chúng.

2. Vấn đề tổ chức của kế hoạch quan sát.

Để tổ chức thành công việc quan sát và bao quát toàn bộ dân số, một kế hoạch tổ chức quan sát được phát triển.

Nó nói:

a) đối tượng quan sát:

b) thời gian và địa điểm nghiên cứu;

c) tổ chức thu thập dữ liệu và công nghệ xử lý dữ liệu.


3.2 Hình thức và loại hình quan sát thống kê

Hình thức, loại hình và phương pháp quan sát thống kê.

Hình thức tổ chức quan sát thống kê

Các loại quan sát thống kê

Phương pháp quan sát thống kê

vào thời điểm đăng ký sự thật

theo diện bao phủ đơn vị dân số

1. Báo cáo thống kê.

2. Tổ chức quan sát đặc biệt.

3. Đăng ký quan sát.

1. Hiện tại hoặc liên tục.

2. Không liên tục:

a) định kỳ;

b) một lần.

1. Rắn.

2. Không liên tục:

a) chọn lọc;

b) mảng chính;

c) chuyên khảo.


1. Ngay lập tức.

2. Phim tài liệu.

a) chuyển tiếp;

b) tự đăng ký;

c) phóng viên;

d) bảng câu hỏi;

e) người phục vụ.

Trong thống kê trong nước, ba hình thức tổ chức (loại) quan sát thống kê được sử dụng:

1. Báo cáo- đây là hình thức quan sát thống kê chính, với sự trợ giúp của các cơ quan thống kê nhận được dữ liệu cần thiết từ các doanh nghiệp, tổ chức và tổ chức trong một khoảng thời gian nhất định dưới dạng tài liệu báo cáo được thiết lập hợp pháp, được ký bởi những người chịu trách nhiệm về họ cung cấp và độ tin cậy của thông tin thu thập được.

Dùng chung: điện thoại, teletype, mail.

2. Giám sát có tổ chức đặc biệtđược thực hiện để có được thông tin không có trong báo cáo hoặc để xác minh dữ liệu của nó. Thống kê thực tế tiến hành điều tra dân số, tài nguyên vật liệu, đồn điền lâu năm, thiết bị đã tháo dỡ, công trường xây dựng thiết bị đang được tiến hành, v.v. và thu nhập của gia đình.

3. Đăng ký giám sát là một hình thức quan sát thống kê liên tục các quá trình dài hạn có khởi đầu cố định, giai đoạn phát triển và kết thúc cố định. Nó dựa trên việc duy trì một sổ đăng ký thống kê. Sổ đăng ký là một hệ thống liên tục theo dõi trạng thái của đơn vị quan sát và đánh giá cường độ tác động của các yếu tố khác nhau đối với các chỉ số được nghiên cứu.

Trong thực tiễn thống kê, có sự phân biệt giữa đăng ký dân số và đăng ký kinh doanh.

Các loại quan sát thống kê tại thời điểm đăng ký sự kiện

Quan sát hiện tại được thực hiện một cách có hệ thống, khi các hiện tượng xảy ra. Với quan sát định kỳ, việc đăng ký các hiện tượng đang nghiên cứu được thực hiện trong các khoảng thời gian nhất định, thường giống hệt nhau. Quan sát một lần được thực hiện một lần để giải quyết vấn đề hoặc được lặp lại theo từng giai đoạn sau một khoảng thời gian nhất định, nếu cần.

Các loại quan sát thống kê theo phạm vi đơn vị dân số

Với sự quan sát liên tục, tất cả các đơn vị dân số được ghi lại mà không có ngoại lệ. Trong quan sát có chọn lọc, một phần được chọn ngẫu nhiên của các đơn vị dân số được kiểm tra để mô tả toàn bộ dân số.

Với sự quan sát liên tục không hoàn hảo (của mảng chính), phần chính của dân số được kiểm tra và một phần nhất định bị loại trừ một cách có chủ ý, về phần mà người ta biết rằng nó không đóng vai trò lớn trong việc mô tả đặc điểm của toàn bộ dân số. Quan sát chuyên khảo bao gồm một mô tả chi tiết về một số lượng nhỏ hoặc các đơn vị điển hình riêng lẻ của dân số.

Phương pháp đăng ký sự kiện hoặc phương pháp lấy tài liệu chính

Quan sát trực tiếp được thực hiện bằng cách đăng ký các đơn vị đang nghiên cứu và đặc điểm của chúng bởi những người được chỉ định đặc biệt trên cơ sở kiểm tra trực tiếp, đếm, cân, đọc thiết bị, v.v. Quan sát tài liệu dựa trên việc sử dụng các tài liệu kế toán cơ bản khác nhau của các doanh nghiệp, tổ chức và tổ chức làm nguồn thông tin thống kê. Trong quá trình khảo sát, các tài liệu thống kê thu được bằng cách đăng ký các câu trả lời của những người được phỏng vấn. Phương pháp chuyển tiếp bao gồm thực tế là các nhà đăng ký được đào tạo đặc biệt điền vào các công thức bằng một cuộc khảo sát, đồng thời kiểm soát quyền tự do của thông tin nhận được. Trong quá trình tự đăng ký hoặc tự tính toán, nhân viên của cơ quan thống kê phát phiếu điều tra cho người được phỏng vấn, hướng dẫn họ, sau đó thu phiếu đã hoàn thành, kiểm soát tính đầy đủ và chính xác của thông tin nhận được. Một cuộc khảo sát bằng câu hỏi bao gồm thực tế là bảng câu hỏi đã phát triển được gửi đến một nhóm người và sau khi điền vào sẽ được trả lại cho các cơ quan tiến hành quan sát. Phóng viên bao gồm tổ chức bởi các cơ quan thống kê của một mạng lưới phóng viên đặc biệt từ những người sống trong lĩnh vực này tiến hành quan sát theo mẫu và hướng dẫn đã phát triển và báo cáo thông tin cho cơ quan thống kê. Không được yêu cầu cung cấp cho việc gửi thông tin cho các cơ quan tiến hành giám sát trên cơ sở không được yêu cầu.

4. Tổng hợp và phân nhóm số liệu thống kê

4.1 Nhiệm vụ và các loại tổng hợp thống kê


Định nghĩa: Tóm tắt là một tập hợp các thao tác tuần tự để khái quát hóa các sự kiện đơn lẻ cụ thể tạo thành một tập hợp nhằm xác định các đặc điểm và mô hình điển hình vốn có trong toàn bộ hiện tượng đang nghiên cứu.

Do đó, nếu trong quá trình quan sát thống kê, dữ liệu được thu thập về từng đơn vị của một đối tượng, thì kết quả của bản tóm tắt là dữ liệu chi tiết phản ánh tổng thể của nó.

Tóm tắt thống kê nên dựa trên phân tích lý thuyết sơ bộ về các hiện tượng và quá trình.

Theo độ sâu xử lý vật liệu tóm tắt vừa đơn giản vừa phức tạp.

Một bản tóm tắt đơn giản là một hoạt động để tính toán tổng số cho một tập hợp các đơn vị quan sát.

Tóm tắt phức hợp là một tập hợp các thao tác bao gồm nhóm các đơn vị quan sát, đếm tổng số cho từng nhóm và cho toàn bộ đối tượng, đồng thời trình bày kết quả nhóm và tóm tắt dưới dạng bảng thống kê.

Phần tóm tắt được bắt đầu bằng việc phát triển chương trình của nó, bao gồm các bước sau:

Sự lựa chọn của các tính năng nhóm;

Xác định thứ tự thành lập các nhóm;

Xây dựng hệ thống chỉ tiêu thống kê đặc trưng cho các nhóm và đối tượng nói chung;

Phát triển bố cục của các bảng thống kê trong đó các kết quả tóm tắt sẽ được trình bày.

Theo chế biến vật liệu tóm tắt được phân cấp và tập trung.

Với một bản tóm tắt phi tập trung (theo quy định, nó được sử dụng trong quá trình xử lý báo cáo thống kê), việc phát triển tài liệu được thực hiện theo các giai đoạn kế tiếp. Do đó, báo cáo của các doanh nghiệp được cơ quan thống kê của các đơn vị cấu thành của Liên bang Nga tóm tắt và kết quả cho khu vực đã được gửi đến Ủy ban Thống kê Nhà nước của Nga, và ở đó các chỉ số cho toàn bộ nền kinh tế quốc gia là xác định. Với một bản tóm tắt tập trung, tất cả tài liệu chính được đưa vào một tổ chức, nơi nó được xử lý từ đầu đến cuối. Tóm tắt tập trung thường được sử dụng để xử lý tài liệu từ các cuộc điều tra thống kê một lần. Theo kỹ thuật thực hiện, tóm tắt thống kê được chia thành cơ giới hóa và thủ công.

Để thực hiện một bản tóm tắt, một kế hoạch được vạch ra trong đó đặt ra các vấn đề về tổ chức: ai và khi nào tất cả các hoạt động sẽ được thực hiện, quy trình tiến hành và thành phần thông tin sẽ được đăng trên báo chí định kỳ.


4.2 Phương pháp phân nhóm trong thống kê

Phân nhóm thống kê là việc phân chia toàn bộ tài liệu thành các nhóm và phân nhóm theo các đặc điểm cần thiết để nghiên cứu toàn diện các hiện tượng và quá trình của đời sống xã hội.

Dấu hiệu cơ bản được gọi là nhóm.

Để xây dựng các nhóm trong thống kê, hai loại tính năng chủ yếu được sử dụng:

1. định lượng (số);

2. định tính (attributive).

Nhóm trên cùng một cơ sở được gọi là đơn giản và các nhóm theo hai hoặc nhiều tính năng được thực hiện kết hợp với nhau được gọi là tổ hợp(khó).

Sau khi thuộc tính nhóm được chọn, số lượng nhóm được chọn. Nếu việc phân nhóm dựa trên một đặc điểm định tính, thì câu hỏi về số lượng nhóm sẽ tự động được giải quyết - sẽ có bao nhiêu nhóm trong số đó tùy theo trạng thái định tính của quần thể được nghiên cứu (đơn vị của nó).

Khi nhóm theo các đặc điểm định lượng, câu hỏi đặt ra là xác định các khoảng thời gian nhóm. Giá trị của khoảng là hiệu giữa giá trị lớn nhất và nhỏ nhất của thuộc tính trong mỗi nhóm. Tùy thuộc vào bản chất của sự phân bố của các đơn vị dân số cho một đặc điểm nhất định, các khoảng có thể khác nhau và không bằng nhau về kích thước. Nếu sự phân bố của một tính trạng trong ranh giới dao động của nó đủ đồng đều, thì phạm vi dao động của tính trạng đó được chia thành các khoảng bằng nhau, độ dài của các khoảng đó được xác định theo công thức:

ở đâu XMakXtối thiểu tương ứng, giá trị tối đa và tối thiểu của tính năng trong quần thể này,

n là số nhóm được thành lập.

Số lượng các nhóm có thể được thiết lập dựa trên các nghiên cứu trước đây. Trong trường hợp bạn phải tự quyết định số lượng nhóm, thì bạn có thể sử dụng công thức Sturgess để xác định số lượng nhóm tối ưu:



n - số nhóm

N là số đơn vị dân số

Có các khoảng đóng, trong đó các ranh giới trên và dưới được cho trước, và các khoảng mở, trong đó chỉ có một ranh giới: trên hoặc dưới.

Các nhóm thống kê theo các nhiệm vụ được giải quyết với sự giúp đỡ của họ được chia thành:

nhóm kiểu chữ- đây là sự phân chia dân số không đồng nhất về chất được nghiên cứu thành các giai cấp, loại hình kinh tế xã hội, các nhóm đơn vị đồng nhất theo các quy tắc phân nhóm khoa học.

Cấu trúcđược gọi là một nhóm trong đó một quần thể đồng nhất được chia thành các nhóm đặc trưng cho cấu trúc của nó theo một số tính năng khác nhau.

phân tíchđược gọi là một nhóm tiết lộ mối quan hệ giữa các hiện tượng được nghiên cứu và các đặc điểm của chúng.


4.3 Chuỗi phân phối trong thống kê

Một chuỗi phân phối thống kê là một phân phối có thứ tự của các đơn vị dân số thành các nhóm theo một thuộc tính thay đổi nhất định.

Tùy thuộc vào dấu hiệu bên dưới sự hình thành của một chuỗi phân phối, có:

1. Chuỗi thuộc tính - phân phối được xây dựng trên cơ sở định tính.

2. Chuỗi biến thiên - phân phối được xây dựng trên cơ sở định lượng. Bất kỳ dấu hiệu biến thể bao gồm 2 yếu tố: biến thể và tần số.

Các biến thể là các giá trị riêng lẻ của một tính năng mà nó có trong một chuỗi biến thể.

Tần suất là số lượng biến thể riêng lẻ hoặc từng nhóm của chuỗi biến thể.

Tần số được gọi là tần số, được biểu thị bằng phân số của một đơn vị hoặc dưới dạng phần trăm của tổng số.

Tuỳ theo tính chất biến dị của tính trạng có:

1. Chuỗi biến thiên rời rạc đặc trưng cho sự phân bố của các đơn vị dân số theo một thuộc tính rời rạc (giá trị của thuộc tính định lượng chỉ nhận giá trị nguyên).

2. Chuỗi biến thiên theo khoảng thời gian - nó phù hợp với sự biến đổi liên tục của một tính trạng và cả khi biến thể rời rạc biểu hiện trên một phạm vi rộng, tức là. số lượng tùy chọn cho một tính năng riêng biệt là khá lớn.

Thuận tiện nhất là phân tích chuỗi phân phối bằng hình ảnh Ugaric của chúng.

Đa giác được sử dụng khi hiển thị chuỗi biến thể rời rạc.

Biểu đồ được lấy để hiển thị chuỗi biến thể khoảng thời gian.

5. Các chỉ tiêu thống kê

Chỉ tiêu thống kê là đặc trưng định lượng của các hiện tượng, quá trình kinh tế - xã hội về mặt chất chắc chắn. Sự chắc chắn về chất lượng của chỉ báo nằm ở chỗ nó liên quan trực tiếp đến nội dung bên trong của hiện tượng hoặc quá trình đang được nghiên cứu, bản chất của nó.

Theo quy luật, các quá trình và hiện tượng được thống kê nghiên cứu khá phức tạp và bản chất của chúng không thể được phản ánh bằng một chỉ số duy nhất. Trong những trường hợp như vậy, một hệ thống các chỉ số thống kê được sử dụng (một tập hợp các chỉ số có liên quan với nhau, có cấu trúc một cấp hoặc đa cấp và nhằm giải quyết một vấn đề thống kê cụ thể).


5.1 Các chỉ tiêu tuyệt đối và tương đối

Thống kê tuyệt đối.

Các chỉ tiêu thống kê ở dạng giá trị tuyệt đối đặc trưng cho các kích thước tuyệt đối của các quá trình và hiện tượng được nghiên cứu bởi thống kê: khối lượng, diện tích, khối lượng, chiều dài của chúng; phản ánh các đặc điểm thời gian của chúng và cũng có thể đại diện cho khối lượng dân số, tức là số đơn vị cấu thành của nó.

Các chỉ số tuyệt đối riêng lẻ thường thu được trực tiếp trong quá trình quan sát thống kê do đo lường, cân, đếm và đánh giá một đặc điểm định lượng quan tâm.

Các chỉ số thể tích hợp nhất thu được là kết quả của việc tóm tắt và nhóm các giá trị riêng lẻ (chúng đặc trưng cho khối lượng của một đối tượng địa lý hoặc khối lượng của tổng thể đối với toàn bộ đối tượng đang nghiên cứu và đối với bất kỳ phần nào của đối tượng).

Các chỉ tiêu thống kê tuyệt đối được thể hiện bằng các đơn vị đo lường sau:

Tự nhiên (tấn, kilôgam, kilômét, cái);

Chi phí (đánh giá bằng tiền về các hiện tượng và quá trình kinh tế - xã hội);

Lao động (ngày công, giờ công).

Thống kê tương đối.

Chỉ tiêu tương đối là kết quả của việc chia một chỉ tiêu tuyệt đối này cho một chỉ tiêu tuyệt đối khác và biểu thị tỷ lệ giữa các đặc điểm định lượng của các quá trình và hiện tượng kinh tế - xã hội. Ở tử số, chỉ tiêu gọi là chỉ tiêu hiện hành hay so sánh, ở mẫu số gọi là gốc hay cơ sở so sánh.

Nếu lấy cơ sở so sánh là 1 thì chỉ tiêu tương đối được biểu thị bằng hệ số, nếu lấy cơ sở là 100 thì biểu thị bằng phần trăm (%), nếu lấy 1000 thì biểu thị bằng ppm (%0 ), nếu cơ sở được lấy là 10.000, thì nó được biểu thị bằng decimilles .

Tỷ lệ phần trăm, theo quy định, được sử dụng trong trường hợp chỉ số tuyệt đối được so sánh vượt quá chỉ số cơ sở không quá 2-3 lần. Lãi trên 200-300 thường được thay thế bằng bội số, hệ số.


5.2 Trung bình (giá trị)

Giá trị trung bình là một đặc trưng định lượng được khái quát hóa của một tính trạng trong quần thể thống kê trong những điều kiện cụ thể về địa điểm và thời gian, là hình thức phổ biến nhất của chỉ tiêu thống kê.

Xem xét các loại trung bình được tính cho các trường hợp mỗi biến thể của chuỗi biến thiên chỉ xảy ra một lần (khi đó trung bình được gọi là đơn giản hoặc không có trọng số) và khi biến thể hoặc khoảng được lặp lại (trung bình có trọng số). Tùy chọn số lần lặp lại - tần suất. Khi chọn một hoặc một loại trung bình khác, người ta nên tiến hành theo nguyên tắc về ý nghĩa của kết quả khi tổng hợp hoặc khi cân.

Ý nghĩa số học.

X là sức mạnh trung bình;

Z là số mũ xác định loại trung bình cộng;

Xi - tùy chọn;

mi – tần số hoặc trọng số thống kê của các biến thể.

Điều hòa trung bình (z=-1).


gia sư

Cần giúp học một chủ đề?

Các chuyên gia của chúng tôi sẽ tư vấn hoặc cung cấp dịch vụ gia sư về các chủ đề mà bạn quan tâm.
Nộp đơn chỉ ra chủ đề ngay bây giờ để tìm hiểu về khả năng nhận được tư vấn.

:

mẫu văn bản

dạng bảng

bảng thống kê

Biểu đồ thống kê là hình ảnh có điều kiện của các giá trị số và tỷ lệ của chúng thông qua các đường, hình dạng hình học, hình vẽ hoặc biểu đồ địa lý. Dạng đồ họa tạo điều kiện thuận lợi cho việc xem xét dữ liệu thống kê, làm cho chúng trực quan, biểu cảm và có thể nhìn thấy được. Tuy nhiên, biểu đồ có những hạn chế nhất định: trước hết, một biểu đồ không thể bao gồm nhiều dữ liệu như nó có thể chứa trong một bảng; Ngoài ra, biểu đồ luôn hiển thị dữ liệu được làm tròn - không chính xác, nhưng gần đúng. Như vậy, biểu đồ chỉ dùng để thể hiện tình hình chung chứ không thể hiện chi tiết. Hạn chế cuối cùng là sự phức tạp của âm mưu. Nó có thể được khắc phục bằng máy tính cá nhân (ví dụ: "Trình hướng dẫn biểu đồ" từ gói Microsoft Office Excel).

Xác định hàm phân phối thực nghiệm.

Hàm phân phối mẫu (thực nghiệm) trong thống kê toán học, nó là một xấp xỉ của hàm phân phối lý thuyết được xây dựng bằng cách sử dụng một mẫu từ nó.

Sự định nghĩa

Hãy là một mẫu từ phân phối của một biến ngẫu nhiên được đưa ra bởi hàm phân phối. Chúng tôi giả định rằng , ở đâu , là các biến ngẫu nhiên độc lập được xác định trên một số không gian của các kết quả cơ bản . Cho phép . Hãy xác định một biến ngẫu nhiên theo cách sau:

đâu là chỉ báo sự kiện, là hàm Heaviside. Như vậy, hàm phân bố lấy mẫu tại một điểm bằng với tần suất tương đối của các phần tử mẫu không vượt quá giá trị . Biến ngẫu nhiên được gọi là hàm phân phối mẫu của biến ngẫu nhiên và là một xấp xỉ của hàm . Có một kết quả cho thấy rằng với , hàm hội tụ đều đến , và cho biết tốc độ hội tụ.

thanh biểu đồ

Một biểu đồ được sử dụng để thể hiện bằng đồ họa các bản phân phối tính trạng biến đổi liên tục và bao gồm các hình chữ nhật liền kề, như thể hiện trong Hình. 2.1. Cơ sở của mỗi hình chữ nhật bằng chiều rộng của khoảng cách nhóm và chiều cao của nó sao cho diện tích hình chữ nhật tỷ lệ thuận với tần số (hoặc tần suất) đánh trong khoảng đã cho. Nếu hàng không phải là khoảng cách, thì chiều rộng của tất cả các cột được chọn tùy ý, nhưng giống nhau. Do đó, chiều cao của hình chữ nhật phải tỷ lệ thuận với các giá trị

ở đâu n tôi- tần số tôi-th nhóm khoảng thời gian; Chào- bề rộng tôi-th nhóm khoảng thời gian.

Trên biểu đồ tần suất, đáy của các hình chữ nhật được vẽ dọc theo trục x ( x) và chiều cao dọc theo trục y ( tại) của hệ tọa độ vuông góc.

Tuy nhiên, trong trường hợp chiều rộng của tất cả các khoảng thời gian nhóm là như nhau, hình thức của biểu đồ sẽ không thay đổi nếu các giá trị không được vẽ dọc theo trục y số Pi, và tần số khoảng n tôi.

Cơm. 2.1. Biểu đồ phân phối kết quả trong ví dụ trước (khi chiều rộng của một số khoảng cách nhóm không giống nhau).

Trong trường hợp này, để không vi phạm nguyên tắc xây dựng biểu đồ (diện tích của hình chữ nhật tỷ lệ thuận với tần số của các khoảng), tần số không còn có thể được vẽ dọc theo trục y, mà là chiều cao của hình chữ nhật (phải tỷ lệ thuận với các tỷ lệ) phải được vẽ.

Đa giác tần số

Một biểu diễn đồ họa phổ biến khác là đa giác tần số.

Đa giác tần số được hình thành bởi một đường đứt đoạn nối các điểm tương ứng với các giá trị trung bình của các khoảng thời gian nhóm và tần số của các khoảng thời gian này, các giá trị trung bình được vẽ dọc theo trục X và tần số - dọc theo trục tại.

Từ việc so sánh hai phương pháp biểu diễn đồ họa được xem xét của các phân phối theo kinh nghiệm, theo đó, để có được đa giác tần số từ biểu đồ được xây dựng, cần phải kết nối các điểm giữa của các đỉnh của các hình chữ nhật tạo thành biểu đồ bằng cách kết nối thẳng phân đoạn dòng. Một ví dụ về đa giác tần số được hiển thị trong hình. 2.2.

Cơm. 2.2. Đa giác tần số

Đa giác tần số được sử dụng để biểu thị các phân phối của cả các tính năng liên tục và rời rạc. Trong trường hợp phân phối liên tục, đa giác tần số là cách biểu diễn đồ họa thích hợp hơn so với biểu đồ, nếu biểu đồ của phân phối theo kinh nghiệm được mô tả bằng một sự phụ thuộc trơn tru.

21.giả thuyết(tiếng Hy Lạp cổ đại ὑπόθεσις - giả định; từ ὑπό - từ bên dưới, dưới + θέσις - luận điểm) - giả định hoặc phỏng đoán; một tuyên bố giả định trước một bằng chứng, trái ngược với các tiên đề

Các định đề không yêu cầu bằng chứng. Một giả thuyết được coi là khoa học nếu nó thỏa mãn tiêu chí Popper, tức là có khả năng được kiểm tra bằng một thí nghiệm quan trọng, cũng như nếu nó đáp ứng các tiêu chí khác để phân biệt khoa học với phi khoa học.

giả thuyết thống kê là một giả định về các thuộc tính của các biến hoặc sự kiện ngẫu nhiên mà chúng tôi muốn kiểm tra dựa trên dữ liệu có sẵn. Ví dụ về giả thuyết thống kê trong nghiên cứu giáo dục:

Giả thuyết 1. Hiệu suất của một lớp học ngẫu nhiên (có thể) phụ thuộc vào mức độ học tập của học sinh.

Giả thuyết 2. Việc tiếp thu các khóa học toán ban đầu không có sự khác biệt đáng kể giữa những học sinh bắt đầu học từ 6 hoặc 7 tuổi.

Giả thuyết 3. Dạy học nêu vấn đề ở lớp 1 hiệu quả hơn phương pháp dạy học truyền thống xét theo sự phát triển toàn diện của học sinh.

ví dụ 1 Quy trình sản xuất một số sản phẩm y tế rất phức tạp. Thoạt nhìn, những sai lệch không đáng kể so với công nghệ gây ra sự xuất hiện của tạp chất phụ có độc tính cao. Độc tính của tạp chất này có thể cao đến mức thậm chí một lượng không thể phát hiện được bằng phân tích hóa học thông thường cũng có thể gây nguy hiểm cho người dùng thuốc này. Do đó, trước khi một lô hàng mới sản xuất được đưa ra thị trường, nó sẽ được nghiên cứu độc tính bằng phương pháp sinh học. Liều lượng nhỏ của thuốc được dùng cho một số động vật thí nghiệm, chẳng hạn như chuột, và kết quả được ghi lại. Nếu thuốc độc hại, thì tất cả hoặc gần như tất cả động vật đều chết. Nếu không, tỷ lệ sống sót cao.

Nghiên cứu về một loại thuốc có thể dẫn đến một trong các hành động khả thi: bán lô hàng (a 1), trả lại lô hàng cho nhà cung cấp để làm lại hoặc có thể tiêu hủy (a 2).

Hai loại lỗi liên quan đến hành động 1 và 2 hoàn toàn khác nhau và tầm quan trọng của việc tránh chúng cũng khác nhau. Trước tiên, hãy xem xét trường hợp áp dụng hành động 1, trong khi hành động 2 được ưu tiên hơn. Thuốc nguy hiểm cho bệnh nhân, trong khi nó được công nhận là an toàn. Một lỗi loại này có thể gây tử vong cho bệnh nhân sử dụng thuốc này. Đây là lỗi Loại I, vì điều quan trọng hơn đối với chúng tôi là tránh nó.

Hãy xem xét trường hợp hành động 2 được thực hiện trong khi hành động 1 được ưu tiên hơn. Điều này có nghĩa là do không chính xác trong quá trình tiến hành thí nghiệm, lô thuốc không độc hại đã được phân loại là nguy hiểm. Hậu quả của một lỗi có thể được thể hiện bằng tổn thất tài chính và tăng chi phí thuốc. Tuy nhiên, sự từ chối ngẫu nhiên của một loại thuốc hoàn toàn an toàn rõ ràng ít gây khó chịu hơn so với cái chết của bệnh nhân. Từ chối một lô thuốc không độc hại là lỗi Loại II.

Xác suất lỗi loại I cho phép(đồng) có thể bằng 5% hoặc 1% (0,05 hoặc 0,01).

22. Kiểm định giả thuyết thống kê(kiểm định các giả thuyết thống kê) là quá trình quyết định liệu một giả thuyết thống kê đưa ra có mâu thuẫn với một mẫu dữ liệu được quan sát hay không.

kiểm tra thống kê hoặc là tiêu chí thống kê- một quy tắc toán học nghiêm ngặt được chấp nhận hoặc từ chối giả thuyết thống kê.

· 23. phân loại giả thuyết

· đơn giản- một tình huống được chỉ định, trong trường hợp có hoặc không có quy phạm pháp luật có hiệu lực;

· phức tạp- sự hiện diện trong giả thuyết của hai hoặc nhiều hoàn cảnh cùng một lúc, cùng xác định hoạt động của chuẩn mực;

· thay thế- một số biến thể của hoàn cảnh (thay thế) được chỉ định theo đó quy tắc có thể được áp dụng. Trong trường hợp này, khi một trong số chúng xảy ra, định mức có hiệu lực;

giả thuyết tham sốđược gọi là giả thuyết giá trị của các tham số phân phối hoặc về giá trị so sánh của các tham số của hai phân phối. Một ví dụ về giả thuyết thống kê tham số là giả thuyết về bình đẳng của kỳ vọng toán học hai bộ bình thường.

giả thuyết phi tham sốđược gọi là giả thuyết về phân phối ngẫu nhiên số lượng.

Vô giá trị, giả thuyết chính hoặc được thử nghiệm là giả thuyết ban đầu được đưa ra, được ký hiệu là H0.

giả thuyết thống kêđại diện cho một số giả định về luật phân phối của một biến ngẫu nhiên hoặc về các tham số của luật này, được xây dựng trên cơ sở một mẫu. Ví dụ về các giả thuyết thống kê là các giả định: tổng thể dân số phân bố theo quy luật hàm mũ; kỳ vọng toán học của hai mẫu phân phối theo cấp số nhân bằng nhau. Trong phần đầu tiên, một giả định được đưa ra về dạng của luật phân phối và trong phần thứ hai, về các tham số của hai phân phối. Các giả thuyết dựa trên đó không có giả định nào về một loại quy luật phân phối cụ thể được gọi là phi tham số, nếu không thì - tham số.

Giả thuyết cho rằng không có sự khác biệt giữa các đặc điểm được so sánh và độ lệch quan sát được chỉ được giải thích bằng các dao động ngẫu nhiên trong các mẫu trên cơ sở so sánh được thực hiện, được gọi là vô giá trị(chính) giả thuyết và ký hiệu h 0 . Cùng với giả thuyết chính, chúng tôi cũng xem xét thay thế(cạnh tranh, mâu thuẫn) giả thuyết của cô ấy h 1 . Và nếu giả thuyết vô hiệu bị bác bỏ, thì giả thuyết thay thế sẽ diễn ra.

Phân biệt giữa các giả thuyết đơn giản và phức tạp. Giả thuyết được gọi là đơn giản, nếu nó đặc trưng duy nhất cho tham số phân phối của biến ngẫu nhiên. Ví dụ, nếu  là một tham số của phân phối mũ, thì giả thuyết h 0 về bình đẳng  = 10 là một giả thuyết đơn giản. phức tạpđược gọi là một giả thuyết bao gồm một tập hợp hữu hạn hoặc vô hạn các giả thuyết đơn giản. Giả thuyết phức tạp h 0 về bất bình đẳng  > 10 bao gồm vô số giả thuyết đơn giản h 0 về bình đẳng =b i, ở đâu b tôi- bất kỳ số nào lớn hơn 10. Giả thuyết h 0 rằng kỳ vọng của phân phối chuẩn là hai đối với phương sai chưa biết cũng rất khó. Một giả thuyết phức tạp sẽ là giả định về phân phối của một biến ngẫu nhiên X theo quy luật thông thường, nếu các giá trị cụ thể của kỳ vọng toán học và phương sai không cố định.

Kiểm tra giả thuyết dựa trên việc tính toán một số biến ngẫu nhiên - một tiêu chí, đã biết phân phối chính xác hoặc gần đúng của nó. Hãy để chúng tôi biểu thị số lượng này bằng z, giá trị của nó là một hàm của các phần tử của mẫu z=z(x 1 , x 2 , …, x n). Quy trình kiểm tra giả thuyết quy định cho mỗi giá trị tiêu chí một trong hai quyết định - chấp nhận hoặc bác bỏ giả thuyết. Do đó, toàn bộ không gian mẫu và theo đó, tập hợp các giá trị tiêu chí được chia thành hai tập con không chồng chéo S 0 và S 1 . Nếu giá trị của tiêu chí z rơi vào khu vực S 0 , thì giả thuyết được chấp nhận và nếu S 1 , – giả thuyết bị bác bỏ. một bó S 0 được gọi là khu vực chấp nhận giả thuyết hoặc khu vực của các giá trị được chấp nhận, và tập hợp S 1 – khu vực bác bỏ giả thuyết hoặc khu vực quan trọng. Sự lựa chọn của một khu vực xác định duy nhất khu vực khác.

Chấp nhận hoặc bác bỏ giả thuyết h 0 theo một mẫu ngẫu nhiên tương ứng với sự thật với một số xác suất và theo đó, có thể có hai loại lỗi. Sai lầm loại I xảy ra với xác suất  khi giả thuyết đúng bị bác bỏ. h 0 và giả thuyết cạnh tranh được chấp nhận h 1 . Lỗi loại hai xảy ra với xác suất  trong trường hợp chấp nhận một giả thuyết không đúng h 0 , trong khi giả thuyết cạnh tranh là đúng h 1 . xác suất tin cậy là xác suất không phạm sai lầm loại I và chấp nhận giả thuyết đúng h 0 . Xác suất bác bỏ một giả thuyết sai h 0 được gọi là sức mạnh của tiêu chí. Do đó, khi kiểm định giả thuyết, có bốn kết quả có thể xảy ra, Bảng. 3.1.

Bảng 3.1.

Ví dụ, hãy xem xét trường hợp khi một số ước tính không chệch của tham số  được tính toán từ một mẫu thể tích N và ước tính này có mật độ phân phối f(), hình. 3.1.

Cơm. 3.1. Khu vực và độ lệch của giả thuyết

Giả sử rằng giá trị thực của tham số ước tính bằng t. Nếu chúng ta xem xét giả thuyết h 0 về đẳng thức  = t, thì hiệu giữa  và tđể bác bỏ giả thuyết này. Câu hỏi này có thể được trả lời theo nghĩa thống kê, xem xét xác suất đạt được một số khác biệt nhất định giữa  và t dựa trên phân phối lấy mẫu của tham số  .

Nên giả sử các giá trị xác suất của tham số  vượt quá giới hạn dưới và giới hạn trên của khoảng là như nhau. Một giả định như vậy trong nhiều trường hợp cho phép người ta giảm thiểu khoảng tin cậy, tức là tăng sức mạnh của tiêu chí kiểm tra. Tổng xác suất để tham số  vượt ra ngoài khoảng có ranh giới  1– /2 và   /2 là  . Giá trị này nên được chọn nhỏ đến mức không có khả năng vượt ra ngoài khoảng. Nếu ước tính của tham số nằm trong một khoảng nhất định, thì trong trường hợp này không có lý do gì để đặt câu hỏi về giả thuyết đang được kiểm tra, do đó, giả thuyết về đẳng thức  = t có thể được chấp nhận. Nhưng nếu sau khi nhận được mẫu, hóa ra ước tính nằm ngoài giới hạn đã thiết lập, thì trong trường hợp này, có những lý do nghiêm trọng để bác bỏ giả thuyết h 0 . Suy ra xác suất mắc sai lầm loại I bằng  (bằng mức ý nghĩa của tiêu chí).

Ví dụ, giả sử rằng giá trị thực của tham số thực sự bằng t+đ, thì theo giả thiết h 0 về đẳng thức  = t– xác suất mà ước lượng của tham số  sẽ rơi vào vùng chấp nhận giả thuyết sẽ là  , hình. 3.2.

Đối với một cỡ mẫu nhất định, xác suất mắc lỗi loại I có thể giảm bằng cách hạ thấp mức ý nghĩa  . Tuy nhiên, trong trường hợp này, xác suất xảy ra lỗi loại  thứ hai tăng lên (sức mạnh của tiêu chí giảm). Lập luận tương tự có thể được thực hiện cho trường hợp khi giá trị thực của tham số bằng tđ.

Cách duy nhất để giảm cả hai xác suất là tăng cỡ mẫu (mật độ phân bố của ước lượng tham số trở nên "hẹp" hơn). Khi chọn vùng tới hạn, họ tuân theo quy tắc Neumann-Pearson: người ta nên chọn vùng tới hạn sao cho xác suất  nhỏ nếu giả thuyết đúng và lớn nếu ngược lại. Tuy nhiên, việc lựa chọn một giá trị cụ thể của  là tương đối tùy ý. Các giá trị phổ biến nằm trong khoảng từ 0,001 đến 0,2. Để đơn giản hóa việc tính toán thủ công, các bảng khoảng có ranh giới  1– /2 và   /2 cho các giá trị  điển hình và các phương pháp xây dựng tiêu chí khác nhau đã được biên soạn.

Khi chọn mức ý nghĩa, cần tính đến sức mạnh của tiêu chí theo một giả thuyết thay thế. Đôi khi, sức mạnh lớn của tiêu chí hóa ra lại quan trọng hơn mức ý nghĩa nhỏ và giá trị của nó được chọn tương đối lớn, ví dụ: 0,2. Sự lựa chọn như vậy là hợp lý nếu hậu quả của lỗi loại thứ hai đáng kể hơn lỗi loại thứ nhất. Ví dụ: nếu quyết định chính xác "tiếp tục với người dùng có mật khẩu hiện tại" bị từ chối, thì lỗi Loại I sẽ dẫn đến một số chậm trễ trong hoạt động bình thường của hệ thống do thay đổi mật khẩu. Nếu quyết định không thay đổi mật khẩu, bất chấp nguy cơ bị người không được phép truy cập trái phép vào thông tin, thì sai lầm này sẽ dẫn đến hậu quả nghiêm trọng hơn.

Tùy thuộc vào bản chất của giả thuyết đang được thử nghiệm và các biện pháp đo lường sự khác biệt giữa việc đánh giá một đặc tính và giá trị lý thuyết của nó, các tiêu chí khác nhau được sử dụng. Các tiêu chí được sử dụng phổ biến nhất để kiểm định các giả thuyết về luật phân phối bao gồm các phép kiểm Pearson, Kolmogorov, Mises, Wilcoxon chi-square, và các phép kiểm Fisher và Student đối với các giá trị tham số.

25. KHU VỰC QUAN TRỌNG- một phần của không gian mẫu sao cho việc nhập vào nó giá trị quan sát của một biến ngẫu nhiên, với phân phối liên quan đến giả thuyết được kiểm tra, dẫn đến việc bác bỏ giả thuyết này

điểm quan trọng(biên giới) k cr là các điểm ngăn cách vùng tới hạn với vùng chấp nhận giả thuyết.
Có các vùng quan trọng một bên (bên phải hoặc bên trái) và hai bên.

Lỗi đo lường ngẫu nhiên được hình thành dưới ảnh hưởng của một số lượng lớn các yếu tố kèm theo quá trình đo. Mỗi tình huống cụ thể có cơ chế phát sinh lỗi riêng. Do đó, điều tự nhiên là giả định rằng mỗi tình huống nên có kiểu phân phối lỗi riêng. Tuy nhiên, trong nhiều trường hợp, có thể đưa ra một số giả định về hình dạng của hàm phân phối ngay cả trước khi đo, để sau khi đo, chỉ còn lại việc xác định giá trị của một số tham số được đưa vào biểu thức cho giá trị ước tính. Chức năng phân phối.

Sai số ngẫu nhiên đặc trưng cho sự không chắc chắn trong kiến ​​thức của chúng ta về giá trị thực của giá trị đo được, thu được từ các quan sát. Theo K. Shannon, thước đo độ không chắc chắn của tình huống được mô tả bởi biến ngẫu nhiên X là entropy


đó là một chức năng của chức năng phân phối vi phân. Có thể giả định rằng bất kỳ quy trình đo lường nào cũng được hình thành theo cách sao cho độ không đảm bảo của kết quả quan sát hóa ra là lớn nhất trong các giới hạn nhất định được xác định bởi các giá trị sai số cho phép. Do đó, khả năng xảy ra cao nhất phải là những phân phối như vậy trong đó entropy đạt giá trị cực đại.

Để xác định loại phân phối có thể xảy ra nhất, chúng ta hãy xem xét một số trường hợp điển hình nhất.

1. Trong lớp phân phối kết quả quan sát, có vùng phân tán nhất định giữa các giá trị x = bx = một bề rộng ba=2a, chúng tôi tìm thấy một cách tối đa hóa entropy khi có các điều kiện giới hạn:
, , ,
đâu là kỳ vọng toán học của các kết quả quan sát. Lời giải của bài toán được tìm bằng phương pháp nhân tử Lagrange.

Mật độ phân phối mong muốn của kết quả quan sát được mô tả bằng biểu thức

Hãy để chúng tôi xác định các đặc điểm số của phân phối đồng đều. Kỳ vọng toán học của một lỗi ngẫu nhiên được tìm thấy theo công thức (10):

Độ phân tán của sai số ngẫu nhiên phân bố đều có thể được tìm theo công thức (18):

Do tính đối xứng của phân phối đối với kỳ vọng toán học, hệ số độ lệch phải bằng 0:

Để xác định độ nhọn, trước tiên chúng ta tìm thời điểm thứ tư của sai số ngẫu nhiên:

vì thế

Để kết luận, chúng tôi tìm thấy xác suất xảy ra lỗi ngẫu nhiên rơi vào một khoảng nhất định bằng với vùng được tô bóng trong Hình 7

2. Trong lớp phân phối kết quả quan sát , có một phương sai nhất định , chúng tôi tìm thấy một phương sai tối đa hóa entropy khi có các hạn chế:

, , , .

Lời giải của bài toán này cũng được tìm ra bằng phương pháp nhân tử Lagrange. Mật độ phân phối mong muốn của kết quả quan sát được mô tả bằng biểu thức

Phân phối được mô tả bởi các phương trình (25) và (26) được gọi là thông thường hoặc là phân phối Gaussian.

Hình 8 cho thấy các đường cong phân phối chuẩn của sai số ngẫu nhiên đối với các giá trị khác nhau của độ lệch chuẩn .

Hình vẽ cho thấy khi độ lệch chuẩn tăng lên, phân phối ngày càng lan rộng, xác suất xảy ra lỗi lớn tăng lên và xác suất xảy ra lỗi nhỏ hơn giảm xuống, tức là sự phân tán của các kết quả quan sát tăng lên.

Hãy tính xác suất mà kết quả quan sát sẽ rơi vào một khoảng thời gian nhất định:

Hãy thay đổi các biến:

Sau đó, chúng tôi nhận được biểu thức sau cho xác suất mong muốn:

Các tích phân trong ngoặc vuông không được biểu thị bằng các hàm cơ bản, vì vậy chúng được tính bằng cái gọi là phân phối chuẩn hóa chuẩn hóa với hàm vi phân

Với sự trợ giúp của hàm F( z) xác suất tìm cách

(29)

Khi sử dụng công thức này, người ta nên ghi nhớ danh tính

Theo trực tiếp từ định nghĩa của hàm Ф( z).

Sự phân bố rộng rãi của sai số phân phối chuẩn trong thực hành đo lường được giải thích bằng định lý giới hạn trung tâm của lý thuyết xác suất, đây là một trong những định lý toán học đáng chú ý nhất, trong quá trình phát triển có nhiều nhà toán học lỗi lạc - De Moivre, Laplace, Gauss , Chebyshev và Lyapunov. Định lý giới hạn trung tâm phát biểu rằng sự phân bố của các sai số ngẫu nhiên sẽ gần với bình thường bất cứ khi nào kết quả của một quan sát được hình thành dưới ảnh hưởng của một số lượng lớn các yếu tố tác động độc lập, mỗi yếu tố chỉ có một tác động nhỏ so với tổng tác động của tất cả các yếu tố khác.

3. Giả sử rằng kết quả của các quan sát có phân phối chuẩn, nhưng độ lệch chuẩn của chúng là một giá trị ngẫu nhiên thay đổi từ kinh nghiệm này sang kinh nghiệm khác. Giả định này thận trọng hơn giả định về sự bất biến trong toàn bộ thời gian đo. Trong trường hợp này, lập luận theo cách tương tự như trước đây, dễ dàng thấy rằng entropy là cực đại nếu kết quả quan sát có phân bố Laplace với mật độ

(30)

đâu là kỳ vọng toán học, là độ lệch chuẩn của kết quả quan sát. Phân phối Laplace nên được sử dụng trong trường hợp các đặc tính chính xác không được biết trước hoặc không ổn định theo thời gian.

Hàm phân phối vi phân của các lỗi ngẫu nhiên có được bằng cách thay thế và vào biểu thức (30):

Độ lệch của phân phối bằng 0, vì phân phối đối xứng quanh 0 và độ nhọn, theo công thức (22), là

Như vậy, so với phân phối chuẩn ( Bán tại= 0) phân bố đều có đỉnh phẳng hơn ( Bán tại= -1,2) và phân phối Laplace đạt cực đại hơn ( Bán tại = 3).

Các hình thức trình bày dữ liệu thống kê.

Dữ liệu thống kê nên được trình bày theo cách mà chúng có thể được sử dụng. Có 3 chính Các hình thức trình bày dữ liệu thống kê:

Văn bản - bao gồm dữ liệu trong văn bản;

Bảng - trình bày dữ liệu trong bảng;

Đồ họa - biểu thức của dữ liệu dưới dạng biểu đồ.

mẫu văn bảnđược sử dụng với một lượng nhỏ dữ liệu số.

dạng bảngđược sử dụng thường xuyên nhất, vì nó là một hình thức trình bày dữ liệu thống kê hiệu quả hơn. Không giống như các bảng toán học, theo các điều kiện ban đầu, cho phép thu được kết quả này hoặc kết quả khác, các bảng thống kê cho biết ngôn ngữ của các con số về các đối tượng đang nghiên cứu.

bảng thống kê- Đây là một hệ thống các hàng và cột, trong đó các thông tin thống kê về các hiện tượng kinh tế - xã hội được trình bày theo một trình tự và mối liên hệ nhất định.

Phân biệt chủ ngữ, vị ngữ của bảng thống kê. Chủ đề chỉ ra đối tượng được đặc trưng - đơn vị dân số, hoặc nhóm đơn vị hoặc toàn bộ tổng thể. Trong vị ngữ, đặc điểm của chủ đề được đưa ra, thường ở dạng số. Tiêu đề của bảng là bắt buộc, cho biết loại nào và thời gian dữ liệu của bảng thuộc về.

Theo tính chất của chủ đề, các bảng thống kê được chia thành các bảng đơn giản, nhóm và kết hợp. Trong chủ đề của một bảng đơn giản, đối tượng nghiên cứu không được chia thành các nhóm, nhưng một danh sách tất cả các đơn vị dân số được đưa ra hoặc toàn bộ dân số được chỉ định. Trong chủ đề của bảng nhóm, đối tượng nghiên cứu được chia thành các nhóm theo một thuộc tính và vị ngữ cho biết số lượng đơn vị trong các nhóm (tuyệt đối hoặc theo tỷ lệ phần trăm) và các chỉ số tóm tắt cho các nhóm. Trong chủ đề của bảng kết hợp, dân số được chia thành các nhóm không phải theo một mà theo một số tiêu chí.

Khi xây dựng các bảng, cần tuân theo các quy tắc chung sau đây.

Chủ ngữ của bảng nằm ở phần bên trái (hiếm khi - phía trên) và vị ngữ - ở bên phải (ít thường xuyên hơn - phía dưới).

Các tiêu đề cột chứa tên của các chỉ số và đơn vị đo lường của chúng.

Dòng cuối cùng hoàn thành bảng và nằm ở cuối bảng, nhưng đôi khi nó là dòng đầu tiên: trong trường hợp này, dòng thứ hai được viết "bao gồm" và các dòng tiếp theo chứa các thành phần của dòng tổng.

Dữ liệu số được viết với cùng mức độ chính xác trong mỗi cột, với các chữ số của các số nằm dưới các chữ số và phần nguyên được phân tách bằng dấu phẩy phân số.

Bảng không được chứa các ô trống: nếu dữ liệu bằng 0, thì dấu “–” (dấu gạch ngang) được đặt; nếu không biết dữ liệu thì ghi “không có thông tin” hoặc ghi dấu “…” (dấu chấm lửng). Nếu giá trị số mũ không bằng 0, nhưng chữ số có nghĩa đầu tiên xuất hiện sau mức độ chính xác được chấp nhận, thì 0,0 được ghi lại (ví dụ: nếu mức độ chính xác 0,1 được chấp nhận).

Đôi khi các bảng thống kê được bổ sung bằng các biểu đồ khi mục tiêu là nhấn mạnh một số tính năng của dữ liệu, để so sánh chúng. Hình thức đồ họa là hình thức trình bày dữ liệu hiệu quả nhất về mặt nhận thức của họ. Với sự trợ giúp của các biểu đồ, khả năng hiển thị các đặc điểm của cấu trúc, động lực học, mối quan hệ của các hiện tượng và sự so sánh của chúng đã đạt được.

Trước hết, hình ảnh đồ họa cho phép kiểm soát độ tin cậy của các chỉ số thống kê, vì khi được trình bày trên biểu đồ, chúng cho thấy rõ hơn những điểm không chính xác hiện có liên quan đến sự hiện diện của lỗi quan sát hoặc bản chất của hiện tượng đang nghiên cứu. Với sự trợ giúp của hình ảnh đồ họa, có thể nghiên cứu các mô hình phát triển của một hiện tượng, để thiết lập các mối quan hệ hiện có. Việc so sánh dữ liệu đơn giản không phải lúc nào cũng có thể nắm bắt được sự hiện diện của các mối quan hệ nhân quả, đồng thời, biểu diễn đồ họa của chúng giúp xác định các mối quan hệ nhân quả, đặc biệt là trong trường hợp thiết lập các giả thuyết ban đầu, sau đó có thể phát triển thêm. Đồ thị cũng được sử dụng rộng rãi để nghiên cứu cấu trúc của các ảnh hưởng, sự thay đổi của chúng theo thời gian và vị trí của chúng trong không gian. Các đặc điểm được so sánh được thể hiện rõ ràng hơn trong chúng và có thể thấy rõ các xu hướng phát triển chính và các mối quan hệ vốn có trong hiện tượng hoặc quá trình đang nghiên cứu.

Trong thống kê, biểu đồ là biểu diễn trực quan của các đại lượng thống kê và mối quan hệ của chúng bằng cách sử dụng các điểm hình học, đường thẳng, số liệu hoặc bản đồ địa lý.

Biểu đồ giúp trình bày dữ liệu thống kê rõ ràng hơn so với bảng, tính biểu cảm, tạo điều kiện thuận lợi cho nhận thức và phân tích của họ. Biểu đồ thống kê cho phép bạn đánh giá trực quan bản chất của hiện tượng đang nghiên cứu, các kiểu vốn có của nó, xu hướng phát triển, mối quan hệ với các chỉ số khác và độ phân giải địa lý của các hiện tượng được nghiên cứu. Ngay cả trong thời cổ đại, người Trung Quốc nói rằng một hình ảnh có thể thay thế một ngàn lời nói. Biểu đồ làm cho tài liệu thống kê dễ hiểu hơn, dễ tiếp cận hơn đối với những người không chuyên, thu hút sự chú ý của nhiều đối tượng vào dữ liệu thống kê và phổ biến số liệu thống kê và thông tin thống kê.

Bất cứ khi nào có thể, bạn nên luôn bắt đầu phân tích dữ liệu thống kê bằng biểu diễn đồ họa của chúng. Biểu đồ cho phép bạn ngay lập tức có được ý tưởng chung về toàn bộ tập hợp các chỉ số thống kê. Phương pháp phân tích đồ họa đóng vai trò là sự tiếp nối hợp lý của phương pháp bảng và phục vụ mục đích thu được các đặc điểm thống kê tổng quát của các quá trình vốn có trong các hiện tượng khối lượng.

Với sự trợ giúp của biểu diễn đồ họa dữ liệu thống kê, nhiều nhiệm vụ nghiên cứu thống kê đã được giải quyết:

  • 1) một biểu diễn trực quan về tầm quan trọng của các chỉ số (hiện tượng) so với nhau;
  • 2) đặc điểm cấu trúc của bất kỳ hiện tượng nào;
  • 3) sự thay đổi của hiện tượng kịp thời;
  • 4) tiến độ của kế hoạch;
  • 5) sự phụ thuộc của một sự thay đổi trong một hiện tượng vào một sự thay đổi trong một hiện tượng khác;
  • 6) mức độ phổ biến hoặc phân phối của bất kỳ số lượng nào trên lãnh thổ.

Nói cách khác, rất nhiều đồ thị được sử dụng trong các nghiên cứu thống kê.

Mỗi biểu đồ có các thành phần chính sau:

  • 1) các điểm tham chiếu không gian (hệ tọa độ);
  • 2) hình ảnh đồ họa;
  • 3) trường biểu đồ;
  • 4) mốc tỷ lệ;
  • 5) lịch trình giải thích;
  • 6) tên của biểu đồ

Các mốc không gian được xác định dưới dạng hệ thống lưới tọa độ. Trong đồ thị thống kê, hệ tọa độ vuông góc thường được sử dụng nhất. Đôi khi nguyên tắc tọa độ cực (góc) (đồ thị tròn) được sử dụng. Trong bản đồ, các phương tiện định hướng không gian là biên giới của các quốc gia, ranh giới của các bộ phận hành chính, các mốc địa lý (đường viền của sông, bờ biển và đại dương).

Trên các trục của hệ tọa độ hoặc trên bản đồ, các đặc điểm của các đặc điểm thống kê của các hiện tượng hoặc quá trình được mô tả được sắp xếp theo một thứ tự nhất định. Các tính năng nằm trên các trục tọa độ có thể là định tính hoặc định lượng.

Hình ảnh đồ họa của dữ liệu thống kê là tập hợp các đường, hình, điểm tạo thành các khối hình học có nhiều hình dạng khác nhau (hình tròn, hình vuông, hình chữ nhật, v.v.) với độ nét, tô màu, mật độ chấm khác nhau.

Bất kỳ hiện tượng nào được nghiên cứu bằng số liệu thống kê đều có thể được biểu diễn bằng đồ họa. Để làm điều này, bạn cần tìm giải pháp đồ họa phù hợp, xác định hình ảnh đồ họa phù hợp nhất với hiện tượng này, mô tả rõ hơn dữ liệu thống kê. Hình ảnh đồ họa phải tương ứng với mục đích của biểu đồ. Do đó, trước khi vẽ biểu đồ, cần hiểu bản chất của hiện tượng và mục tiêu đặt ra cho hình ảnh đồ họa. Hình thức biểu đồ được chọn phải phù hợp với nội dung và tính chất của chỉ tiêu thống kê. Ví dụ: so sánh trên biểu đồ được thực hiện theo các phép đo như diện tích, độ dài của một trong các cạnh của hình, vị trí của các điểm, mật độ của chúng, v.v.

Vì vậy, để mô tả những thay đổi của một hiện tượng theo thời gian, loại biểu đồ tự nhiên nhất là một đường thẳng. Đối với chuỗi phân phối - đa giác hoặc biểu đồ.

Trường đồ thị là không gian chứa các hình ảnh đồ họa (các khối hình học tạo thành đồ thị).

Trường đồ thị được đặc trưng bởi kích thước và tỷ lệ. Kích thước của trường phụ thuộc vào mục đích của biểu đồ. Tỷ lệ và kích thước của biểu đồ (dạng biểu đồ) cũng phải tương ứng với bản chất của hiện tượng được mô tả. Đối với các nghiên cứu thống kê, các đồ thị có các cạnh không bằng nhau thường được sử dụng, ví dụ, với tỷ lệ khung hình trường là 1: hoặc 1:1,33 đến 1:1,6 + 5,8. Nhưng đôi khi hình dạng vuông của biểu đồ là thuận tiện.

Các mốc tỷ lệ mang lại sự chắc chắn về số lượng cho hình ảnh hình học là hệ thống tỷ lệ được sử dụng trong đồ họa. Tỷ lệ của đồ thị là thước đo có điều kiện của việc dịch một giá trị số thống kê thành một đồ họa. Thang tỷ lệ là một dòng, các điểm riêng lẻ có thể được đọc theo thang đo được chấp nhận dưới dạng một giá trị nhất định của chỉ báo thống kê. Thang đo được chọn sao cho giá trị lớn nhất và nhỏ nhất được hiển thị có thể vừa với biểu đồ.

Thang tỷ lệ là đồng nhất và không đồng nhất, thẳng (thường nằm dọc theo các trục tọa độ) và cong (hình tròn trong biểu đồ hình tròn).

Giải thích biểu đồ là một lời giải thích bằng lời về nội dung của nó (tên của biểu đồ và các giải thích tương ứng về các phần riêng lẻ của nó).

Tiêu đề của biểu đồ nên mô tả rõ ràng và chính xác nội dung của nó. Các văn bản giải thích có thể được đặt trong hình ảnh đồ họa, bên cạnh nó hoặc được đặt bên ngoài nó, dọc theo tỷ lệ. Chúng giúp di chuyển tinh thần từ hình ảnh hình học sang các hiện tượng và quá trình được mô tả trên biểu đồ.

Điểm đặc biệt của hình ảnh đồ họa là tính biểu cảm, tính dễ hiểu và khả năng hiển thị của chúng. Tuy nhiên, hình ảnh đồ họa không chỉ mang tính minh họa mà còn mang tính phân tích. Vì vậy, hiện nay, lịch biểu được sử dụng rộng rãi trong thực hành kế toán và thống kê của các doanh nghiệp và tổ chức, trong công việc nghiên cứu, trong sản xuất và hoạt động kinh tế, trong quá trình giáo dục, tuyên truyền và các lĩnh vực khác.

Có nhiều loại đồ họa. Phân loại của họ dựa trên một số tính năng:

  • a) phương pháp xây dựng hình ảnh đồ họa;
  • b) các dấu hiệu hình học mô tả các chỉ số và mối quan hệ thống kê;
  • c) các nhiệm vụ được giải quyết với sự trợ giúp của hình ảnh đồ họa.

Biểu đồ thống kê ở dạng hình ảnh đồ họa:

Tuyến tính: đường cong thống kê.

Mặt phẳng: thanh, dải, hình vuông, hình tròn, cung, xoăn, chấm, nền.

Thể tích: bề mặt phân phối.

Biểu đồ thống kê theo phương pháp dựng hình và tác vụ:

Các sơ đồ: sơ đồ so sánh, sơ đồ động lực học, sơ đồ kết cấu.

Bản đồ thống kê: bản đồ, bản đồ.

Theo phương pháp xây dựng, đồ thị thống kê được chia thành sơ đồ và bản đồ thống kê.

Biểu đồ là cách phổ biến nhất của biểu diễn đồ họa. Đây là những đồ thị của quan hệ định lượng. Các loại và phương pháp xây dựng của họ rất đa dạng. Biểu đồ được sử dụng để so sánh trực quan về các khía cạnh khác nhau (không gian, thời gian, v.v.) của các giá trị độc lập với nhau: lãnh thổ, dân số, v.v. Trong trường hợp này, việc so sánh các quần thể được nghiên cứu được thực hiện theo một số thay đổi đáng kể thuộc tính.

Bản đồ thống kê - đồ thị phân bố định lượng trên bề mặt. Với mục đích chính, chúng liên kết chặt chẽ với các sơ đồ và chỉ cụ thể theo nghĩa chúng là biểu diễn có điều kiện của dữ liệu thống kê trên bản đồ địa lý đường viền, nghĩa là chúng hiển thị phân bố không gian hoặc phân bố không gian của dữ liệu thống kê. Dấu hiệu hình học, như đã đề cập ở trên, là điểm, hoặc đường hoặc mặt phẳng, hoặc vật thể hình học. Theo đó, có các đồ thị điểm, đường thẳng, phẳng và không gian (thể tích).

Khi xây dựng các biểu đồ phân tán, các tập hợp điểm được sử dụng làm hình ảnh đồ họa; khi xây dựng tuyến - đường. Nguyên tắc cơ bản của việc xây dựng tất cả các biểu đồ phẳng là các đại lượng thống kê được mô tả dưới dạng các hình hình học và lần lượt được chia thành thanh, dải, tròn, vuông và xoăn.

Bản đồ thống kê theo hình ảnh đồ họa được chia thành bản đồ và bản đồ.

Tuỳ theo phạm vi nhiệm vụ cần giải quyết mà người ta phân biệt sơ đồ so sánh, sơ đồ kết cấu và sơ đồ động lực học.