Biểu diễn đồ họa của dữ liệu thống kê. Trình bày đồ họa của thông tin thống kê


Giá trị của phương pháp đồ thị trong việc phân tích và tổng quát hóa dữ liệu là rất lớn. Trước hết, hình ảnh đồ họa cho phép kiểm soát độ tin cậy của các chỉ số thống kê, vì khi được trình bày trên biểu đồ, chúng cho thấy rõ hơn những điểm không chính xác hiện có liên quan đến sự hiện diện của lỗi quan sát hoặc bản chất của hiện tượng đang nghiên cứu. Với sự trợ giúp của hình ảnh đồ họa, có thể nghiên cứu các mô hình phát triển của một hiện tượng, để thiết lập các mối quan hệ hiện có. Việc so sánh dữ liệu đơn giản không phải lúc nào cũng có thể nắm bắt được sự hiện diện của các mối quan hệ nhân quả, đồng thời, biểu diễn đồ họa của chúng giúp xác định các mối quan hệ nhân quả, đặc biệt là trong trường hợp thiết lập các giả thuyết ban đầu, sau đó có thể phát triển thêm.

Biểu đồ thống kê- đây là một bản vẽ trong đó các tập hợp thống kê được đặc trưng bởi các chỉ số nhất định được mô tả bằng các hình ảnh hoặc dấu hiệu hình học có điều kiện. hình ảnh đồ họa là tập hợp các điểm, đường và hình thể hiện dữ liệu thống kê. các yếu tố phụ trợđồ họa là:

    Trường đồ thị là một phần của mặt phẳng chứa các hình ảnh đồ họa. Trường biểu đồ có các kích thước nhất định, phụ thuộc vào mục đích của nó.

    Các mốc không gian của đồ thị được thiết lập dưới dạng hệ thống các lưới tọa độ. Hệ tọa độ là cần thiết để đặt các ký hiệu hình học trong trường biểu đồ. Cả hai hệ tọa độ hình chữ nhật và cực đều được sử dụng.

    Các mốc tỷ lệ được sử dụng để so sánh hiển thị đồ họa của đối tượng và kích thước thực tế của nó. Các mốc tỷ lệ được thiết lập bằng hệ thống thước tỷ lệ hoặc ký hiệu tỷ lệ.

    Giải thích biểu đồ bao gồm giải thích đối tượng được biểu thị bằng biểu đồ (tên) và ý nghĩa ngữ nghĩa của từng dấu hiệu được sử dụng trên biểu đồ.

Biểu đồ thống kê được phân loại theo mục đích (nội dung), phương pháp xây dựng và bản chất của hình ảnh đồ họa (Hình 1).

Hình.1. Phân loại biểu đồ thống kê

Theo phương pháp xây dựng hình ảnh đồ họa, có:

    sơ đồ- biểu diễn đồ họa của dữ liệu thống kê, thể hiện rõ ràng mối quan hệ giữa các giá trị được so sánh.

    bản đồ thống kê

Có các loại biểu đồ chính sau: đường, thanh, dải, khu vực, hình vuông, hình tròn, đường cong.

biểu đồ đườngđược sử dụng để mô tả động lực học, tức là đánh giá sự biến đổi của hiện tượng theo thời gian. Trục hoành hiển thị các khoảng thời gian hoặc ngày tháng và tọa độ hiển thị các mức của một loạt động lực. Một số biểu đồ có thể được đặt trên một biểu đồ, cho phép bạn so sánh động lực của các chỉ số khác nhau hoặc một chỉ báo cho các khu vực hoặc quốc gia khác nhau.

Hình.2. Động lực nhập khẩu ô tô du lịch tại Liên bang Nga

cho 2006-1q. 2010

biểu đồ thanh có thể được sử dụng:

    phân tích động thái của các hiện tượng kinh tế - xã hội;

    đánh giá việc thực hiện quy hoạch;

    đặc điểm của sự biến đổi trong chuỗi phân phối;

    để so sánh không gian (so sánh giữa các vùng lãnh thổ, quốc gia, doanh nghiệp);

    để nghiên cứu cấu trúc của hiện tượng.

Các cột được đặt gần hoặc riêng biệt ở cùng một khoảng cách. Chiều cao của các cột phải tỷ lệ thuận với các giá trị số của các mức tính năng.

Hình 3. Động lực chia sẻ của Belarus trong kim ngạch thương mại của Liên bang Nga với các nước SNG

Để đặc trưng cho cấu trúc của các hiện tượng kinh tế - xã hội được sử dụng rộng rãi biểu đồ tròn. Để xây dựng nó, vòng tròn phải được chia thành các phần theo tỷ lệ trọng lượng riêng của các phần trong tổng thể tích. Tổng khối lượng riêng bằng 100%, tương ứng với tổng khối lượng của hiện tượng đang nghiên cứu.

Hình.4. Phân bố địa lý kim ngạch thương mại giữa Liên bang Nga và các nước CIS

biểu đồ thanh bao gồm các hình chữ nhật được sắp xếp theo chiều ngang (sọc).

Đôi khi để phân tích so sánh theo khu vực, các quốc gia sử dụng sơ đồ ký hiệu hình(sơ đồ các hình hình học). Các sơ đồ này phản ánh kích thước của đối tượng nghiên cứu phù hợp với kích thước khu vực của nó.

bản đồ thống kêđược sử dụng để đánh giá sự phân bố địa lý của các hiện tượng và phân tích so sánh theo lãnh thổ.

Bản đồ thống kê bao gồm bản đồ và bản đồ. Sự khác biệt giữa chúng nằm ở cách hiển thị số liệu thống kê trên bản đồ.

bản đồ cho thấy sự phân bố theo lãnh thổ của tính trạng đang được nghiên cứu trong các khu vực riêng biệt và được sử dụng để xác định các kiểu phân bố này. Bản đồ được chia thành nền và điểm. Các bản đồ nền có mật độ màu khác nhau đặc trưng cho cường độ của bất kỳ chỉ số nào trong một đơn vị lãnh thổ. Trên bản đồ chấm, mức độ của hiện tượng đã chọn được mô tả bằng các dấu chấm.

bản đồ- đây là sự kết hợp của bản đồ địa lý hoặc sơ đồ của nó với sơ đồ. Nó cho phép bạn phản ánh các chi tiết cụ thể của từng khu vực trong sự phân bố của hiện tượng đang nghiên cứu, các đặc điểm cấu trúc của nó.

Hiện tại, nhiều gói phần mềm đồ họa máy tính đã được phát triển, chẳng hạn như Excel, Statgraf, Statistica.

Dữ liệu thống kê nên được trình bày theo cách mà chúng có thể được sử dụng. Có 3 hình thức trình bày dữ liệu thống kê chính:

1) văn bản - bao gồm dữ liệu trong văn bản;

2) dạng bảng - trình bày dữ liệu dưới dạng bảng;

3) đồ họa - biểu thức của dữ liệu dưới dạng biểu đồ.

Dạng văn bản được sử dụng khi có một lượng nhỏ dữ liệu số.

Dạng bảng được sử dụng thường xuyên nhất, vì đây là dạng trình bày dữ liệu thống kê hiệu quả hơn. Không giống như các bảng toán học, theo các điều kiện ban đầu, cho phép thu được kết quả này hoặc kết quả khác, các bảng thống kê cho biết ngôn ngữ của các con số về các đối tượng đang nghiên cứu.

bảng thống kê- Đây là một hệ thống các hàng và cột, trong đó các thông tin thống kê về các hiện tượng kinh tế - xã hội được trình bày theo một trình tự và mối liên hệ nhất định.

Bảng 2. Ngoại thương của Liên bang Nga 2000 - 2006, tỷ đô la

Mục lục 2000 2001 2002 2003 2004 2005 2006
kim ngạch ngoại thương 149,9 155,6 168,3 280,6 368,9 468,4
Xuất khẩu 101,9 107,3 135,9 183,2 243,6 304,5
Nhập khẩu 44,9 53,8 76,1 97,4 125,3 163,9
cán cân thương mại 60,1 48,1 46,3 59,9 85,8 118,3 140,7
bao gồm:
với nước ngoài
xuất khẩu 90,8 86,6 90,9 114,6 210,1 261,1
nhập khẩu 31,4 40,7 48,8 77,5 103,5 138,6
cán cân thương mại 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Ví dụ, trong bảng. 2 trình bày thông tin về ngoại thương của Nga, sẽ không hiệu quả để thể hiện ở dạng văn bản.

Phân biệt chủ thểThuộc tính bảng thống kê. Chủ đề chỉ ra đối tượng được đặc trưng - đơn vị dân số, hoặc nhóm đơn vị hoặc toàn bộ tổng thể. Trong vị ngữ, đặc điểm của chủ đề được đưa ra, thường ở dạng số. Bắt buộc tiêu đề bảng, cho biết dữ liệu trong bảng thuộc về danh mục nào và thời gian nào.

Theo tính chất của đối tượng, bảng thống kê được chia thành đơn giản, nhómtổ hợp. Trong chủ đề của một bảng đơn giản, đối tượng nghiên cứu không được chia thành các nhóm, nhưng một danh sách tất cả các đơn vị dân số được đưa ra hoặc toàn bộ dân số được chỉ định (ví dụ: Bảng 11). Trong chủ đề của bảng nhóm, đối tượng nghiên cứu được chia thành các nhóm theo một thuộc tính và vị ngữ cho biết số lượng đơn vị trong các nhóm (tuyệt đối hoặc theo tỷ lệ phần trăm) và các chỉ số tóm tắt cho các nhóm (ví dụ: Bảng 4). Trong chủ đề của bảng kết hợp, dân số được chia thành các nhóm không phải theo một mà theo một số tiêu chí (ví dụ: Bảng 2).

Khi xây dựng các bảng, bạn phải được hướng dẫn bởi những điều sau đây quy tắc chung.

1. Chủ đề của bảng nằm ở phần bên trái (ít thường xuyên hơn - phía trên) và vị ngữ - ở bên phải (ít thường xuyên hơn - thấp hơn).

2. Tiêu đề cột ghi tên chỉ tiêu và đơn vị tính.

3. Dòng cuối cùng hoàn thành bảng và nằm ở cuối bảng, nhưng đôi khi nó là dòng đầu tiên: trong trường hợp này, dòng thứ hai được viết là “bao gồm”, và các dòng tiếp theo chứa các thành phần của dòng tổng.

4. Dữ liệu số được ghi với độ chính xác như nhau trong mỗi cột, chữ số của số nằm dưới chữ số, phần nguyên cách nhau bằng dấu phẩy phân số.

5. Không được có các ô trống trong bảng: nếu dữ liệu bằng 0 thì đặt dấu “–” (dấu gạch ngang); nếu không biết dữ liệu thì ghi “không có thông tin” hoặc ghi dấu “…” (dấu chấm lửng). Nếu giá trị số mũ không bằng 0, nhưng chữ số có nghĩa đầu tiên xuất hiện sau mức độ chính xác được chấp nhận, thì 0,0 được ghi lại (ví dụ: nếu mức độ chính xác 0,1 được chấp nhận).

Đôi khi các bảng thống kê được bổ sung bằng các biểu đồ khi mục tiêu là nhấn mạnh một số tính năng của dữ liệu, để so sánh chúng. Hình thức đồ họa là hình thức trình bày dữ liệu hiệu quả nhất về mặt nhận thức của họ. Với sự trợ giúp của các biểu đồ, khả năng hiển thị các đặc điểm của cấu trúc, động lực học, mối quan hệ của các hiện tượng và sự so sánh của chúng đã đạt được.

đồ thị thống kê- đây là những hình ảnh có điều kiện về các giá trị số và tỷ lệ của chúng thông qua các đường kẻ, hình dạng hình học, hình vẽ hoặc biểu đồ địa lý. Dạng đồ họa tạo điều kiện thuận lợi cho việc xem xét dữ liệu thống kê, làm cho chúng trực quan, biểu cảm và có thể nhìn thấy được. Tuy nhiên, biểu đồ có những hạn chế nhất định: trước hết, một biểu đồ không thể bao gồm nhiều dữ liệu như nó có thể chứa trong một bảng; Ngoài ra, biểu đồ luôn hiển thị dữ liệu được làm tròn - không chính xác, nhưng gần đúng. Như vậy, biểu đồ chỉ dùng để thể hiện tình hình chung chứ không thể hiện chi tiết. Hạn chế cuối cùng là sự phức tạp của âm mưu. Nó có thể được khắc phục bằng máy tính cá nhân (ví dụ: "Trình hướng dẫn sơ đồ" từ gói Microsoft OfficeExcel).

Theo phương pháp xây dựng đồ họa, chúng được chia thành sơ đồ, bản đồsơ đồ biểu đồ.

Cách phổ biến nhất để biểu diễn dữ liệu bằng đồ họa là các biểu đồ, thuộc các loại sau: tuyến tính, xuyên tâm, tán xạ, phẳng, thể tích, xoăn. Loại sơ đồ phụ thuộc vào loại dữ liệu được trình bày và nhiệm vụ xây dựng. Trong mọi trường hợp, biểu đồ phải có tiêu đề đi kèm - bên trên hoặc bên dưới trường biểu đồ. Tiêu đề cho biết chỉ báo nào được hiển thị, cho lãnh thổ nào và trong thời gian nào.

Biểu đồ đường được sử dụng để biểu diễn các biến định lượng: đặc điểm của sự thay đổi giá trị của chúng, động lực học, mối quan hệ giữa các biến. Biến thể dữ liệu được phân tích bằng cách sử dụng khu vực phân phối, tích lũy(nhỏ hơn đường cong) và xin lỗi(đường cong "lớn hơn"). Đa giác phân phối được thảo luận trong Chủ đề 4 (ví dụ: Hình 5.). Để xây dựng một tích lũy, các giá trị của tính năng biến được vẽ dọc theo trục hoành và tọa độ là tổng tần số hoặc tần số tích lũy (từ f1đến ∑ f). Để xây dựng một ogive, tổng số tần số tích lũy được đặt trên trục y theo thứ tự ngược lại (từ ∑ f trước f1). Tích lũy và ogive theo Bảng. 4. mô tả trong hình. 1.

Cơm. 1. Cộng trừ phân bổ hàng hóa theo trị giá hải quan

Việc sử dụng biểu đồ đường trong phân tích xu hướng được đề cập trong Chủ đề 5 (ví dụ: Hình 13) và việc sử dụng chúng để phân tích liên kết trong Chủ đề 6 (ví dụ: Hình 21). Chủ đề 6 cũng đề cập đến việc sử dụng biểu đồ phân tán (ví dụ: Hình 20).

Biểu đồ đường được chia nhỏ thành một chiều, được sử dụng để biểu diễn dữ liệu trên một biến duy nhất và hai chiều- cho hai biến. Ví dụ về biểu đồ đường một chiều là đa giác phân phối và biểu đồ hai chiều là đường hồi quy (ví dụ: Hình 21).

Đôi khi, với những thay đổi lớn trong chỉ báo, thang logarit được sử dụng. Ví dụ: nếu các giá trị của chỉ báo thay đổi từ 1 đến 1000, thì điều này có thể gây khó khăn khi vẽ đồ thị. Trong những trường hợp như vậy, chúng chuyển sang logarit của các giá trị chỉ báo, giá trị này sẽ không khác nhau nhiều: lg 1 = 0, lg 1000 = 3.

Giữa phẳng Biểu đồ thanh (biểu đồ) được phân biệt theo tần suất sử dụng, trong đó chỉ báo được trình bày dưới dạng thanh, chiều cao tương ứng với giá trị của chỉ báo (ví dụ: Hình 4).

Tỷ lệ diện tích của một hình hình học cụ thể với giá trị của chỉ báo làm cơ sở cho các loại sơ đồ phẳng khác: hình tam giác, quảng trường, hình hộp chữ nhật. Bạn cũng có thể sử dụng phép so sánh diện tích của hình tròn - trong trường hợp này, bán kính của hình tròn được đặt.

biểu đồ dải trình bày các chỉ số ở dạng hình chữ nhật kéo dài theo chiều ngang và nếu không thì giống như biểu đồ thanh.

Trong số các sơ đồ phẳng, nó thường được sử dụng biểu đồ tròn, được sử dụng để minh họa cấu trúc của dân số được nghiên cứu. Toàn bộ tập hợp được lấy là 100%, nó tương ứng với tổng diện tích của hình tròn, diện tích của các cung tương ứng với các phần của tập hợp. Hãy xây dựng sơ đồ ngành về cơ cấu ngoại thương của Liên bang Nga năm 2006 theo Bảng. 2 (xem hình 2). Khi sử dụng các chương trình máy tính, các sơ đồ ngành được xây dựng ở dạng ba chiều, nghĩa là không phải ở hai mà ở ba mặt phẳng (xem Hình 3).

Cơm. 2. Biểu đồ tròn đơn giản 3. Biểu đồ tròn 3D

Biểu đồ xoăn (hình ảnh) nâng cao độ rõ nét của hình ảnh, vì chúng bao gồm hình ảnh của chỉ báo được hiển thị, kích thước tương ứng với kích thước của chỉ báo.

Khi vẽ biểu đồ, mọi thứ đều quan trọng như nhau - lựa chọn đúng hình ảnh đồ họa, tỷ lệ, tuân thủ các quy tắc thiết kế biểu đồ. Những vấn đề này được đề cập chi tiết hơn trong và.

Bản đồ và bản đồ được sử dụng để mô tả các đặc điểm địa lý của các hiện tượng đang được nghiên cứu. Chúng cho thấy vị trí của hiện tượng đang được nghiên cứu, cường độ của nó trong một lãnh thổ nhất định - trong một nước cộng hòa, khu vực, khu kinh tế hoặc hành chính, v.v. Việc xây dựng bản đồ và bản đồ được xem xét trong tài liệu đặc biệt, chẳng hạn.

Kết thúc công việc -

Chủ đề này thuộc về:

Khái niệm thống kê. Đối tượng và phương pháp thống kê

Khái niệm thống kê.. đối tượng và phương pháp thống kê.. quan sát thống kê..

Nếu bạn cần tài liệu bổ sung về chủ đề này hoặc bạn không tìm thấy những gì bạn đang tìm kiếm, chúng tôi khuyên bạn nên sử dụng tìm kiếm trong cơ sở dữ liệu tác phẩm của chúng tôi:

Chúng tôi sẽ làm gì với tài liệu nhận được:

Nếu tài liệu này hữu ích cho bạn, bạn có thể lưu nó vào trang của mình trên các mạng xã hội:

Tất cả các chủ đề trong phần này:

Đối tượng và phương pháp thống kê
Thuật ngữ "thống kê" được đưa vào sử dụng khoa học bởi nhà khoa học người Đức Gottfried Achenwal vào năm 1746, người đã đề xuất thay thế tiêu đề của khóa học "Nghiên cứu Nhà nước" được giảng dạy tại các trường đại học Đức bằng "St.

quan sát thống kê
Mọi người có thái độ khác nhau đối với thông tin thống kê: một số không nhận thức được nó, những người khác tin tưởng vô điều kiện, và những người khác vẫn đồng ý với ý kiến ​​​​của chính trị gia người Anh Disraeli: “Có 3 loại nói dối: nói dối,

Tổng hợp và phân nhóm thống kê
Tóm tắt - xử lý các tài liệu quan sát được tổ chức một cách khoa học (theo chương trình đã phát triển trước đó), bao gồm, ngoài việc kiểm soát bắt buộc đối với dữ liệu được thu thập, hệ thống hóa, nhóm

giá trị tuyệt đối
Để mô tả các hiện tượng khối lượng, thống kê sử dụng các đại lượng thống kê (chỉ số) đặc trưng cho các nhóm đơn vị hoặc tổng thể (hiện tượng) nói chung. số lượng thống kê

Giá trị tương đối
Một giá trị tương đối là kết quả của việc chia (so sánh) hai giá trị tuyệt đối. Tử số của phân số là giá trị được so sánh và mẫu số là giá trị được so sánh với (ba

Giá trị trung bình
Như đã nói nhiều lần trước đây, thống kê nghiên cứu các hiện tượng và quá trình khối lượng. Mỗi hiện tượng này đều có cả tính chất chung của cả tập hợp và tính chất riêng, đặc biệt.

Xây dựng chuỗi phân phối
Các đặc điểm được nghiên cứu bằng thống kê khác nhau (khác nhau) đối với các đơn vị dân số khác nhau trong cùng một khoảng thời gian hoặc thời điểm. Ví dụ, giá trị kim ngạch ngoại thương thay đổi

Tính toán các đặc điểm cấu trúc của chuỗi phân phối
Khi nghiên cứu sự thay đổi, các đặc điểm như vậy của chuỗi phân phối được sử dụng để mô tả định lượng cấu trúc, cấu trúc của nó. Ví dụ, như vậy là trung vị - giá trị của thuộc tính biến

Tính toán số đo độ lớn và cường độ biến thiên
Chỉ số đơn giản nhất là phạm vi biến đổi - sự khác biệt tuyệt đối giữa giá trị tối đa và tối thiểu của một tính trạng so với các giá trị có sẵn trong quần thể nghiên cứu (24):

Tính toán các khoảnh khắc phân phối và các chỉ số ở dạng của nó
Để nghiên cứu sâu hơn về bản chất của biến thể, các giá trị trung bình của các mức độ sai lệch khác nhau của các giá trị riêng lẻ của một đặc điểm so với giá trị trung bình số học của nó được sử dụng. Các chỉ số này được gọi là

Kiểm tra xem chuỗi phân phối có bình thường không
Đường cong phân phối lý thuyết được hiểu là biểu diễn đồ họa của một chuỗi dưới dạng một đường thay đổi tần số liên tục trong một chuỗi biến thiên, liên quan về mặt chức năng với sự thay đổi trong các tùy chọn, khác

Kiểm tra chuỗi phân phối có tuân theo định luật Poisson hay không
Kiểm tra hải quan đã tiến hành kiểm tra sau khi giải phóng hàng hóa. Kết quả là, đã thu được chuỗi phân phối riêng biệt sau đây về số lượng vi phạm được xác định trong mỗi thử nghiệm (Bảng 16). Bảng 1

Các chỉ tiêu tuyệt đối và tương đối của sự thay đổi cơ cấu
Sự phát triển của quần thể thống kê không chỉ thể hiện ở sự tăng giảm về số lượng của các phần tử trong hệ thống mà còn thể hiện ở sự thay đổi cấu trúc của nó. Cấu trúc là cấu trúc của tổng hợp

Xếp hạng các chỉ số thay đổi cơ cấu
Để đo lường sự khác biệt trong cấu trúc, các chỉ báo ít chính xác hơn nhưng dễ tính toán hơn thường được sử dụng, dựa trên việc đánh giá sự khác biệt không phải về giá trị của chính cổ phiếu, mà theo thứ hạng của chúng, nghĩa là thứ tự

Khái niệm quan sát chọn lọc
Phương pháp lấy mẫu được sử dụng khi việc sử dụng quan sát liên tục là bất khả thi về mặt vật lý do lượng dữ liệu khổng lồ hoặc không khả thi về mặt kinh tế. Có một sự bất khả thi về thể chất

Phương pháp xét nghiệm
1. Lựa chọn ngẫu nhiên trên thực tế: tất cả các đơn vị của HS đều được đánh số, các số do bốc thăm tương ứng với các đơn vị rơi vào mẫu, số lượng bằng với số dự kiến

Lỗi lấy mẫu trung bình
Sau khi hoàn thành việc lựa chọn số lượng đơn vị cần thiết trong mẫu và đăng ký các đặc điểm của các đơn vị này do chương trình quan sát cung cấp, họ tiến hành tính toán các chỉ số tổng quát hóa. cho họ từ

Lỗi lấy mẫu cận biên
Xét rằng trên cơ sở điều tra mẫu, không thể đánh giá chính xác đặc điểm chung của HS, cần phải tìm ra các giới hạn mà nó nằm trong đó. Trong một mẫu cụ thể, sự khác biệt

Cỡ mẫu yêu cầu
Khi phát triển một chương trình quan sát có chọn lọc, họ được cung cấp một giá trị cụ thể của sai số biên và mức xác suất. Cỡ mẫu tối thiểu cung cấp một giá trị nhất định

hướng dẫn
Nhiệm vụ. Tại doanh nghiệp, 100 công nhân trong số 1000 công nhân đã được phỏng vấn theo thứ tự mẫu ngẫu nhiên không lặp lại và thu được dữ liệu về thu nhập của họ trong tháng như sau (bảng 24): Ta

Khái niệm chuỗi thời gian
Một trong những nhiệm vụ quan trọng nhất của thống kê là nghiên cứu sự thay đổi của các chỉ số được phân tích theo thời gian, tức là tính năng động của chúng. Vấn đề này được giải quyết bằng cách phân tích chuỗi động lực (chuỗi thời gian).

Các chỉ số thay đổi mức độ của một loạt các động lực
Việc phân tích chuỗi thời gian bắt đầu bằng việc xác định mức độ thay đổi của chuỗi (tăng, giảm hoặc không thay đổi) về mặt tuyệt đối và tương đối. để theo dõi

Các chỉ số trung bình của một loạt các động lực
Mỗi chuỗi động thái có thể được coi là một tập hợp nhất định của n chỉ số thay đổi theo thời gian, có thể được tóm tắt dưới dạng các giá trị trung bình. Các chỉ số tổng quát (trung bình) như vậy đặc biệt

Phương pháp xác định xu hướng chính (trend) trong chuỗi động thái
Một trong những nhiệm vụ chính của việc nghiên cứu chuỗi động lực là xác định xu hướng chính (mẫu) trong việc thay đổi cấp độ của chuỗi, được gọi là xu hướng. Thường xuyên thay đổi cấp độ của một loạt trong một số trường hợp

Đánh giá và dự báo mức độ phù hợp của xu hướng
Đối với phương trình xu hướng được tìm thấy, cần đánh giá độ tin cậy (mức độ phù hợp) của nó, thường được thực hiện bằng tiêu chí Fisher, so sánh giá trị tính toán Fр của nó

Phân tích theo mùa
Trong chuỗi động thái, mức độ là các chỉ số hàng tháng hoặc hàng quý, cùng với các biến động ngẫu nhiên, thường quan sát thấy các biến động theo mùa, được hiểu là định kỳ

hướng dẫn
Theo Cục Thống kê Nhà nước Liên bang, cán cân ngoại thương (SVT) của Nga giai đoạn 2000-2006. được đặc trưng bởi một số động lực học được trình bày trong Bảng. 36. Bảng 36. Cán cân ngoại thương (CBT) của Nga đối với p

Khái niệm về sự phụ thuộc tương quan
Một trong những quy luật chung nhất của thế giới khách quan là quy luật về mối liên hệ phổ biến và sự phụ thuộc giữa các sự vật hiện tượng. Đương nhiên, khi điều tra các hiện tượng trong các lĩnh vực đa dạng nhất, số liệu thống kê chắc chắn sẽ va chạm

Phương pháp xác định và đánh giá mối tương quan
Một số phương pháp được sử dụng trong thống kê để xác định sự hiện diện và bản chất của mối tương quan giữa hai tính năng. 1. Xem xét dữ liệu song song (kn

Hệ số tương quan xếp hạng
Các hệ số tương quan xếp hạng kém chính xác hơn, nhưng dễ tính toán hơn, là các chỉ số phi tham số để đo lường mức độ gần gũi của mối quan hệ giữa hai đặc điểm tương quan. Bao gồm các

Đặc điểm tương quan của chuỗi thời gian
Trong nhiều nghiên cứu, cần phải nghiên cứu đồng thời động lực của một số chỉ số, tức là xem xét một số chuỗi thời gian song song. Trong trường hợp này, cần phải đo lường sự phụ thuộc

Các chỉ số về mức độ chặt chẽ của mối quan hệ giữa các tính năng định tính
Phương pháp bảng tương quan không chỉ áp dụng cho định lượng mà còn cho các đặc điểm mô tả (định tính), mối quan hệ giữa chúng thường phải được nghiên cứu khi tiến hành các nhà xã hội học khác nhau.

nhiều tương quan
Khi giải quyết các vấn đề thực tế, các nhà nghiên cứu phải đối mặt với thực tế là các mối tương quan không chỉ giới hạn ở mối quan hệ giữa hai tính năng: y hiệu quả và yếu tố x. trong hành động

Mục đích và các loại chỉ số
Chỉ số là một giá trị tương đối cho thấy mức độ của hiện tượng được nghiên cứu trong những điều kiện nhất định khác với mức độ của cùng một hiện tượng trong những điều kiện khác bao nhiêu lần. Sự khác biệt về điều kiện có thể là

chỉ số cá nhân
Giá trị tương đối thu được bằng cách so sánh các mức được gọi là chỉ số riêng nếu cấu trúc của hiện tượng đang nghiên cứu không quan trọng. Các chỉ số riêng lẻ được ký hiệu là i

chỉ số chung
Nếu hiện tượng đang nghiên cứu không đồng nhất và chỉ có thể so sánh các cấp độ sau khi đưa chúng về một thước đo chung, thì phân tích kinh tế được thực hiện bằng các chỉ số chung. Chỉ số trở thành chung

Chỉ số trung bình
Khi nghiên cứu các chỉ tiêu định tính, người ta thường xem xét sự thay đổi theo thời gian (hoặc không gian) của giá trị trung bình của một chỉ tiêu đã định tính đối với một tổng thể thuần nhất nhất định.

chỉ số lãnh thổ
Các chỉ số lãnh thổ được sử dụng để so sánh không gian, liên vùng của các chỉ số khác nhau. Tính toán của chúng phức tạp hơn so với tính toán của các chỉ số (động) truyền thống được xem xét

BIỂU DIỄN HÌNH ẢNH CỦA DỮ LIỆU THỐNG KÊ, một phương pháp biểu diễn trực quan và khái quát hóa dữ liệu về các hiện tượng kinh tế xã hội thông qua hình ảnh hình học, hình vẽ hoặc sơ đồ địa lý và giải thích cho chúng. Biểu diễn đồ họa của dữ liệu thống kê thể hiện rõ ràng và trực quan mối quan hệ giữa các hiện tượng và quá trình của đời sống xã hội, xu hướng phát triển chính của chúng, mức độ phân bố của chúng trong không gian; cho phép bạn nhìn thấy cả tổng thể của các hiện tượng và các bộ phận riêng lẻ của nó.

Để trình bày đồ họa của dữ liệu thống kê, các loại biểu đồ thống kê khác nhau được sử dụng. Mỗi biểu đồ bao gồm một hình ảnh đồ họa và các yếu tố phụ trợ. Chúng bao gồm: giải thích biểu đồ, tham chiếu không gian, tham chiếu tỷ lệ, trường biểu đồ. Các yếu tố phụ giúp có thể đọc, hiểu và sử dụng biểu đồ. Đồ thị có thể được phân loại theo một số tính năng: tùy thuộc vào hình dạng của hình ảnh đồ họa, chúng có thể là điểm, đường, phẳng, không gian và cong. Theo phương pháp xây dựng đồ họa, chúng được chia thành sơ đồ và bản đồ thống kê.

Cách phổ biến nhất của hình ảnh đồ họa là một sơ đồ. Đây là một bản vẽ trong đó dữ liệu thống kê được trình bày dưới dạng hình dạng hình học hoặc ký hiệu và lãnh thổ mà những dữ liệu này liên quan chỉ được biểu thị bằng lời nói. Nếu sơ đồ được đặt chồng lên bản đồ địa lý hoặc sơ đồ lãnh thổ mà dữ liệu thống kê liên quan, thì biểu đồ được gọi là sơ đồ bản đồ. Nếu dữ liệu thống kê được hiển thị bằng cách tô bóng hoặc tô màu lãnh thổ tương ứng trên bản đồ hoặc sơ đồ địa lý, thì biểu đồ được gọi là bản đồ.

Các loại biểu đồ khác nhau có thể được sử dụng để so sánh dữ liệu thống kê tương tự mô tả các đối tượng hoặc lãnh thổ khác nhau. Rõ ràng nhất là biểu đồ thanh, trong đó dữ liệu thống kê được hiển thị dưới dạng hình chữ nhật kéo dài theo chiều dọc. Độ rõ của chúng đạt được bằng cách so sánh chiều cao của các cột (Hình 1).

Nếu đường cơ sở thẳng đứng và các thanh nằm ngang, thì biểu đồ được gọi là biểu đồ dải. Hình 2 cho thấy một biểu đồ thanh so sánh đặc trưng cho lãnh thổ của địa cầu.

Các biểu đồ dành cho mục đích phổ biến đôi khi được xây dựng dưới dạng các số liệu tiêu chuẩn - các hình vẽ đặc trưng cho dữ liệu thống kê được hiển thị, điều này làm cho biểu đồ trở nên biểu cảm hơn và thu hút sự chú ý đến nó. Các sơ đồ như vậy được gọi là xoăn hoặc hình ảnh (Hình 3).

Một nhóm lớn các đồ thị biểu thị là sơ đồ cấu trúc. Phương pháp biểu diễn đồ họa của cấu trúc dữ liệu thống kê bao gồm vẽ các biểu đồ hình tròn hoặc hình tròn cấu trúc (Hình 4).

Đối với hình ảnh và phân tích sự phát triển của các hiện tượng theo thời gian, các sơ đồ động lực học được xây dựng: thanh, dải, hình vuông, hình tròn, tuyến tính, xuyên tâm, v.v. Việc lựa chọn loại sơ đồ phụ thuộc vào đặc điểm của dữ liệu ban đầu, Mục đích nghiên cứu. Ví dụ: nếu có một loạt các động lực có mức độ không bằng nhau về thời gian (1913, 1940, 1950, 1980, 2000, 2005), thì các biểu đồ thanh, hình vuông hoặc hình tròn sẽ được sử dụng. Chúng ấn tượng về mặt hình ảnh, được ghi nhớ rõ ràng, nhưng không phù hợp để mô tả một số lượng lớn các cấp độ. Nếu số lượng cấp độ trong một chuỗi động lực lớn, thì các sơ đồ tuyến tính được sử dụng để tái tạo quá trình phát triển dưới dạng một đường đứt đoạn liên tục (Hình 5).

Khá thường xuyên, một số đường cong được hiển thị trên một biểu đồ đường, cung cấp mô tả so sánh về động lực học của các chỉ báo khác nhau hoặc cùng một chỉ báo ở các quốc gia khác nhau (Hình 6).

Để hiển thị sự phụ thuộc của một chỉ số này vào một chỉ số khác, một sơ đồ mối quan hệ được xây dựng. Một chỉ báo được coi là X và chỉ báo kia là Y (tức là một hàm của X). Một hệ tọa độ hình chữ nhật với các tỷ lệ cho các chỉ số được xây dựng và một biểu đồ được vẽ trong đó (Hình 7).

Sự phát triển của công nghệ máy tính và phần mềm ứng dụng đã cho phép tạo ra các hệ thống thông tin địa lý (GIS), đại diện cho một giai đoạn mới về chất trong việc biểu diễn thông tin bằng đồ họa. GIS cung cấp việc thu thập, lưu trữ, xử lý, truy cập, hiển thị và phân phối dữ liệu được điều phối theo không gian; bao gồm một số lượng lớn cơ sở dữ liệu đồ họa và chuyên đề kết hợp với các chức năng tính toán và mô hình cho phép trình bày thông tin ở dạng không gian (bản đồ), thu được bản đồ điện tử nhiều lớp của khu vực ở các tỷ lệ khác nhau. Theo phạm vi lãnh thổ, các loại GIS toàn cầu, tiểu lục địa, tiểu bang, khu vực và địa phương được phân biệt. Định hướng chủ đề của một hệ thống thông tin địa lý được xác định bởi các nhiệm vụ được giải quyết với sự trợ giúp của nó, trong đó có thể có kiểm kê tài nguyên, phân tích, đánh giá, giám sát, quản lý và lập kế hoạch.

Lit.: Gerchuk Ya. P. Phương pháp đồ họa trong thống kê. M., 1968; Lý thuyết Thống kê / Chỉnh sửa bởi R. A. Shmoylova. tái bản lần thứ 4. M., 2005. S. 150-83.

Biểu đồ thống kê là một bản vẽ trong đó các quần thể thống kê được đặc trưng bởi các chỉ số nhất định được mô tả bằng các hình ảnh hoặc dấu hiệu hình học có điều kiện. Trong đồ thị thống kê, hệ tọa độ chữ nhật thường được sử dụng nhất, nhưng cũng có những đồ thị dựa trên nguyên tắc tọa độ cực (đồ thị tròn).

Phân loại các loại biểu đồ:

a) phương pháp xây dựng hình ảnh đồ họa;

b) các dấu hiệu hình học mô tả các chỉ số và mối quan hệ thống kê;

c) các nhiệm vụ được giải quyết với sự trợ giúp của hình ảnh đồ họa.

Biểu đồ thống kê ở dạng hình ảnh đồ họa:

1. Tuyến tính: đường cong thống kê.

2. Mặt phẳng: thanh, dải, hình vuông, hình tròn, cung, quăn, chấm, nền.

3. Thể tích: các bề mặt phân bố.

Biểu đồ thống kê theo phương pháp dựng hình và tác vụ:

1. Các biểu đồ: biểu đồ so sánh, biểu đồ động lực học, biểu đồ cơ cấu (cách gọi chung nhất của hình ảnh đồ họa. Đây là các biểu đồ về quan hệ lượng chất).

2. Bản đồ thống kê: bản đồ, bản đồ (đồ thị phân bố định lượng trên bề mặt. Với mục đích chính, chúng gần kề với sơ đồ và chỉ cụ thể theo nghĩa chúng là hình ảnh có điều kiện của dữ liệu thống kê trên bản đồ địa lý đường viền, tức là , chúng hiển thị phân phối không gian hoặc phân phối không gian của số liệu thống kê)

10/ Số tuyệt đối

chỉ tiêu tuyệt đối phản ánh các kích thước vật lý của các quá trình và hiện tượng được nghiên cứu bằng thống kê, cụ thể là khối lượng, diện tích, thể tích, chiều dài, đặc điểm thời gian của chúng. Chúng luôn được đặt tên là số. Thể hiện trong tự nhiên, giá trị hoặc lao độngđơn vị đo lường.

Đơn vị tự nhiên - tấn, km, lít, thùng, cái.

Các đơn vị tự nhiên có điều kiện được sử dụng khi một sản phẩm có nhiều loại và tổng khối lượng chỉ có thể được xác định trên cơ sở thuộc tính tiêu dùng chung cho tất cả các loại. Việc chuyển đổi thành các đơn vị thông thường được thực hiện trên cơ sở các hệ số đặc biệt được tính bằng tỷ lệ giữa các đặc tính tiêu dùng của từng loại sản phẩm với giá trị tham chiếu.

Các đơn vị đo lường chi phí đưa ra đánh giá bằng tiền về các hiện tượng kinh tế xã hội (giá trị GDP). Các đơn vị đo lường lao động cho phép tính đến tổng chi phí lao động tại doanh nghiệp và cường độ lao động của các hoạt động riêng lẻ của quy trình công nghệ (ngày công, giờ công).

Các chỉ số tuyệt đối riêng lẻ thu được trực tiếp trong quá trình quan sát thống kê do kết quả của đặc điểm định lượng quan tâm.

Tổng hợp các chỉ tiêu tuyệt đối về khối lượng thu được bằng cách tóm tắt và nhóm các giá trị riêng lẻ.

11/ Các chỉ tiêu tương đối

Chỉ tiêu tương đối là kết quả của việc chia một chỉ tiêu tuyệt đối này cho một chỉ tiêu tuyệt đối khác và biểu thị tỷ lệ giữa các đặc điểm định lượng của các hiện tượng kinh tế - xã hội.

Nếu không có các chỉ số tương đối, không thể đo lường kịp thời cường độ phát triển của hiện tượng đang nghiên cứu, đánh giá mức độ phát triển của một hiện tượng so với nền tảng của các hiện tượng khác có liên quan đến nó, để tiến hành so sánh không gian và lãnh thổ.

Khi tính một chỉ tiêu tương đối, chỉ tiêu tuyệt đối nằm ở tử số của tỷ lệ kết quả được gọi là hiện tại hoặc so sánh, và số mũ trong mẫu số được gọi là cơ sở so sánh hoặc cơ sở.

Các chỉ số tương đối có thể được biểu thị bằng hệ số, tỷ lệ phần trăm, ppm, số thập phân hoặc chúng có thể được đặt tên theo giá trị. Tỷ lệ phần trăm được sử dụng trong trường hợp chỉ số tuyệt đối được so sánh vượt quá cơ sở không quá 2-3 lần. Nếu ưu thế lớn hơn, thì hệ số được sử dụng.

Có những điều sau đây các loại chỉ tiêu tương đối.

    Chỉ tiêu tương đối của động lực học (RDI) là tỷ số giữa mức độ của quá trình hoặc hiện tượng đang nghiên cứu trong một khoảng thời gian nhất định và mức độ của hiện tượng tương tự trong quá khứ. OPD được đo bằng phần trăm hoặc được biểu thị bằng hệ số.

    Giá trị này cho biết mức hiện tại lớn hơn đường cơ sở bao nhiêu lần hoặc tỷ lệ của đường cơ sở đó là bao nhiêu. Nếu GPV được biểu thị dưới dạng bội số, thì đó là yếu tố tăng trưởng. Khi hệ số này được nhân với 100, tốc độ tăng trưởng sẽ thu được.

    Chỉ tiêu tương đối của kế hoạch (RPI) là tỷ lệ giữa mức kế hoạch của chỉ tiêu so với chỉ tiêu đã đạt được trong quá khứ. ROP, giống như RAP, được thể hiện dưới dạng phần trăm hoặc tỷ lệ.

    Chỉ số thực hiện kế hoạch tương đối (PRRP) là tỷ lệ giữa mức độ thực tế đạt được so với mức độ kế hoạch của chỉ số. PRRP cũng được thể hiện dưới dạng phần trăm hoặc theo tỷ lệ.

    Chỉ số cấu trúc tương đối (RPS) là tỷ lệ giữa các bộ phận cấu trúc của đối tượng nghiên cứu và được xác định bằng tỷ lệ giữa chỉ tiêu đặc trưng cho một bộ phận dân số với chỉ tiêu đặc trưng cho toàn bộ dân số. OPS được thể hiện dưới dạng phân số của đơn vị hoặc dưới dạng phần trăm.

    Chỉ số phối hợp tương đối (RIC) - tỷ lệ các phần khác nhau thuộc về một đối tượng.

    Chỉ số so sánh tương đối (RPCr) là tỷ lệ của các chỉ số tuyệt đối cùng tên đặc trưng cho các đối tượng khác nhau.

    Chỉ số cường độ tương đối (RII) đặc trưng cho mức độ lan truyền của quá trình hoặc hiện tượng đang nghiên cứu trong môi trường vốn có của nó và được xác định bằng tỷ lệ của chỉ số đặc trưng cho hiện tượng với chỉ số đặc trưng cho môi trường phân bố hiện tượng này. OPI được đo bằng phần trăm, ppm, decimille. Chỉ số này được tính toán khi giá trị tuyệt đối không đủ để đưa ra kết luận hợp lý về quy mô của hiện tượng. Một loạt các OPII là các chỉ số trình độ phát triển kinh tếđặc trưng cho sản lượng GDP bình quân đầu người, kim ngạch thương mại bình quân đầu người, v.v. Các chỉ số về mức độ phát triển kinh tế là các giá trị được đặt tên và được tính bằng rúp trên đầu người, v.v.

§1.Khái niệm thống kê, tính đều đặn thống kê, tính tổng thể..... 2

§2. Dấu hiệu của các đơn vị dân số thống kê, phân loại của chúng ...... 2

§1. Khái niệm về quan sát thống kê, sự chuẩn bị của nó ............... 4

§2. Các loại quan sát thống kê .............................................................. ................... .. 5

§3. Sai số quan sát ............................................................ ..................... ................... 6

§4. Tóm tắt và phân nhóm ............................................................ ............... ................. 6

§5. Các loại nhóm thống kê .............................................................. ............ 6

§6. Bảng thống kê ................................................................. ... ............ 7

§7. Biểu đồ thống kê ............................................................ ................................... 8

§1. Phân phối thực tế và lý thuyết .................................................. .21

§2. Đường cong phân phối chuẩn ............................................................ 21

§3. Kiểm định Giả thuyết về Phân phối Chuẩn....................................21

§4. Tiêu chí phù hợp: Pearson, Romanovsky, Kolmogorov........... 21

§5. Giá trị thực tiễn của mô hình chuỗi phân phối ..... 22

§1. Khái niệm quan sát chọn lọc. Lý do sử dụng ...... 23

§3. Lỗi lấy mẫu .................................................................. ............... 24

§4. Nhiệm vụ quan sát mẫu ............................................................ 25

§5. Mở rộng dữ liệu quan sát mẫu cho dân số chung... 26

§6. Mẫu nhỏ ............................................................. .............. ................ 26

§1. Khái niệm tương quan và CRA ......................................... 27

§2. Điều kiện sử dụng và giới hạn của KPA .............................. 27

§3. Hồi quy cặp theo phương pháp bình phương nhỏ nhất.. 28

§4. Ứng dụng của phương trình hồi quy tuyến tính ghép đôi ............ 29

§6. Đa tương quan.................................................. 32


Chủ đề 1.: Nhập môn thống kê.

  1. các khái niệm thống kê, quy luật thống kê và dân số.
  2. dấu hiệu của các đơn vị dân số thống kê, phân loại của họ.
  3. đối tượng và phương pháp thống kê.

§1.Khái niệm thống kê, tính đều đặn thống kê và tính toàn phần.

Từ thống kê bắt nguồn từ tiếng Latin “ trạng thái” trong bản dịch - một trạng thái, một trạng thái.

Thuật ngữ thống kê bắt nguồn từ nửa sau của thế kỷ 18. Liên quan đến kiến ​​​​thức về các trạng thái, nghiên cứu về các tính năng của chúng. Việc bắt đầu giảng dạy thống kê tại trường đại học cũng bắt đầu từ thời điểm đó. Tùy theo ngành nghiên cứu thống kê có: thống kê dân số, thống kê công nghiệp, nông nghiệp, v.v. - Thống kê áp dụng.

Lý thuyết chung về thống kê là tập hợp các phương pháp và kỹ thuật thu thập, xử lý, trình bày và phân tích dữ liệu số. Thuật ngữ thống kê được sử dụng ngày nay theo 3 nghĩa:

  1. như một từ đồng nghĩa với từ "dữ liệu"
  2. một nhánh ý nghĩa kết hợp các nguyên tắc và phương pháp làm việc với dữ liệu số đặc trưng cho các hiện tượng đại chúng (tuổi thọ của nam thấp hơn nữ)
  3. một nhánh của hoạt động thực tế nhằm xử lý và phân tích dữ liệu số

Thống kê giúp xác định và đo lường mô hình phát triển của các quá trình và hiện tượng kinh tế - xã hội, cũng như mối quan hệ giữa chúng trong những điều kiện cụ thể về địa điểm và thời gian.

Tính quy luật đề cập đến sự lặp lại, trình tự và thứ tự của những thay đổi trong các hiện tượng.

Tính quy luật thống kê - tính quy luật trong đó tính tất yếu gắn bó chặt chẽ với nhau trong từng hiện tượng riêng lẻ với tính ngẫu nhiên và chỉ trong vô số hiện tượng mới biểu hiện thành quy luật. Khái niệm về quy luật thống kê bị phản đối bởi khái niệm về quy luật động biểu hiện trong mọi hiện tượng. (ví dụ: S circle =pr 2 than > r chủ đề > S circle). Đối tượng của nghiên cứu thống kê là tập hợp thống kê - tập hợp các đơn vị có tính chất đại chúng, tính đồng nhất, được xác định bởi tính toàn vẹn và sự có mặt của biến thiên. Mỗi phần tử riêng lẻ được gọi là một đơn vị tổng thể thống kê (ESS)

§2. Dấu hiệu của các đơn vị dân số thống kê, phân loại của họ.

ECC có một số thuộc tính được gọi là tính năng. Thống kê nghiên cứu các hiện tượng thông qua các đặc trưng của chúng, tập hợp càng đồng nhất thì các đơn vị của nó càng có nhiều đặc trưng chung và giá trị của các đặc trưng này càng ít biến đổi.

Dấu hiệu miêu tả là dấu hiệu chỉ được biểu đạt bằng lời nói.

  1. Dấu hiệu định lượng - một dấu hiệu có thể được biểu thị bằng số.
  2. Dấu hiệu trực tiếp là thuộc tính trực tiếp vốn có trong đối tượng đặc trưng.
  3. Một dấu hiệu gián tiếp là các thuộc tính không phải của chính đối tượng được đặc trưng, ​​​​mà của đối tượng được liên kết với nó hoặc được bao gồm trong nó.
  4. thuộc tính chính là một giá trị tuyệt đối có thể đo lường được.
  5. tính năng phụ - kết quả so sánh các tính năng chính, nó được đo lường trực tiếp.
  6. ký tự nhiên - đo bằng đơn vị, kg, tấn, lít, v.v.
  7. dấu hiệu lao động - tính bằng ngày công, giờ công.
  8. thuộc tính giá trị - được đo bằng rúp, $, €, ₤.
  9. ký hiệu không thứ nguyên - đo lường bằng cổ phiếu,%
  10. một tính năng thay thế là một tính năng chỉ lấy một giá trị trong số một số giá trị có thể.
  11. dấu rời rạc - chỉ nhận một giá trị nguyên, không có giá trị trung gian.
  12. một tính năng liên tục là một tính năng nhận bất kỳ giá trị nào trong một phạm vi nhất định.
  13. Một đặc điểm nhân tố là một đặc điểm làm thay đổi một đặc điểm khác.
  14. đặc điểm hiệu quả - một đặc điểm thay đổi theo đặc điểm khác
  15. dấu hiệu tạm thời - một dấu hiệu được đo tại một thời điểm nhất định.
  16. dấu khoảng - một dấu hiệu trong một khoảng thời gian nhất định.

Cùng một tính năng có thể được phân loại đồng thời theo các cách phân loại khác nhau.

§3. Đối tượng và phương pháp thống kê.

Đối tượng của nghiên cứu thống kê là tổng hợp thống kê - một tập hợp các đối tượng khác nhau về chất lượng.

Các chi tiết cụ thể của chủ đề thống kê xác định các chi tiết cụ thể của phương pháp, chúng bao gồm:

  1. thu thập dữ liệu (quan sát thống kê, xuất bản)
  2. khái quát hóa dữ liệu (tóm tắt, nhóm)
  3. trình bày dữ liệu (bảng và đồ thị)
  4. phân tích và giải thích dữ liệu số (tính toán trung bình, phân tích các biến thể, KRA, chuỗi động lực học, chỉ số)

Chủ đề 2: Tổ chức quan sát thống kê.

Tổng hợp và nhóm dữ liệu.

§1. Khái niệm về quan sát thống kê, sự chuẩn bị của nó.

§2. Các loại quan sát thống kê.

§3 Sai số quan sát.

§4 Tóm tắt và phân nhóm

§5 Các loại phân nhóm thống kê.

§6 Bảng thống kê.

§7 Đồ thị thống kê.

§1. Khái niệm về quan sát thống kê, sự chuẩn bị của nó.

Bất kỳ nghiên cứu thống kê nào cũng bắt đầu bằng việc thu thập dữ liệu.

Nguồn thông tin:

  1. các ấn phẩm khác nhau (báo, tạp chí, v.v.)
  2. nguồn chính của thông tin thống kê được xuất bản là các ấn phẩm của cơ quan thống kê nhà nước (RF năm 2001, nhà xuất bản GOSKOMSTAT).
  3. thực hiện quan sát thống kê, tức là tổ chức thu thập dữ liệu một cách khoa học.

Quan sát thống kê là quan sát hàng loạt, có kế hoạch, được tổ chức khoa học về các hiện tượng của đời sống kinh tế - xã hội, bao gồm việc đăng ký các dấu hiệu cho từng đơn vị dân số được nghiên cứu.

Quá trình quan sát:

  1. Chuẩn bị cho quan sát
  2. Tiến hành thu thập dữ liệu hàng loạt
  3. Chuẩn bị dữ liệu để xử lý
  4. Phát triển các đề xuất để cải thiện quan sát thống kê.

Chuẩn bị quan sát:

  1. Xác định mục đích, đối tượng quan sát
  2. Xác định thành phần của dấu hiệu phải đăng ký
  3. Xây dựng tài liệu thu thập dữ liệu
  4. Sự lựa chọn của đơn vị báo cáo và đơn vị mà việc quan sát sẽ được thực hiện.
  5. Nó là cần thiết để xác định các phương pháp và phương tiện để có được dữ liệu.

Các vấn đề tổ chức cần giải quyết:

  1. cần xác định thành phần của các dịch vụ tiến hành nghiên cứu
  2. tóm tắt nhân viên
  3. lập kế hoạch làm việc
  4. sao chép tài liệu để thu thập dữ liệu

Đối tượng quan sát là các hiện tượng, quá trình kinh tế - xã hội.

Cần xác định rõ các dấu hiệu để đăng ký.

Chương trình quan sát - một danh sách các biển báo phải đăng ký trong quá trình quan sát.

Yêu cầu chương trình quan sát:

  1. Chương trình nên chứa các tính năng thiết yếu đặc trưng trực tiếp cho hiện tượng đang nghiên cứu; các dấu hiệu có hiện tượng hoặc dấu hiệu phụ, các giá trị rõ ràng sẽ không đáng tin cậy hoặc sẽ hoàn toàn vắng mặt, không nên được đưa vào chương trình.
  2. Các câu hỏi của chương trình quan sát phải chính xác, không mơ hồ và dễ hiểu để tránh khó khăn trong việc tìm kiếm câu trả lời.
  3. Trình tự các câu hỏi nên được xác định.
  4. Chương trình giám sát nên bao gồm các câu hỏi có tính chất trực tiếp để tiến hành và làm rõ dữ liệu thu thập được.
  5. để đảm bảo tính đồng nhất của thông tin nhận được, chương trình được soạn thảo dưới dạng văn bản - gọi là biểu mẫu thống kê.

Một biểu mẫu thống kê là một tài liệu của một mẫu duy nhất có chứa một chương trình và kết quả quan sát.

Có sự khác biệt giữa dạng riêng lẻ (câu trả lời cho các câu hỏi trên một đơn vị quan sát) và dạng viết tắt (thông tin về một số đơn vị của tổng thể thống kê).

Biểu mẫu và hướng dẫn điền vào biểu mẫu là công cụ để quan sát thống kê.

Việc lựa chọn thời gian quan sát bao gồm giải quyết 2 câu hỏi: thiết lập ngày hoặc khoảng thời gian quan trọng, xác định thời gian quan sát.

Ngày quan trọng - một ngày cụ thể trong năm, giờ trong ngày mà các dấu hiệu phải được đăng ký cho từng đơn vị dân số được nghiên cứu.

Khoảng thời gian quan sát - thời gian mà các biểu mẫu thống kê được điền vào, tức là thời gian cần thiết để thu thập dữ liệu.

Cần lưu ý rằng khoảng cách của khoảng thời gian quan sát so với ngày hoặc khoảng thời gian quan trọng có thể dẫn đến giảm độ tin cậy của thông tin thu được.

§2. Các loại quan sát thống kê.

Trong thống kê trong nước, ba hình thức quan sát thống kê được sử dụng.

  1. báo cáo thống kê của doanh nghiệp, tổ chức, cơ quan.
  2. quan sát thống kê được tổ chức đặc biệt (điều tra dân số, v.v.)
  3. đăng ký - một hình thức giám sát thống kê liên tục các quy trình dài hạn

Quan sát thống kê được phân loại:

Theo thời gian quan sát:

  • quan sát hiện tại - đăng ký liên tục các dấu hiệu được thực hiện (văn phòng đăng ký, tội phạm, v.v.).
  • quan sát định kỳ - được thực hiện trong những khoảng thời gian nhất định (mức sống ở thành phố Chelyabinsk, chi phí của giỏ hàng tiêu dùng, điều tra dân số).
  • Một lần - một quan sát được thực hiện một lần cho một mục đích cụ thể.

Theo diện bao phủ đơn vị dân số:

  • Quan sát liên tục - phải thu thập thông tin về tất cả các ECC
  • Không phải là một quan sát đầy đủ
    • Phương pháp của mảng chính - các đơn vị quan trọng nhất của dân số được nghiên cứu được kiểm tra (để nghiên cứu doanh nghiệp kỹ thuật của vùng Chelyabinsk).
    • Quan sát chọn lọc là lựa chọn ngẫu nhiên các ECC được quan sát.
    • Quan sát chuyên khảo - khi một ECC được quan sát, chúng thường được sử dụng để xây dựng một chương trình quan sát hàng loạt.

Bằng cách thu thập dữ liệu:

  • Quan sát trực tiếp - chính những người đăng ký, bằng cách đo trực tiếp, cân, xác định thực tế của đối tượng được đăng ký (một đứa trẻ dưới 1 tuổi trong phòng khám đa khoa).
  • Quan sát tài liệu - các tài liệu khác nhau được sử dụng (lập một tuyên bố)

Thăm dò ý kiến ​​- thông tin cần thiết được lấy từ lời của người trả lời.

  • Khảo sát chuyển tiếp - được thực hiện bởi các nhân viên được đào tạo đặc biệt, những người nhận được thông tin cần thiết trên cơ sở khảo sát những người có liên quan và tự ghi lại các câu trả lời vào biểu mẫu. Khảo sát thám hiểm có thể là trực tiếp (trực tiếp) và gián tiếp (khảo sát qua điện thoại)
  • Khảo sát phóng viên - thông tin được cung cấp bởi đội ngũ phóng viên tự nguyện, phương pháp này đòi hỏi ít chi phí tài chính, nhưng không đưa ra giá trị chính xác của quan sát.
  • Tự đăng ký - các biểu mẫu được điền bởi chính người trả lời và các nhà đăng ký chỉ phân phát các biểu mẫu của bảng câu hỏi cho họ và giải thích cách điền chúng.

§3. lỗi quan sát

Yêu cầu chính áp dụng cho quan sát thống kê là độ chính xác.

Độ chính xác - mức độ tuân thủ của bất kỳ chỉ báo đặc trưng nào với giá trị thực được xác định từ các tài liệu quan sát thống kê.

Sự khác biệt giữa giá trị tính toán và giá trị thực được gọi là lỗi quan sát, tùy thuộc vào nguyên nhân xảy ra, người ta phân biệt: lỗi đăng ký và lỗi đại diện. Lỗi đăng ký được chia thành ngẫu nhiên và hệ thống.

Lỗi ngẫu nhiên - kết quả của các hành động của các yếu tố ngẫu nhiên (hàng, cột được trộn lẫn)

Lỗi hệ thống - luôn có xu hướng đánh giá quá cao hoặc đánh giá thấp chỉ báo. (tuổi)

Lỗi đại diện là bản chất của việc quan sát không liên tục và phát sinh do sao chép không chính xác mẫu của toàn bộ dân số ban đầu.

Sau khi nhận các biểu mẫu thống kê phải:

  1. kiểm tra tính đầy đủ của dữ liệu thu thập được.
  2. thực hiện kiểm soát số học dựa trên mối quan hệ của các tính năng khác nhau với nhau.
  3. để thực hiện kiểm soát logic dựa trên kiến ​​thức về mối quan hệ logic giữa các tính năng.

§4. Tóm tắt và phân nhóm

Dựa trên dữ liệu thu thập được, không thể tính toán và đưa ra kết luận, trước tiên, chúng cần được tóm tắt và tóm tắt trong một bảng duy nhất. Đối với những mục đích này, tóm tắt và nhóm được sử dụng.

Tóm tắt - một tập hợp các hoạt động tuần tự để khái quát hóa các sự kiện đơn lẻ cụ thể tạo thành một tập hợp và xác định các đặc điểm và mô hình điển hình vốn có trong toàn bộ hiện tượng đang nghiên cứu.

Vodka đơn giản - đếm tổng số cho dân số.

Một bản tóm tắt phức tạp là một tập hợp các hoạt động để nhóm các quan sát riêng lẻ, đếm kết quả cho từng nhóm và cho toàn bộ đối tượng và trình bày kết quả dưới dạng bảng thống kê.

Theo hình thức xử lý tài liệu, bản tóm tắt có thể được phân cấp, tập trung - một bản tóm tắt như vậy được thực hiện với quan sát thống kê một lần.

Phân nhóm - phân chia tập hợp các đơn vị dân số được nghiên cứu thành các nhóm theo các đặc điểm nhất định.

§5. Các loại nhóm thống kê

Các nhóm có thể được phân loại theo cấu trúc và nội dung.

Nhóm phân tích đặc trưng cho mối quan hệ giữa các tính năng, một trong số đó là một yếu tố và cái kia là hiệu quả.

giáo dục

Không đầy đủ cao

§6. bảng thống kê

Các kết quả của việc tóm tắt và phân nhóm nên được trình bày theo cách mà chúng có thể được sử dụng.

Có 3 cách trình bày dữ liệu:

  1. dữ liệu có thể được bao gồm trong văn bản.
  2. trình bày dưới dạng bảng.
  3. cách đồ họa

Bảng thống kê - một hệ thống các hàng và cột trong đó các thông tin thống kê về các hiện tượng kinh tế - xã hội được trình bày theo một trình tự nhất định.

Phân biệt chủ ngữ, vị ngữ của bảng.

Chủ ngữ là một đối tượng được đặc trưng bởi các con số, thông thường chủ ngữ được cho ở phía bên trái của bảng.

Vị từ là một hệ thống các chỉ số mà đối tượng được đặc trưng.

Bảng thống kê gồm 3 loại tiêu đề: chung, phụ

Tiêu đề chung phải phản ánh nội dung của toàn bộ bảng, nằm phía trên bảng ở trung tâm.

Nội quy bảng.

  1. cả ba loại tiêu đề không có từ viết tắt là bắt buộc, đơn vị đo lường thông dụng có thể được đặt trong tiêu đề.
  2. bảng không được có thêm dòng, có thể thiếu các dấu dọc.
  3. Dòng cuối cùng là bắt buộc. Nó có thể ở đầu hoặc ở cuối tài liệu. Nếu ở đầu tài liệu thì nếu ở cuối thì TỔNG:
  1. dữ liệu kỹ thuật số trong một cột được ghi lại với một mức độ chính xác. Các chữ số được viết chặt chẽ dưới các chữ số, toàn bộ phần được phân tách bằng dấu phẩy.
  2. bảng không được chứa các ô trống, nếu không có dữ liệu thì ghi “Không có thông tin” hoặc “…”, nếu dữ liệu bằng 0 thì ghi “-”. Nếu giá trị không bằng 0 nhưng chữ số có nghĩa đầu tiên xuất hiện sau độ chính xác đã chỉ định 0,01®0,0 - nếu độ chính xác được chấp nhận lên đến phần mười.
  3. nếu có nhiều cột trong bảng thì các cột của chủ ngữ được biểu thị bằng chữ in hoa và các cột của vị ngữ được biểu thị bằng số.
  4. nếu bảng dựa trên dữ liệu mượn, thì nguồn dữ liệu được chỉ định bên dưới bảng, nếu cần, bảng có thể được kèm theo ghi chú.

§7. đồ thị thống kê

Các bảng thống kê có thể được bổ sung bằng các biểu đồ.

Biểu đồ thống kê là hình ảnh có điều kiện của các giá trị số và tỷ lệ của chúng thông qua các đường, hình hình học, hình vẽ.

Ưu điểm của hình ảnh đồ họa

  1. rõ ràng, dễ thấy, biểu cảm.
  2. các giới hạn thay đổi của chỉ báo, tỷ lệ thay đổi và biến động so sánh có thể nhìn thấy ngay lập tức

Nhược điểm của một hình ảnh đồ họa

  1. Bao gồm ít dữ liệu hơn trong bảng.
  2. biểu đồ hiển thị dữ liệu được làm tròn, tình hình chung, nhưng không phải là chi tiết.

đồ thị thống kê

sơ đồ

quăn

Chuyên đề 3: Các chỉ tiêu thống kê.

§1. Bản chất và ý nghĩa của một chỉ tiêu thống kê, các thuộc tính của nó.

§2. Phân loại chỉ tiêu thống kê.

§3. Các loại chỉ tiêu tương đối. Nguyên lý thi công.

§4. Các hệ thống chỉ tiêu thống kê.

Dấu hiệu thống kê là thuộc tính vốn có trong KTTT, nó tồn tại một cách khách quan từ việc nó có được nghiên cứu với tư cách là một khoa học hay không.

Một chỉ số thống kê là một đặc điểm tổng quát của một số tài sản của dân số.

Cấu trúc của một chỉ tiêu thống kê (các thuộc tính của nó):

  • Giá trị trung bình
  • chỉ số biến đổi
  • Chỉ báo kết nối tính năng
  • Các chỉ tiêu về cơ cấu và tính chất phân phối
  • chỉ báo động
  • chỉ số biến đổi
  • Các chỉ số về độ chính xác và độ tin cậy của ước tính mẫu
  • Các chỉ số về độ chính xác và độ tin cậy của dự báo

Theo loại: tổng số đơn vị hoặc tổng thuộc tính của đối tượng. Đây là tổng các đặc điểm chính, được đo bằng đơn vị, kg, m, $, v.v.

chỉ số tương đối- thu được bằng cách so sánh các chỉ tiêu tuyệt đối hoặc tương đối trong không gian, theo thời gian hoặc bằng cách so sánh các chỉ tiêu thuộc các tính chất khác nhau của đối tượng nghiên cứu.

Chỉ báo tương đối bậc 1 thu được bằng cách so sánh 2 x chỉ báo tuyệt đối. Chỉ báo tương đối bậc 2 thu được bằng cách so sánh các chỉ báo tương đối bậc 1, v.v.

Chỉ số tương đối bậc 3 trở lên là rất hiếm.

Các chỉ số trực tiếp - các chỉ số như vậy, giá trị của chúng tăng lên cùng với sự gia tăng của hiện tượng đang nghiên cứu.

Các chỉ số nghịch đảo - các chỉ số có giá trị giảm khi hiện tượng đang được nghiên cứu gia tăng.

… cấu trúc

…diễn giả

…các mối quan hệ

… cường độ

… liên quan đến tiêu chuẩn

... phép so sánh

chỉ tiêu cơ cấu có được bằng cách liên hệ bộ phận với toàn thể.

Các chỉ số tương đối của động lực học

ü Các chỉ tiêu về tính năng động (tốc độ tăng trưởng, tốc độ tăng trưởng)

ü Chỉ số

chỉ số mối quan hệ Nêu mối quan hệ giữa các đặc trưng:

ü Hệ số tương quan

ü Chỉ số phân tích

chỉ số cường độđặc trưng cho mối quan hệ của hai đối tượng trên những cơ sở khác nhau.

ü Cường độ lao động - lượng thời gian được sử dụng để sản xuất một đơn vị sản phẩm

ü Sản xuất - số lượng sản phẩm được sản xuất trên một đơn vị thời gian

ĐẦU RA \u003d 1/ cường độ lao động

Các chỉ số về thái độ đối với tiêu chuẩn- tỷ lệ các giá trị thực tế của dấu hiệu của chỉ báo so với quy chuẩn, kế hoạch, tối ưu.

Các chỉ số so sánh - so sánh các đối tượng khác nhau trên cùng một cơ sở.

Nguyên tắc chung xây dựng chỉ tiêu thống kê:

  1. thống kê có quan hệ khách quan.
  2. Các chỉ số được so sánh chỉ có thể khác nhau ở một thuộc tính; bạn không thể so sánh một chỉ số theo hai hoặc nhiều thuộc tính.
  3. cần phải biết và tính đến các giới hạn của chỉ báo.

Đối với mỗi đặc điểm của đối tượng cần có hệ thống chỉ tiêu thống kê.

  1. chức năng nhận thức - dựa trên phân tích dữ liệu
  2. tuyên truyền
  3. chức năng kích thích

Chủ đề 4: Trung bình cộng

§1. khái niệm trung bình

§2. các loại trung bình

§3. trung bình cộng và tính chất của nó

§4. trung bình điều hòa, trung bình hình học, trung bình bậc hai.

§5. trung bình đa biến

Hình thức phổ biến nhất của các chỉ số thống kê là trung bình.

Tính chất quan trọng nhất của giá trị trung bình là nó phản ánh cái chung vốn có trong mỗi đơn vị dân số đang nghiên cứu, mặc dù giá trị thuộc tính của các đơn vị dân số riêng lẻ có thể dao động theo hướng này hay hướng khác.

Tính điển hình của giá trị trung bình có liên quan trực tiếp đến tính đồng nhất của dân số được nghiên cứu. Trong trường hợp dân số không đồng nhất, cần chia nó thành các nhóm đồng nhất về chất và tính giá trị trung bình cho từng nhóm đối với từng nhóm đồng nhất.

Bạn có thể xác định mức trung bình thông qua tỷ lệ ban đầu của mức trung bình (ISS) theo công thức logic của nó.

trung bình cấu trúc

Thời Trang - Mơ

trung bình - Tôi

Trong chuỗi động lực học, trung bình cộng và trung bình thời gian được tính toán.

trung bình cộng được gọi là giá trị trung bình của đối tượng trong phép tính sao cho tổng thể tích của đối tượng không thay đổi.

Ví dụ: trọng lượng.

Thứ Tư số học đơn giản

x Tôi– giá trị cá nhân của tính năng

n là tổng số dân số nghiên cứu

xem trọng số học

Thuộc tính cf. Môn số học.

Tổng độ lệch của các giá trị riêng lẻ của một đặc điểm so với giá trị trung bình của nó bằng không

nếu mỗi giá trị riêng lẻ của một tính năng được nhân hoặc chia cho cùng một số không đổi, thì giá trị trung bình sẽ tăng hoặc giảm theo cùng một lượng.

nếu một và cùng một số không đổi được thêm vào từng giá trị riêng lẻ của thuộc tính, thì giá trị trung bình sẽ thay đổi tương ứng theo cùng một số.

Bằng chứng

nếu các trọng số f của trung bình cộng được nhân hoặc chia cho cùng một số, thì trung bình sẽ không thay đổi.

tổng bình phương độ lệch của thuộc tính nhỏ hơn bất kỳ số nào khác.

Các loại trung bình khác

Loại giữa

trung bình đơn giản

Bình quân gia quyền

điều hòa

hình học

bậc hai

Rất khó để mô tả đặc điểm của nhóm trên một cơ sở và rất ít thông tin còn lại trong bộ nhớ.

Trung bình đa biến - giá trị trung bình cho một số tính năng E.S.S.

Từ tỷ lệ của các giá trị tính năng cho E.S. đến giá trị trung bình của các tính trạng này.

Trung bình đa biến cho tôi đơn vị

x ij– giá trị của tính năng j cho đơn vị i

Giá trị trung bình của tính năng j

k là số lượng tính năng

j là số lượng đối tượng và số lượng dân số của nó

Chủ đề 5: Phân tích biến thể

§1. Sự thay đổi của các dấu hiệu và nguyên nhân của nó

§2. cấp bậc phân phối

§3. Đặc điểm cấu tạo của dãy biến thiên.

§4. Sức mạnh của các chỉ số biến thể.

§5. Chỉ số cường độ biến đổi

§6. các loại phân tán. Quy tắc cộng phương sai.

Sự thay đổi giá trị của một đối tượng địa lý trong tổng thể là sự khác biệt về giá trị của nó giữa các đơn vị khác nhau của một tổng thể nhất định trong cùng một khoảng thời gian hoặc thời điểm.

Lý do cho sự thay đổi: các điều kiện khác nhau cho sự tồn tại của ESS, chính sự thay đổi tạo ra nhu cầu về một ngành khoa học như thống kê.

Thực hiện phân tích biến phân bắt đầu bằng việc xây dựng một chuỗi biến phân - một phân bố có thứ tự của các đơn vị dân số theo các dấu hiệu tăng hoặc giảm và đếm các tần số tương ứng.

cấp bậc phân phối

ü xếp hạng

ü rời rạc

ü khoảng thời gian

Chuỗi biến thể được xếp hạng- một danh sách các đơn vị cá nhân. tổng hợp theo thứ tự tăng dần của tính năng được xếp hạng

Chuỗi biến thể rời rạc - một bảng gồm 2 hàng - các giá trị polime của một tính trạng biến đổi và số đơn vị có giá trị tính trạng cho trước.

Một chuỗi biến phân khoảng được xây dựng trong các trường hợp sau:

  1. tính năng nhận các giá trị rời rạc, nhưng số lượng của chúng quá lớn
  2. thuộc tính nhận bất kỳ giá trị nào trong một phạm vi nhất định

Khi xây dựng chuỗi biến thiên khoảng, cần chọn số nhóm tối ưu, phương pháp phổ biến nhất là sử dụng công thức Sturgess

k - số khoảng thời gian

n là khối lượng dân số

Trong các phép tính, hầu như luôn thu được các giá trị phân số, làm tròn thành một số nguyên.

Độ dài khoảng thời gian - tôi

các loại khoảng thời gian

giới hạn dưới của khoảng thời gian tiếp theo lặp lại giới hạn trên của khoảng thời gian tiếp theo

khoảng mở, khoảng có một biên

Khi tính toán cho một chuỗi biến thiên khoảng, giá trị giữa của khoảng được lấy là x i.

NME =60 trung vị = 1

Tích lũy - phân phối nhỏ hơn

Ogiva – phân phối lớn hơn

Trung vị là giá trị của một tính năng chia toàn bộ dân số thành hai phần bằng nhau.

Đối với một chuỗi biến thiên rời rạc, cách tính trung vị: nếu n chẵn thì S. Đơn vị trung vị

Chuỗi biến thiên khoảng:

k - số khoảng thời gian

x 0 - giới hạn dưới của khoảng trung vị

tôi là độ dài của khoảng trung bình

Tổng các tần số

Tần suất tích lũy của khoảng trước trung vị.

Tần số khoảng thời gian trung bình

Khoảng thời gian trung bình– khoảng đầu tiên có tần số tích lũy vượt quá một nửa tổng các tần số.

Về mặt đồ họa, trung vị nằm trên tích lũy.

  1. Quartiles - giá trị của thuộc tính chia dân số thành 4 phần bằng nhau.

phần tư thứ nhất

phần tư thứ 3

phần tư thứ 2 - trung vị.

xq 1 x Q 3 - giới hạn dưới của khoảng chứa phần tư thứ 1 và thứ 3.

l - chiều dài khoảng

và - tần số tích lũy của các khoảng của các khoảng trước đó chứa phần tư thứ 1 và thứ 3.

Tần suất của các khoảng tứ phân vị.

Để mô tả chuỗi biến thể, những điều sau đây được sử dụng:

Deciles - chia dân số thành 10 phần bằng nhau, Percitiles - chia dân số thành 100 phần bằng nhau.

  1. Chế độ là một đặc điểm tính năng thường xuyên xảy ra. Đối với một chuỗi biến thể rời rạc - tần số cao nhất. Đối với một chuỗi biến thiên khoảng thời gian, chế độ được tính bằng công thức sau:

Giới hạn dưới của khoảng phương thức

tôi- độ dài khoảng phương thức

fMo- tần số khoảng phương thức

f Mo +1 là tần số của khoảng theo phương thức

Khoảng thời gian phương thức - khoảng thời gian có tần số cao nhất. Về mặt đồ họa, chế độ được tìm thấy trên biểu đồ.

  1. biến thể nhịp
  2. Độ lệch tuyến tính trung bình

có trọng số

  1. phân tán:

có trọng số

  1. độ lệch chuẩn

tính chất phân tán.

  1. việc giảm tất cả các giá trị của một tính năng theo cùng một lượng không làm thay đổi giá trị của phương sai.
  2. Giảm tất cả các giá trị tính năng xuống k lần sẽ giảm phương sai xuống đến 2 lần và RMS trong ĐẾN một lần
  3. nếu bạn tính bình phương trung bình của các độ lệch so với bất kỳ giá trị A nào khác với giá trị trung bình số học, thì giá trị đó sẽ luôn lớn hơn bình phương trung bình của các độ lệch được tính từ giá trị trung bình cộng. Do đó, từ giá trị trung bình luôn nhỏ hơn tính từ bất kỳ giá trị nào khác, tức là nó có tài sản tối thiểu. RMS = 1,25 - với phân phối gần bình thường.

Trong điều kiện phân phối chuẩn, có mối quan hệ sau giữa và số lượng quan sát trong 68,3% số quan sát.

95,4% quan sát nằm trong giới hạn

99,7% quan sát nằm trong giới hạn

Để so sánh sự biến đổi của các tính trạng trong các quần thể khác nhau hoặc so sánh sự biến đổi của các tính trạng khác nhau trong cùng một quần thể, người ta dùng chỉ thị tương đối, cơ sở là trung bình cộng.

  1. Khoảng biến thiên tương đối.
  2. Độ lệch tuyến tính tương đối
  3. hệ số biến thiên

các chỉ số này không chỉ đưa ra đánh giá so sánh mà còn hình thành nên tính đồng nhất của dân số. Tập hợp được coi là đồng nhất nếu hệ số biến thiên không vượt quá 33%.

Cùng với việc nghiên cứu sự biến đổi của một tính trạng trong toàn bộ quần thể, người ta thường phải theo dõi những thay đổi về số lượng của tính trạng đó, nhưng đối với các nhóm mà quần thể được phân chia và giữa chúng. Điều này đạt được bằng cách tính toán các chế độ xem khác nhau.

Các loại phân tán:

  1. Tổng phương sai
  2. Phương sai giữa các nhóm
  3. Phương sai trong nhóm (dư)

1. đo lường sự biến đổi của một tính trạng trong toàn bộ quần thể dưới tác động của tất cả các nhân tố gây ra sự biến đổi đó

Ví dụ: tiêu thụ sữa chua: dựa trên mẫu 100 người

Địa vị xã hội

x i -giá trị cá nhân của tính năng

Giá trị trung bình của tính trạng trên toàn bộ quần thể

tần suất của tính năng này.

  1. 2. đặc trưng cho sự biến đổi của tính trạng dưới tác động của tính trạng của nhân tố quy định nhóm.

nhóm trung bình

Điểm trung bình chung của nhóm

Tần suất theo nhóm

  1. 3. đặc trưng cho sự biến đổi của một tính trạng dưới ảnh hưởng của các yếu tố không được bao gồm trong nhóm

x ijtôi tính năng giá trị trong nhóm j

Giá trị trung bình của tính năng trong j nhóm

f ij - tần sốtính năng thứ i trongnhóm j

Có một quy tắc nối 3 loại phương sai, nó được gọi là quy tắc cộng phương sai.

phân tán còn lại bởi j nhóm

Tổng các tần số trên j nhóm

N là tổng các tần số

nhiệm vụ chính của phân tích chuỗi biến phân là xác định các mẫu phân bố tần số.

Đường cong phân phối là một biểu diễn đồ họa dưới dạng một đường thay đổi tần số liên tục trong một chuỗi biến thể trong một thay đổi liên quan đến chức năng trong giá trị của một tính năng.

Đường cong phân phối có thể được vẽ bằng đa giác và biểu đồ. Nên giảm phân phối theo kinh nghiệm thành lý thuyết, thành một trong những hình thức được nghiên cứu kỹ lưỡng.

Đường cong của phân phối chuẩn.

Có các loại đường cong phân phối sau:

  1. đơn thức
  2. nhiều đỉnh

Quần thể đồng nhất được đặc trưng bởi các đường cong đơn đỉnh, đường cong nhiều đỉnh biểu thị tính không đồng nhất của quần thể và nhu cầu sắp xếp lại.

Việc tìm ra bản chất chung của phân phối liên quan đến việc đánh giá tính đồng nhất của nó và tính toán độ lệch và độ nhọn. Đối với phân phối đối xứng

Đối với một nghiên cứu so sánh về sự bất đối xứng của các phân phối khác nhau, hệ số bất đối xứng As được tính toán.

Khoảnh khắc trung tâm của thứ tự thứ ba; - RMS lập phương;

Nếu thì sự bất đối xứng có ý nghĩa

Nếu như<0, то As – левосторонняя, если As>0 thì As thuận tay phải.

Nếu thì As không đáng kể. Đối với đối xứng và không đối xứng vừa phải, chỉ số nhọn được tính: nếu E k > 0 thì phân phối đạt cực đại, nếu E k<0, то распределение плосковершинное.

Sự thay đổi của tính năng thay thế được biểu hiện định lượng như sau.

0 - đơn vị không có tính năng này;

1 - đơn vị có tính năng này;

r- tỷ lệ các đơn vị có tính năng này;

q- tỷ lệ các đơn vị không có tính năng này;

Sau đó p+q=1.

Tính năng thay thế nhận 2 giá trị 0 và 1 với trọng số Pq.

Dấu hiệu trực tiếp- đây là những dấu hiệu, giá trị của chúng tăng lên cùng với sự gia tăng của hiện tượng đang nghiên cứu.

Biển báo ngược - các dấu hiệu, cường độ giảm khi hiện tượng đang nghiên cứu tăng lên.

Tạo (trực tiếp)

Cường độ lao động (đảo ngược)

Phương sai tối đa của cổ phiếu là 0,25.

Chủ đề 6: Mô hình hóa chuỗi phân phối.

§1. Phân phối thực tế và lý thuyết

§2. Đường cong của phân phối chuẩn.

§3. Kiểm định giả thuyết về phân phối chuẩn.

§4. Tiêu chí đồng ý: Pearson, Romanovsky, Kolmogorov.

§5. Giá trị thực tiễn của mô hình chuỗi phân phối.

§1. Phân phối thực tế và lý thuyết

Một trong những mục tiêu quan trọng nhất của việc nghiên cứu chuỗi phân phối là phát hiện ra mô hình phân phối và xác định bản chất của nó. Các mẫu phân phối chỉ được biểu hiện rõ ràng nhất với một số lượng lớn các quan sát.

Phân phối thực tế có thể được mô tả bằng đồ thị bằng cách sử dụng đường cong phân phối - được mô tả bằng đồ thị dưới dạng một đường thay đổi tần suất liên tục trong chuỗi biến thể của biến thể có chức năng liên quan đến thay đổi.

Đường cong phân phối lý thuyết được hiểu là đường cong của loại phân phối này nói chung loại trừ ảnh hưởng của các yếu tố ngẫu nhiên đối với tính quy luật.

Phân phối lý thuyết có thể được biểu thị bằng một công thức giải tích được gọi là công thức giải tích. Phổ biến nhất là phân phối bình thường.

§2. Đường cong của phân phối chuẩn.

Luật phân phối chuẩn:

y là tung độ của phân phối chuẩn

t là độ lệch chuẩn hóa.

; e=2,7218; tôi - tùy chọn chuỗi biến thể; - trung bình;

Của cải:

Hàm phân phối chuẩn là chẵn, tức là f(t)=f(-t), . Hàm phân phối chuẩn hoàn toàn được xác định bởi độ lệch chuẩn.

§3. Kiểm định giả thuyết về phân phối chuẩn.

Nguyên nhân dẫn đến quy luật phân phối thường xuyên là do sự phụ thuộc do tác động của nhiều nguyên nhân ngẫu nhiên, không nguyên nhân nào chiếm ưu thế. Nếu Mo = Me được tính trong chuỗi biến thiên, thì điều này có thể cho thấy sự gần gũi với phân phối chuẩn. Bài kiểm tra chính xác nhất về việc tuân thủ luật thông thường được thực hiện bằng các tiêu chí đặc biệt.

§4. Tiêu chí đồng ý: Pearson, Romanovsky, Kolmogorov.

Tiêu chí của Pearson.

tần số lý thuyết

tần số thực nghiệm

Phương pháp tính tần số lý thuyết.

  1. Giá trị trung bình số học được xác định và theo chuỗi biến thiên khoảng thời gian, t được tính cho mỗi khoảng thời gian.
  2. Ta tìm giá trị của mật độ xác suất cho luật phân phối chuẩn hóa. TRANG 49
  3. Chúng tôi tìm thấy tần số lý thuyết.

l - chiều dài khoảng

- tổng tần số thực nghiệm

- mật độ xác suất

làm tròn giá trị thành số nguyên

  1. Tính toán tỷ lệ của Pearson
  2. bảng giá trị

d.f. – số khoảng thời gian – 3

d.f. là số bậc tự do.

  1. nếu > , thì phân phối không bình thường, tức là giả thuyết về một phân phối bình thường bị hủy bỏ. Nếu như< , то распределение является нормальным.

tiêu chí Romanovsky.

Tiêu chí của Pearson được tính toán;

Số độ.

Nếu với<3, то распределение близко к нормальному.

Tiêu chí Kolmogorov

, D- giá trị tối đa giữa tần số thực nghiệm và lý thuyết tích lũy. Một điều kiện cần thiết để sử dụng Kolmogorov: Số lượng quan sát lớn hơn 100. Theo một bảng xác suất đặc biệt, có thể lập luận rằng phân phối này là bình thường.

§5. Giá trị thực tiễn của mô hình chuỗi phân phối.

  1. khả năng áp dụng các quy luật phân phối chuẩn vào phân phối thực nghiệm.
  2. khả năng sử dụng quy tắc 3 x sigma.
  3. Khả năng tránh các tính toán tốn thời gian và chi phí bổ sung, bằng cách kiểm tra dân số, biết rằng phân phối là bình thường.

Chủ đề 7: Quan sát có chọn lọc.

§1. Khái niệm quan sát chọn lọc. Lý do sử dụng nó.

§2. Các loại quan sát chọn lọc.

§3. lỗi lấy mẫu.

§4. Nhiệm vụ quan sát mẫu

§5. Phân phối dữ liệu quan sát mẫu cho dân số nói chung.

§6. mẫu nhỏ.

§1. Khái niệm quan sát chọn lọc. Lý do sử dụng nó.

quan sát có chọn lọc - một quan sát không liên tục như vậy, trong đó các đơn vị dân số được nghiên cứu, được lựa chọn theo một cách nhất định, được kiểm tra thống kê.

Mục đích (nhiệm vụ) của quan sát mẫu: đối với phần được kiểm tra, để mô tả toàn bộ dân số của các đơn vị tuân theo tất cả các quy tắc và nguyên tắc quan sát thống kê.

Lý do sử dụng quan sát chọn lọc:

  1. tiết kiệm vật tư, chi phí lao động và thời gian;
  2. cơ hội nghiên cứu chi tiết và chi tiết hơn các đơn vị riêng lẻ của dân số thống kê và các nhóm của họ.
  3. một số vấn đề cụ thể chỉ có thể được giải quyết bằng cách sử dụng quan sát chọn lọc.
  4. quan sát chọn lọc có thẩm quyền và được tổ chức tốt mang lại độ chính xác cao của kết quả.

Dân số nói chung là tập hợp các đơn vị mà từ đó việc lựa chọn được thực hiện.

Khung lấy mẫu là tập hợp các đơn vị được chọn để khảo sát. Trong thống kê, người ta thường phân biệt giữa các tham số của tổng thể chung và tổng thể mẫu.

Các loại lấy mẫu

Theo phương thức tuyển chọn:

Lặp đi lặp lại

Đơn vị được đưa vào mẫu, sau khi đăng ký các đặc điểm được quan sát, được đưa trở lại dân số chung để tham gia vào quy trình lựa chọn tiếp theo.

Khối lượng của dân số nói chung không thay đổi, điều này dẫn đến lượng truy cập không đổi trong mẫu của bất kỳ đơn vị nào.

không lặp lại

Một đơn vị được lấy mẫu không được trả lại cho tổng thể mà từ đó việc lựa chọn được thực hiện.

Phương pháp lựa chọn:

thực tế-ngẫu nhiên là liên quan đến các đơn vị từ dân số nói chung một cách ngẫu nhiên hoặc ngẫu nhiên mà không có bất kỳ yếu tố nhất quán nào. Tuy nhiên, trước khi tiến hành một mẫu như vậy, người ta phải đảm bảo rằng tất cả các đơn vị của tổng thể đều có cơ hội như nhau để được đưa vào mẫu, tức là trong danh sách đầy đủ các đơn vị của tổng thể thống kê không được bỏ sót hoặc bỏ qua các đơn vị riêng lẻ. Cũng cần phải thiết lập rõ ràng ranh giới của dân số nói chung. Lựa chọn được thiết lập về mặt kỹ thuật được thực hiện bằng cách bốc thăm hoặc sử dụng bảng số ngẫu nhiên.

lấy mẫu cơ học (mỗi 5 trong danh sách) được sử dụng trong trường hợp dân số nói chung được sắp xếp theo cách nào đó, tức là có một trình tự nhất định trong việc phân phối các đơn vị. Khi tiến hành chọn mẫu cơ giới, tỷ lệ chọn lọc được xác lập, tỷ lệ này được xác lập bằng tỷ lệ giữa tổng thể chung và tổng thể mẫu.

Nguy cơ sai sót trong lấy mẫu cơ học có thể xuất hiện do: sự trùng hợp ngẫu nhiên của khoảng thời gian đã chọn và các mô hình theo chu kỳ trong việc sắp xếp các đơn vị của tổng thể.

lấy mẫu khoanh vùng được sử dụng khi tất cả các đơn vị của dân số nói chung có thể được chia thành các nhóm (khu vực, quốc gia) theo một số thuộc tính.

Mẫu kết hợp.

Việc lựa chọn các đơn vị có thể được thực hiện:

  1. hoặc tỷ lệ với quy mô của nhóm
  2. hoặc tỷ lệ thuận với sự khác biệt giữa các nhóm của tính trạng
  3. , trong đó n là cỡ mẫu, N là cỡ của tổng thể chung, n Tôi cỡ mẫu Tôi-nhóm, N Tôiâm lượng Tôi mẫu.
  4. - Phương pháp này chính xác hơn nhưng trong quá trình lấy mẫu rất khó xác định trước về sự biến động. (trước khi quan sát).

lựa chọn nối tiếp.

Nó được sử dụng khi các ECC được kết hợp thành các nhóm nhỏ (sê-ri), ví dụ, bao bì có thành phẩm, nhóm học sinh. Bản chất của lấy mẫu nối tiếp là loạt được chọn bằng phương pháp ngẫu nhiên hoặc cơ học, sau đó tiến hành khảo sát liên tục trong loạt đã chọn.

Lựa chọn kết hợp.

Đây là sự kết hợp của các phương pháp lựa chọn đã thảo luận ở trên, thường sử dụng kết hợp giữa sê-ri điển hình và sê-ri, tức là. lựa chọn hàng loạt từ một số nhóm tiêu biểu.

Việc lựa chọn cũng có thể là nhiều giai đoạn và một giai đoạn, nhiều cụm từ và một cụm từ.

Lựa chọn nhiều giai đoạn: từ tổng thể chung, đầu tiên, các nhóm lớn hơn được trích xuất, sau đó là các nhóm nhỏ hơn, v.v. cho đến khi các đơn vị đối tượng điều tra được chọn.

Lựa chọn nhiều cụm từ: liên quan đến việc duy trì cùng một đơn vị lựa chọn ở tất cả các giai đoạn thực hiện của nó. Đồng thời, các đơn vị tuyển chọn được chọn ở mỗi giai đoạn tiếp theo phải được kiểm tra, chương trình đang mở rộng (Ví dụ: sinh viên toàn viện, sau đó là sinh viên của một số khoa).

§3. lỗi lấy mẫu.

có hệ thống

Lỗi đại diện chỉ xảy ra trong quan sát chọn lọc. Phát sinh do quần thể mẫu không thể sao chép chính xác quần thể chung. Chúng không thể tránh được, nhưng chúng rất dễ dự đoán và nếu cần, chúng có thể được giảm thiểu.

Sai số lấy mẫu là sự khác biệt giữa giá trị của một tham số trong tổng thể chung và giá trị của nó được tính toán từ kết quả quan sát mẫu. Dх=-m+ , Dх – sai số biên trong mẫu, m – trung bình chung; - mẫu có nghĩa là.

Sai số lấy mẫu cận biên là một giá trị ngẫu nhiên Các công trình của Chebyshev dành cho việc nghiên cứu các dạng sai số lấy mẫu ngẫu nhiên. Định lý Chebyshev chứng minh rằng Dx không vượt quá: - sai số lấy mẫu trung bình.t-hệ số tin cậy cho biết xác suất của sai số này. trang 42-43.

Trong trường hợp cần xác định t từ F(t) đã biết, chúng ta lấy F(t) lớn gần nhất và xác định t từ đó.

Giới hạn phần lỗi

P - chia sẻ.

Nếu việc lựa chọn được thực hiện theo cách không lặp lại, thì các công thức lỗi giới hạn sẽ được thêm vào

Sửa lỗi không lặp lại.

Đối với mỗi loại quan sát mẫu, lỗi trình bày được tính khác nhau:

  1. quan sát ngẫu nhiên và máy móc thích hợp;
  2. khoanh vùng giám sát
  3. lấy mẫu nối tiếp

r là số sê-ri trong mẫu;

R là số sê-ri trong quần thể chung;

Phương sai giữa các nhóm của tỷ lệ.

§4. Nhiệm vụ quan sát mẫu

Dùng cho các công việc sau:

  1. N-? để xác định cỡ mẫu từ F(t), Dx đã biết.
  2. xác định mẫu Dx từ F(t), n đã biết
  3. xác định F(t) từ Dx và n đã biết

1 nhiệm vụ n - ? Đầu tiên, n được xác định theo công thức chọn lại, đối với lựa chọn không lặp lại:

Các cách xác định phương sai:

  1. nó được lấy từ các nghiên cứu tương tự trước đây.
  2. RMS có phân phối chuẩn » 1/6 phạm vi biến thiên.
  3. nếu phân phối rõ ràng là không đối xứng, thì RMS »1/5 của phạm vi biến thể
  4. Đối với chia sẻ, phương sai tối đa có thể p(1-p)=0,25 được áp dụng
  5. với n³100 thì s 2 \u003d S 2 - phương sai mẫu

£30 N£100 thì s 2 \u003d S 2 (n / n-1), s 2 - phương sai chung

N<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2

Khi tính n, người ta không nên theo đuổi giá trị lớn của t và sai số biên nhỏ, vì điều này dẫn đến sự gia tăng trong n và do đó làm tăng chi phí. Định luật sau cũng tương tự.

§5. Phân phối dữ liệu quan sát mẫu cho dân số nói chung.

Mục tiêu cuối cùng của bất kỳ VN nào là đặc trưng cho dân số nói chung.

Các giá trị được tính toán từ các kết quả của VN được phân phối cho dân số nói chung, có tính đến giới hạn sai số biên của chúng.

Giả sử mức tiêu thụ sữa chua mỗi tháng của một người.

£250-20m£250+20; £230 triệu £270

Và chỉ 1000 người

£230,000 triệu £270,000

48%-5%£p£48%+5%

§6. mẫu nhỏ.

Trong thực tiễn nghiên cứu thống kê trong điều kiện hiện đại, việc xử lý các mẫu nhỏ ngày càng trở nên cần thiết.

Mẫu nhỏ - số lượng mẫu quan sát của các đơn vị trong đó không vượt quá 30, n £ 30 /

Sự phát triển của lý thuyết lấy mẫu nhỏ được thực hiện bởi nhà thống kê người Anh Gosset, người đã viết dưới bút danh là sinh viên vào năm 1908.

Ông đã chứng minh rằng ước lượng về sự khác biệt giữa trung bình của một mẫu nhỏ và mẫu chung có một luật phân phối đặc biệt. Khi tính toán cho một mẫu nhỏ, giá trị của s 2 không được tính toán. t st cho các giới hạn lỗi có thể sử dụng tiêu chí sinh viên. Trang 44-45. là xác suất của biến cố ngược lại.

Số bậc tự do

hạn chế lỗi mẫu nhỏ

lỗi chia sẻ cận biên

Chủ đề 8: Phân tích và mô hình hóa tương quan-hồi quy.

§1. Khái niệm tương quan và CRA.

§2. Điều kiện sử dụng và hạn chế của KRA.

§3. Hồi quy cặp dựa trên phương pháp bình phương nhỏ nhất.

§4. Ứng dụng của phương trình hồi quy tuyến tính ghép cặp.

§5. Các chỉ số về độ kín của mối nối và độ bền của mối nối.

§6. Nhiều tương quan.

§1. Khái niệm tương quan và CRA.

Kết nối chức năng y=5x

tương quan

Có 2 loại kết nối giữa các hiện tượng khác nhau và dấu hiệu của chúng, chức năng và thống kê.

Một kết nối như vậy được gọi là chức năng khi, với sự thay đổi giá trị của một trong các biến, biến thứ hai thay đổi theo cách được xác định nghiêm ngặt, tức là giá trị của một biến tương ứng với một hoặc nhiều giá trị được chỉ định chính xác của biến khác . Một kết nối chức năng chỉ có thể thực hiện được khi biến y phụ thuộc vào biến x và không phụ thuộc vào bất kỳ yếu tố nào khác, nhưng trong cuộc sống thực, điều này là không thể.

Một mối quan hệ thống kê tồn tại khi, với sự thay đổi giá trị của một trong các biến, biến thứ hai có thể lấy bất kỳ giá trị nào trong các giới hạn nhất định, nhưng các đặc điểm thống kê của nó thay đổi theo một quy luật nhất định.

Trường hợp cụ thể quan trọng nhất của mối quan hệ thống kê là mối quan hệ tương quan. Với một mối tương quan, các giá trị khác nhau của một biến tương ứng với các giá trị trung bình khác nhau của một biến khác, tức là với sự thay đổi giá trị của thuộc tính x, giá trị trung bình của thuộc tính y thay đổi một cách tự nhiên.

Từ tương quan được giới thiệu bởi nhà sinh vật học và nhà thống kê người Anh Francis Gal (tương quan)

Mối tương quan có thể phát sinh theo những cách khác nhau:

  • sự phụ thuộc nhân quả của sự biến đổi của tính trạng kết quả vào sự biến đổi của tính trạng nhân tố.
  • Có thể xảy ra mối tương quan giữa 2 tác động của cùng một nguyên nhân (đám cháy, số lượng lính cứu hỏa, quy mô đám cháy)
  • Mối quan hệ của các dấu hiệu, mỗi dấu hiệu vừa là nguyên nhân vừa là kết quả (năng suất lao động và tiền lương)

Trong thống kê, người ta thường phân biệt giữa các loại phụ thuộc sau:

  1. tương quan cặp - mối quan hệ giữa 2 dấu hiệu của kết quả và giai thừa, hoặc giữa hai dấu hiệu của giai thừa.
  2. tương quan một phần - mối quan hệ giữa thuộc tính hiệu quả và một yếu tố với một giá trị cố định của thuộc tính yếu tố khác.
  3. nhiều mối tương quan - sự phụ thuộc của đặc điểm kết quả vào hai hoặc nhiều đặc điểm nhân tố được đưa vào nghiên cứu.

Nhiệm vụ của phân tích tương quan là định lượng mức độ chặt chẽ của mối quan hệ giữa các tính năng. Vào cuối thế kỷ 19, Galton và Pearson đã điều tra mối quan hệ giữa chiều cao của người cha và con cái.

Hồi quy kiểm tra hình thức của mối quan hệ. Nhiệm vụ của phân tích hồi quy là xác định biểu thức phân tích của mối quan hệ.

Phân tích hồi quy tương quan như một khái niệm chung bao gồm sự thay đổi độ chặt của kết nối và thiết lập biểu thức phân tích của kết nối.

§2. Điều kiện sử dụng và hạn chế của KPA.

  1. sự hiện diện của dữ liệu đại chúng, bởi vì tương quan thống kê
  2. đòi hỏi phải có sự đồng nhất về chất của quần thể.
  3. sự phụ thuộc của phân phối dân số theo các đặc điểm kết quả và nhân tố, theo luật phân phối chuẩn, có liên quan đến việc sử dụng phương pháp bình phương nhỏ nhất.

§3. Hồi quy cặp dựa trên phương pháp bình phương nhỏ nhất.

Phân tích hồi quy bao gồm việc xác định biểu thức phân tích của mối quan hệ. Biểu mẫu phân biệt giữa hồi quy tuyến tính, được biểu thị bằng phương trình của một đường thẳng và hồi quy phi tuyến tính hoặc.

Theo hướng giao tiếp, chúng được phân biệt theo một đường thẳng, tức là. Khi x tăng, y tăng.

đảo ngược

Đảo ngược tức là khi x tăng, y giảm.

  1. phương pháp đồ họa - bằng cách vẽ dữ liệu thực nghiệm trên trường tương quan, nhưng ước tính chính xác hơn được thực hiện bằng phương pháp bình phương nhỏ nhất.

X - dấu hiệu thực tế

U - một dấu hiệu của hiệu quả

Sự khác biệt giữa giá trị thực tế và giá trị được tính toán bởi phương trình ghép bình phương sẽ có xu hướng ở mức tối thiểu.

Với LSM min là tổng các bình phương độ lệch của các giá trị thực nghiệm y so với các giá trị lý thuyết thu được theo phương trình hồi quy đã chọn.

Đối với một mối quan hệ tuyến tính

Þ một,b

cho parabol

Đối với cường điệu

tham số a, b, c được viết vào phương trình, sau đó chúng tôi thay thế phương trình kết quả bằng giá trị thực nghiệm x tôi và tìm giá trị lý thuyết tôi . Sau đó, chúng tôi so sánh tôi lý thuyết và tôi theo kinh nghiệm. Tổng bình phương của sự khác biệt giữa chúng phải là tối thiểu. Chúng tôi chọn loại phụ thuộc trong đó phụ thuộc này được thực hiện.

Trong phương trình hồi quy tuyến tính theo cặp:

b là hệ số hồi quy tuyến tính theo cặp, nó đo sức mạnh của trái phiếu, tức là đặc trưng cho độ lệch trung bình tổng thể của y so với giá trị trung bình của nó trên mỗi đơn vị đo lường được chấp nhận.

b\u003d 20 khi x thay đổi 1 dấu y lệch khỏi giá trị trung bình của nó trung bình 20 trong dân số.

Dấu dương ở hệ số hồi quy biểu thị mối quan hệ trực tiếp giữa các đặc trưng, ​​dấu “-” biểu thị phản hồi giữa các đặc trưng.

§4. Ứng dụng của phương trình hồi quy tuyến tính ghép cặp.

Ứng dụng chính là dự báo theo phương trình hồi quy. Dự báo bị giới hạn bởi điều kiện ổn định của các yếu tố khác và điều kiện của quá trình. Nếu môi trường của quá trình đang diễn ra thay đổi mạnh trong đó, thì phương trình hồi quy này sẽ không diễn ra.

Dự báo điểm thu được bằng cách thay thế giá trị kỳ vọng của nhân tố vào phương trình hồi quy. Xác suất thực hiện chính xác của một dự báo như vậy là vô cùng nhỏ.

Nếu một dự báo điểm được kèm theo một giá trị của sai số dự báo trung bình, thì dự báo đó được gọi là dự báo khoảng.

Sai số dự báo trung bình được hình thành từ hai loại sai số:

  1. lỗi loại 1 - lỗi đường hồi quy
  2. lỗi loại 2 - lỗi liên quan đến lỗi thay đổi.

Lỗi dự báo trung bình.

Lỗi ở vị trí của đường hồi quy trong tổng thể

n - cỡ mẫu

x k - giá trị sai số của hệ số

RMS của đặc điểm kết quả từ đường hồi quy trong dân số nói chung

Phân tích tương quan liên quan đến việc đánh giá mức độ chặt chẽ của kết nối. Các chỉ số:

  1. hệ số tương quan tuyến tính - đặc trưng cho mức độ chặt chẽ và hướng của mối quan hệ giữa hai đối tượng địa lý trong trường hợp giữa chúng có mối quan hệ tuyến tính

tại = -1 kết nối là chức năng nghịch đảo, =1 kết nối là chức năng trực tiếp, tại = 0 không có kết nối.

Nó chỉ được sử dụng cho các mối quan hệ tuyến tính, nó được sử dụng để đánh giá các mối quan hệ giữa các đặc tính định lượng. Chỉ được tính trên các giá trị riêng lẻ.

Tỷ lệ tương quan:

Thực nghiệm: cả hai loại phương sai đều được tính theo thuộc tính kết quả.

lý thuyết:

Độ phân tán của các giá trị của tính năng hiệu quả được tính theo phương trình hồi quy

Phân tán giá trị thực nghiệm của tính năng kết quả

  • độ chính xác cao
  • phù hợp để đánh giá mức độ gần gũi của mối quan hệ giữa đặc điểm mô tả và định lượng, nhưng định lượng phải hiệu quả
  • thích hợp cho tất cả các loại kết nối

Hệ số tương quan của Spearman

thứ hạng - số thứ tự của các đơn vị dân cư trong dãy được xếp hạng. Cần phải xếp hạng cả hai đối tượng theo thứ tự từ nhỏ nhất đến lớn nhất hoặc ngược lại. Nếu thứ hạng của các đơn vị dân số được ký hiệu là p x và p y thì hệ số tương quan của thứ hạng sẽ có dạng sau:

Ưu điểm của hệ số chuỗi tương quan:

  1. Bạn cũng có thể xếp hạng theo các đặc điểm mô tả không thể biểu thị bằng số, do đó, việc tính toán hệ số Spearman có thể thực hiện được đối với các cặp đặc điểm sau: số - số; mô tả - định lượng; Miêu tả - miêu tả. (giáo dục là một thuộc tính mô tả)
  2. hiển thị hướng kết nối

Nhược điểm của hệ số Spearman.

  1. sự khác biệt về thứ hạng giống hệt nhau có thể tương ứng với sự khác biệt hoàn toàn khác nhau về giá trị của một tính trạng (trong trường hợp tính trạng số lượng). Ví dụ: Sản lượng điện của quốc gia mỗi năm

Mỹ 2400 kWh 1

RF 800 kWh 2

Canada 600 kWh 3

Nếu một số giá trị giống hệt nhau xảy ra giữa các giá trị Spearman, thì các cấp bậc liên quan được hình thành, tức là cùng số ở giữa

Trong trường hợp này, hệ số Spearman được tính như sau:

j- số lượng liên kết theo thứ tự cho tính năng x

Aj- số lượng cấp bậc giống hệt nhau trong liên kết j theo x

k- số dây chằng theo thứ tự của tính năng y

Bk- số lượng cấp bậc giống hệt nhau trong cái mà một loạt

  1. 4. Hệ số tương quan xếp hạng Kendall

Số tiền xếp hạng tối đa

S là tổng thực tế của các cấp bậc

Đưa ra ước tính chính xác hơn hệ số Spearman.

Đối với tính toán, tất cả các đơn vị được xếp theo thuộc tính x theo thuộc tính Tạiđối với mỗi thứ hạng, số lượng thứ hạng tiếp theo vượt quá tổng đã cho được tính, ký hiệu là P và số lượng thứ hạng tiếp theo bên dưới ký hiệu này Q.

P+Q= 1 / 2 n(n-1)

  1. Hệ số tương quan hạng Fechner.

hệ số Fechner - thước đo mức độ chặt chẽ của kết nối dưới dạng tỷ lệ của sự khác biệt về số lượng các cặp dấu hiệu trùng khớp và không trùng khớp với tổng của các số này.

  1. tính trung bình cho x và y
  2. các giá trị riêng lẻ x i y i được so sánh với các giá trị trung bình với dấu hiệu bắt buộc là dấu “+” hoặc “-”. Nếu các dấu hiệu khớp với x và y, thì chúng tôi chuyển chúng sang số “C”, nếu không, thì chuyển sang số “H”.
  3. đếm số cặp phù hợp và không phù hợp.

Nhiệm vụ đo lường mối quan hệ trở nên trước mắt nhà thống kê liên quan đến các đặc điểm mô tả, một trường hợp đặc biệt quan trọng của nhiệm vụ đó, đo lường mối quan hệ giữa 2 đặc điểm thay thế, một trong số đó là nguyên nhân của hậu quả kia.

Có thể đo lường mức độ chặt chẽ của mối quan hệ giữa 2 tính năng thay thế bằng 2 hệ số:

  1. hệ số kết hợp
  2. yếu tố dự phòng

Hệ số dự phòng có một nhược điểm: khi một trong hai tổ hợp không đồng nhất Av hoặc Ba bằng 0, hệ số sẽ chuyển thành một. Anh ấy đánh giá rất tự do về độ chặt chẽ của mối liên hệ - anh ấy đánh giá quá cao nó.

tỷ lệ của Pearson

Nếu không có hai, nhưng nhiều giá trị có thể có hơn của từng tính năng có liên quan với nhau, thì các hệ số sau được tính:

  1. tỷ lệ của Pearson
  2. Hệ số Chuprov cho một tính năng mô tả

Hệ số Pearson được tính từ các ma trận vuông

Dưới mức trung bình

đến 1 và 2 - số của nhóm tương ứng với các dấu hiệu 1 và 2. Nhược điểm của hệ số Pearson là nó không đạt đến 1 ngay cả khi số lượng nhóm tăng lên.

Hệ số Chuprov (1874–1926)

hệ số Chuprov ước tính chặt chẽ hơn độ kín của kết nối.

§6. Nhiều tương quan.

Việc nghiên cứu mối quan hệ giữa kết quả và hai hoặc nhiều đặc điểm nhân tố được gọi là hồi quy bội. Trong nghiên cứu về sự phụ thuộc bằng phương pháp hồi quy bội, có 2 nhiệm vụ được đặt ra.

  1. xác định biểu thức giải tích mối quan hệ giữa đặc trưng hữu hiệu y và đặc trưng thực x 1 , x 2 , x 3 , ... x k , tức là tìm hàm y \u003d f (x 1, x 2, ... x k)
  2. Đánh giá mức độ chặt chẽ của mối quan hệ giữa hiệu quả và từng dấu hiệu nhân tố.

Mô hình hồi quy tương quan (CRM) là một phương trình hồi quy bao gồm các yếu tố chính ảnh hưởng đến sự biến thiên của thuộc tính kết quả.

Xây dựng mô hình hồi quy bội bao gồm các bước sau:

  1. lựa chọn hình thức giao tiếp
  2. lựa chọn các tính năng yếu tố
  3. Đảm bảo rằng dân số đủ lớn để đưa ra các ước tính chính xác.

I. Toàn bộ các mối quan hệ giữa các biến gặp phải trong thực tế được mô tả khá đầy đủ bởi các chức năng của 5 loại:

  1. tuyến tính:
  2. quyền lực:
  3. chỉ định:
  4. parabol:
  5. hypebol:

mặc dù tất cả 5 hàm đều có mặt trong thực tế của CRA, nhưng sự phụ thuộc tuyến tính thường được sử dụng nhất, là phương trình phụ thuộc tuyến tính đơn giản nhất và dễ hiểu nhất: , k - một tập hợp các yếu tố có trong phương trình, bj

0 - bởi vì >0.7 do đó chúng tôi đặc biệt chú ý đến chúng

sinh thái. Thang đo độ chặt thông tin liên lạc:

Nếu kết nối là 0 - 0,3 - kết nối yếu

0,3 - 0,5 - đáng chú ý

0,3 - 0,5 - đóng

0,7 - 0,9 - cao

hơn 0,9 - rất cao

sau đó chúng tôi so sánh hai tính năng (thu nhập và giới tính)<0,7, то включаем в уравнение множественной регрессии.

Lựa chọn các yếu tố để đưa vào phương trình hồi quy bội:

  1. phải có mối quan hệ nhân quả giữa hiệu lực và dấu hiệu thực tế.
  2. hiệu quả và dấu hiệu thực tế phải có quan hệ mật thiết với nhau, nếu không sẽ phát sinh hiện tượng đa cộng tuyến (>06) , I E. các dấu hiệu yếu tố có trong phương trình không chỉ ảnh hưởng đến kết quả mà còn ảnh hưởng lẫn nhau, dẫn đến việc giải thích dữ liệu số không chính xác.

Các phương pháp lựa chọn nhân tố đưa vào phương trình hồi quy bội:

1. phương pháp chuyên gia – dựa trên phân tích logic trực quan được thực hiện bởi các chuyên gia có trình độ cao.

2. việc sử dụng ma trận của các cặp hệ số tương quan được thực hiện song song với phương pháp đầu tiên, ma trận đối xứng với đường chéo đơn vị.

3. phân tích hồi quy từng bước - việc đưa các đặc điểm của yếu tố vào phương trình hồi quy và kiểm tra ý nghĩa được thực hiện dựa trên các giá trị của hai chỉ số ở mỗi bước. Chỉ báo tương quan, hồi quy.

Correlation Score: Tính toán sự thay đổi trong tương quan lý thuyết của tỷ lệ hoặc sự thay đổi trong phương sai thặng dư trung bình. Chỉ báo hồi quy là sự thay đổi của hệ số hồi quy thuần túy có điều kiện.

Tổng cộng

31

32

22

85