Đặc điểm thống kê và nghiên cứu. Trình bày đồ họa của thông tin thống kê


1. Khái niệm thống kê

Thống kê là một trong những ngành kiến ​​thức lâu đời nhất phát sinh trên cơ sở kế toán kinh tế. Sự xuất hiện của nó gắn liền với nhu cầu của xã hội về các loại thông tin.

Người ta tin rằng thuật ngữ thống kê xuất phát từ các từ tiếng Latinh stato (trạng thái) và trạng thái (vị trí, trạng thái).

Theo nghĩa rộng, thống kê được hiểu là một môn khoa học nghiên cứu các hiện tượng khối lượng và tính quy luật của chúng từ quan điểm định lượng.

Lý thuyết chung về thống kê là một khoa học về phương pháp luận, khoa học về phương pháp có thể áp dụng để xác định các mẫu trong bất kỳ lĩnh vực nào mà kết luận dựa trên quan sát hàng loạt, trong đó có sự thay đổi của một dấu hiệu trong các phần tử riêng lẻ của tổng thể, trong đó các mẫu chung chỉ có thể tự biểu hiện thông qua việc loại bỏ lẫn nhau tính ngẫu nhiên trong các đơn vị riêng lẻ. .

2. Thống kê như một khoa học

2.1 Các cách phát triển số liệu thống kê

Sự phát triển của thống kê như một khoa học đã đi theo hai hướng:

Hướng đầu tiên bắt nguồn từ Đức và được gọi là nghiên cứu nhà nước hoặc trường mô tả. Đại diện của trường này coi nhiệm vụ chính của họ là mô tả các điểm tham quan của tiểu bang mà không phân tích các mô hình và mối quan hệ giữa chúng. Người sáng lập trường phái miêu tả là nhà bác học người Đức Hermann Konring.

Hướng thứ hai trong sự phát triển của thống kê bắt nguồn từ Anh, và nó được gọi là số học chính trị. Các đại diện của trường này coi nhiệm vụ chính của họ là tiết lộ, trên cơ sở một số lượng lớn các quan sát, các quy luật và mối tương quan khác nhau của các hiện tượng được nghiên cứu. Người sáng lập trường là William Petty.

2.2 Môn thống kê và các khái niệm cơ bản

Nhà toán học người Bỉ Adolphe Ketie đã tóm tắt thông tin lý thuyết từ các nghiên cứu về nhà nước và công việc thực tế của các đại diện của trường phái số học chính trị. Ông cũng cho định nghĩa về chủ đề của thống kê - đây là những hiện tượng quần chúng gắn liền với đời sống của xã hội và con người.Ông cũng nhìn thấy trong số liệu thống kê một công cụ nhận thức xã hội.

Đặc điểm nổi bật của hiện tượng khối lượng:

1. Mỗi phần tử của tập hợp vừa có những nét riêng hoặc nét riêng, vừa có nét chung hoặc nét giống nhau.

2. Không thể có được đặc điểm của một trong các yếu tố của hiện tượng khối lượng trên cơ sở đặc điểm của các yếu tố khác.

Định nghĩa: Các hiện tượng khối lượng được thống kê nghiên cứu dưới dạng một tập hợp các đơn vị có chất lượng giống nhau nhưng có các đặc điểm riêng khác nhau được gọi là các tập hợp thống kê. Dựa trên điều này, chúng ta có thể nói rằng chủ đề của thống kê là các tập hợp thống kê khác nhau, nghiên cứu về chúng có liên quan đến đặc tính định lượng và xác định các mẫu vốn có của chúng. Tổng thể thống kê là một trong những khái niệm chính của khoa học thống kê. Nó cũng được liên kết với các khái niệm như: một đơn vị dân số. Định nghĩa: Các phần tử, tập hợp tạo thành tập hợp đang nghiên cứu, được gọi là đơn vị. Dấu hiệu của đơn vị quần thể:

Mỗi đơn vị dân số có thể được đặc trưng bởi các loại tính năng định tính và định lượng khác nhau.

Nếu một thuộc tính nhất định có các giá trị khác nhau đối với một số đơn vị dân số, thì điều này được gọi là biến thể. Định nghĩa: Một mẫu được xác định trên cơ sở quan sát hàng loạt, nghĩa là được biểu hiện trong một khối lượng lớn các hiện tượng thông qua việc khắc phục tính ngẫu nhiên cố hữu của từng yếu tố riêng lẻ của nó, được gọi là quy luật thống kê. Nhiệm vụ chính của thống kê là trừu tượng hóa cái ngẫu nhiên và xác định cái điển hình, thường xuyên.

Có ba cách để xác định các mẫu:

1. hợp lý;

2. theo kinh nghiệm;

3. dựa vào quy luật số lớn.


2.3 Phương pháp thống kê

Quan sát hàng loạt, phân nhóm và tóm tắt kết quả, tính toán và phân tích các chỉ số khái quát hóa. Tất cả điều này cùng nhau đưa ra phương pháp thống kê.

3. Quan sát thống kê

3.1 Quan sát thống kê với tư cách là một giai đoạn nghiên cứu thống kê. Kế hoạch quan sát thống kê

Quan sát thống kê là giai đoạn đầu tiên của nghiên cứu thống kê.

Định nghĩa: Quan sát thống kê là tập hợp các dữ liệu khối lượng lớn được tổ chức một cách khoa học về các quá trình, hiện tượng đang nghiên cứu, được thực hiện theo một chương trình đã thiết kế sẵn.

Yêu cầu dữ liệu hàng loạt:

Số liệu thống kê phải đầy đủ. Mỗi hiện tượng có một loạt các tính năng liên quan đến nhau. Tính đầy đủ của dữ liệu cung cấp phạm vi bảo hiểm của các tính năng quan trọng nhất cần thiết để có được kết luận khách quan. Nếu dữ liệu quan sát thống kê đề cập đến các khoảng thời gian, lãnh thổ khác nhau thì cần đảm bảo khả năng so sánh của chúng. Khả năng so sánh của thông tin thống kê có nghĩa là tính thống nhất của các đơn vị đo lường, ước tính chi phí, ranh giới của các lãnh thổ hành chính, đặc điểm thời gian, v.v. Trước khi bắt đầu quan sát thống kê, cần thiết lập quy trình thực hiện. Để làm điều này, một kế hoạch giám sát chi tiết được phát triển, bao gồm:

1. Phần chương trình và phương pháp:

2. phần tổ chức.

1. Vấn đề chương trình và phương pháp của kế hoạch quan sát.

Phần này của kế hoạch nên bao gồm:

a) mục đích và mục tiêu của quan sát:

b) đối tượng và đơn vị khảo sát;

c) chương trình giám sát.

Chương trình quan sát là một danh sách các câu hỏi dự kiến ​​sẽ được trả lời trong quá trình khảo sát. Chương trình nên được phân biệt bởi tính đầy đủ của thông tin và phạm vi bảo hiểm. Từ ngữ của các câu hỏi phải ngắn gọn và rõ ràng nhất có thể, loại trừ sự thiếu chính xác và mơ hồ trong câu trả lời, nếu cần thiết, một gợi ý được đưa ra để giải thích và hiểu câu hỏi một cách thống nhất. Phần phương pháp luận chương trình của quan sát chỉ ra các công cụ cụ thể của nghiên cứu thống kê, tức là. các biểu mẫu, trong đó phải có câu trả lời cho các câu hỏi đã đặt ra, cũng như hướng dẫn điền chúng.

2. Vấn đề tổ chức của kế hoạch quan sát.

Để tổ chức thành công việc quan sát và bao quát toàn bộ dân số, một kế hoạch tổ chức quan sát được phát triển.

Nó nói:

a) đối tượng quan sát:

b) thời gian và địa điểm nghiên cứu;

c) tổ chức thu thập dữ liệu và công nghệ xử lý dữ liệu.


3.2 Hình thức và loại hình quan sát thống kê

Hình thức, loại hình và phương pháp quan sát thống kê.

Hình thức tổ chức quan sát thống kê

Các loại quan sát thống kê

Phương pháp quan sát thống kê

vào thời điểm đăng ký sự thật

theo diện bao phủ đơn vị dân số

1. Báo cáo thống kê.

2. Tổ chức quan sát đặc biệt.

3. Đăng ký quan sát.

1. Hiện tại hoặc liên tục.

2. Không liên tục:

a) định kỳ;

b) một lần.

1. Rắn.

2. Không liên tục:

a) chọn lọc;

b) mảng chính;

c) chuyên khảo.


1. Ngay lập tức.

2. Phim tài liệu.

a) chuyển tiếp;

b) tự đăng ký;

c) phóng viên;

d) bảng câu hỏi;

e) người phục vụ.

Trong thống kê trong nước, ba hình thức tổ chức (loại) quan sát thống kê được sử dụng:

1. Báo cáo- đây là hình thức quan sát thống kê chính, với sự trợ giúp của các cơ quan thống kê nhận được dữ liệu cần thiết từ các doanh nghiệp, tổ chức và tổ chức trong một khoảng thời gian nhất định dưới dạng tài liệu báo cáo được thiết lập hợp pháp, được ký bởi những người chịu trách nhiệm về họ cung cấp và độ tin cậy của thông tin thu thập được.

Dùng chung: điện thoại, teletype, mail.

2. Giám sát có tổ chức đặc biệtđược thực hiện để có được thông tin không có trong báo cáo hoặc để xác minh dữ liệu của nó. Thống kê thực tế tiến hành điều tra dân số, tài nguyên vật liệu, đồn điền lâu năm, thiết bị đã tháo dỡ, công trường xây dựng thiết bị đang được tiến hành, v.v. và thu nhập của gia đình.

3. Đăng ký giám sát là một hình thức quan sát thống kê liên tục các quá trình dài hạn có khởi đầu cố định, giai đoạn phát triển và kết thúc cố định. Nó dựa trên việc duy trì một sổ đăng ký thống kê. Sổ đăng ký là một hệ thống liên tục theo dõi trạng thái của đơn vị quan sát và đánh giá cường độ tác động của các yếu tố khác nhau đối với các chỉ số được nghiên cứu.

Trong thực tiễn thống kê, có sự phân biệt giữa đăng ký dân số và đăng ký kinh doanh.

Các loại quan sát thống kê tại thời điểm đăng ký sự kiện

Quan sát hiện tại được thực hiện một cách có hệ thống, khi các hiện tượng xảy ra. Với quan sát định kỳ, việc đăng ký các hiện tượng đang nghiên cứu được thực hiện trong các khoảng thời gian nhất định, thường giống hệt nhau. Quan sát một lần được thực hiện một lần để giải quyết vấn đề hoặc được lặp lại theo từng giai đoạn sau một khoảng thời gian nhất định, nếu cần.

Các loại quan sát thống kê theo phạm vi đơn vị dân số

Với sự quan sát liên tục, tất cả các đơn vị dân số được ghi lại mà không có ngoại lệ. Trong quan sát có chọn lọc, một phần được chọn ngẫu nhiên của các đơn vị dân số được kiểm tra để mô tả toàn bộ dân số.

Với sự quan sát liên tục không hoàn hảo (của mảng chính), phần chính của dân số được kiểm tra và một phần nhất định bị loại trừ một cách có chủ ý, về phần mà người ta biết rằng nó không đóng vai trò lớn trong việc mô tả đặc điểm của toàn bộ dân số. Quan sát chuyên khảo bao gồm một mô tả chi tiết về một số lượng nhỏ hoặc các đơn vị điển hình riêng lẻ của dân số.

Phương pháp đăng ký sự kiện hoặc phương pháp lấy tài liệu chính

Quan sát trực tiếp được thực hiện bằng cách đăng ký các đơn vị đang nghiên cứu và đặc điểm của chúng bởi những người được chỉ định đặc biệt trên cơ sở kiểm tra trực tiếp, đếm, cân, đọc thiết bị, v.v. Quan sát tài liệu dựa trên việc sử dụng các tài liệu kế toán cơ bản khác nhau của các doanh nghiệp, tổ chức và tổ chức làm nguồn thông tin thống kê. Trong quá trình khảo sát, các tài liệu thống kê thu được bằng cách đăng ký các câu trả lời của những người được phỏng vấn. Phương pháp chuyển tiếp bao gồm thực tế là các nhà đăng ký được đào tạo đặc biệt điền vào các công thức bằng một cuộc khảo sát, đồng thời kiểm soát quyền tự do của thông tin nhận được. Trong quá trình tự đăng ký hoặc tự tính toán, nhân viên của cơ quan thống kê phát phiếu điều tra cho người được phỏng vấn, hướng dẫn họ, sau đó thu phiếu đã hoàn thành, kiểm soát tính đầy đủ và chính xác của thông tin nhận được. Một cuộc khảo sát bằng câu hỏi bao gồm thực tế là bảng câu hỏi đã phát triển được gửi đến một nhóm người và sau khi điền vào sẽ được trả lại cho các cơ quan tiến hành quan sát. Phóng viên bao gồm tổ chức bởi các cơ quan thống kê của một mạng lưới phóng viên đặc biệt từ những người sống trong lĩnh vực này tiến hành quan sát theo mẫu và hướng dẫn đã phát triển và báo cáo thông tin cho cơ quan thống kê. Không được yêu cầu cung cấp cho việc gửi thông tin cho các cơ quan tiến hành giám sát trên cơ sở không được yêu cầu.

4. Tổng hợp và phân nhóm số liệu thống kê

4.1 Nhiệm vụ và các loại tổng hợp thống kê


Định nghĩa: Tóm tắt là một tập hợp các thao tác tuần tự để khái quát hóa các sự kiện đơn lẻ cụ thể tạo thành một tập hợp nhằm xác định các đặc điểm và mô hình điển hình vốn có trong toàn bộ hiện tượng đang nghiên cứu.

Do đó, nếu trong quá trình quan sát thống kê, dữ liệu được thu thập về từng đơn vị của một đối tượng, thì kết quả của bản tóm tắt là dữ liệu chi tiết phản ánh tổng thể của nó.

Tóm tắt thống kê nên dựa trên phân tích lý thuyết sơ bộ về các hiện tượng và quá trình.

Theo độ sâu xử lý vật liệu tóm tắt vừa đơn giản vừa phức tạp.

Một bản tóm tắt đơn giản là một hoạt động để tính toán tổng số cho một tập hợp các đơn vị quan sát.

Tóm tắt phức hợp là một tập hợp các thao tác bao gồm nhóm các đơn vị quan sát, đếm tổng số cho từng nhóm và cho toàn bộ đối tượng, đồng thời trình bày kết quả nhóm và tóm tắt dưới dạng bảng thống kê.

Phần tóm tắt được bắt đầu bằng việc phát triển chương trình của nó, bao gồm các bước sau:

Sự lựa chọn của các tính năng nhóm;

Xác định thứ tự thành lập các nhóm;

Xây dựng hệ thống chỉ tiêu thống kê đặc trưng cho các nhóm và đối tượng nói chung;

Phát triển bố cục của các bảng thống kê trong đó các kết quả tóm tắt sẽ được trình bày.

Theo chế biến vật liệu tóm tắt được phân cấp và tập trung.

Với một bản tóm tắt phi tập trung (theo quy định, nó được sử dụng trong quá trình xử lý báo cáo thống kê), việc phát triển tài liệu được thực hiện theo các giai đoạn kế tiếp. Do đó, báo cáo của các doanh nghiệp được cơ quan thống kê của các đơn vị cấu thành của Liên bang Nga tóm tắt và kết quả cho khu vực đã được gửi đến Ủy ban Thống kê Nhà nước của Nga, và ở đó các chỉ số cho toàn bộ nền kinh tế quốc gia là xác định. Với một bản tóm tắt tập trung, tất cả tài liệu chính được đưa vào một tổ chức, nơi nó được xử lý từ đầu đến cuối. Tóm tắt tập trung thường được sử dụng để xử lý tài liệu từ các cuộc điều tra thống kê một lần. Theo kỹ thuật thực hiện, tóm tắt thống kê được chia thành cơ giới hóa và thủ công.

Để thực hiện một bản tóm tắt, một kế hoạch được vạch ra trong đó đặt ra các vấn đề về tổ chức: ai và khi nào tất cả các hoạt động sẽ được thực hiện, quy trình tiến hành và thành phần thông tin sẽ được đăng trên báo chí định kỳ.


4.2 Phương pháp phân nhóm trong thống kê

Phân nhóm thống kê là việc phân chia toàn bộ tài liệu thành các nhóm và phân nhóm theo các đặc điểm cần thiết để nghiên cứu toàn diện các hiện tượng và quá trình của đời sống xã hội.

Dấu hiệu cơ bản được gọi là nhóm.

Để xây dựng các nhóm trong thống kê, hai loại tính năng chủ yếu được sử dụng:

1. định lượng (số);

2. định tính (attributive).

Nhóm trên cùng một cơ sở được gọi là giản dị và các nhóm theo hai hoặc nhiều tính năng được thực hiện kết hợp với nhau được gọi là tổ hợp(khó khăn).

Sau khi thuộc tính nhóm được chọn, số lượng nhóm được chọn. Nếu việc phân nhóm dựa trên một đặc điểm định tính, thì câu hỏi về số lượng nhóm sẽ tự động được giải quyết - sẽ có bao nhiêu nhóm trong số đó tùy theo trạng thái định tính của quần thể được nghiên cứu (đơn vị của nó).

Khi nhóm theo các đặc điểm định lượng, câu hỏi đặt ra là xác định các khoảng thời gian nhóm. Giá trị của khoảng là hiệu giữa giá trị lớn nhất và nhỏ nhất của thuộc tính trong mỗi nhóm. Tùy thuộc vào bản chất của sự phân bố của các đơn vị dân số cho một đặc điểm nhất định, các khoảng có thể khác nhau và không bằng nhau về kích thước. Nếu sự phân bố của một tính trạng trong ranh giới dao động của nó đủ đồng đều, thì phạm vi dao động của tính trạng đó được chia thành các khoảng bằng nhau, độ dài của các khoảng đó được xác định theo công thức:

ở đâu XMakXtối thiểu tương ứng, giá trị tối đa và tối thiểu của tính năng trong quần thể này,

n là số nhóm được thành lập.

Số lượng các nhóm có thể được thiết lập dựa trên các nghiên cứu trước đây. Trong trường hợp bạn phải tự quyết định số lượng nhóm, thì bạn có thể sử dụng công thức Sturgess để xác định số lượng nhóm tối ưu:



n - số nhóm

N là số đơn vị dân số

Có các khoảng đóng, trong đó các ranh giới trên và dưới được cho trước, và các khoảng mở, trong đó chỉ có một ranh giới: trên hoặc dưới.

Các nhóm thống kê theo các nhiệm vụ được giải quyết với sự giúp đỡ của họ được chia thành:

nhóm kiểu chữ- đây là sự phân chia dân số không đồng nhất về chất được nghiên cứu thành các giai cấp, loại hình kinh tế xã hội, các nhóm đơn vị đồng nhất theo quy tắc phân nhóm khoa học.

Cấu trúcđược gọi là một nhóm trong đó một quần thể đồng nhất được chia thành các nhóm đặc trưng cho cấu trúc của nó theo một số tính năng khác nhau.

phân tíchđược gọi là một nhóm tiết lộ mối quan hệ giữa các hiện tượng được nghiên cứu và các đặc điểm của chúng.


4.3 Chuỗi phân phối trong thống kê

Một chuỗi phân phối thống kê là một phân phối có thứ tự của các đơn vị dân số thành các nhóm theo một thuộc tính thay đổi nhất định.

Tùy thuộc vào dấu hiệu bên dưới sự hình thành của một chuỗi phân phối, có:

1. Chuỗi thuộc tính - phân phối được xây dựng trên cơ sở định tính.

2. Chuỗi biến thiên - phân phối được xây dựng trên cơ sở định lượng. Bất kỳ dấu hiệu biến thể bao gồm 2 yếu tố: biến thể và tần số.

Các biến thể là các giá trị riêng lẻ của một tính năng mà nó có trong một chuỗi biến thể.

Tần suất là số lượng biến thể riêng lẻ hoặc từng nhóm của chuỗi biến thể.

Tần số được gọi là tần số, được biểu thị bằng phân số của một đơn vị hoặc dưới dạng phần trăm của tổng số.

Tuỳ theo tính chất biến dị của tính trạng có:

1. Chuỗi biến thiên rời rạc đặc trưng cho sự phân bố của các đơn vị dân số theo một thuộc tính rời rạc (giá trị của thuộc tính định lượng chỉ nhận giá trị nguyên).

2. Chuỗi biến thiên theo khoảng thời gian - nó phù hợp với sự biến đổi liên tục của một tính trạng và cả khi biến thể rời rạc biểu hiện trên một phạm vi rộng, tức là. số lượng tùy chọn cho một tính năng riêng biệt là khá lớn.

Thuận tiện nhất là phân tích chuỗi phân phối bằng hình ảnh Ugaric của chúng.

Đa giác được sử dụng khi hiển thị chuỗi biến thể rời rạc.

Biểu đồ được lấy để hiển thị chuỗi biến thể khoảng thời gian.

5. Các chỉ tiêu thống kê

Chỉ tiêu thống kê là đặc trưng định lượng của các hiện tượng, quá trình kinh tế - xã hội về mặt chất chắc chắn. Sự chắc chắn về chất lượng của chỉ báo nằm ở chỗ nó liên quan trực tiếp đến nội dung bên trong của hiện tượng hoặc quá trình đang được nghiên cứu, bản chất của nó.

Theo quy luật, các quá trình và hiện tượng được thống kê nghiên cứu khá phức tạp và bản chất của chúng không thể được phản ánh bằng một chỉ số duy nhất. Trong những trường hợp như vậy, một hệ thống các chỉ số thống kê được sử dụng (một tập hợp các chỉ số có liên quan với nhau, có cấu trúc một cấp hoặc đa cấp và nhằm giải quyết một vấn đề thống kê cụ thể).


5.1 Các chỉ tiêu tuyệt đối và tương đối

Thống kê tuyệt đối.

Các chỉ tiêu thống kê ở dạng giá trị tuyệt đối đặc trưng cho các kích thước tuyệt đối của các quá trình và hiện tượng được nghiên cứu bởi thống kê: khối lượng, diện tích, khối lượng, chiều dài của chúng; phản ánh các đặc điểm thời gian của chúng và cũng có thể đại diện cho khối lượng dân số, tức là số đơn vị cấu thành của nó.

Các chỉ số tuyệt đối riêng lẻ thường thu được trực tiếp trong quá trình quan sát thống kê do đo lường, cân, đếm và đánh giá một đặc điểm định lượng quan tâm.

Các chỉ số thể tích hợp nhất thu được là kết quả của việc tóm tắt và nhóm các giá trị riêng lẻ (chúng đặc trưng cho khối lượng của một đối tượng địa lý hoặc khối lượng của tổng thể đối với toàn bộ đối tượng đang nghiên cứu và đối với bất kỳ phần nào của đối tượng).

Các chỉ tiêu thống kê tuyệt đối được thể hiện bằng các đơn vị đo lường sau:

Tự nhiên (tấn, kilôgam, kilômét, cái);

Chi phí (đánh giá bằng tiền về các hiện tượng và quá trình kinh tế - xã hội);

Lao động (ngày công, giờ công).

Thống kê tương đối.

Chỉ tiêu tương đối là kết quả của việc chia một chỉ tiêu tuyệt đối này cho một chỉ tiêu tuyệt đối khác và biểu thị tỷ lệ giữa các đặc điểm định lượng của các quá trình và hiện tượng kinh tế - xã hội. Ở tử số, chỉ tiêu gọi là chỉ tiêu hiện hành hay so sánh, ở mẫu số gọi là gốc hay cơ sở so sánh.

Nếu lấy cơ sở so sánh là 1 thì chỉ tiêu tương đối được biểu thị bằng hệ số, nếu lấy cơ sở là 100 thì biểu thị bằng phần trăm (%), nếu lấy 1000 thì biểu thị bằng ppm (%0 ), nếu cơ sở được lấy là 10.000, thì nó được biểu thị bằng decimilles .

Tỷ lệ phần trăm, theo quy định, được sử dụng trong trường hợp chỉ số tuyệt đối được so sánh vượt quá chỉ số cơ sở không quá 2-3 lần. Lãi trên 200-300 thường được thay thế bằng bội số, hệ số.


5.2 Trung bình (giá trị)

Giá trị trung bình là một đặc trưng định lượng được khái quát hóa của một tính trạng trong quần thể thống kê trong những điều kiện cụ thể về địa điểm và thời gian, là hình thức phổ biến nhất của chỉ tiêu thống kê.

Xem xét các loại trung bình được tính cho các trường hợp mỗi biến thể của chuỗi biến thiên chỉ xảy ra một lần (khi đó trung bình được gọi là đơn giản hoặc không có trọng số) và khi biến thể hoặc khoảng được lặp lại (trung bình có trọng số). Tùy chọn số lần lặp lại - tần suất. Khi chọn một hoặc một loại trung bình khác, người ta nên tiến hành theo nguyên tắc về ý nghĩa của kết quả khi tổng hợp hoặc khi cân.

Ý nghĩa số học.

X là sức mạnh trung bình;

Z là số mũ xác định loại trung bình cộng;

Xi - tùy chọn;

mi – tần số hoặc trọng số thống kê của các biến thể.

Điều hòa trung bình (z=-1).


gia sư

Cần giúp học một chủ đề?

Các chuyên gia của chúng tôi sẽ tư vấn hoặc cung cấp dịch vụ gia sư về các chủ đề mà bạn quan tâm.
Nộp đơn chỉ ra chủ đề ngay bây giờ để tìm hiểu về khả năng nhận được tư vấn.

§1.Khái niệm thống kê, tính đều đặn thống kê, tính tổng thể..... 2

§2. Dấu hiệu của các đơn vị dân số thống kê, phân loại của chúng ...... 2

§một. Khái niệm về quan sát thống kê, sự chuẩn bị của nó ............... 4

§2. Các loại quan sát thống kê .............................................................. ................... .. 5

§3. Sai số quan sát ............................................................ ..................... ................... 6

§bốn. Tóm tắt và phân nhóm ............................................................ ............... ................. 6

§5. Các loại nhóm thống kê .............................................................. ............ 6

§6. Bảng thống kê ................................................................. ... ............ 7

§7. Biểu đồ thống kê ............................................................ ................... ............. tám

§một. Phân phối thực tế và lý thuyết .................................................. .21

§2. Đường cong phân phối chuẩn ............................................................ 21

§3. Kiểm định Giả thuyết về Phân phối Chuẩn....................................21

§bốn. Tiêu chí phù hợp: Pearson, Romanovsky, Kolmogorov........... 21

§5. Giá trị thực tiễn của mô hình chuỗi phân phối ..... 22

§một. Khái niệm quan sát chọn lọc. Lý do sử dụng ...... 23

§3. Lỗi lấy mẫu .................................................................. ............... 24

§bốn. Nhiệm vụ quan sát mẫu ............................................................ 25

§5. Mở rộng dữ liệu quan sát mẫu cho dân số chung... 26

§6. Mẫu nhỏ ............................................................. .............. ................ 26

§một. Khái niệm tương quan và CRA ......................................... 27

§2. Điều kiện sử dụng và giới hạn của KPA .............................. 27

§3. Hồi quy cặp theo phương pháp bình phương nhỏ nhất.. 28

§bốn. Ứng dụng của phương trình hồi quy tuyến tính ghép đôi ............ 29

§6. Đa tương quan.................................................. 32


Chủ đề 1.: Nhập môn thống kê.

  1. các khái niệm thống kê, quy luật thống kê và dân số.
  2. dấu hiệu của các đơn vị dân số thống kê, phân loại của họ.
  3. đối tượng và phương pháp thống kê.

§1.Khái niệm thống kê, tính đều đặn thống kê và tính toàn phần.

Từ thống kê bắt nguồn từ tiếng Latin “ trạng thái” trong bản dịch - một trạng thái, một trạng thái.

Thuật ngữ thống kê bắt nguồn từ nửa sau của thế kỷ 18. Liên quan đến kiến ​​​​thức về các trạng thái, nghiên cứu về các tính năng của chúng. Việc bắt đầu giảng dạy thống kê tại trường đại học cũng bắt đầu từ thời điểm đó. Tùy theo ngành nghiên cứu thống kê có: thống kê dân số, thống kê công nghiệp, nông nghiệp, v.v. - Thống kê áp dụng.

Lý thuyết chung về thống kê là tập hợp các phương pháp và kỹ thuật thu thập, xử lý, trình bày và phân tích dữ liệu số. Thuật ngữ thống kê được sử dụng ngày nay theo 3 nghĩa:

  1. như một từ đồng nghĩa với từ "dữ liệu"
  2. một nhánh ý nghĩa kết hợp các nguyên tắc và phương pháp làm việc với dữ liệu số đặc trưng cho các hiện tượng đại chúng (tuổi thọ của nam thấp hơn nữ)
  3. một nhánh của hoạt động thực tế nhằm xử lý và phân tích dữ liệu số

Thống kê giúp xác định và đo lường mô hình phát triển của các quá trình và hiện tượng kinh tế - xã hội, cũng như mối quan hệ giữa chúng trong những điều kiện cụ thể về địa điểm và thời gian.

Tính quy luật đề cập đến sự lặp lại, trình tự và thứ tự của những thay đổi trong các hiện tượng.

Tính quy luật thống kê - tính quy luật trong đó tính tất yếu gắn bó chặt chẽ với nhau trong từng hiện tượng riêng lẻ với tính ngẫu nhiên và chỉ trong vô số hiện tượng mới biểu hiện thành quy luật. Khái niệm về quy luật thống kê bị phản đối bởi khái niệm về quy luật động biểu hiện trong mọi hiện tượng. (ví dụ: S circle =pr 2 than > r chủ đề > S circle). Đối tượng của nghiên cứu thống kê là tập hợp thống kê - tập hợp các đơn vị có tính chất đại chúng, tính đồng nhất, được xác định bởi tính toàn vẹn và sự có mặt của biến thiên. Mỗi phần tử riêng lẻ được gọi là một đơn vị tổng thể thống kê (ESS)

§2. Dấu hiệu của các đơn vị dân số thống kê, phân loại của họ.

ECC có một số thuộc tính được gọi là tính năng. Thống kê nghiên cứu các hiện tượng thông qua các đặc trưng của chúng, tập hợp càng đồng nhất thì các đơn vị của nó càng có nhiều đặc trưng chung và giá trị của các đặc trưng này càng ít biến đổi.

Dấu hiệu miêu tả là dấu hiệu chỉ được biểu đạt bằng lời nói.

  1. Dấu hiệu định lượng - một dấu hiệu có thể được biểu thị bằng số.
  2. Dấu hiệu trực tiếp là thuộc tính trực tiếp vốn có trong đối tượng đặc trưng.
  3. Một dấu hiệu gián tiếp là các thuộc tính không phải của chính đối tượng được đặc trưng, ​​​​mà của đối tượng được liên kết với nó hoặc được bao gồm trong nó.
  4. thuộc tính chính là một giá trị tuyệt đối có thể đo lường được.
  5. tính năng phụ - kết quả so sánh các tính năng chính, nó được đo lường trực tiếp.
  6. ký tự nhiên - đo bằng đơn vị, kg, tấn, lít, v.v.
  7. dấu hiệu lao động - tính bằng ngày công, giờ công.
  8. thuộc tính giá trị - được đo bằng rúp, $, €, ₤.
  9. ký hiệu không thứ nguyên - đo lường bằng cổ phiếu,%
  10. một tính năng thay thế là một tính năng chỉ lấy một giá trị trong số một số giá trị có thể.
  11. dấu rời rạc - chỉ nhận một giá trị nguyên, không có giá trị trung gian.
  12. một tính năng liên tục là một tính năng nhận bất kỳ giá trị nào trong một phạm vi nhất định.
  13. Một đặc điểm nhân tố là một đặc điểm làm thay đổi một đặc điểm khác.
  14. đặc điểm hiệu quả - một đặc điểm thay đổi theo đặc điểm khác
  15. dấu hiệu tạm thời - một dấu hiệu được đo tại một thời điểm nhất định.
  16. dấu khoảng - một dấu hiệu trong một khoảng thời gian nhất định.

Cùng một tính năng có thể được phân loại đồng thời theo các cách phân loại khác nhau.

§3. Đối tượng và phương pháp thống kê.

Đối tượng của nghiên cứu thống kê là tập hợp thống kê - một tập hợp các đối tượng khác nhau về chất lượng.

Các chi tiết cụ thể của chủ đề thống kê xác định các chi tiết cụ thể của phương pháp, chúng bao gồm:

  1. thu thập dữ liệu (quan sát thống kê, xuất bản)
  2. khái quát hóa dữ liệu (tóm tắt, nhóm)
  3. trình bày dữ liệu (bảng và đồ thị)
  4. phân tích và giải thích dữ liệu số (tính toán trung bình, phân tích các biến thể, KRA, chuỗi động lực học, chỉ số)

Chủ đề 2: Tổ chức quan sát thống kê.

Tổng hợp và nhóm dữ liệu.

§một. Khái niệm về quan sát thống kê, sự chuẩn bị của nó.

§2. Các loại quan sát thống kê.

§3 Sai số quan sát.

§4 Tóm tắt và phân nhóm

§5 Các loại phân nhóm thống kê.

§6 Bảng thống kê.

§7 Đồ thị thống kê.

§một. Khái niệm về quan sát thống kê, sự chuẩn bị của nó.

Bất kỳ nghiên cứu thống kê nào cũng bắt đầu bằng việc thu thập dữ liệu.

Nguồn thông tin:

  1. các ấn phẩm khác nhau (báo, tạp chí, v.v.)
  2. nguồn chính của thông tin thống kê được xuất bản là các ấn phẩm của cơ quan thống kê nhà nước (RF năm 2001, nhà xuất bản GOSKOMSTAT).
  3. thực hiện quan sát thống kê, tức là tổ chức thu thập dữ liệu một cách khoa học.

Quan sát thống kê là quan sát hàng loạt, có kế hoạch, được tổ chức khoa học về các hiện tượng của đời sống kinh tế - xã hội, bao gồm việc đăng ký các dấu hiệu cho từng đơn vị dân số được nghiên cứu.

Quá trình quan sát:

  1. Chuẩn bị cho quan sát
  2. Tiến hành thu thập dữ liệu hàng loạt
  3. Chuẩn bị dữ liệu để xử lý
  4. Phát triển các đề xuất để cải thiện quan sát thống kê.

Chuẩn bị quan sát:

  1. Xác định mục đích, đối tượng quan sát
  2. Xác định thành phần của dấu hiệu phải đăng ký
  3. Xây dựng tài liệu thu thập dữ liệu
  4. Sự lựa chọn của đơn vị báo cáo và đơn vị mà việc quan sát sẽ được thực hiện.
  5. Nó là cần thiết để xác định các phương pháp và phương tiện để có được dữ liệu.

Các vấn đề tổ chức cần giải quyết:

  1. cần xác định thành phần của các dịch vụ tiến hành nghiên cứu
  2. tóm tắt nhân viên
  3. lập kế hoạch làm việc
  4. sao chép tài liệu để thu thập dữ liệu

Đối tượng quan sát là các hiện tượng, quá trình kinh tế - xã hội.

Cần xác định rõ các dấu hiệu để đăng ký.

Chương trình quan sát - một danh sách các biển báo phải đăng ký trong quá trình quan sát.

Yêu cầu chương trình quan sát:

  1. Chương trình nên chứa các tính năng thiết yếu đặc trưng trực tiếp cho hiện tượng đang nghiên cứu; các dấu hiệu có hiện tượng hoặc dấu hiệu phụ, các giá trị rõ ràng sẽ không đáng tin cậy hoặc sẽ hoàn toàn vắng mặt, không nên được đưa vào chương trình.
  2. Các câu hỏi của chương trình quan sát phải chính xác, không mơ hồ và dễ hiểu để tránh khó khăn trong việc tìm kiếm câu trả lời.
  3. Trình tự các câu hỏi nên được xác định.
  4. Chương trình giám sát nên bao gồm các câu hỏi có tính chất trực tiếp để tiến hành và làm rõ dữ liệu thu thập được.
  5. để đảm bảo tính đồng nhất của thông tin nhận được, chương trình được soạn thảo dưới dạng văn bản - gọi là biểu mẫu thống kê.

Một biểu mẫu thống kê là một tài liệu của một mẫu duy nhất có chứa một chương trình và kết quả quan sát.

Có sự khác biệt giữa dạng riêng lẻ (câu trả lời cho các câu hỏi trên một đơn vị quan sát) và dạng viết tắt (thông tin về một số đơn vị của tổng thể thống kê).

Biểu mẫu và hướng dẫn điền vào biểu mẫu là công cụ để quan sát thống kê.

Việc lựa chọn thời gian quan sát bao gồm giải quyết 2 câu hỏi: thiết lập ngày hoặc khoảng thời gian quan trọng, xác định thời gian quan sát.

Ngày quan trọng - một ngày cụ thể trong năm, giờ trong ngày mà các dấu hiệu phải được đăng ký cho từng đơn vị dân số được nghiên cứu.

Khoảng thời gian quan sát - thời gian mà các biểu mẫu thống kê được điền vào, tức là thời gian cần thiết để thu thập dữ liệu.

Cần lưu ý rằng khoảng cách của khoảng thời gian quan sát so với ngày hoặc khoảng thời gian quan trọng có thể dẫn đến giảm độ tin cậy của thông tin thu được.

§2. Các loại quan sát thống kê.

Trong thống kê trong nước, ba hình thức quan sát thống kê được sử dụng.

  1. báo cáo thống kê của doanh nghiệp, tổ chức, cơ quan.
  2. quan sát thống kê được tổ chức đặc biệt (điều tra dân số, v.v.)
  3. đăng ký - một hình thức giám sát thống kê liên tục các quy trình dài hạn

Quan sát thống kê được phân loại:

Theo thời gian quan sát:

  • quan sát hiện tại - đăng ký liên tục các dấu hiệu được thực hiện (văn phòng đăng ký, tội phạm, v.v.).
  • quan sát định kỳ - được thực hiện trong những khoảng thời gian nhất định (mức sống ở thành phố Chelyabinsk, chi phí của giỏ hàng tiêu dùng, điều tra dân số).
  • Một lần - một quan sát được thực hiện một lần cho một mục đích cụ thể.

Theo diện bao phủ đơn vị dân số:

  • Quan sát liên tục - phải thu thập thông tin về tất cả các ECC
  • Không phải là một quan sát đầy đủ
    • Phương pháp của mảng chính - các đơn vị quan trọng nhất của dân số được nghiên cứu được kiểm tra (để nghiên cứu doanh nghiệp kỹ thuật của vùng Chelyabinsk).
    • Quan sát chọn lọc là lựa chọn ngẫu nhiên các ECC được quan sát.
    • Quan sát chuyên khảo - khi một ECC được quan sát, chúng thường được sử dụng để xây dựng một chương trình quan sát hàng loạt.

Bằng cách thu thập dữ liệu:

  • Quan sát trực tiếp - chính những người đăng ký, bằng cách đo trực tiếp, cân, xác định thực tế của đối tượng được đăng ký (một đứa trẻ dưới 1 tuổi trong phòng khám đa khoa).
  • Quan sát tài liệu - các tài liệu khác nhau được sử dụng (lập một tuyên bố)

Thăm dò ý kiến ​​- thông tin cần thiết được lấy từ lời của người trả lời.

  • Khảo sát chuyển tiếp - được thực hiện bởi các nhân viên được đào tạo đặc biệt, những người nhận được thông tin cần thiết trên cơ sở khảo sát những người có liên quan và tự ghi lại các câu trả lời vào biểu mẫu. Khảo sát thám hiểm có thể là trực tiếp (trực tiếp) và gián tiếp (khảo sát qua điện thoại)
  • Khảo sát phóng viên - thông tin được cung cấp bởi đội ngũ phóng viên tự nguyện, phương pháp này đòi hỏi ít chi phí tài chính, nhưng không đưa ra giá trị chính xác của quan sát.
  • Tự đăng ký - các biểu mẫu được điền bởi chính người trả lời và các nhà đăng ký chỉ phân phát các biểu mẫu của bảng câu hỏi cho họ và giải thích cách điền chúng.

§3. lỗi quan sát

Yêu cầu chính áp dụng cho quan sát thống kê là độ chính xác.

Độ chính xác - mức độ tuân thủ của bất kỳ chỉ báo đặc trưng nào với giá trị thực được xác định từ các tài liệu quan sát thống kê.

Sự khác biệt giữa giá trị tính toán và giá trị thực được gọi là lỗi quan sát, tùy thuộc vào nguyên nhân xảy ra, người ta phân biệt: lỗi đăng ký và lỗi đại diện. Lỗi đăng ký được chia thành ngẫu nhiên và hệ thống.

Lỗi ngẫu nhiên - kết quả của các hành động của các yếu tố ngẫu nhiên (hàng, cột được trộn lẫn)

Lỗi hệ thống - luôn có xu hướng đánh giá quá cao hoặc đánh giá thấp chỉ báo. (tuổi tác)

Lỗi đại diện là bản chất của việc quan sát không liên tục và phát sinh do sao chép không chính xác mẫu của toàn bộ dân số ban đầu.

Sau khi nhận các biểu mẫu thống kê phải:

  1. kiểm tra tính đầy đủ của dữ liệu thu thập được.
  2. thực hiện kiểm soát số học dựa trên mối quan hệ của các tính năng khác nhau với nhau.
  3. để thực hiện kiểm soát logic dựa trên kiến ​​thức về mối quan hệ logic giữa các tính năng.

§bốn. Tóm tắt và phân nhóm

Dựa trên dữ liệu thu thập được, không thể tính toán và đưa ra kết luận, trước tiên, chúng cần được tóm tắt và tóm tắt trong một bảng duy nhất. Đối với những mục đích này, tóm tắt và nhóm được sử dụng.

Tóm tắt - một tập hợp các hoạt động tuần tự để khái quát hóa các sự kiện đơn lẻ cụ thể tạo thành một tập hợp và xác định các đặc điểm và mô hình điển hình vốn có trong toàn bộ hiện tượng đang nghiên cứu.

Vodka đơn giản - đếm tổng số cho dân số.

Một bản tóm tắt phức tạp là một tập hợp các hoạt động để nhóm các quan sát riêng lẻ, đếm kết quả cho từng nhóm và cho toàn bộ đối tượng và trình bày kết quả dưới dạng bảng thống kê.

Theo hình thức xử lý tài liệu, bản tóm tắt có thể được phân cấp, tập trung - một bản tóm tắt như vậy được thực hiện với quan sát thống kê một lần.

Phân nhóm - phân chia tập hợp các đơn vị dân số được nghiên cứu thành các nhóm theo các đặc điểm nhất định.

§5. Các loại nhóm thống kê

Các nhóm có thể được phân loại theo cấu trúc và nội dung.

Nhóm phân tích đặc trưng cho mối quan hệ giữa các tính năng, một trong số đó là một yếu tố và cái kia là hiệu quả.

giáo dục

Không đầy đủ cao

§6. bảng thống kê

Các kết quả của việc tóm tắt và phân nhóm nên được trình bày theo cách mà chúng có thể được sử dụng.

Có 3 cách trình bày dữ liệu:

  1. dữ liệu có thể được bao gồm trong văn bản.
  2. trình bày dưới dạng bảng.
  3. cách đồ họa

Bảng thống kê - một hệ thống các hàng và cột trong đó các thông tin thống kê về các hiện tượng kinh tế - xã hội được trình bày theo một trình tự nhất định.

Phân biệt chủ ngữ, vị ngữ của bảng.

Chủ ngữ là một đối tượng được đặc trưng bởi các con số, thông thường chủ ngữ được cho ở phía bên trái của bảng.

Vị từ là một hệ thống các chỉ số mà đối tượng được đặc trưng.

Bảng thống kê gồm 3 loại tiêu đề: chung, phụ

Tiêu đề chung phải phản ánh nội dung của toàn bộ bảng, nằm phía trên bảng ở trung tâm.

Nội quy bảng.

  1. cả ba loại tiêu đề không có từ viết tắt là bắt buộc, đơn vị đo lường thông dụng có thể được đặt trong tiêu đề.
  2. bảng không được có thêm dòng, có thể thiếu các dấu dọc.
  3. Dòng cuối cùng là bắt buộc. Nó có thể ở đầu hoặc ở cuối tài liệu. Nếu ở đầu tài liệu thì nếu ở cuối thì TỔNG:
  1. dữ liệu kỹ thuật số trong một cột được ghi lại với một mức độ chính xác. Các chữ số được viết chặt chẽ dưới các chữ số, toàn bộ phần được phân tách bằng dấu phẩy.
  2. bảng không được chứa các ô trống, nếu không có dữ liệu thì ghi “Không có thông tin” hoặc “…”, nếu dữ liệu bằng 0 thì ghi “-”. Nếu giá trị không bằng 0 nhưng chữ số có nghĩa đầu tiên xuất hiện sau độ chính xác được chỉ định 0,01®0,0 - nếu độ chính xác được chấp nhận lên đến phần mười.
  3. nếu có nhiều cột trong bảng thì các cột của chủ ngữ được biểu thị bằng chữ in hoa và các cột của vị ngữ được biểu thị bằng số.
  4. nếu bảng dựa trên dữ liệu mượn, thì nguồn dữ liệu được chỉ định bên dưới bảng, nếu cần, bảng có thể được kèm theo ghi chú.

§7. đồ thị thống kê

Các bảng thống kê có thể được bổ sung bằng các biểu đồ.

Biểu đồ thống kê là hình ảnh có điều kiện của các giá trị số và tỷ lệ của chúng thông qua các đường, hình hình học, hình vẽ.

Ưu điểm của hình ảnh đồ họa

  1. rõ ràng, dễ thấy, biểu cảm.
  2. các giới hạn thay đổi của chỉ báo, tỷ lệ thay đổi và biến động so sánh có thể nhìn thấy ngay lập tức

Nhược điểm của một hình ảnh đồ họa

  1. Bao gồm ít dữ liệu hơn trong bảng.
  2. biểu đồ hiển thị dữ liệu được làm tròn, tình hình chung, nhưng không phải là chi tiết.

đồ thị thống kê

sơ đồ

quăn

Chuyên đề 3: Các chỉ tiêu thống kê.

§một. Bản chất và ý nghĩa của một chỉ tiêu thống kê, các thuộc tính của nó.

§2. Phân loại chỉ tiêu thống kê.

§3. Các loại chỉ tiêu tương đối. Nguyên lý thi công.

§bốn. Các hệ thống chỉ tiêu thống kê.

Dấu hiệu thống kê là thuộc tính vốn có trong KTTT, nó tồn tại một cách khách quan từ việc nó có được nghiên cứu với tư cách là một khoa học hay không.

Một chỉ số thống kê là một đặc điểm tổng quát của một số thuộc tính của dân số.

Cấu trúc của một chỉ tiêu thống kê (các thuộc tính của nó):

  • Giá trị trung bình
  • chỉ số biến đổi
  • Chỉ báo kết nối tính năng
  • Các chỉ tiêu về cơ cấu và tính chất phân phối
  • chỉ báo động
  • chỉ số biến đổi
  • Các chỉ số về độ chính xác và độ tin cậy của ước tính mẫu
  • Các chỉ số về độ chính xác và độ tin cậy của dự báo

Theo loại: tổng số đơn vị hoặc tổng thuộc tính của đối tượng. Đây là tổng các đặc điểm chính, được đo bằng đơn vị, kg, m, $, v.v.

chỉ số tương đối- thu được bằng cách so sánh các chỉ tiêu tuyệt đối hoặc tương đối trong không gian, theo thời gian hoặc bằng cách so sánh các chỉ tiêu thuộc các tính chất khác nhau của đối tượng nghiên cứu.

Chỉ báo tương đối bậc 1 thu được bằng cách so sánh 2 x chỉ báo tuyệt đối. Chỉ báo tương đối bậc 2 thu được bằng cách so sánh các chỉ báo tương đối bậc 1, v.v.

Chỉ số tương đối bậc 3 trở lên là rất hiếm.

Các chỉ số trực tiếp - các chỉ số như vậy, giá trị của chúng tăng lên cùng với sự gia tăng của hiện tượng đang nghiên cứu.

Các chỉ số nghịch đảo - các chỉ số có giá trị giảm khi hiện tượng đang được nghiên cứu gia tăng.

… cấu trúc

…diễn giả

…các mối quan hệ

… cường độ

… liên quan đến tiêu chuẩn

... phép so sánh

chỉ tiêu cơ cấu có được bằng cách liên hệ bộ phận với toàn thể.

Các chỉ số tương đối của động lực học

ü Các chỉ tiêu về tính năng động (tốc độ tăng trưởng, tốc độ tăng trưởng)

ü Chỉ số

chỉ số mối quan hệ Nêu mối quan hệ giữa các đặc trưng:

ü Hệ số tương quan

ü Chỉ số phân tích

chỉ số cường độđặc trưng cho mối quan hệ của hai đối tượng trên những cơ sở khác nhau.

ü Cường độ lao động - lượng thời gian được sử dụng để sản xuất một đơn vị sản phẩm

ü Sản xuất - số lượng sản phẩm được sản xuất trên một đơn vị thời gian

ĐẦU RA \u003d 1/ cường độ lao động

Các chỉ số về thái độ đối với tiêu chuẩn- tỷ lệ các giá trị thực tế của dấu hiệu của chỉ báo so với quy chuẩn, kế hoạch, tối ưu.

Các chỉ số so sánh - so sánh các đối tượng khác nhau trên cùng một cơ sở.

Nguyên tắc chung xây dựng chỉ tiêu thống kê:

  1. thống kê có quan hệ khách quan.
  2. Các chỉ số được so sánh chỉ có thể khác nhau ở một thuộc tính; bạn không thể so sánh một chỉ số theo hai hoặc nhiều thuộc tính.
  3. cần phải biết và tính đến các giới hạn của chỉ báo.

Đối với mỗi đặc điểm của đối tượng cần có hệ thống chỉ tiêu thống kê.

  1. chức năng nhận thức - dựa trên phân tích dữ liệu
  2. tuyên truyền
  3. chức năng kích thích

Chủ đề 4: Trung bình cộng

§một. khái niệm trung bình

§2. các loại trung bình

§3. trung bình cộng và tính chất của nó

§bốn. trung bình điều hòa, trung bình hình học, trung bình bậc hai.

§5. trung bình đa biến

Hình thức phổ biến nhất của các chỉ số thống kê là trung bình.

Tính chất quan trọng nhất của giá trị trung bình là nó phản ánh cái chung vốn có trong mỗi đơn vị dân số đang nghiên cứu, mặc dù giá trị thuộc tính của các đơn vị dân số riêng lẻ có thể dao động theo hướng này hay hướng khác.

Tính điển hình của giá trị trung bình có liên quan trực tiếp đến tính đồng nhất của dân số được nghiên cứu. Trong trường hợp dân số không đồng nhất, cần chia nó thành các nhóm đồng nhất về chất và tính giá trị trung bình cho từng nhóm đối với từng nhóm đồng nhất.

Bạn có thể xác định mức trung bình thông qua tỷ lệ ban đầu của mức trung bình (ISS) theo công thức logic của nó.

trung bình cấu trúc

Thời Trang - Mơ

trung bình - Tôi

Trong chuỗi động lực học, trung bình cộng và trung bình thời gian được tính toán.

trung bình cộng được gọi là giá trị trung bình của đối tượng trong phép tính sao cho tổng thể tích của đối tượng không thay đổi.

Ví dụ: trọng lượng.

Thứ Tư số học đơn giản

x tôi– giá trị cá nhân của tính năng

n là tổng số dân số nghiên cứu

xem trọng số học

Thuộc tính cf. Môn số học.

Tổng độ lệch của các giá trị riêng lẻ của một đặc điểm so với giá trị trung bình của nó bằng không

nếu mỗi giá trị riêng lẻ của một tính năng được nhân hoặc chia cho cùng một số không đổi, thì giá trị trung bình sẽ tăng hoặc giảm theo cùng một lượng.

nếu một và cùng một số không đổi được thêm vào từng giá trị riêng lẻ của thuộc tính, thì giá trị trung bình sẽ thay đổi tương ứng theo cùng một số.

Bằng chứng

nếu trọng số f của trung bình cộng được nhân hoặc chia cho cùng một số, thì trung bình sẽ không thay đổi.

tổng bình phương độ lệch của thuộc tính nhỏ hơn bất kỳ số nào khác.

Các loại trung bình khác

Loại giữa

trung bình đơn giản

Bình quân gia quyền

điều hòa

hình học

bậc hai

Rất khó để mô tả đặc điểm của nhóm trên một cơ sở và rất ít thông tin còn lại trong bộ nhớ.

Trung bình đa biến - giá trị trung bình cho một số tính năng E.S.S.

Từ tỷ lệ của các giá trị tính năng cho E.S. đến giá trị trung bình của các tính trạng này.

Trung bình đa biến cho tôi đơn vị

x ij– giá trị của tính năng j cho đơn vị i

Giá trị trung bình của tính năng j

k là số lượng tính năng

j là số lượng đối tượng và số lượng dân số của nó

Chủ đề 5: Phân tích biến thể

§một. Sự thay đổi của các dấu hiệu và nguyên nhân của nó

§2. cấp bậc phân phối

§3. Đặc điểm cấu tạo của dãy biến thiên.

§bốn. Sức mạnh của các chỉ số biến thể.

§5. Chỉ số cường độ biến đổi

§6. các loại phân tán. Quy tắc cộng phương sai.

Sự thay đổi giá trị của một đối tượng địa lý trong tổng thể là sự khác biệt về giá trị của nó giữa các đơn vị khác nhau của một tổng thể nhất định trong cùng một khoảng thời gian hoặc thời điểm.

Lý do cho sự thay đổi: các điều kiện khác nhau cho sự tồn tại của ESS, chính sự thay đổi tạo ra nhu cầu về một ngành khoa học như thống kê.

Thực hiện phân tích biến phân bắt đầu bằng việc xây dựng một chuỗi biến phân - một phân bố có thứ tự của các đơn vị dân số theo các dấu hiệu tăng hoặc giảm và đếm các tần số tương ứng.

cấp bậc phân phối

ü xếp hạng

ü rời rạc

ü khoảng thời gian

Chuỗi biến thể được xếp hạng- một danh sách các đơn vị cá nhân. tổng hợp theo thứ tự tăng dần của tính năng được xếp hạng

Chuỗi biến thể rời rạc - một bảng gồm 2 hàng - các giá trị polime của một tính trạng biến đổi và số đơn vị có giá trị tính trạng cho trước.

Một chuỗi biến phân khoảng được xây dựng trong các trường hợp sau:

  1. tính năng nhận các giá trị rời rạc, nhưng số lượng của chúng quá lớn
  2. thuộc tính nhận bất kỳ giá trị nào trong một phạm vi nhất định

Khi xây dựng chuỗi biến thiên khoảng, cần chọn số nhóm tối ưu, phương pháp phổ biến nhất là sử dụng công thức Sturgess

k - số khoảng thời gian

n là khối lượng dân số

Trong các phép tính, hầu như luôn thu được các giá trị phân số, làm tròn thành một số nguyên.

Độ dài khoảng thời gian - tôi

các loại khoảng thời gian

giới hạn dưới của khoảng thời gian tiếp theo lặp lại giới hạn trên của khoảng thời gian tiếp theo

khoảng mở, khoảng có một biên

Khi tính toán cho một chuỗi biến thiên khoảng, giá trị giữa của khoảng được lấy là x i.

NME =60 trung vị = 1

Tích lũy - phân phối nhỏ hơn

Ogiva – phân phối lớn hơn

Trung vị là giá trị của một tính năng chia toàn bộ dân số thành hai phần bằng nhau.

Đối với một chuỗi biến thiên rời rạc, cách tính trung vị: nếu n chẵn thì S. Đơn vị trung vị

Chuỗi biến thiên khoảng:

k - số khoảng thời gian

x 0 - giới hạn dưới của khoảng trung vị

tôi là độ dài của khoảng trung bình

Tổng các tần số

Tần suất tích lũy của khoảng trước trung vị.

Tần số khoảng thời gian trung bình

Khoảng thời gian trung bình– khoảng đầu tiên có tần số tích lũy vượt quá một nửa tổng các tần số.

Về mặt đồ họa, trung vị nằm trên tích lũy.

  1. Quartiles - giá trị của thuộc tính chia dân số thành 4 phần bằng nhau.

phần tư thứ nhất

phần tư thứ 3

phần tư thứ 2 - trung vị.

xq 1 x Q 3 - giới hạn dưới của khoảng chứa phần tư thứ 1 và thứ 3.

l - chiều dài khoảng

và - tần số tích lũy của các khoảng của các khoảng trước đó chứa phần tư thứ 1 và thứ 3.

Tần suất của các khoảng tứ phân vị.

Để mô tả chuỗi biến thể, những điều sau đây được sử dụng:

Deciles - chia dân số thành 10 phần bằng nhau, Percitiles - chia dân số thành 100 phần bằng nhau.

  1. Chế độ là một đặc điểm tính năng thường xuyên xảy ra. Đối với một chuỗi biến thể rời rạc - tần số cao nhất. Đối với một chuỗi biến thiên khoảng thời gian, chế độ được tính bằng công thức sau:

Giới hạn dưới của khoảng phương thức

tôi- độ dài khoảng phương thức

fMo- tần số khoảng phương thức

f Mo +1 là tần số của khoảng theo phương thức

Khoảng thời gian phương thức - khoảng thời gian có tần số cao nhất. Về mặt đồ họa, chế độ được tìm thấy trên biểu đồ.

  1. biến thể nhịp
  2. Độ lệch tuyến tính trung bình

có trọng số

  1. phân tán:

có trọng số

  1. độ lệch chuẩn

tính chất phân tán.

  1. việc giảm tất cả các giá trị của một tính năng theo cùng một lượng không làm thay đổi giá trị của phương sai.
  2. Giảm tất cả các giá trị tính năng xuống k lần sẽ giảm phương sai xuống đến 2 lần và RMS trong đến Một lần
  3. nếu bạn tính bình phương trung bình của các độ lệch so với bất kỳ giá trị A nào khác với giá trị trung bình số học, thì giá trị đó sẽ luôn lớn hơn bình phương trung bình của các độ lệch được tính từ giá trị trung bình cộng. Do đó, từ giá trị trung bình luôn nhỏ hơn tính từ bất kỳ giá trị nào khác, tức là nó có tài sản tối thiểu. RMS = 1,25 - với phân phối gần bình thường.

Trong điều kiện phân phối chuẩn, có mối quan hệ sau giữa và số lượng quan sát trong 68,3% số quan sát.

95,4% quan sát nằm trong giới hạn

99,7% quan sát nằm trong giới hạn

Để so sánh sự biến đổi của các tính trạng trong các quần thể khác nhau hoặc so sánh sự biến đổi của các tính trạng khác nhau trong cùng một quần thể, người ta dùng chỉ thị tương đối, cơ sở là trung bình cộng.

  1. Khoảng biến thiên tương đối.
  2. Độ lệch tuyến tính tương đối
  3. hệ số biến thiên

các chỉ số này không chỉ đưa ra đánh giá so sánh mà còn hình thành nên tính đồng nhất của dân số. Tập hợp được coi là đồng nhất nếu hệ số biến thiên không vượt quá 33%.

Cùng với việc nghiên cứu sự biến đổi của một tính trạng trong toàn bộ quần thể, người ta thường phải theo dõi những thay đổi về số lượng của tính trạng đó, nhưng đối với các nhóm mà quần thể được phân chia và giữa chúng. Điều này đạt được bằng cách tính toán các chế độ xem khác nhau.

Các loại phân tán:

  1. Tổng phương sai
  2. Phương sai giữa các nhóm
  3. Phương sai trong nhóm (dư)

1. đo lường sự biến đổi của một tính trạng trong toàn bộ quần thể dưới tác động của tất cả các nhân tố gây ra sự biến đổi đó

Thí dụ: tiêu thụ sữa chua: dựa trên mẫu 100 người

Địa vị xã hội

x i - giá trị riêng của thuộc tính

Giá trị trung bình của tính trạng trên toàn bộ quần thể

tần suất của tính năng này.

  1. 2. đặc trưng cho sự biến đổi của tính trạng dưới tác động của tính trạng của nhân tố quy định nhóm.

nhóm trung bình

Điểm trung bình chung của nhóm

Tần suất theo nhóm

  1. 3. đặc trưng cho sự biến đổi của một tính trạng dưới ảnh hưởng của các yếu tố không được bao gồm trong nhóm

x ijtôi tính năng giá trị trong nhóm j

Giá trị trung bình của tính năng trong j tập đoàn

f ij - tần sốtính năng thứ i trongnhóm j

Có một quy tắc nối 3 loại phương sai, nó được gọi là quy tắc cộng phương sai.

phân tán còn lại bởi j tập đoàn

Tổng các tần số trên j tập đoàn

N là tổng các tần số

nhiệm vụ chính của phân tích chuỗi biến phân là xác định các mẫu phân bố tần số.

Đường cong phân phối là một biểu diễn đồ họa dưới dạng một đường thay đổi tần số liên tục trong một chuỗi biến thể trong một thay đổi liên quan đến chức năng trong giá trị của một tính năng.

Đường cong phân phối có thể được vẽ bằng đa giác và biểu đồ. Nên giảm phân phối theo kinh nghiệm thành lý thuyết, thành một trong những hình thức được nghiên cứu kỹ lưỡng.

Đường cong của phân phối chuẩn.

Có các loại đường cong phân phối sau:

  1. đơn thức
  2. nhiều đỉnh

Quần thể đồng nhất được đặc trưng bởi các đường cong đơn đỉnh, đường cong nhiều đỉnh biểu thị tính không đồng nhất của quần thể và nhu cầu sắp xếp lại.

Việc tìm ra bản chất chung của phân phối liên quan đến việc đánh giá tính đồng nhất của nó và tính toán độ lệch và độ nhọn. Đối với phân phối đối xứng

Đối với một nghiên cứu so sánh về sự bất đối xứng của các phân phối khác nhau, hệ số bất đối xứng As được tính toán.

Khoảnh khắc trung tâm của thứ tự thứ ba; - RMS lập phương;

Nếu thì sự bất đối xứng có ý nghĩa

Nếu như<0, то As – левосторонняя, если As>0 thì As thuận tay phải.

Nếu thì As không đáng kể. Đối với đối xứng và không đối xứng vừa phải, chỉ số nhọn được tính: nếu E k > 0 thì phân phối đạt cực đại, nếu E k<0, то распределение плосковершинное.

Sự thay đổi của tính năng thay thế được biểu hiện định lượng như sau.

0 - đơn vị không có tính năng này;

1 - đơn vị có tính năng này;

r- tỷ lệ các đơn vị có tính năng này;

q- tỷ lệ các đơn vị không có tính năng này;

sau đó p+q=1.

Tính năng thay thế nhận 2 giá trị 0 và 1 với trọng số Pq.

Dấu hiệu trực tiếp- đây là những dấu hiệu, giá trị của chúng tăng lên cùng với sự gia tăng của hiện tượng đang nghiên cứu.

Biển báo ngược - các dấu hiệu, cường độ giảm khi hiện tượng đang nghiên cứu tăng lên.

Tạo (trực tiếp)

Cường độ lao động (đảo ngược)

Phương sai tối đa của cổ phiếu là 0,25.

Chủ đề 6: Mô hình hóa chuỗi phân phối.

§một. Phân phối thực tế và lý thuyết

§2. Đường cong của phân phối chuẩn.

§3. Kiểm định giả thuyết về phân phối chuẩn.

§bốn. Tiêu chí đồng ý: Pearson, Romanovsky, Kolmogorov.

§5. Giá trị thực tiễn của mô hình chuỗi phân phối.

§một. Phân phối thực tế và lý thuyết

Một trong những mục tiêu quan trọng nhất của việc nghiên cứu chuỗi phân phối là phát hiện ra mô hình phân phối và xác định bản chất của nó. Các mẫu phân phối chỉ được biểu hiện rõ ràng nhất với một số lượng lớn các quan sát.

Phân phối thực tế có thể được mô tả bằng đồ thị bằng cách sử dụng đường cong phân phối - được mô tả bằng đồ thị dưới dạng một đường thay đổi tần suất liên tục trong chuỗi biến thể của biến thể có chức năng liên quan đến thay đổi.

Đường cong phân phối lý thuyết được hiểu là đường cong của loại phân phối này nói chung loại trừ ảnh hưởng của các yếu tố ngẫu nhiên đối với tính quy luật.

Phân phối lý thuyết có thể được biểu thị bằng một công thức giải tích được gọi là công thức giải tích. Phổ biến nhất là phân phối bình thường.

§2. Đường cong của phân phối chuẩn.

Luật phân phối chuẩn:

y là tung độ của phân phối chuẩn

t là độ lệch chuẩn hóa.

; e=2,7218; tôi - tùy chọn chuỗi biến thể; - trung bình;

Đặc tính:

Hàm phân phối chuẩn là chẵn, tức là f(t)=f(-t), . Hàm phân phối chuẩn hoàn toàn được xác định bởi độ lệch chuẩn.

§3. Kiểm định giả thuyết về phân phối chuẩn.

Nguyên nhân dẫn đến quy luật phân phối thường xuyên là do sự phụ thuộc do tác động của nhiều nguyên nhân ngẫu nhiên, không nguyên nhân nào chiếm ưu thế. Nếu Mo = Me được tính trong chuỗi biến thiên, thì điều này có thể cho thấy sự gần gũi với phân phối chuẩn. Bài kiểm tra chính xác nhất về việc tuân thủ luật thông thường được thực hiện bằng các tiêu chí đặc biệt.

§bốn. Tiêu chí đồng ý: Pearson, Romanovsky, Kolmogorov.

Tiêu chí của Pearson.

tần số lý thuyết

tần số thực nghiệm

Phương pháp tính tần số lý thuyết.

  1. Giá trị trung bình số học được xác định và theo chuỗi biến thiên khoảng thời gian, t được tính cho mỗi khoảng thời gian.
  2. Ta tìm giá trị của mật độ xác suất cho luật phân phối chuẩn hóa. TRANG 49
  3. Chúng tôi tìm thấy tần số lý thuyết.

l - chiều dài khoảng

- tổng tần số thực nghiệm

- mật độ xác suất

làm tròn giá trị thành số nguyên

  1. Tính toán tỷ lệ của Pearson
  2. bảng giá trị

d.f. – số khoảng thời gian – 3

d.f. là số bậc tự do.

  1. nếu > , thì phân phối không bình thường, tức là giả thuyết về một phân phối bình thường bị hủy bỏ. Nếu một< , то распределение является нормальным.

tiêu chí Romanovsky.

Tiêu chí của Pearson được tính toán;

Số độ.

Nếu với<3, то распределение близко к нормальному.

Tiêu chí Kolmogorov

, D- giá trị tối đa giữa tần số thực nghiệm và lý thuyết tích lũy. Một điều kiện cần thiết để sử dụng Kolmogorov: Số lượng quan sát lớn hơn 100. Theo một bảng xác suất đặc biệt, có thể lập luận rằng phân phối này là bình thường.

§5. Giá trị thực tiễn của mô hình chuỗi phân phối.

  1. khả năng áp dụng các quy luật phân phối chuẩn vào phân phối thực nghiệm.
  2. khả năng sử dụng quy tắc 3 x sigma.
  3. Khả năng tránh các tính toán tốn thời gian và chi phí bổ sung, bằng cách kiểm tra dân số, biết rằng phân phối là bình thường.

Chủ đề 7: Quan sát có chọn lọc.

§một. Khái niệm quan sát chọn lọc. Lý do sử dụng nó.

§2. Các loại quan sát chọn lọc.

§3. lỗi lấy mẫu.

§bốn. Nhiệm vụ quan sát mẫu

§5. Phân phối dữ liệu quan sát mẫu cho dân số nói chung.

§6. mẫu nhỏ.

§một. Khái niệm quan sát chọn lọc. Lý do sử dụng nó.

quan sát có chọn lọc - một quan sát không liên tục như vậy, trong đó các đơn vị dân số được nghiên cứu, được lựa chọn theo một cách nhất định, được kiểm tra thống kê.

Mục đích (nhiệm vụ) của quan sát mẫu: đối với phần được kiểm tra, để mô tả toàn bộ dân số của các đơn vị tuân theo tất cả các quy tắc và nguyên tắc quan sát thống kê.

Lý do sử dụng quan sát chọn lọc:

  1. tiết kiệm vật tư, chi phí lao động và thời gian;
  2. cơ hội nghiên cứu chi tiết và chi tiết hơn các đơn vị riêng lẻ của dân số thống kê và các nhóm của họ.
  3. một số vấn đề cụ thể chỉ có thể được giải quyết bằng cách sử dụng quan sát chọn lọc.
  4. quan sát chọn lọc có thẩm quyền và được tổ chức tốt mang lại độ chính xác cao của kết quả.

Dân số nói chung là tập hợp các đơn vị mà từ đó việc lựa chọn được thực hiện.

Khung lấy mẫu là tập hợp các đơn vị được chọn để khảo sát. Trong thống kê, người ta thường phân biệt giữa các tham số của tổng thể chung và tổng thể mẫu.

Các loại lấy mẫu

Theo phương thức tuyển chọn:

Lặp đi lặp lại

Đơn vị được đưa vào mẫu, sau khi đăng ký các đặc điểm được quan sát, được đưa trở lại dân số chung để tham gia vào quy trình lựa chọn tiếp theo.

Khối lượng của dân số nói chung không thay đổi, điều này dẫn đến lượng truy cập không đổi trong mẫu của bất kỳ đơn vị nào.

không lặp lại

Một đơn vị được lấy mẫu không được trả lại cho tổng thể mà từ đó việc lựa chọn được thực hiện.

Phương pháp lựa chọn:

thực tế-ngẫu nhiên là liên quan đến các đơn vị từ dân số nói chung một cách ngẫu nhiên hoặc ngẫu nhiên mà không có bất kỳ yếu tố nhất quán nào. Tuy nhiên, trước khi tiến hành một mẫu như vậy, người ta phải đảm bảo rằng tất cả các đơn vị của tổng thể đều có cơ hội như nhau để được đưa vào mẫu, tức là trong danh sách đầy đủ các đơn vị của tổng thể thống kê không được bỏ sót hoặc bỏ qua các đơn vị riêng lẻ. Cũng cần phải thiết lập rõ ràng ranh giới của dân số nói chung. Lựa chọn được thiết lập về mặt kỹ thuật được thực hiện bằng cách bốc thăm hoặc sử dụng bảng số ngẫu nhiên.

lấy mẫu cơ học (mỗi 5 trong danh sách) được sử dụng trong trường hợp dân số nói chung được sắp xếp theo cách nào đó, tức là có một trình tự nhất định trong việc phân phối các đơn vị. Khi tiến hành chọn mẫu cơ giới, tỷ lệ chọn lọc được xác lập, tỷ lệ này được xác lập bằng tỷ lệ giữa tổng thể chung và tổng thể mẫu.

Nguy cơ sai sót trong lấy mẫu cơ học có thể xuất hiện do: sự trùng hợp ngẫu nhiên của khoảng thời gian đã chọn và các mô hình theo chu kỳ trong việc sắp xếp các đơn vị của tổng thể.

lấy mẫu khoanh vùng được sử dụng khi tất cả các đơn vị của dân số nói chung có thể được chia thành các nhóm (khu vực, quốc gia) theo một số thuộc tính.

Mẫu kết hợp.

Việc lựa chọn các đơn vị có thể được thực hiện:

  1. hoặc tỷ lệ với quy mô của nhóm
  2. hoặc tỷ lệ thuận với sự khác biệt giữa các nhóm của tính trạng
  3. , trong đó n là cỡ mẫu, N là cỡ của tổng thể chung, n tôi cỡ mẫu tôi-nhóm, N tôiâm lượng tôi mẫu.
  4. - Phương pháp này chính xác hơn nhưng trong quá trình lấy mẫu rất khó xác định trước về sự biến thiên. (trước khi quan sát).

lựa chọn nối tiếp.

Nó được sử dụng khi các ECC được kết hợp thành các nhóm nhỏ (sê-ri), ví dụ, bao bì có thành phẩm, nhóm học sinh. Bản chất của lấy mẫu nối tiếp là loạt được chọn bằng phương pháp ngẫu nhiên hoặc cơ học, sau đó tiến hành khảo sát liên tục trong loạt đã chọn.

Lựa chọn kết hợp.

Đây là sự kết hợp của các phương pháp lựa chọn đã thảo luận ở trên, thường sử dụng kết hợp giữa sê-ri điển hình và sê-ri, tức là. lựa chọn hàng loạt từ một số nhóm tiêu biểu.

Việc lựa chọn cũng có thể là nhiều giai đoạn và một giai đoạn, nhiều cụm từ và một cụm từ.

Lựa chọn nhiều giai đoạn: từ tổng thể chung, đầu tiên, các nhóm lớn hơn được trích xuất, sau đó là các nhóm nhỏ hơn, v.v. cho đến khi các đơn vị đối tượng điều tra được chọn.

Lựa chọn nhiều cụm từ: liên quan đến việc duy trì cùng một đơn vị lựa chọn ở tất cả các giai đoạn thực hiện của nó. Đồng thời, các đơn vị tuyển chọn được chọn ở mỗi giai đoạn tiếp theo phải được kiểm tra, chương trình đang mở rộng (Ví dụ: sinh viên toàn viện, sau đó là sinh viên của một số khoa).

§3. lỗi lấy mẫu.

có hệ thống

Lỗi đại diện chỉ xảy ra trong quan sát chọn lọc. Phát sinh do quần thể mẫu không thể sao chép chính xác quần thể chung. Chúng không thể tránh được, nhưng chúng rất dễ dự đoán và nếu cần, chúng có thể được giảm thiểu.

Sai số lấy mẫu là sự khác biệt giữa giá trị của một tham số trong tổng thể chung và giá trị của nó được tính toán từ kết quả quan sát mẫu. Dх=-m+ , Dх – sai số biên trong mẫu, m – trung bình chung; - mẫu có nghĩa là.

Sai số lấy mẫu cận biên là một giá trị ngẫu nhiên Các công trình của Chebyshev dành cho việc nghiên cứu các dạng sai số lấy mẫu ngẫu nhiên. Định lý Chebyshev chứng minh rằng Dx không vượt quá: - sai số lấy mẫu trung bình.t-hệ số tin cậy cho biết xác suất của sai số này. trang 42-43.

Trong trường hợp cần xác định t từ F(t) đã biết, chúng ta lấy F(t) lớn gần nhất và xác định t từ đó.

Giới hạn phần lỗi

P - chia sẻ.

Nếu việc lựa chọn được thực hiện theo cách không lặp lại, thì các công thức lỗi giới hạn sẽ được thêm vào

Sửa lỗi không lặp lại.

Đối với mỗi loại quan sát mẫu, lỗi trình bày được tính khác nhau:

  1. quan sát ngẫu nhiên và máy móc thích hợp;
  2. khoanh vùng giám sát
  3. lấy mẫu nối tiếp

r là số sê-ri trong mẫu;

R là số sê-ri trong quần thể chung;

Phương sai giữa các nhóm của tỷ lệ.

§bốn. Nhiệm vụ quan sát mẫu

Dùng cho các công việc sau:

  1. N-? để xác định cỡ mẫu từ F(t), Dx đã biết.
  2. xác định mẫu Dx từ F(t), n đã biết
  3. xác định F(t) từ Dx và n đã biết

1 nhiệm vụ n - ? Đầu tiên, n được xác định theo công thức chọn lại, đối với lựa chọn không lặp lại:

Các cách xác định phương sai:

  1. nó được lấy từ các nghiên cứu tương tự trước đó.
  2. RMS có phân phối chuẩn » 1/6 phạm vi biến thiên.
  3. nếu phân phối rõ ràng là không đối xứng, thì RMS »1/5 của phạm vi biến thể
  4. Đối với chia sẻ, phương sai tối đa có thể p(1-p)=0,25 được áp dụng
  5. với n³100 thì s 2 \u003d S 2 - phương sai mẫu

£30 N£100 thì s 2 \u003d S 2 (n / n-1), s 2 - phương sai chung

N<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2

Khi tính n, người ta không nên theo đuổi giá trị lớn của t và sai số biên nhỏ, vì điều này dẫn đến sự gia tăng trong n và do đó làm tăng chi phí. Định luật sau cũng tương tự.

§5. Phân phối dữ liệu quan sát mẫu cho dân số nói chung.

Mục tiêu cuối cùng của bất kỳ VN nào là đặc trưng cho dân số nói chung.

Các giá trị được tính toán từ các kết quả của VN được phân phối cho dân số nói chung, có tính đến giới hạn sai số biên của chúng.

Giả sử mức tiêu thụ sữa chua mỗi tháng của một người.

£250-20m£250+20; £230 triệu £270

Và chỉ 1000 người

£230,000 triệu £270,000

48%-5%£p£48%+5%

§6. mẫu nhỏ.

Trong thực tiễn nghiên cứu thống kê trong điều kiện hiện đại, việc xử lý các mẫu nhỏ ngày càng trở nên cần thiết.

Mẫu nhỏ - số lượng mẫu quan sát của các đơn vị trong đó không vượt quá 30, n £ 30 /

Sự phát triển của lý thuyết lấy mẫu nhỏ được thực hiện bởi nhà thống kê người Anh Gosset, người đã viết dưới bút danh là sinh viên vào năm 1908.

Ông đã chứng minh rằng ước lượng về sự khác biệt giữa trung bình của một mẫu nhỏ và mẫu chung có một luật phân phối đặc biệt. Khi tính toán cho một mẫu nhỏ, giá trị của s 2 không được tính toán. t st cho các giới hạn lỗi có thể sử dụng tiêu chí sinh viên. Trang 44-45. là xác suất của biến cố ngược lại.

Số bậc tự do

hạn chế lỗi mẫu nhỏ

lỗi chia sẻ cận biên

Chuyên đề 8: Phân tích và mô hình hóa tương quan-hồi quy.

§một. Khái niệm tương quan và CRA.

§2. Điều kiện sử dụng và hạn chế của KPA.

§3. Hồi quy cặp dựa trên phương pháp bình phương nhỏ nhất.

§bốn. Ứng dụng của phương trình hồi quy tuyến tính ghép cặp.

§5. Các chỉ số về độ kín của mối nối và độ bền của mối nối.

§6. Nhiều tương quan.

§một. Khái niệm tương quan và CRA.

Kết nối chức năng y=5x

tương quan

Có 2 loại kết nối giữa các hiện tượng khác nhau và dấu hiệu của chúng, chức năng và thống kê.

Một kết nối như vậy được gọi là chức năng khi, với sự thay đổi giá trị của một trong các biến, biến thứ hai thay đổi theo cách được xác định nghiêm ngặt, tức là giá trị của một biến tương ứng với một hoặc nhiều giá trị được chỉ định chính xác của biến khác . Một kết nối chức năng chỉ có thể thực hiện được khi biến y phụ thuộc vào biến x và không phụ thuộc vào bất kỳ yếu tố nào khác, nhưng trong cuộc sống thực, điều này là không thể.

Một mối quan hệ thống kê tồn tại khi, với sự thay đổi giá trị của một trong các biến, biến thứ hai có thể lấy bất kỳ giá trị nào trong các giới hạn nhất định, nhưng các đặc điểm thống kê của nó thay đổi theo một quy luật nhất định.

Trường hợp cụ thể quan trọng nhất của mối quan hệ thống kê là mối quan hệ tương quan. Với một mối tương quan, các giá trị khác nhau của một biến tương ứng với các giá trị trung bình khác nhau của một biến khác, tức là với sự thay đổi giá trị của thuộc tính x, giá trị trung bình của thuộc tính y thay đổi một cách tự nhiên.

Từ tương quan được giới thiệu bởi nhà sinh vật học và nhà thống kê người Anh Francis Gal (tương quan)

Mối tương quan có thể phát sinh theo những cách khác nhau:

  • sự phụ thuộc nhân quả của sự biến đổi của tính trạng kết quả vào sự biến đổi của tính trạng nhân tố.
  • Có thể xảy ra mối tương quan giữa 2 tác động của cùng một nguyên nhân (đám cháy, số lượng lính cứu hỏa, quy mô đám cháy)
  • Mối quan hệ của các dấu hiệu, mỗi dấu hiệu vừa là nguyên nhân vừa là kết quả (năng suất lao động và tiền lương)

Trong thống kê, người ta thường phân biệt giữa các loại phụ thuộc sau:

  1. tương quan cặp - mối quan hệ giữa 2 dấu hiệu của kết quả và giai thừa, hoặc giữa hai dấu hiệu của giai thừa.
  2. tương quan một phần - mối quan hệ giữa thuộc tính hiệu quả và một yếu tố với một giá trị cố định của thuộc tính yếu tố khác.
  3. nhiều mối tương quan - sự phụ thuộc của đặc điểm kết quả vào hai hoặc nhiều đặc điểm nhân tố được đưa vào nghiên cứu.

Nhiệm vụ của phân tích tương quan là định lượng mức độ chặt chẽ của mối quan hệ giữa các tính năng. Vào cuối thế kỷ 19, Galton và Pearson đã điều tra mối quan hệ giữa chiều cao của người cha và con cái.

Hồi quy kiểm tra hình thức của kết nối. Nhiệm vụ của phân tích hồi quy là xác định biểu thức phân tích của mối quan hệ.

Phân tích hồi quy tương quan như một khái niệm chung bao gồm sự thay đổi độ chặt của kết nối và thiết lập biểu thức phân tích của kết nối.

§2. Điều kiện sử dụng và hạn chế của KRA.

  1. sự hiện diện của dữ liệu đại chúng, bởi vì tương quan thống kê
  2. đòi hỏi phải có sự đồng nhất về chất của quần thể.
  3. sự phụ thuộc của phân phối dân số theo các đặc điểm kết quả và nhân tố, theo luật phân phối chuẩn, có liên quan đến việc sử dụng phương pháp bình phương nhỏ nhất.

§3. Hồi quy cặp dựa trên phương pháp bình phương nhỏ nhất.

Phân tích hồi quy bao gồm việc xác định biểu thức phân tích của mối quan hệ. Biểu mẫu phân biệt giữa hồi quy tuyến tính, được biểu thị bằng phương trình của một đường thẳng và hồi quy phi tuyến tính hoặc.

Theo hướng giao tiếp, chúng được phân biệt theo một đường thẳng, tức là. Khi x tăng, y tăng.

đảo ngược

Đảo ngược tức là khi x tăng, y giảm.

  1. phương pháp đồ họa - bằng cách vẽ dữ liệu thực nghiệm trên trường tương quan, nhưng ước tính chính xác hơn được thực hiện bằng phương pháp bình phương nhỏ nhất.

X - dấu hiệu thực tế

U - một dấu hiệu của hiệu quả

Sự khác biệt giữa giá trị thực tế và giá trị được tính toán bởi phương trình ghép bình phương sẽ có xu hướng ở mức tối thiểu.

Với LSM min là tổng các bình phương độ lệch của các giá trị thực nghiệm y so với các giá trị lý thuyết thu được theo phương trình hồi quy đã chọn.

Đối với một mối quan hệ tuyến tính

Þ một,b

cho parabol

Đối với cường điệu

tham số a, b, c được viết vào phương trình, sau đó chúng tôi thay thế phương trình kết quả bằng giá trị thực nghiệm x tôi và tìm giá trị lý thuyết tôi . Sau đó, chúng tôi so sánh tôi lý thuyết và tôi theo kinh nghiệm. Tổng bình phương của sự khác biệt giữa chúng phải là tối thiểu. Chúng tôi chọn loại phụ thuộc trong đó phụ thuộc này được thực hiện.

Trong phương trình hồi quy tuyến tính theo cặp:

b là hệ số hồi quy tuyến tính theo cặp, nó đo sức mạnh của trái phiếu, tức là đặc trưng cho độ lệch trung bình tổng thể của y so với giá trị trung bình của nó trên mỗi đơn vị đo lường được chấp nhận.

b\u003d 20 khi x thay đổi 1 dấu y lệch khỏi giá trị trung bình của nó trung bình 20 trong dân số.

Dấu dương ở hệ số hồi quy biểu thị mối quan hệ trực tiếp giữa các đặc trưng, ​​dấu “-” biểu thị phản hồi giữa các đặc trưng.

§bốn. Ứng dụng của phương trình hồi quy tuyến tính ghép cặp.

Ứng dụng chính là dự báo theo phương trình hồi quy. Dự báo bị giới hạn bởi điều kiện ổn định của các yếu tố khác và điều kiện của quá trình. Nếu môi trường của quá trình đang diễn ra thay đổi mạnh trong đó, thì phương trình hồi quy này sẽ không diễn ra.

Dự báo điểm thu được bằng cách thay thế giá trị kỳ vọng của nhân tố vào phương trình hồi quy. Xác suất thực hiện chính xác của một dự báo như vậy là vô cùng nhỏ.

Nếu một dự báo điểm được kèm theo một giá trị của sai số dự báo trung bình, thì dự báo đó được gọi là dự báo khoảng.

Sai số dự báo trung bình được hình thành từ hai loại sai số:

  1. lỗi loại 1 - lỗi đường hồi quy
  2. lỗi loại 2 - lỗi liên quan đến lỗi thay đổi.

Lỗi dự báo trung bình.

Lỗi ở vị trí của đường hồi quy trong tổng thể

n - cỡ mẫu

x k - giá trị sai số của hệ số

RMS của đặc điểm kết quả từ đường hồi quy trong dân số nói chung

Phân tích tương quan liên quan đến việc đánh giá mức độ chặt chẽ của kết nối. Các chỉ số:

  1. hệ số tương quan tuyến tính - đặc trưng cho mức độ chặt chẽ và hướng của mối quan hệ giữa hai đối tượng địa lý trong trường hợp giữa chúng có mối quan hệ tuyến tính

tại = -1 kết nối là chức năng nghịch đảo, =1 kết nối là chức năng trực tiếp, tại = 0 không có kết nối.

Nó chỉ được sử dụng cho các mối quan hệ tuyến tính, nó được sử dụng để đánh giá các mối quan hệ giữa các đặc tính định lượng. Chỉ được tính trên các giá trị riêng lẻ.

Tỷ lệ tương quan:

Thực nghiệm: cả hai loại phương sai đều được tính theo thuộc tính kết quả.

lý thuyết:

Độ phân tán của các giá trị của tính năng hiệu quả được tính theo phương trình hồi quy

Phân tán giá trị thực nghiệm của tính năng kết quả

  • độ chính xác cao
  • phù hợp để đánh giá mức độ gần gũi của mối quan hệ giữa đặc điểm mô tả và định lượng, nhưng định lượng phải hiệu quả
  • thích hợp cho tất cả các loại kết nối

Hệ số tương quan của Spearman

thứ hạng - số thứ tự của các đơn vị dân cư trong dãy được xếp hạng. Cần phải xếp hạng cả hai đối tượng theo cùng thứ tự từ nhỏ nhất đến lớn nhất hoặc ngược lại. Nếu thứ hạng của các đơn vị dân số được ký hiệu là p x và p y thì hệ số tương quan của thứ hạng sẽ có dạng sau:

Ưu điểm của hệ số chuỗi tương quan:

  1. Bạn cũng có thể xếp hạng theo các đặc điểm mô tả không thể biểu thị bằng số, do đó, việc tính toán hệ số Spearman có thể thực hiện được đối với các cặp đặc điểm sau: số - số; mô tả - định lượng; Miêu tả - miêu tả. (giáo dục là một thuộc tính mô tả)
  2. hiển thị hướng kết nối

Nhược điểm của hệ số Spearman.

  1. sự khác biệt về thứ hạng giống hệt nhau có thể tương ứng với sự khác biệt hoàn toàn khác nhau về giá trị của một tính trạng (trong trường hợp tính trạng số lượng). Ví dụ: Sản lượng điện của quốc gia mỗi năm

Mỹ 2400 kWh 1

RF 800 kWh 2

Canada 600 kWh 3

Nếu một số giá trị giống hệt nhau xảy ra giữa các giá trị Spearman, thì các cấp bậc liên quan được hình thành, tức là cùng số ở giữa

Trong trường hợp này, hệ số Spearman được tính như sau:

j- số lượng liên kết theo thứ tự cho tính năng x

Aj- số lượng cấp bậc giống hệt nhau trong liên kết j theo x

k- số dây chằng theo thứ tự của tính năng y

Bk- số lượng cấp bậc giống hệt nhau trong cái mà một loạt

  1. 4. Hệ số tương quan xếp hạng Kendall

Số tiền xếp hạng tối đa

S là tổng thực tế của các cấp bậc

Đưa ra ước tính chính xác hơn hệ số Spearman.

Đối với tính toán, tất cả các đơn vị được xếp theo thuộc tính x theo thuộc tính tạiđối với mỗi thứ hạng, số lượng thứ hạng tiếp theo vượt quá tổng đã cho được tính, ký hiệu là P và số lượng thứ hạng tiếp theo bên dưới ký hiệu này Q.

P+Q= 1 / 2 n(n-1)

  1. Hệ số tương quan hạng Fechner.

hệ số Fechner - thước đo mức độ chặt chẽ của kết nối dưới dạng tỷ lệ của sự khác biệt trong số các cặp dấu trùng khớp và không trùng với tổng của các số này.

  1. tính trung bình cho x và y
  2. các giá trị riêng lẻ x i y i được so sánh với các giá trị trung bình với dấu hiệu bắt buộc là dấu “+” hoặc “-”. Nếu các dấu hiệu khớp với x và y, thì chúng tôi chuyển chúng sang số “C”, nếu không, thì chuyển sang số “H”.
  3. đếm số cặp phù hợp và không phù hợp.

Nhiệm vụ đo lường mối quan hệ trở nên trước mắt nhà thống kê liên quan đến các đặc điểm mô tả, một trường hợp đặc biệt quan trọng của nhiệm vụ đó, đo lường mối quan hệ giữa 2 đặc điểm thay thế, một trong số đó là nguyên nhân của hậu quả kia.

Có thể đo lường mức độ chặt chẽ của mối quan hệ giữa 2 tính năng thay thế bằng 2 hệ số:

  1. hệ số kết hợp
  2. yếu tố dự phòng

Hệ số dự phòng có một nhược điểm: khi một trong hai tổ hợp không đồng nhất Av hoặc Ba bằng 0, hệ số sẽ chuyển thành một. Anh ấy đánh giá rất tự do về độ chặt chẽ của mối liên hệ - anh ấy đánh giá quá cao nó.

tỷ lệ của Pearson

Nếu không có hai, nhưng nhiều giá trị có thể có hơn của từng tính năng có liên quan với nhau, thì các hệ số sau được tính:

  1. tỷ lệ của Pearson
  2. Hệ số Chuprov cho một tính năng mô tả

Hệ số Pearson được tính từ các ma trận vuông

Dưới mức trung bình

đến 1 và 2 - số của nhóm tương ứng với các dấu hiệu 1 và 2. Nhược điểm của hệ số Pearson là nó không đạt đến 1 ngay cả khi số lượng nhóm tăng lên.

Hệ số Chuprov (1874–1926)

hệ số Chuprov ước tính chặt chẽ hơn độ kín của kết nối.

§6. Nhiều tương quan.

Việc nghiên cứu mối quan hệ giữa kết quả và hai hoặc nhiều đặc điểm nhân tố được gọi là hồi quy bội. Trong nghiên cứu về sự phụ thuộc bằng phương pháp hồi quy bội, có 2 nhiệm vụ được đặt ra.

  1. xác định biểu thức giải tích mối quan hệ giữa đặc trưng hữu hiệu y và đặc trưng thực x 1 , x 2 , x 3 , ... x k , tức là tìm hàm y \u003d f (x 1, x 2, ... x k)
  2. Đánh giá mức độ chặt chẽ của mối quan hệ giữa hiệu quả và từng dấu hiệu nhân tố.

Mô hình hồi quy tương quan (CRM) là một phương trình hồi quy bao gồm các yếu tố chính ảnh hưởng đến sự biến thiên của thuộc tính kết quả.

Xây dựng mô hình hồi quy bội bao gồm các bước sau:

  1. lựa chọn hình thức giao tiếp
  2. lựa chọn các tính năng yếu tố
  3. Đảm bảo rằng dân số đủ lớn để đưa ra các ước tính chính xác.

I. Toàn bộ các mối quan hệ giữa các biến gặp phải trong thực tế được mô tả khá đầy đủ bởi các chức năng của 5 loại:

  1. tuyến tính:
  2. sức mạnh:
  3. chỉ định:
  4. parabol:
  5. hypebol:

mặc dù tất cả 5 hàm đều có mặt trong thực tế của CRA, nhưng sự phụ thuộc tuyến tính thường được sử dụng nhất, là phương trình phụ thuộc tuyến tính đơn giản nhất và dễ hiểu nhất: , k - một tập hợp các yếu tố có trong phương trình, bj

0 - bởi vì >0.7 do đó chúng tôi đặc biệt chú ý đến chúng

sinh thái. Thang đo độ chặt thông tin liên lạc:

Nếu kết nối là 0 - 0,3 - kết nối yếu

0,3 - 0,5 - đáng chú ý

0,3 - 0,5 - đóng

0,7 - 0,9 - cao

hơn 0,9 - rất cao

sau đó chúng tôi so sánh hai tính năng (thu nhập và giới tính)<0,7, то включаем в уравнение множественной регрессии.

Lựa chọn các yếu tố để đưa vào phương trình hồi quy bội:

  1. phải có mối quan hệ nhân quả giữa hiệu lực và dấu hiệu thực tế.
  2. hiệu quả và dấu hiệu thực tế phải có quan hệ mật thiết với nhau, nếu không sẽ phát sinh hiện tượng đa cộng tuyến (>06) , I E. các dấu hiệu yếu tố có trong phương trình không chỉ ảnh hưởng đến kết quả mà còn ảnh hưởng lẫn nhau, dẫn đến việc giải thích dữ liệu số không chính xác.

Các phương pháp lựa chọn nhân tố đưa vào phương trình hồi quy bội:

1. phương pháp chuyên gia – dựa trên phân tích logic trực quan được thực hiện bởi các chuyên gia có trình độ cao.

2. việc sử dụng ma trận của các cặp hệ số tương quan được thực hiện song song với phương pháp đầu tiên, ma trận đối xứng với đường chéo đơn vị.

3. phân tích hồi quy từng bước - việc đưa các đặc điểm của yếu tố vào phương trình hồi quy và kiểm tra ý nghĩa được thực hiện dựa trên các giá trị của hai chỉ số ở mỗi bước. Chỉ báo tương quan, hồi quy.

Correlation Score: Tính toán sự thay đổi trong tương quan lý thuyết của tỷ lệ hoặc sự thay đổi trong phương sai thặng dư trung bình. Chỉ báo hồi quy là sự thay đổi của hệ số hồi quy thuần túy có điều kiện.

Tổng cộng

31

32

22

85

Dữ liệu thống kê nên được trình bày theo cách mà chúng có thể được sử dụng. Có 3 hình thức trình bày dữ liệu thống kê chính:

1) văn bản - bao gồm dữ liệu trong văn bản;

2) dạng bảng - trình bày dữ liệu dưới dạng bảng;

3) đồ họa - biểu thức của dữ liệu dưới dạng biểu đồ.

Dạng văn bản được sử dụng khi có một lượng nhỏ dữ liệu số.

Dạng bảng được sử dụng thường xuyên nhất, vì đây là dạng trình bày dữ liệu thống kê hiệu quả hơn. Không giống như các bảng toán học, theo các điều kiện ban đầu, cho phép thu được kết quả này hoặc kết quả khác, các bảng thống kê cho biết ngôn ngữ của các con số về các đối tượng đang nghiên cứu.

bảng thống kê- Đây là một hệ thống các hàng và cột, trong đó các thông tin thống kê về các hiện tượng kinh tế - xã hội được trình bày theo một trình tự và mối liên hệ nhất định.

Bảng 2. Ngoại thương của Liên bang Nga 2000 - 2006, tỷ đô la

Mục lục 2000 2001 2002 2003 2004 2005 2006
kim ngạch ngoại thương 149,9 155,6 168,3 280,6 368,9 468,4
Xuất khẩu 101,9 107,3 135,9 183,2 243,6 304,5
Nhập khẩu 44,9 53,8 76,1 97,4 125,3 163,9
cán cân thương mại 60,1 48,1 46,3 59,9 85,8 118,3 140,7
bao gồm:
với nước ngoài
xuất khẩu 90,8 86,6 90,9 114,6 210,1 261,1
nhập khẩu 31,4 40,7 48,8 77,5 103,5 138,6
cán cân thương mại 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Ví dụ, trong bảng. 2 trình bày thông tin về ngoại thương của Nga, sẽ không hiệu quả để thể hiện ở dạng văn bản.

Phân biệt môn họcThuộc tính bảng thống kê. Chủ đề chỉ ra đối tượng được đặc trưng - đơn vị dân số, hoặc nhóm đơn vị hoặc toàn bộ tổng thể. Trong vị ngữ, đặc điểm của chủ đề được đưa ra, thường ở dạng số. Bắt buộc tiêu đề bảng, cho biết dữ liệu trong bảng thuộc về danh mục nào và thời gian nào.

Theo tính chất của đối tượng, bảng thống kê được chia thành giản dị, tập đoàntổ hợp. Trong chủ đề của một bảng đơn giản, đối tượng nghiên cứu không được chia thành các nhóm, nhưng một danh sách tất cả các đơn vị dân số được đưa ra hoặc toàn bộ dân số được chỉ định (ví dụ: Bảng 11). Trong chủ đề của bảng nhóm, đối tượng nghiên cứu được chia thành các nhóm theo một thuộc tính và vị ngữ cho biết số lượng đơn vị trong các nhóm (tuyệt đối hoặc theo tỷ lệ phần trăm) và các chỉ số tóm tắt cho các nhóm (ví dụ: Bảng 4). Trong chủ đề của bảng kết hợp, dân số được chia thành các nhóm không phải theo một mà theo một số tiêu chí (ví dụ: Bảng 2).

Khi xây dựng các bảng, bạn phải được hướng dẫn bởi những điều sau đây quy tắc chung.

1. Chủ đề của bảng nằm ở phần bên trái (ít thường xuyên hơn - phía trên) và vị ngữ - ở bên phải (ít thường xuyên hơn - thấp hơn).

2. Tiêu đề cột ghi tên chỉ tiêu và đơn vị tính.

3. Dòng cuối cùng hoàn thành bảng và nằm ở cuối bảng, nhưng đôi khi nó là dòng đầu tiên: trong trường hợp này, dòng thứ hai được viết là “bao gồm”, và các dòng tiếp theo chứa các thành phần của dòng tổng.

4. Dữ liệu số được ghi với độ chính xác như nhau trong mỗi cột, chữ số của số nằm dưới chữ số, phần nguyên cách nhau bằng dấu phẩy phân số.

5. Không được có các ô trống trong bảng: nếu dữ liệu bằng 0 thì đặt dấu “–” (dấu gạch ngang); nếu không biết dữ liệu thì ghi “không có thông tin” hoặc ghi dấu “…” (dấu chấm lửng). Nếu giá trị số mũ không bằng 0, nhưng chữ số có nghĩa đầu tiên xuất hiện sau mức độ chính xác được chấp nhận, thì 0,0 được ghi lại (ví dụ: nếu mức độ chính xác 0,1 được chấp nhận).

Đôi khi các bảng thống kê được bổ sung bằng các biểu đồ khi mục tiêu là nhấn mạnh một số tính năng của dữ liệu, để so sánh chúng. Hình thức đồ họa là hình thức trình bày dữ liệu hiệu quả nhất về mặt nhận thức của họ. Với sự trợ giúp của các biểu đồ, khả năng hiển thị các đặc điểm của cấu trúc, động lực học, mối quan hệ của các hiện tượng và sự so sánh của chúng đã đạt được.

đồ thị thống kê- đây là những hình ảnh có điều kiện về các giá trị số và tỷ lệ của chúng thông qua các đường kẻ, hình dạng hình học, hình vẽ hoặc biểu đồ địa lý. Dạng đồ họa tạo điều kiện thuận lợi cho việc xem xét dữ liệu thống kê, làm cho chúng trực quan, biểu cảm và có thể nhìn thấy được. Tuy nhiên, biểu đồ có những hạn chế nhất định: trước hết, một biểu đồ không thể bao gồm nhiều dữ liệu như nó có thể chứa trong một bảng; Ngoài ra, biểu đồ luôn hiển thị dữ liệu được làm tròn - không chính xác, nhưng gần đúng. Như vậy, biểu đồ chỉ dùng để thể hiện tình hình chung chứ không thể hiện chi tiết. Hạn chế cuối cùng là sự phức tạp của âm mưu. Nó có thể được khắc phục bằng máy tính cá nhân (ví dụ: "Trình hướng dẫn sơ đồ" từ gói Microsoft OfficeExcel).

Theo phương pháp xây dựng đồ họa, chúng được chia thành sơ đồ, bản đồsơ đồ biểu đồ.

Cách phổ biến nhất để biểu diễn dữ liệu bằng đồ họa là các biểu đồ, thuộc các loại sau: tuyến tính, xuyên tâm, tán xạ, phẳng, thể tích, xoăn. Loại sơ đồ phụ thuộc vào loại dữ liệu được trình bày và nhiệm vụ xây dựng. Trong mọi trường hợp, biểu đồ phải có tiêu đề đi kèm - bên trên hoặc bên dưới trường biểu đồ. Tiêu đề cho biết chỉ báo nào được hiển thị, cho lãnh thổ nào và trong thời gian nào.

Biểu đồ đường được sử dụng để biểu diễn các biến định lượng: đặc điểm của sự thay đổi giá trị của chúng, động lực học, mối quan hệ giữa các biến. Biến thể dữ liệu được phân tích bằng cách sử dụng khu vực phân phối, tích lũy(nhỏ hơn đường cong) và xin lỗi(đường cong "lớn hơn"). Đa giác phân phối được thảo luận trong Chủ đề 4 (ví dụ: Hình 5.). Để xây dựng một tích lũy, các giá trị của tính năng biến được vẽ dọc theo trục hoành và tọa độ là tổng tần số hoặc tần số tích lũy (từ f1đến ∑ f). Để xây dựng một ogive, tổng số tần số tích lũy được đặt trên trục y theo thứ tự ngược lại (từ ∑ f trước f1). Tích lũy và ogive theo Bảng. 4. mô tả trong hình. một.

Cơm. 1. Cộng trừ phân bổ hàng hóa theo trị giá hải quan

Việc sử dụng biểu đồ đường trong phân tích xu hướng được đề cập trong Chủ đề 5 (ví dụ: Hình 13) và việc sử dụng chúng để phân tích liên kết trong Chủ đề 6 (ví dụ: Hình 21). Chủ đề 6 cũng đề cập đến việc sử dụng biểu đồ phân tán (ví dụ: Hình 20).

Biểu đồ đường được chia nhỏ thành một chiều, được sử dụng để biểu diễn dữ liệu trên một biến duy nhất và hai chiều- cho hai biến. Ví dụ về biểu đồ đường một chiều là đa giác phân phối và biểu đồ hai chiều là đường hồi quy (ví dụ: Hình 21).

Đôi khi, với những thay đổi lớn trong chỉ báo, thang logarit được sử dụng. Ví dụ: nếu các giá trị của chỉ báo thay đổi từ 1 đến 1000, thì điều này có thể gây khó khăn khi vẽ đồ thị. Trong những trường hợp như vậy, chúng chuyển sang logarit của các giá trị chỉ báo, giá trị này sẽ không khác nhau nhiều: lg 1 = 0, lg 1000 = 3.

Giữa phẳng Biểu đồ thanh (biểu đồ) được phân biệt theo tần suất sử dụng, trong đó chỉ báo được trình bày dưới dạng thanh, chiều cao tương ứng với giá trị của chỉ báo (ví dụ: Hình 4).

Tỷ lệ diện tích của một hình hình học cụ thể với giá trị của chỉ báo làm cơ sở cho các loại sơ đồ phẳng khác: hình tam giác, Quảng trường, hình hộp chữ nhật. Bạn cũng có thể sử dụng phép so sánh diện tích của hình tròn - trong trường hợp này, bán kính của hình tròn được đặt.

biểu đồ dải trình bày các chỉ số ở dạng hình chữ nhật kéo dài theo chiều ngang và nếu không thì giống như biểu đồ thanh.

Trong số các sơ đồ phẳng, nó thường được sử dụng biểu đồ tròn, được sử dụng để minh họa cấu trúc của dân số được nghiên cứu. Toàn bộ tập hợp được lấy là 100%, nó tương ứng với tổng diện tích của hình tròn, diện tích của các cung tương ứng với các phần của tập hợp. Hãy xây dựng sơ đồ ngành về cơ cấu ngoại thương của Liên bang Nga năm 2006 theo Bảng. 2 (xem hình 2). Khi sử dụng các chương trình máy tính, các sơ đồ ngành được xây dựng ở dạng ba chiều, nghĩa là không phải ở hai mà ở ba mặt phẳng (xem Hình 3).

Cơm. 2. Biểu đồ tròn đơn giản 3. Biểu đồ tròn 3D

Biểu đồ xoăn (hình ảnh) nâng cao độ rõ nét của hình ảnh, vì chúng bao gồm hình ảnh của chỉ báo được hiển thị, kích thước tương ứng với kích thước của chỉ báo.

Khi vẽ biểu đồ, mọi thứ đều quan trọng như nhau - lựa chọn đúng hình ảnh đồ họa, tỷ lệ, tuân thủ các quy tắc thiết kế biểu đồ. Những vấn đề này được đề cập chi tiết hơn trong và.

Bản đồ và bản đồ được sử dụng để mô tả các đặc điểm địa lý của các hiện tượng đang được nghiên cứu. Chúng cho thấy vị trí của hiện tượng đang được nghiên cứu, cường độ của nó trong một lãnh thổ nhất định - trong một nước cộng hòa, khu vực, khu kinh tế hoặc hành chính, v.v. Việc xây dựng bản đồ và bản đồ được xem xét trong tài liệu đặc biệt, chẳng hạn.

Kết thúc công việc -

Chủ đề này thuộc về:

Khái niệm thống kê. Đối tượng và phương pháp thống kê

Khái niệm thống kê.. đối tượng và phương pháp thống kê.. quan sát thống kê..

Nếu bạn cần tài liệu bổ sung về chủ đề này hoặc bạn không tìm thấy những gì bạn đang tìm kiếm, chúng tôi khuyên bạn nên sử dụng tìm kiếm trong cơ sở dữ liệu tác phẩm của chúng tôi:

Chúng tôi sẽ làm gì với tài liệu nhận được:

Nếu tài liệu này hữu ích cho bạn, bạn có thể lưu nó vào trang của mình trên các mạng xã hội:

Tất cả các chủ đề trong phần này:

Đối tượng và phương pháp thống kê
Thuật ngữ "thống kê" được đưa vào sử dụng khoa học bởi nhà khoa học người Đức Gottfried Achenwal vào năm 1746, người đã đề xuất thay thế tiêu đề của khóa học "Nghiên cứu Nhà nước" được giảng dạy tại các trường đại học Đức bằng "St.

quan sát thống kê
Mọi người có thái độ khác nhau đối với thông tin thống kê: một số không nhận thức được nó, những người khác tin tưởng vô điều kiện, và những người khác vẫn đồng ý với ý kiến ​​​​của chính trị gia người Anh Disraeli: “Có 3 loại nói dối: nói dối,

Tổng hợp và phân nhóm thống kê
Tóm tắt - xử lý các tài liệu quan sát được tổ chức một cách khoa học (theo chương trình đã phát triển trước đó), bao gồm, ngoài việc kiểm soát bắt buộc đối với dữ liệu được thu thập, hệ thống hóa, nhóm

giá trị tuyệt đối
Để mô tả các hiện tượng khối lượng, thống kê sử dụng các đại lượng thống kê (chỉ số) đặc trưng cho các nhóm đơn vị hoặc tổng thể (hiện tượng) nói chung. số lượng thống kê

Giá trị tương đối
Một giá trị tương đối là kết quả của việc chia (so sánh) hai giá trị tuyệt đối. Tử số của phân số là giá trị được so sánh và mẫu số là giá trị được so sánh với (ba

Giá trị trung bình
Như đã nói nhiều lần trước đây, thống kê nghiên cứu các hiện tượng và quá trình khối lượng. Mỗi hiện tượng này đều có cả tính chất chung của cả tập hợp và tính chất riêng, đặc biệt.

Xây dựng chuỗi phân phối
Các đặc điểm được nghiên cứu bằng thống kê khác nhau (khác nhau) đối với các đơn vị dân số khác nhau trong cùng một khoảng thời gian hoặc thời điểm. Ví dụ, giá trị kim ngạch ngoại thương thay đổi

Tính toán các đặc điểm cấu trúc của chuỗi phân phối
Khi nghiên cứu sự thay đổi, các đặc điểm như vậy của chuỗi phân phối được sử dụng để mô tả định lượng cấu trúc, cấu trúc của nó. Ví dụ, như vậy là trung vị - giá trị của thuộc tính biến

Tính toán số đo độ lớn và cường độ biến thiên
Chỉ số đơn giản nhất là phạm vi biến đổi - sự khác biệt tuyệt đối giữa giá trị tối đa và tối thiểu của một tính trạng so với các giá trị có sẵn trong quần thể nghiên cứu (24):

Tính toán các khoảnh khắc phân phối và các chỉ số về hình dạng của nó
Để nghiên cứu sâu hơn về bản chất của biến thể, các giá trị trung bình của các mức độ sai lệch khác nhau của các giá trị riêng lẻ của một đặc điểm so với giá trị trung bình số học của nó được sử dụng. Các chỉ số này được gọi là

Kiểm tra xem chuỗi phân phối có bình thường không
Đường cong phân phối lý thuyết được hiểu là biểu diễn đồ họa của một chuỗi dưới dạng một đường thay đổi tần số liên tục trong một chuỗi biến thiên, liên quan về mặt chức năng với sự thay đổi trong các tùy chọn, khác

Kiểm tra chuỗi phân phối có tuân theo định luật Poisson hay không
Kiểm tra hải quan đã tiến hành kiểm tra sau khi giải phóng hàng hóa. Kết quả là, đã thu được chuỗi phân phối riêng biệt sau đây về số lượng vi phạm được xác định trong mỗi thử nghiệm (Bảng 16). Bảng 1

Các chỉ tiêu tuyệt đối và tương đối của sự thay đổi cơ cấu
Sự phát triển của quần thể thống kê không chỉ thể hiện ở sự tăng giảm về số lượng của các phần tử trong hệ thống mà còn thể hiện ở sự thay đổi cấu trúc của nó. Cấu trúc là cấu trúc của tổng hợp

Xếp hạng các chỉ số thay đổi cơ cấu
Để đo lường sự khác biệt trong cấu trúc, các chỉ báo ít chính xác hơn nhưng dễ tính toán hơn thường được sử dụng, dựa trên việc đánh giá sự khác biệt không phải về giá trị của chính cổ phiếu, mà theo thứ hạng của chúng, nghĩa là thứ tự

Khái niệm quan sát chọn lọc
Phương pháp lấy mẫu được sử dụng khi việc sử dụng quan sát liên tục là bất khả thi về mặt vật lý do lượng dữ liệu khổng lồ hoặc không khả thi về mặt kinh tế. Có một sự bất khả thi về thể chất

Phương pháp xét nghiệm
1. Lựa chọn ngẫu nhiên trên thực tế: tất cả các đơn vị của HS đều được đánh số, các số do bốc thăm tương ứng với các đơn vị rơi vào mẫu, số lượng bằng với số dự kiến

Lỗi lấy mẫu trung bình
Sau khi hoàn thành việc lựa chọn số lượng đơn vị cần thiết trong mẫu và đăng ký các đặc điểm của các đơn vị này do chương trình quan sát cung cấp, họ tiến hành tính toán các chỉ số tổng quát hóa. cho họ từ

Lỗi lấy mẫu cận biên
Xét rằng trên cơ sở điều tra mẫu, không thể đánh giá chính xác đặc điểm chung của HS, cần phải tìm ra các giới hạn mà nó nằm trong đó. Trong một mẫu cụ thể, sự khác biệt

Cỡ mẫu yêu cầu
Khi phát triển một chương trình quan sát có chọn lọc, họ được cung cấp một giá trị cụ thể của sai số biên và mức xác suất. Cỡ mẫu tối thiểu cung cấp một giá trị nhất định

hướng dẫn
Một nhiệm vụ. Tại doanh nghiệp, 100 công nhân trong số 1000 công nhân đã được phỏng vấn theo thứ tự mẫu ngẫu nhiên không lặp lại và thu được dữ liệu về thu nhập của họ trong tháng như sau (bảng 24): Ta

Khái niệm chuỗi thời gian
Một trong những nhiệm vụ quan trọng nhất của thống kê là nghiên cứu sự thay đổi của các chỉ số được phân tích theo thời gian, tức là tính năng động của chúng. Vấn đề này được giải quyết bằng cách phân tích chuỗi động lực (chuỗi thời gian).

Các chỉ số thay đổi mức độ của một loạt các động lực
Việc phân tích chuỗi thời gian bắt đầu bằng việc xác định mức độ thay đổi của chuỗi (tăng, giảm hoặc không thay đổi) về mặt tuyệt đối và tương đối. để theo dõi

Các chỉ số trung bình của một loạt các động lực
Mỗi chuỗi động thái có thể được coi là một tập hợp nhất định của n chỉ số thay đổi theo thời gian, có thể được tóm tắt dưới dạng các giá trị trung bình. Các chỉ số tổng quát (trung bình) như vậy đặc biệt

Phương pháp xác định xu hướng chính (trend) trong chuỗi động thái
Một trong những nhiệm vụ chính của việc nghiên cứu chuỗi động lực là xác định xu hướng chính (mẫu) trong việc thay đổi cấp độ của chuỗi, được gọi là xu hướng. Thường xuyên thay đổi cấp độ của một loạt trong một số trường hợp

Đánh giá và dự báo mức độ phù hợp của xu hướng
Đối với phương trình xu hướng được tìm thấy, cần đánh giá độ tin cậy (mức độ phù hợp) của nó, thường được thực hiện bằng tiêu chí Fisher, so sánh giá trị tính toán Fр của nó

Phân tích theo mùa
Trong chuỗi động thái, mức độ là các chỉ số hàng tháng hoặc hàng quý, cùng với các biến động ngẫu nhiên, thường quan sát thấy các biến động theo mùa, được hiểu là định kỳ

hướng dẫn
Theo Cục Thống kê Nhà nước Liên bang, cán cân ngoại thương (SVT) của Nga giai đoạn 2000-2006. được đặc trưng bởi một số động lực học được trình bày trong Bảng. 36. Bảng 36. Cán cân ngoại thương (CBT) của Nga đối với p

Khái niệm về sự phụ thuộc tương quan
Một trong những quy luật chung nhất của thế giới khách quan là quy luật về mối liên hệ phổ biến và sự phụ thuộc giữa các sự vật hiện tượng. Đương nhiên, khi điều tra các hiện tượng trong các lĩnh vực đa dạng nhất, số liệu thống kê chắc chắn sẽ va chạm

Phương pháp xác định và đánh giá mối tương quan
Một số phương pháp được sử dụng trong thống kê để xác định sự hiện diện và bản chất của mối tương quan giữa hai tính năng. 1. Xem xét dữ liệu song song (kn

Hệ số tương quan xếp hạng
Các hệ số tương quan xếp hạng kém chính xác hơn, nhưng dễ tính toán hơn, là các chỉ số phi tham số để đo lường mức độ gần gũi của mối quan hệ giữa hai đặc điểm tương quan. Bao gồm các

Đặc điểm tương quan của chuỗi thời gian
Trong nhiều nghiên cứu, cần phải nghiên cứu đồng thời động lực của một số chỉ số, tức là xem xét một số chuỗi thời gian song song. Trong trường hợp này, cần phải đo lường sự phụ thuộc

Các chỉ số về mức độ chặt chẽ của mối quan hệ giữa các tính năng định tính
Phương pháp bảng tương quan không chỉ áp dụng cho định lượng mà còn cho các đặc điểm mô tả (định tính), mối quan hệ giữa chúng thường phải được nghiên cứu khi tiến hành các nhà xã hội học khác nhau.

nhiều tương quan
Khi giải quyết các vấn đề thực tế, các nhà nghiên cứu phải đối mặt với thực tế là các mối tương quan không chỉ giới hạn ở mối quan hệ giữa hai tính năng: y hiệu quả và yếu tố x. trong hành động

Mục đích và các loại chỉ số
Chỉ số là một giá trị tương đối cho thấy mức độ của hiện tượng được nghiên cứu trong những điều kiện nhất định khác với mức độ của cùng một hiện tượng trong những điều kiện khác bao nhiêu lần. Sự khác biệt về điều kiện có thể là

chỉ số cá nhân
Giá trị tương đối thu được bằng cách so sánh các mức được gọi là chỉ số riêng nếu cấu trúc của hiện tượng đang nghiên cứu không quan trọng. Các chỉ số riêng lẻ được ký hiệu là i

chỉ số chung
Nếu hiện tượng đang nghiên cứu không đồng nhất và chỉ có thể so sánh các cấp độ sau khi đưa chúng về một thước đo chung, thì phân tích kinh tế được thực hiện bằng các chỉ số chung. Chỉ số trở thành chung

Chỉ số trung bình
Khi nghiên cứu các chỉ tiêu định tính, người ta thường xem xét sự thay đổi theo thời gian (hoặc không gian) của giá trị trung bình của một chỉ tiêu đã định tính đối với một tổng thể thuần nhất nhất định.

chỉ số lãnh thổ
Các chỉ số lãnh thổ được sử dụng để so sánh không gian, liên vùng của các chỉ số khác nhau. Tính toán của chúng phức tạp hơn so với tính toán của các chỉ số (động) truyền thống được xem xét

Dữ liệu thống kê nên được trình bày theo cách mà chúng có thể được sử dụng. Có 3 hình thức trình bày dữ liệu thống kê chính:

1) văn bản - bao gồm dữ liệu trong văn bản;

2) dạng bảng - trình bày dữ liệu dưới dạng bảng;

3) đồ họa - biểu thức của dữ liệu dưới dạng biểu đồ.

Dạng văn bản được sử dụng khi có một lượng nhỏ dữ liệu số.

Dạng bảng được sử dụng thường xuyên nhất, vì đây là dạng trình bày dữ liệu thống kê hiệu quả hơn. Không giống như các bảng toán học, theo các điều kiện ban đầu, cho phép thu được kết quả này hoặc kết quả khác, các bảng thống kê cho biết ngôn ngữ của các con số về các đối tượng đang nghiên cứu.

bảng thống kê- Đây là một hệ thống các hàng và cột, trong đó các thông tin thống kê về các hiện tượng kinh tế - xã hội được trình bày theo một trình tự và mối liên hệ nhất định.

Bảng 2. Ngoại thương của Liên bang Nga 2000 - 2006, tỷ đô la

Mục lục 2000 2001 2002 2003 2004 2005 2006
kim ngạch ngoại thương 149,9 155,6 168,3 280,6 368,9 468,4
Xuất khẩu 101,9 107,3 135,9 183,2 243,6 304,5
Nhập khẩu 44,9 53,8 76,1 97,4 125,3 163,9
cán cân thương mại 60,1 48,1 46,3 59,9 85,8 118,3 140,7
bao gồm:
với nước ngoài
xuất khẩu 90,8 86,6 90,9 114,6 210,1 261,1
nhập khẩu 31,4 40,7 48,8 77,5 103,5 138,6
cán cân thương mại 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Ví dụ, trong bảng. 2 trình bày thông tin về ngoại thương của Nga, sẽ không hiệu quả để thể hiện ở dạng văn bản.

Phân biệt môn họcThuộc tính bảng thống kê. Chủ đề chỉ ra đối tượng được đặc trưng - đơn vị dân số, hoặc nhóm đơn vị hoặc toàn bộ tổng thể. Trong vị ngữ, đặc điểm của chủ đề được đưa ra, thường ở dạng số. Bắt buộc tiêu đề bảng, cho biết dữ liệu trong bảng thuộc về danh mục nào và thời gian nào.

Theo tính chất của đối tượng, bảng thống kê được chia thành giản dị, tập đoàntổ hợp. Trong chủ đề của một bảng đơn giản, đối tượng nghiên cứu không được chia thành các nhóm, nhưng một danh sách tất cả các đơn vị dân số được đưa ra hoặc toàn bộ dân số được chỉ định (ví dụ: Bảng 11). Trong chủ đề của bảng nhóm, đối tượng nghiên cứu được chia thành các nhóm theo một thuộc tính và vị ngữ cho biết số lượng đơn vị trong các nhóm (tuyệt đối hoặc theo tỷ lệ phần trăm) và các chỉ số tóm tắt cho các nhóm (ví dụ: Bảng 4). Trong chủ đề của bảng kết hợp, dân số được chia thành các nhóm không phải theo một mà theo một số tiêu chí (ví dụ: Bảng 2).

Khi xây dựng các bảng, bạn phải được hướng dẫn bởi những điều sau đây quy tắc chung.

1. Chủ đề của bảng nằm ở phần bên trái (ít thường xuyên hơn - phía trên) và vị ngữ - ở bên phải (ít thường xuyên hơn - thấp hơn).

2. Tiêu đề cột ghi tên chỉ tiêu và đơn vị tính.

3. Dòng cuối cùng hoàn thành bảng và nằm ở cuối bảng, nhưng đôi khi nó là dòng đầu tiên: trong trường hợp này, dòng thứ hai được viết là “bao gồm”, và các dòng tiếp theo chứa các thành phần của dòng tổng.

4. Dữ liệu số được ghi với độ chính xác như nhau trong mỗi cột, chữ số của số nằm dưới chữ số, phần nguyên cách nhau bằng dấu phẩy phân số.

5. Không được có các ô trống trong bảng: nếu dữ liệu bằng 0 thì đặt dấu “–” (dấu gạch ngang); nếu không biết dữ liệu thì ghi “không có thông tin” hoặc ghi dấu “…” (dấu chấm lửng). Nếu giá trị số mũ không bằng 0, nhưng chữ số có nghĩa đầu tiên xuất hiện sau mức độ chính xác được chấp nhận, thì 0,0 được ghi lại (ví dụ: nếu mức độ chính xác 0,1 được chấp nhận).

Đôi khi các bảng thống kê được bổ sung bằng các biểu đồ khi mục tiêu là nhấn mạnh một số tính năng của dữ liệu, để so sánh chúng. Hình thức đồ họa là hình thức trình bày dữ liệu hiệu quả nhất về mặt nhận thức của họ. Với sự trợ giúp của các biểu đồ, khả năng hiển thị các đặc điểm của cấu trúc, động lực học, mối quan hệ của các hiện tượng và sự so sánh của chúng đã đạt được.

đồ thị thống kê- đây là những hình ảnh có điều kiện về các giá trị số và tỷ lệ của chúng thông qua các đường kẻ, hình dạng hình học, hình vẽ hoặc biểu đồ địa lý. Dạng đồ họa tạo điều kiện thuận lợi cho việc xem xét dữ liệu thống kê, làm cho chúng trực quan, biểu cảm và có thể nhìn thấy được. Tuy nhiên, biểu đồ có những hạn chế nhất định: trước hết, một biểu đồ không thể bao gồm nhiều dữ liệu như nó có thể chứa trong một bảng; Ngoài ra, biểu đồ luôn hiển thị dữ liệu được làm tròn - không chính xác, nhưng gần đúng. Như vậy, biểu đồ chỉ dùng để thể hiện tình hình chung chứ không thể hiện chi tiết. Hạn chế cuối cùng là sự phức tạp của âm mưu. Nó có thể được khắc phục bằng máy tính cá nhân (ví dụ: "Trình hướng dẫn sơ đồ" từ gói Microsoft OfficeExcel).

Theo phương pháp xây dựng đồ họa, chúng được chia thành sơ đồ, bản đồsơ đồ biểu đồ.

Cách phổ biến nhất để biểu diễn dữ liệu bằng đồ họa là các biểu đồ, thuộc các loại sau: tuyến tính, xuyên tâm, tán xạ, phẳng, thể tích, xoăn. Loại sơ đồ phụ thuộc vào loại dữ liệu được trình bày và nhiệm vụ xây dựng. Trong mọi trường hợp, biểu đồ phải có tiêu đề đi kèm - bên trên hoặc bên dưới trường biểu đồ. Tiêu đề cho biết chỉ báo nào được hiển thị, cho lãnh thổ nào và trong thời gian nào.

Biểu đồ đường được sử dụng để biểu diễn các biến định lượng: đặc điểm của sự thay đổi giá trị của chúng, động lực học, mối quan hệ giữa các biến. Biến thể dữ liệu được phân tích bằng cách sử dụng khu vực phân phối, tích lũy(nhỏ hơn đường cong) và xin lỗi(đường cong "lớn hơn"). Đa giác phân phối được thảo luận trong Chủ đề 4 (ví dụ: Hình 5.). Để xây dựng một tích lũy, các giá trị của tính năng biến được vẽ dọc theo trục hoành và tọa độ là tổng tần số hoặc tần số tích lũy (từ f1đến ∑ f). Để xây dựng một ogive, tổng số tần số tích lũy được đặt trên trục y theo thứ tự ngược lại (từ ∑ f trước f1). Tích lũy và ogive theo Bảng. 4. mô tả trong hình. một.

Cơm. 1. Cộng trừ phân bổ hàng hóa theo trị giá hải quan

Việc sử dụng biểu đồ đường trong phân tích xu hướng được đề cập trong Chủ đề 5 (ví dụ: Hình 13) và việc sử dụng chúng để phân tích liên kết trong Chủ đề 6 (ví dụ: Hình 21). Chủ đề 6 cũng đề cập đến việc sử dụng biểu đồ phân tán (ví dụ: Hình 20).

Biểu đồ đường được chia nhỏ thành một chiều, được sử dụng để biểu diễn dữ liệu trên một biến duy nhất và hai chiều- cho hai biến. Ví dụ về biểu đồ đường một chiều là đa giác phân phối và biểu đồ hai chiều là đường hồi quy (ví dụ: Hình 21).

Đôi khi, với những thay đổi lớn trong chỉ báo, thang logarit được sử dụng. Ví dụ: nếu các giá trị của chỉ báo thay đổi từ 1 đến 1000, thì điều này có thể gây khó khăn khi vẽ đồ thị. Trong những trường hợp như vậy, chúng chuyển sang logarit của các giá trị chỉ báo, giá trị này sẽ không khác nhau nhiều: lg 1 = 0, lg 1000 = 3.

Giữa phẳng Biểu đồ thanh (biểu đồ) được phân biệt theo tần suất sử dụng, trong đó chỉ báo được trình bày dưới dạng thanh, chiều cao tương ứng với giá trị của chỉ báo (ví dụ: Hình 4).

Tỷ lệ diện tích của một hình hình học cụ thể với giá trị của chỉ báo làm cơ sở cho các loại sơ đồ phẳng khác: hình tam giác, Quảng trường, hình hộp chữ nhật. Bạn cũng có thể sử dụng phép so sánh diện tích của hình tròn - trong trường hợp này, bán kính của hình tròn được đặt.

biểu đồ dải trình bày các chỉ số ở dạng hình chữ nhật kéo dài theo chiều ngang và nếu không thì giống như biểu đồ thanh.

Trong số các sơ đồ phẳng, nó thường được sử dụng biểu đồ tròn, được sử dụng để minh họa cấu trúc của dân số được nghiên cứu. Toàn bộ tập hợp được lấy là 100%, nó tương ứng với tổng diện tích của hình tròn, diện tích của các cung tương ứng với các phần của tập hợp. Hãy xây dựng sơ đồ ngành về cơ cấu ngoại thương của Liên bang Nga năm 2006 theo Bảng. 2 (xem hình 2). Khi sử dụng các chương trình máy tính, các sơ đồ ngành được xây dựng ở dạng ba chiều, nghĩa là không phải ở hai mà ở ba mặt phẳng (xem Hình 3).

Cơm. 2. Biểu đồ tròn đơn giản 3. Biểu đồ tròn 3D

Biểu đồ xoăn (hình ảnh) nâng cao độ rõ nét của hình ảnh, vì chúng bao gồm hình ảnh của chỉ báo được hiển thị, kích thước tương ứng với kích thước của chỉ báo.

Khi vẽ biểu đồ, mọi thứ đều quan trọng như nhau - lựa chọn đúng hình ảnh đồ họa, tỷ lệ, tuân thủ các quy tắc thiết kế biểu đồ. Những vấn đề này được đề cập chi tiết hơn trong và.

Bản đồ và bản đồ được sử dụng để mô tả các đặc điểm địa lý của các hiện tượng đang được nghiên cứu. Chúng cho thấy vị trí của hiện tượng đang được nghiên cứu, cường độ của nó trong một lãnh thổ nhất định - trong một nước cộng hòa, khu vực, khu kinh tế hoặc hành chính, v.v. Việc xây dựng bản đồ và bản đồ được xem xét trong tài liệu đặc biệt, chẳng hạn.

Giá trị của phương pháp đồ thị trong việc phân tích và tổng quát hóa dữ liệu là rất lớn. Trước hết, hình ảnh đồ họa cho phép kiểm soát độ tin cậy của các chỉ số thống kê, vì khi được trình bày trên biểu đồ, chúng cho thấy rõ hơn những điểm không chính xác hiện có liên quan đến sự hiện diện của lỗi quan sát hoặc bản chất của hiện tượng đang nghiên cứu. Với sự trợ giúp của hình ảnh đồ họa, có thể nghiên cứu các mô hình phát triển của một hiện tượng, để thiết lập các mối quan hệ hiện có. Việc so sánh dữ liệu đơn giản không phải lúc nào cũng có thể nắm bắt được sự hiện diện của các mối quan hệ nhân quả, đồng thời, biểu diễn đồ họa của chúng giúp xác định các mối quan hệ nhân quả, đặc biệt là trong trường hợp thiết lập các giả thuyết ban đầu, sau đó có thể phát triển thêm.

Biểu đồ thống kê- đây là một bản vẽ trong đó các tập hợp thống kê được đặc trưng bởi các chỉ số nhất định được mô tả bằng các hình ảnh hoặc dấu hiệu hình học có điều kiện. hình ảnh đồ họa là tập hợp các điểm, đường và hình thể hiện dữ liệu thống kê. các yếu tố phụ trợđồ họa là:

    Trường đồ thị là một phần của mặt phẳng chứa các hình ảnh đồ họa. Trường biểu đồ có các kích thước nhất định, phụ thuộc vào mục đích của nó.

    Các mốc không gian của đồ thị được thiết lập dưới dạng hệ thống các lưới tọa độ. Hệ tọa độ là cần thiết để đặt các ký hiệu hình học trong trường biểu đồ. Cả hai hệ tọa độ hình chữ nhật và cực đều được sử dụng.

    Các mốc tỷ lệ được sử dụng để so sánh hiển thị đồ họa của đối tượng và kích thước thực tế của nó. Các mốc tỷ lệ được thiết lập bằng hệ thống thước tỷ lệ hoặc ký hiệu tỷ lệ.

    Giải thích biểu đồ bao gồm giải thích đối tượng được biểu thị bằng biểu đồ (tên) và ý nghĩa ngữ nghĩa của từng dấu hiệu được sử dụng trên biểu đồ.

Biểu đồ thống kê được phân loại theo mục đích (nội dung), phương pháp xây dựng và bản chất của hình ảnh đồ họa (Hình 1).

Hình.1. Phân loại biểu đồ thống kê

Theo phương pháp xây dựng hình ảnh đồ họa, có:

    sơ đồ- biểu diễn đồ họa của dữ liệu thống kê, thể hiện rõ ràng mối quan hệ giữa các giá trị được so sánh.

    bản đồ thống kê

Có các loại biểu đồ chính sau: đường, thanh, dải, khu vực, hình vuông, hình tròn, đường cong.

biểu đồ đườngđược sử dụng để mô tả động lực học, tức là đánh giá sự biến đổi của hiện tượng theo thời gian. Trục hoành hiển thị các khoảng thời gian hoặc ngày tháng và tọa độ hiển thị các mức của một loạt động lực. Một số biểu đồ có thể được đặt trên một biểu đồ, cho phép bạn so sánh động lực của các chỉ báo khác nhau hoặc một chỉ báo cho các khu vực hoặc quốc gia khác nhau.

Hình.2. Động lực nhập khẩu ô tô du lịch tại Liên bang Nga

cho 2006-1q. 2010

biểu đồ thanh có thể được sử dụng:

    phân tích động thái của các hiện tượng kinh tế - xã hội;

    đánh giá việc thực hiện quy hoạch;

    đặc điểm của sự biến đổi trong chuỗi phân phối;

    để so sánh không gian (so sánh giữa các vùng lãnh thổ, quốc gia, doanh nghiệp);

    để nghiên cứu cấu trúc của hiện tượng.

Các cột được đặt gần hoặc riêng biệt ở cùng một khoảng cách. Chiều cao của các cột phải tỷ lệ thuận với các giá trị số của các mức tính năng.

Hình 3. Động lực chia sẻ của Belarus trong kim ngạch thương mại của Liên bang Nga với các nước SNG

Để đặc trưng cho cấu trúc của các hiện tượng kinh tế - xã hội được sử dụng rộng rãi biểu đồ tròn. Để xây dựng nó, vòng tròn phải được chia thành các phần theo tỷ lệ trọng lượng riêng của các phần trong tổng thể tích. Tổng khối lượng riêng bằng 100%, tương ứng với tổng khối lượng của hiện tượng đang nghiên cứu.

Hình.4. Phân bố địa lý kim ngạch thương mại giữa Liên bang Nga và các nước CIS

biểu đồ thanh bao gồm các hình chữ nhật được sắp xếp theo chiều ngang (sọc).

Đôi khi để phân tích so sánh theo khu vực, các quốc gia sử dụng sơ đồ ký hiệu hình(sơ đồ các hình hình học). Các sơ đồ này phản ánh kích thước của đối tượng nghiên cứu phù hợp với kích thước khu vực của nó.

bản đồ thống kêđược sử dụng để đánh giá sự phân bố địa lý của các hiện tượng và phân tích so sánh theo lãnh thổ.

Bản đồ thống kê bao gồm bản đồ và bản đồ. Sự khác biệt giữa chúng nằm ở cách hiển thị số liệu thống kê trên bản đồ.

bản đồ cho thấy sự phân bố theo lãnh thổ của tính trạng đang được nghiên cứu trong các khu vực riêng biệt và được sử dụng để xác định các kiểu phân bố này. Bản đồ được chia thành nền và điểm. Các bản đồ nền có mật độ màu khác nhau đặc trưng cho cường độ của bất kỳ chỉ số nào trong một đơn vị lãnh thổ. Trên bản đồ chấm, mức độ của hiện tượng đã chọn được mô tả bằng các dấu chấm.

bản đồ- đây là sự kết hợp của bản đồ địa lý hoặc sơ đồ của nó với sơ đồ. Nó cho phép bạn phản ánh các chi tiết cụ thể của từng khu vực trong sự phân bố của hiện tượng đang nghiên cứu, các đặc điểm cấu trúc của nó.

Hiện tại, nhiều gói phần mềm đồ họa máy tính đã được phát triển, chẳng hạn như Excel, Statgraf, Statistica.