통계 그룹화의 원칙과 방법은 무엇입니까?

통계 그룹화의 핵심은 그룹 태그 선택 및 그룹 경계 구분에 있습니다.

(a) 그룹 로고 선택

그룹 플래그 선택은 통계 그룹화의 핵심 문제이며, 그룹 플래그는 통계 전체 그룹화의 기준 또는 근거입니다. 올바른 그룹화 플래그를 선택하는 것은 통계 그룹화가 충분히 작용하기 위한 전제 조건이다. 전체 셀이 그룹화되면 그룹 플래그 아래의 개별 셀의 차이가 강조 표시되고 다른 플래그 아래의 전체 셀의 차이는 숨겨집니다. 따라서 같은 집단은 그룹 로고가 다르기 때문에 서로 다르거나 반대의 결론을 내릴 수 있다. 통계 그룹화의 과학적 합리성을 보장하기 위해서는 그룹 로고의 선택이 소진되고 상호 배타적이며 사물의 본질을 반영하는 원칙을 따라야 한다.

(b) 통계 그룹화 방법

그룹 표시를 선택한 후에는 그룹 표시의 변경 범위 내에서 인접한 그룹 사이의 자연 경계와 수량 경계를 그려야 합니다. 그룹화된 표식의 특성에 따라 통계 전체를 품질 표시 또는 수량 표시별로 그룹화할 수 있습니다.

1 품질 플래그별로 그룹화.

품질 플래그별 그룹화는 객체의 속성 특성에 따라 단순 품질 그룹과 복잡한 품질 그룹으로 그룹화됩니다.

(1) 단순 품질 플래그 그룹 단순 품질 그룹이란 그룹 플래그가 결정되면 그룹 이름과 수량도 결정되어 각 셀이 속해야 하는 그룹, 그룹 간 경계를 구분할 수 없는 어려운 그룹화를 의미합니다. 예를 들어, 인구는 성별에 따라 남녀 두 그룹으로 나뉘어 있는데, 어느 조로 나누어야 하는지 한눈에 알 수 있다.

(2) 품질 로고 그룹화가 복잡함 일부 현상은 산업 부문 분류, 인구 직업 분류 등 품질 로고별로 그룹화가 복잡하다. 이러한 복잡한 문제의 그룹화를 통계적으로 분류라고 한다. 통계 분류는 복잡한 조별 기술뿐만 아니라 국가 정책과 과학 이론도 포함한다. 각종 분류의 과학성, 통일성, 무결성을 보장하기 위해 각 부처의 숙달과 사용을 용이하게 하기 위해 국가통계청은 관련 부서와 함께 통일된 분류 목록을 만들어 전국적으로 실시한다. 상품 분류 카탈로그, 산업 제품 분류 카탈로그, 산업 부문 분류 카탈로그 등.

통계 분류에서 국민 경제 구조를 반영하는 기본 분류는 주로 다음과 같은 범주를 포함한다.

① 경제 형태 분류는 생산수단 소유제 형식을 바탕으로 한 중요한 경제 분류이다.

② 국가 경제 부문 (산업) 분류. 중국은 부서, 대류, 중류, 소류 4 급 분류 체계를 실시한다.

③ 부서 (산업) 분류에 기초한 세 가지 산업 분류.

(4) 사회생산부문 A 와 B 의 분류 .. 마르크스의 재생산 원리와 제품의 주요 경제적 용도에 따라 분류하다.

⑤ 산업 부문 분류. 그것은 먼저 업종을 채취업과 제조업의 두 부분으로 나누고, 그 다음에는 대형, 중류, 소류의 세 단계로 나뉜다.

⑤ 회원 분류. 기업의 업무 예속 관계와 행정 리더십에 따라 분류하다.

⑦ 지역 분류. 우리나라의 현행 행정 구역에 따라 분류되었다.

(8) 노동 인구의 직업 분류. 그것은 노동 인구가 종사하는 업무의 성격의 신분에 따라 분류된다.

2 수량 기호로 그룹화

수량 표시별로 그룹화한다는 것은 사물의 수량 차이를 반영하는 수량 표시를 선택하여 해당 변경 범위에 따라 각 그룹의 경계를 구분하고 전체를 여러 가지 성질의 성분으로 나누는 것을 말합니다.

예를 들어, 가정의 빈부상황을 연구할 때 엥겔 계수 (즉, 식품지출이 전체 가계소비지출의 비중) 에 따라 그룹화되어 60% 가 넘는 가정이 빈곤가정으로 분류된다. 50 ~ 60% 는 걱정없는 가정입니다. 40 ~ 50% 는 잘 사는 가족입니다. 40% 미만이 부유한 가정이다.

또 다른 예로, 중국에서 연구인의 성장을 연구할 때 연령별로 분류하고, 0-6 세는 영유아이다. 7 ~ 17 세 어린이; 18 ~ 59 세는 중년이다. 노년은 60 세 이상 (여성 55 세 포함) 이다.

수량 표시는 사물의 구체적인 내용의 수량 특징을 반영하며, 그 개념은 구체적이고 명확하다. 그러나 수량 플래그에 따라 그룹화한다는 것은 그룹과 그룹 간의 수량 차이를 단순히 결정하는 것이 아니라 그룹화에 반영된 수량 변화를 통해 현상의 다양한 특성과 유형을 결정하는 것입니다. 따라서 변수 값에 따라 서로 다른 집단의 경계를 정확하게 나누는 것은 쉽지 않습니다. 즉, 수량 표시를 사용하여 그룹화할 때 먼저 그룹에 존재할 수 있는 여러 가지 특성의 그룹을 분석한 다음 그룹 간의 수량 경계를 결정해야 합니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 그룹명언)

각 단위의 특정 수량 플래그 값의 변경 특성에 따라 단일 그룹화 및 그룹 간격 그룹화의 두 가지 그룹화 방법을 선택할 수 있습니다.

(1) 단일 그룹 개별 그룹화는 각 특정 변수 값에 따라 현상을 전체적으로 그룹화하는 것을 의미합니다.

단일 그룹화는 일반적으로 개별 변수에 적용되며 변수 값이 적고 변경 범위가 작습니다. 이산 변수의 값 범위가 비교적 크고 전체 단위 수가 많을 때, 단일 그룹을 사용하여 각 변수 값을 그룹으로 사용하면 그룹 수가 너무 많아지고 그룹당 시간이 너무 분산되어 전체 전체의 각 부분의 특성과 차이를 반영하지 못해 통계 그룹화의 진정한 의미를 잃게 됩니다. 연속 변수의 경우 개별 그룹화는 물론 변수 값을 열거할 수 없으므로 이러한 경우 그룹 간격 그룹화가 필요합니다.

(2) 그룹 거리 그룹 거리 그룹화는 일정 범위의 변수 값에 따라 현상 집단을 그룹화하는 것을 의미합니다. 현상의 전반적인 변화 범위 내에서 여러 개의 구간으로 나뉘는데, 각 구간 내의 모든 변수 값은 그룹으로 되어 있으며, 그 성질은 같지만 그룹 간 성질은 다르다. 개별 그룹에 비해 각 그룹의 변수 값은 특정 점 값이 아니라 간격입니다. 예를 들어, 도시 노동자 가정의 평균 소득 그룹은 표 3.2 에 나와 있습니다.

변수 값이 크게 변경되는 경우 일반적으로 그룹 간격 그룹화를 사용합니다. 그룹 거리 그룹에는 그룹 제한, 그룹 거리, 그룹 수, 그룹 중앙값 등의 그룹 요소가 있습니다.

(1) 그룹 제한은 그룹 간의 경계를 나타내는 변수 값이며 사물의 품질을 결정하는 수량 제한입니다. 여기서 각 그룹에서 변수 값이 가장 작은 것은 그룹 하한, 약어 하한입니다. 최대 변수 값은 그룹 상한, 약어 상한입니다.

② 그룹 간격은 변수 값 세트의 간격 길이, 즉 각 그룹의 상한과 하한 사이의 거리입니다. 즉, 피치 = 상한-하한입니다.

그룹 거리 그룹에서는 각 그룹의 그룹 간격이 같은지 여부에 따라 등거리 그룹과 이거리 그룹으로 나눌 수 있습니다. 그룹 간격이 같은 그룹을 등거리 그룹이라고 하고, 그룹 간격이 같지 않은 그룹을 등거리 또는 같지 않은 그룹 거리라고 합니다.

③ 그룹 배열 수가 그룹 수입니다. 집단의 일정한 조건 하에서, 집단의 수는 집단 간의 거리와 밀접한 관련이 있다. 일반적으로 그룹 수는 그룹 간격에 반비례합니다. 즉, 그룹 수가 적고 그룹 간격이 큽니다. 그룹 수가 많으면 그룹 간의 거리가 작아집니다. 그룹 수가 너무 많고 그룹 간 거리가 너무 작으면 그룹화된 데이터가 복잡해져 전체 현상의 특징과 분포 법칙을 보여 주기 어렵다. 그룹 수가 너무 적고 그룹 간 거리가 너무 크면 그룹화의 의미를 잃고 객관적인 사실을 제대로 반영하지 못할 수 있다. 그룹 간격과 그룹 수를 결정할 때 각 그룹에 충분한 단위가 있는지, 그룹 수가 너무 많거나 너무 적어서는 안 되는지 확인해야 현상의 분포 특성을 충분히 정확하게 반영하는 것이 좋다.

(4) 그룹 중앙값 세트의 중앙값은 그룹 거리의 중간점 값이며, 각 그룹 변수 값의 표현 수준입니다. 겹치는 그룹 제한의 그룹화에서 각 그룹의 상한 및 하한에 대한 단순 평균입니다. 일치하지 않는 그룹 그룹에서 이 그룹의 하한과 다음 그룹의 하한에 대한 단순 평균입니다.

그룹 간격 그룹화에서 그룹 간격은 그룹 내에 분포된 각 셀의 실제 변수 값을 가립니다. 따라서 그룹 중앙값을 사용하여 그룹의 대략적인 수준을 나타내야 합니다. 이것이 그룹 중앙값이 통계 분석에서 널리 사용되는 이유입니다.