데이터 분석/Python

[Python] Pandas _ 서울시 구별 CCTV 현황 분석(2)

Ming9 2021. 8. 14. 17:33

1. 분석 목표

1.1 서울시 구별 인구 대비 CCTV 설치 비율 현황 확인 

 

1.2 확인사항

- 서울시 구별 인구

- 서울시 구별 인구 상세 비율

- 서울시 구별 CCTV 설치 현황

 

2. Data 정렬 및 분석

 

2.1 분석 자료 불러오기 및 전처리

 

서울시 구별 CCTV 설치 현황 (연도별)

이후 자료 병합을 위해 "구분" -> "구별" 로 변경하여 통일 시킴

CCTV_Seoul.rename(columns={CCTV_Seoul.columns[0]:"구별"}, inplace = True)

 

CCTV 증가율 항목 추가 

CCTV_Seoul['최근증가율'] = 100*(CCTV_Seoul["2020년"]+CCTV_Seoul["2019년"]+CCTV_Seoul["2018년"])/CCTV_Seoul["2011년 이전"]

 

 

서울시 구별 인구 통계 정보

usecols 기능을 이용해 해당 자료에서 원하는 column의 자료만 뽑아와서 데이터 생성. 

pop_Seoul = pd.read_excel(r"C:\Users\ok\Desktop\Python\Data science\data\서울시 인구통계.xlsx", header=2 , usecols="B, D, G, J ,N", )

 

각 column name 을 CCTV 현황 데이터와 통일 시키기 위해 아래와 같이 변경. 

pop_Seoul.rename(columns = {pop_Seoul.columns[0]:'구별',
                                        pop_Seoul.columns[1]:'인구수',
                                        pop_Seoul.columns[2]:'한국인',
                                        pop_Seoul.columns[3]:'외국인',
                                        pop_Seoul.columns[4]:'고령자'},
                                        inplace = 'True')
pop_Seoul.head()

데이터 병합 및 분석 

 

아래와 같이 자료 병합 시켜서 분석 준비

data_result= pd.merge(CCTV_Seoul, pop_Seoul, on ='구별') 

 

 

2.2 자료 분석

 

아래와 같이 정리된 자료에서 인구통계(인구수, 외국인 비율, 고령자 비율) 수치와 CCTV 설치숫자 와의 상관관계를 분석

 

 

 

Numpy.corrcoef 를 통해 각 통계치의 상관관계에 대해 분석.

인구수와 CCTV 설치 숫자와의 상관관계가 있는것으로 확인.