데이터 분석/Python
[Python] Pandas _ 서울시 구별 CCTV 현황 분석(2)
Ming9
2021. 8. 14. 17:33
1. 분석 목표
1.1 서울시 구별 인구 대비 CCTV 설치 비율 현황 확인
1.2 확인사항
- 서울시 구별 인구
- 서울시 구별 인구 상세 비율
- 서울시 구별 CCTV 설치 현황
2. Data 정렬 및 분석
2.1 분석 자료 불러오기 및 전처리
서울시 구별 CCTV 설치 현황 (연도별)
이후 자료 병합을 위해 "구분" -> "구별" 로 변경하여 통일 시킴
CCTV_Seoul.rename(columns={CCTV_Seoul.columns[0]:"구별"}, inplace = True)
CCTV 증가율 항목 추가
CCTV_Seoul['최근증가율'] = 100*(CCTV_Seoul["2020년"]+CCTV_Seoul["2019년"]+CCTV_Seoul["2018년"])/CCTV_Seoul["2011년 이전"]
서울시 구별 인구 통계 정보
usecols 기능을 이용해 해당 자료에서 원하는 column의 자료만 뽑아와서 데이터 생성.
pop_Seoul = pd.read_excel(r"C:\Users\ok\Desktop\Python\Data science\data\서울시 인구통계.xlsx", header=2 , usecols="B, D, G, J ,N", )
각 column name 을 CCTV 현황 데이터와 통일 시키기 위해 아래와 같이 변경.
pop_Seoul.rename(columns = {pop_Seoul.columns[0]:'구별',
pop_Seoul.columns[1]:'인구수',
pop_Seoul.columns[2]:'한국인',
pop_Seoul.columns[3]:'외국인',
pop_Seoul.columns[4]:'고령자'},
inplace = 'True')
pop_Seoul.head()
데이터 병합 및 분석
아래와 같이 자료 병합 시켜서 분석 준비
data_result= pd.merge(CCTV_Seoul, pop_Seoul, on ='구별')
2.2 자료 분석
아래와 같이 정리된 자료에서 인구통계(인구수, 외국인 비율, 고령자 비율) 수치와 CCTV 설치숫자 와의 상관관계를 분석
Numpy.corrcoef 를 통해 각 통계치의 상관관계에 대해 분석.
인구수와 CCTV 설치 숫자와의 상관관계가 있는것으로 확인.