세상의 모든 것을 알고 싶은 ENTP

공부하고 싶은 게 너무 많아서 전부다 수박 겉 햝는 중... 수박은 아직 맛도 봇봄

분류 전체보기 15

RPA의 미래

세상의 데이터는 딱 두가지로 분류된다. 정형 데이터 , 비정형 데이터 사람이 하는 대부분의 업무가 결정의 연속인데 그 결정은 주어진 데이터를 기반으로 판단하여 이루어진다. 정형 데이터는 어떠한 인간의 사고 활동과, 인식, 결정을 요구하지 않는다. (물론 조금 있겠지만?) 비정형 데이터는 규칙적이지 않은 자료이기 때문에 인간의 판단과, 결정을 요구 한다. 비정형 데이터는 AI가 발전한다 해도 역사에 존재했던 인간의 결정을 기반으로한 결정만 내릴 수 있기에 이 부분은 절대 인간을 대체 할 수 있다고 생각 하지 않는다. 그러나 정형 데이터는 다르다. 단순 복사, 붙혀넣기 와 같은 반복적이고, 쉬운 일들. 이미 다 프로그램으로 대체되어 가고 있지만 아직은 모든 개개인의 업무 방식에 따라 customizing되는..

오늘의 잡생각 _ 빅데이터의 시대에서 살아 남는 방법

요즘 4차 산업 혁명이니, 빅데이터의 시대이니 하는 이야기를 다들 주변에서 많이 들어본적이 있을 것 같다. 4차 산업 혁명으로 불리는 이유는 이전에는 없었던 방식으로 데이터를 중심으로한 산업이 새롭게 많이 생기기 시작하고 이를 중심으로 데이터 관련 산업이 발전하며 가치를 창출 해 내고, 새로운 일자리도 많이 생기게 되면서이다. 이렇게 우리가 알고 있는 빅데이터라는 건 과연 무엇일까? 하고 언뜻 생각해 보면 긍정적인 것으로 보인다. 정말로 빅데이터가 무엇인지 정확히 이해하기 위해 "빅데이터"에서 말하는 "데이터"가 무엇인지 알아야 한다. 이 데이터란 근래 들어와서 뿅 하고 새롭게 생긴게 아니다. 은행의 개인의 소비 데이터, 인터넷 검색 엔진 회사들의 개개인의 검색 데이터 등. 원래 있던 데이터들이 었다. ..

[Python] Pandas _ 서울시 구별 CCTV 현황 분석(2)

1. 분석 목표 1.1 서울시 구별 인구 대비 CCTV 설치 비율 현황 확인 1.2 확인사항 - 서울시 구별 인구 - 서울시 구별 인구 상세 비율 - 서울시 구별 CCTV 설치 현황 2. Data 정렬 및 분석 2.1 분석 자료 불러오기 및 전처리 서울시 구별 CCTV 설치 현황 (연도별) 이후 자료 병합을 위해 "구분" -> "구별" 로 변경하여 통일 시킴 CCTV_Seoul.rename(columns={CCTV_Seoul.columns[0]:"구별"}, inplace = True) CCTV 증가율 항목 추가 CCTV_Seoul['최근증가율'] = 100*(CCTV_Seoul["2020년"]+CCTV_Seoul["2019년"]+CCTV_Seoul["2018년"])/CCTV_Seoul["2011년 이전"..

[Python] Pandas _ 서울시 구별 CCTV 현황 분석(1)

1. Data 뽑아오기 1) 서울시 CCTV 구별 설치 현황 (CSV) http://data.seoul.go.kr/dataList/OA-2734/F/1/datasetView.do;jsessionid=30E75F096DF081DEE4A6D3534D84B200.new_portal-svr-21 2) 서울시 구별 인구 통계 (TXT, EXCEL) https://data.seoul.go.kr/dataService/boardList.do 서울 열린데이터광장 주제, 작성기관, 자치구, 행정동 , 남녀별 세부 통계정보를 보여 드립니다. 주제 작성기관 자치구 행정동 남녀 인구 가구 산업 경제 보건 복지 교육 문화관광 교통 환경 주택·건설 안전 정보·통 data.seoul.go.kr 2. 분석에 앞선 데이터 전처리 (중요..

빅데이터 분석 공부 시작.

대학교 졸업 후, 서울에서 취업해서 일 한지 2년 반. 항상 길을 잃고 헤매고 있었던 느낌이었다. 분명 뭔가를 하고싶고, 좋아하는 것이 분명히 있었는데.. 바쁜 생활에 치여 지내다 보니 애써 무시하고 살았는데... 마음 한켠 어딘가에 묻어 둔 열정이 요즘 다시 올라오기 시작했다. 평소에 공학뿐만 아니라 정치, 사회 이슈, 수학, 물리, 통계 등 모든분야에 대한 관심이 있었지만 배워서 어디에 쓸 수 있을까 하는 고민과, 주변에서도 "그거 알아서 뭐해? 일이나 열심히 해" 하는 반응에 무엇을 시작할지 조차 모르고 있었다. 화사에서 반복되는 업무를 조금 줄여보고자 RPA 를 위한 Python과, 데이터 관리를 위한 R을 공부하게 되었고 Python과 R 공부를 통해 데이터 분석에 대한 관심이 조금씩 생기기 시..

데이터 분석 2021.08.12