세상의 모든 것을 알고 싶은 ENTP

공부하고 싶은 게 너무 많아서 전부다 수박 겉 햝는 중... 수박은 아직 맛도 봇봄

전체 글 15

국회의원 공약 이행률 조사 하기

스스로를 정치에 관심이 많다 생각 했지만 대선때 마다 새로운 인물이 언급되면 누군지를 모르겠다.. 누군가 이슈가 된다 하면 그 때가 되서야 부랴부랴 찾아보지만 임기동안 어떤 일을, 얼마나 잘해왔는지 계속 보지 않았으니 제대로 알기가 어렵누.. 정보를 찾아볼 때 마다 뭔가 언론사에 따른 편향된 정보를 보는게 아닐까 의심을 떨칠 수 없었다. 그래서 생각난 아이디어! 국회의원의 공약, 임기동안의 공약 실천률, 공약에 대한 여론 조사, 입법활동, 국회 출석률 등 의 정보를 모아 수치화 시켜 계속 tracking 되는 국회의원에 대한 평가자료를 모아 사람들과 공유한다면, 정치하는 인물에 대한 객관적 평가가 가능하지 않을까 싶었다. 1. 국회의원별 당선 당시 공약 2. 공약 이행 여부 3. 해당 지역의 민원 처리 ..

중국어 공부 시작 계기(2021.10.28 ~ )

요즘 영어 과외를 하는데, 내 설명을 잘 못알아 듣는 학생을 보면 답답하다. 나도 처음 영어 공부할 때 그랬는데. 개구리가 올챙이적 기억을 못하는 것 같다. 나도 새로운 언어를 배워보면 그때 그마음이 이해 가지 않을까? 생각이 들어서 배우기로 결정했다 ! "중국어" 지금 일주일째 공부중. 하루에 30분씩 단어만 외우는 정도인데 한마디도 못하니까 진짜 개 똥멍청이가 된 기분이다. 과외하는 학생들이게 더 인내심을 가지고 설명을 해주어야 겠다라는 생각이 들었다. 매일 외운 단어 업데이트해서 자랑해야지

하루 중국어 2021.11.06

RPA의 미래

세상의 데이터는 딱 두가지로 분류된다. 정형 데이터 , 비정형 데이터 사람이 하는 대부분의 업무가 결정의 연속인데 그 결정은 주어진 데이터를 기반으로 판단하여 이루어진다. 정형 데이터는 어떠한 인간의 사고 활동과, 인식, 결정을 요구하지 않는다. (물론 조금 있겠지만?) 비정형 데이터는 규칙적이지 않은 자료이기 때문에 인간의 판단과, 결정을 요구 한다. 비정형 데이터는 AI가 발전한다 해도 역사에 존재했던 인간의 결정을 기반으로한 결정만 내릴 수 있기에 이 부분은 절대 인간을 대체 할 수 있다고 생각 하지 않는다. 그러나 정형 데이터는 다르다. 단순 복사, 붙혀넣기 와 같은 반복적이고, 쉬운 일들. 이미 다 프로그램으로 대체되어 가고 있지만 아직은 모든 개개인의 업무 방식에 따라 customizing되는..

오늘의 잡생각 _ 빅데이터의 시대에서 살아 남는 방법

요즘 4차 산업 혁명이니, 빅데이터의 시대이니 하는 이야기를 다들 주변에서 많이 들어본적이 있을 것 같다. 4차 산업 혁명으로 불리는 이유는 이전에는 없었던 방식으로 데이터를 중심으로한 산업이 새롭게 많이 생기기 시작하고 이를 중심으로 데이터 관련 산업이 발전하며 가치를 창출 해 내고, 새로운 일자리도 많이 생기게 되면서이다. 이렇게 우리가 알고 있는 빅데이터라는 건 과연 무엇일까? 하고 언뜻 생각해 보면 긍정적인 것으로 보인다. 정말로 빅데이터가 무엇인지 정확히 이해하기 위해 "빅데이터"에서 말하는 "데이터"가 무엇인지 알아야 한다. 이 데이터란 근래 들어와서 뿅 하고 새롭게 생긴게 아니다. 은행의 개인의 소비 데이터, 인터넷 검색 엔진 회사들의 개개인의 검색 데이터 등. 원래 있던 데이터들이 었다. ..

[Python] Pandas _ 서울시 구별 CCTV 현황 분석(2)

1. 분석 목표 1.1 서울시 구별 인구 대비 CCTV 설치 비율 현황 확인 1.2 확인사항 - 서울시 구별 인구 - 서울시 구별 인구 상세 비율 - 서울시 구별 CCTV 설치 현황 2. Data 정렬 및 분석 2.1 분석 자료 불러오기 및 전처리 서울시 구별 CCTV 설치 현황 (연도별) 이후 자료 병합을 위해 "구분" -> "구별" 로 변경하여 통일 시킴 CCTV_Seoul.rename(columns={CCTV_Seoul.columns[0]:"구별"}, inplace = True) CCTV 증가율 항목 추가 CCTV_Seoul['최근증가율'] = 100*(CCTV_Seoul["2020년"]+CCTV_Seoul["2019년"]+CCTV_Seoul["2018년"])/CCTV_Seoul["2011년 이전"..

[Python] Pandas _ 서울시 구별 CCTV 현황 분석(1)

1. Data 뽑아오기 1) 서울시 CCTV 구별 설치 현황 (CSV) http://data.seoul.go.kr/dataList/OA-2734/F/1/datasetView.do;jsessionid=30E75F096DF081DEE4A6D3534D84B200.new_portal-svr-21 2) 서울시 구별 인구 통계 (TXT, EXCEL) https://data.seoul.go.kr/dataService/boardList.do 서울 열린데이터광장 주제, 작성기관, 자치구, 행정동 , 남녀별 세부 통계정보를 보여 드립니다. 주제 작성기관 자치구 행정동 남녀 인구 가구 산업 경제 보건 복지 교육 문화관광 교통 환경 주택·건설 안전 정보·통 data.seoul.go.kr 2. 분석에 앞선 데이터 전처리 (중요..

빅데이터 분석 공부 시작.

대학교 졸업 후, 서울에서 취업해서 일 한지 2년 반. 항상 길을 잃고 헤매고 있었던 느낌이었다. 분명 뭔가를 하고싶고, 좋아하는 것이 분명히 있었는데.. 바쁜 생활에 치여 지내다 보니 애써 무시하고 살았는데... 마음 한켠 어딘가에 묻어 둔 열정이 요즘 다시 올라오기 시작했다. 평소에 공학뿐만 아니라 정치, 사회 이슈, 수학, 물리, 통계 등 모든분야에 대한 관심이 있었지만 배워서 어디에 쓸 수 있을까 하는 고민과, 주변에서도 "그거 알아서 뭐해? 일이나 열심히 해" 하는 반응에 무엇을 시작할지 조차 모르고 있었다. 화사에서 반복되는 업무를 조금 줄여보고자 RPA 를 위한 Python과, 데이터 관리를 위한 R을 공부하게 되었고 Python과 R 공부를 통해 데이터 분석에 대한 관심이 조금씩 생기기 시..

데이터 분석 2021.08.12
1 2