서울시의 범죄, CCTV, 1인가구 데이터를 활용한 상관관계 분석 웹 애플리케이션
이 프로젝트는 서울시 공공 데이터를 활용하여 범죄 발생률, CCTV 설치 현황, 1인가구 밀집도 간의 관계를 시각적으로 탐색하는 데이터 분석 프로젝트입니다. Python의 Streamlit 라이브러리를 사용하여 웹 애플리케이션으로 구현하였으며, 사용자가 직접 변수를 선택하여 데이터 간의 상관관계를 실시간으로 확인할 수 있습니다.
👉 웹 앱 바로가기: https://seoul-data-analysis.streamlit.app/
"서울시 지역 안전 요인 분석: 범죄, CCTV, 1인가구의 상관관계"
- 범죄 데이터: 2020년 서울시 자치구별 범죄 발생 건수
- CCTV 데이터: 자치구별, 설치 목적별 CCTV 설치 현황
- 인구 데이터: 자치구별 1인가구 수 및 비율
평소 뉴스를 보며 "CCTV가 많이 설치된 지역은 정말로 범죄로부터 안전할까?", 혹은 "1인가구가 많은 지역이 범죄에 더 취약할까?" 라는 궁금증을 가지고 있었습니다.
단편적인 뉴스 기사가 아닌, 실제 공공 데이터를 통해 이 요소들 간에 유의미한 통계적 관계가 있는지 직접 확인하고 시각화해보고 싶어 이 주제를 선정하게 되었습니다.
이 앱은 크게 4가지 분석 기능을 제공합니다.
- 기능: 3가지 데이터를 병합하여 상관관계 분석
- 시각화: 사용자가 X축/Y축을 선택하면 실시간으로 산점도 와 상관계수를 출력
- 활용: "CCTV 총대수 vs 5대 범죄 발생 건수" 등의 가설 검증 가능
- 기능: 연도별, 범죄 유형별(살인, 강도 등), 발생/검거별 건수 필터링
- 시각화: 자치구별 범죄 건수 내림차순 막대그래프
- 기능: 설치 목적(방범용, 불법주차 단속 등)별 CCTV 설치 현황 조회
- 시각화: 자치구별 CCTV 설치 대수 비교
- 기능: 자치구별 1인가구 수(절대값) 및 전체 세대 대비 1인가구 비율(%) 분석
- 시각화: 자치구별 인구 통계 시각화
아래 링크를 클릭하면 프로젝트 시연 영상을 확인할 수 있습니다.
| 이름 | 역할 | 비고 |
|---|---|---|
| [이세연] | 팀장 / 개발 | 데이터 전처리, Streamlit 구현, 배포 |
| [조혜인] | 개발 / 분석 | 데이터 분석, 발표 |
| [김현하] | 기획 / 분석 | 자료 조사, 데이터 수집 |
- Language: Python 3.13
- Web Framework: Streamlit
- Data Analysis: Pandas, Openpyxl
- Visualization: Seaborn, Matplotlib
