♣ 이번주 목표 : [기초 프로젝트] SQL을 활용한 데이터 분석하기
- 프로젝트 목표 및 가설 설정
- 데이터 수집/분석
오전에 기초 프로젝트 발제를 들은 뒤 계속해서 팀원들과 회의하는 시간을 가졌다.
주제 선정 과정이 쉽지는 않았지만 팀원들과 회의를 하다 보니 어느 정도 가닥을 잡을 수 있었다.
이후 각자 가설을 하나씩 담당해 분석할 데이터를 정했고 서로 데이터를 공유해 가며 분석하고 인사이트를 도출하기로 했다. 나는 지하철 승하차 정보 분석을 담당하여 필요한 데이터셋을 수집 후 분석을 시작했다.
나이대별 데이터는 확보하였으나 승객의 성별이 구분된 데이터는 찾지 못해서 유동인구 데이터를 더 찾아봐야 할 것 같다.
- 프로젝트 목적 및 목표 : 2030대를 타깃으로 한 데이팅앱의 지하철 광고 효율이 높은 최적의 역사 예측
- 가설
- 하차보다 승차 시 대기하는 동안의 광고 주목도가 높을 것이다.
- 심야 시간 승차 인원이 많은 곳에 광고를 하면 노출 효과가 극대화될 것이다.
- 데이터 자료
- 서울시 지하철 호선별 역별 승하차 인원 정보
http://data.seoul.go.kr/dataList/OA-12914/S/1/datasetView.do - 서울시 지하철 호선별 역별 시간대별 승하차 인원 정보
http://data.seoul.go.kr/dataList/OA-12252/S/1/datasetView.do - 서울교통공사 연도별 일별 시간대별 역별 승하차 인원
https://data.seoul.go.kr/dataList/OA-12921/F/1/datasetView.do - 대중교통 O/D 현황
https://topis.seoul.go.kr/refRoom/openRefRoom_3_4.do
- 서울시 지하철 호선별 역별 승하차 인원 정보
문제 상황 및 해결
수집한 데이터를 DBeaver에 연결하여 확인하려던 중에 다음과 같은 오류가 발생했다.
컬럼명이 한글이라서 문자 인코딩 과정에서 오류가 난 것으로 보이는데 다른 분의 도움을 받아 해결하였다.
- 인코딩 방식을 utf-8이 아니라 euc-kr로 변경
오류 상황 | 해결 방법 |
![]() |
![]() |
▼ 한글 깨짐 없이 데이터 불러오기에 성공!
'Today I Learned' 카테고리의 다른 글
240115 / 데이터 분석 부트캠프 19일차 (내일배움캠프 Data_1기) (0) | 2024.01.15 |
---|---|
240112 / 데이터 분석 부트캠프 18일차 (내일배움캠프 Data_1기) (1) | 2024.01.12 |
240110 / 데이터 분석 부트캠프 16일차 (내일배움캠프 Data_1기) (0) | 2024.01.10 |
240109 / 데이터 분석 부트캠프 15일차 (내일배움캠프 Data_1기) (1) | 2024.01.09 |
240108 / 데이터 분석 부트캠프 14일차 (내일배움캠프 Data_1기) (0) | 2024.01.08 |