노인일자리 사업 데이터 파이프라인 개발 및 분석
본 프로젝트는 65세 이상 노인들의 경제적 자립과 사회 참여를 지원하기 위한 정부 복지사업을 분석을 위한 데이터 파이프라인을 개발하는 프로젝트 입니다. 최근 3년간의 노인일자리 공고와 사업 정보를 수집,변환 및 적재를 자동화 하였습니다. 추가로, 노인 일자리 채용 현황과 고용 지속성을 분석하고, 정부 정책의 효과성을 평가할 수 있는 대시보드를 개발했습니다.
팀 내 역할: Airflow를 이용한 ETL 파이프라인 구축
참고자료: 노인 일자리 분석 보고서
jobs.csv
와 projects.csv
파일로 저장합니다.projects_crawling.py
와 job_crawling.py
를 통해 각각 사업 목록과 일자리 데이터를 크롤링하여 Google Sheets와 BigQuery에 적재하는 데이터 파이프라인을 개발하였습니다.