- 배경
- 노령 인구의 증가 및 청, 장년층 인구 감소에 따라 만 65세 이상 노령 인구에 대해 지하철 무임승차에 의한 적자를 방지하기 위한 대책 마련
- 노령 인구의 증가 및 청, 장년층 인구 감소에 따라 만 65세 이상 노령 인구에 대해 지하철 무임승차에 의한 적자를 방지하기 위한 대책 마련
- 사용된 기술
- Scikit-Learn을 이용한 Linear Regression, Polynomial Regression
- Python 3.10
- Anaconda, Pandas, Numpy, etc.
- 동작구조
- Input Data : 2018년부터 2021년까지 1달 단위의 서울교통공사에 속하는 노선별(1호선 ~ 9호선) 전체 이용객 수와 만 65세 이상의 우대권 이용자 수
- 데이터 개수 : 4(년) X 12(달) X 9(노선 개수) = 432(개)
- Target Data : 2018년부터 2021년까지 매년 운송 수입 및 총 적자에 대한 데이터
- Target Data의 경우 통계 기준이 1년 단위로, 월별 전체 이용객수에 비례하도록 운임 수입과 운임 손실을 나눔
- 데이터 개수 : 4(년) X 12(달) X 9(노선 개수) = 432(개)
- 전체 이용자와 우대권 이용자를 각각 운임 수입과 운임 손실에 Mapping
- 이때 사용된 ML 기술은 Polynomial Regression
- 전체 이용객과 우대권 이용개의 2가지 특성을 각각 수입과 손실에 Mapping
- Input Data : 2018년부터 2021년까지 1달 단위의 서울교통공사에 속하는 노선별(1호선 ~ 9호선) 전체 이용객 수와 만 65세 이상의 우대권 이용자 수
- 한계점
- 해결 방안
- 데이터 삭제
- Covid - 19에 영향이 있었던 2020년과 2021년 데이터 삭제 후 재학습
- Covid - 19에 영향이 있었던 2020년과 2021년 데이터 삭제 후 재학습
- 데이터 삭제
- 파일 설명
Data
폴더는 현재 사용되는 Excel FileAll_Population.xlsx
는 사용되지 않음
Dividing_Function_Revenue(Loss).py
는 운임 수입 및 적자액을 월별, 호선별 전체 이용자수에 비례해 나눈 후 2차원 List로 생성해주는 파일- 뒤에
Covid
는 코로나 이전 데이터만 불러올 경우에 대한 파일
- 뒤에
Subway_Poly_Loss_Final.py
는 Linear Regression과 Polynomial Regression을 이용하여 학습시키는 파일- 뒤에
Covid
는 위와 마찬가지로 코로나 이전 데이터를 이용해서만 학습
- 뒤에
FinalProgram.py
는 최종 결과를 보여주기 위한 파일
-
Notifications
You must be signed in to change notification settings - Fork 0
IIIBreakeRIII/ML-SubwayPredict
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
(ML)Supervised Learning : 지하철 운임 수입 / 손실 예측
Topics
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published