GitHub - fr0der1c/EveryClass-collector: Spider part of EveryClass

Data-collecting module of EveryClass

Notice: This repo is deprecated. The new generation of spider is in development and it's planned not to be open-sourced.

这是 EveryClass 的数据收集和处理模块。为了结构的清晰性，我们把本项目的不同模块分成了单独的仓库。查看项目主页了解详情。

This is the data collecting part of EveryClass. We decided to separate its different module to standalone repositories for clearer structure. See project page for more information. Since this repo is specially for Chinese school students, we do not offer English version of this README document.

源码使用指南

环境

Python 3.6.0，所需要的 package 在 requirements.txt 里

数据库和基础设置

配置 settings.py 中的当前学期、数据库等信息；
导入 sql/everyclass.sql 内的数据到mysql数据库，你可能需要修改学期信息。如果你不知道怎么导入，你可以将它拷贝到data_collector目录中，然后在python shell中：

>>> from predefined import create_tables
>>> create_tables()

学生信息采集

通过各种手段取得包含学生基本信息的stu_data.json，保存在根目录下（格式参见stu_data_sample.json，出于对本校学生信息的保护，恕不直接提供stu_data.json文件）

教务数据获取和处理

手动通过浏览器操作进入教务的课表查询页面，然后抓包获得 cookies，修改settings.py里的COOKIE_JW字段（因为教务系统有非常严格的 session 机制，在每次运行 retrieve.py 前请务必先确认你此时通过浏览器能正常访问课表查询界面，然后将 cookies 填入settings.py）
马上运行retrieve.py，它将会按照stu_data.json里的列表从教务系统爬取课表存放在data_collector/raw_data文件夹里，这大概需要耗费10小时的时间
运行process_data.py，程序将会通过 Python 的 Beautiful Soup 4 库分析raw_data文件夹里的 HTML 页面，并将课程和学生信息写入数据库
运行import_available_semesters.py，将每个学生的可用学期导入数据库

英语大班课单独导入

英语大班课没有录入教务系统，因此单独运行english_class.py，程序会获取大班课信息然后保存到数据库
如果无法获取数据请先抓包获得 cookies 然后填入settings.py的COOKIE_ENG字段

参与改进

fork 本项目，然后 pull request。

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
sql		sql
src		src
.gitattributes		.gitattributes
CHANGELOG.txt		CHANGELOG.txt
LICENSE.txt		LICENSE.txt
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Data-collecting module of EveryClass

源码使用指南

环境

数据库和基础设置

学生信息采集

教务数据获取和处理

英语大班课单独导入

参与改进

About

Releases

Packages

Languages

License

fr0der1c/EveryClass-collector

Folders and files

Latest commit

History

Repository files navigation

Data-collecting module of EveryClass

源码使用指南

环境

数据库和基础设置

学生信息采集

教务数据获取和处理

英语大班课单独导入

参与改进

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages