GitHub標星兩萬的-u0026#34;Python搶票教程”,我們先幫你跑了一遍(標星下載)
大數(shù)據(jù)文摘出品
作者:曹培信、池俊輝
盼望著,盼望著,
春節(jié)的腳步近了,
然而,每年到這個時候,
最難的,
莫過于一張回家的火車票。
據(jù)悉,
今年春運期間,
全國鐵路發(fā)送旅客人次同比將增長8.0%。
達到4.4億人次,
2020年鐵路春運自1月10日開始,
2月18日結(jié)束,共40天,
節(jié)前15天,節(jié)后25天,
今年的12月12日起日1月10日火車票正式發(fā)售。
即使再難,家還是要回的,票還是要搶的,所以這一周,GitHub上用python搶票的項目又重回top榜單。
這個搶票小助手誕生于2017年,作者是文賢平/文先森 (testerSunshine) ,目前這個項目標星已經(jīng)將近20000,可想而知程序員們回家的愿望是多么的迫切!
史上最強搶票助手,緊隨12306更新
從項目的更新日志可以看到,這個項目的第一次更新是在2017.5.13,之后一共進行了32次更新,其中大部分是作者本人,也有一些開發(fā)者提供了支持。
這個項目基本上是緊隨著12306網(wǎng)站的功能更新而更新的,比如去年春運增加的候補功能,在票賣完的情況下預先付款,等其他人退票之后自動補上。該項目也在今年加入了這個功能。
目前這個搶票小助手基本支持12306的所有主要功能,包括相當郵件通知、智能候補等。
這個搶票小助手堪稱史上最強的搶票小助手了,作者在項目后面提供了交流群,9個群如今已經(jīng)有7個滿了,可想而知這是多么強大的力量。
句句代碼,只為搶一張回家的票
作者為了這個項目還是費了不少心血的,首先我們來看一下作者的思路。
思路并不復雜而且相當緊湊。
首先需要下載一個機器學習模型完成對12306驗證碼的自動識別,該模型需放于項目根目錄中。
1. 模型下載鏈接:
https://pan.baidu.com/s/1rS155VjweWVWIJogakechA
密碼:bmlm
2. git倉庫下載:
https://github.com/testerSunshine/12306model.git
(1)cd 12306/
(2)git clone
https://github.com/testerSunshine/12306model.git
模型的安裝需要一些依賴,具體如下:
滿足了依賴之后可以進行安裝:
- root用戶(避免多python環(huán)境產(chǎn)生問題):
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt
- 非root用戶(避免安裝和運行時使用了不同環(huán)境):
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt
許多windows的用戶裝不了tensorflow的話,可以適當降低版本或者升高版本都是可以的。
注意,在過程中如果報錯為缺少上面列表中的依賴,只需單獨使用pip3安裝相應依賴包即可。
而后就可以啟動項目了。
第一步:修改配置文件
# 測試郵箱和server醬是否可用, server醬測試的前提是server醬開關(guān)開啟# 可以配置server醬提醒(推薦)[配置教程](https://www.jianshu.com/p/8d10b5b9c4e3)# 用python3?還是python?完全取決于安裝的時候配置的環(huán)境變量是否為python3,以下啟動默認環(huán)境變量為python3python3?run.py?t
配置文件說明(仔細閱讀說明?。?/p>
# -*- coding=utf-8 -*-
# 關(guān)于軟件使用配置說明,一定要看?。?!
# ps: 如果是候補車票,需要通過人證一致性核驗的用戶及激活的“鐵路暢行”會員可以提交候補需求,請您按照操作說明在鐵路12306app.上完成人證核驗
# 關(guān)于候補了之后是否還能繼續(xù)撿漏的問題在此說明:軟件為全自動候補加撿漏,如果軟件候補成功則會停止搶票,發(fā)出郵件通知,但是不會影響你繼續(xù)撿漏,
# 如果這個時候撿漏撿到的話,也是可以付款成功的,也就是說,撿漏 候補,可以最大程度提升搶票成功率
# 刷票模式:1=刷票 2=候補 刷票
TICKET_TYPE = 1
# 出發(fā)日期(list) "2018-01-06", "2018-01-07"
STATION_DATES = [
"2020-01-17"
]
# 填入需要購買的車次(list),"G1353"
# 修改車次填入規(guī)則,注:(以前設(shè)置的車次邏輯不變),如果車次填入為空,那么就是當日乘車所有車次都納入篩選返回
# 不填車次是整個list為空才算,如果不是為空,依然會判斷車次的,這種是錯誤的寫法 [""], 正確的寫法 []
STATION_TRAINS = ["G1120"]
# 出發(fā)城市,比如深圳北,就填深圳就搜得到
FROM_STATION = "廣州"
# 到達城市 比如深圳北,就填深圳就搜得到
TO_STATION = "武漢"
# 座位(list) 多個座位ex:
# "商務座",
# "一等座",
# "二等座",
# "特等座",
# "軟臥",
# "硬臥",
# "硬座",
# "無座",
# "動臥",
SET_TYPE = ["二等座"]
# 當余票小于乘車人,如果選擇優(yōu)先提交,則刪減聯(lián)系人和余票數(shù)一致在提交
# bool
IS_MORE_TICKET = True
# 乘車人(list) 多個乘車人ex:
# "張三",
#"李四"
TICKET_PEOPLES = [""]
# 12306登錄賬號
USER = ""
PWD = ""
# 加入小黑屋時間默認為5分鐘,此功能為了防止僵尸票導致一直下單不成功錯過正常的票
TICKET_BLACK_LIST_TIME = 5
# 自動打碼
IS_AUTO_CODE = True
# 設(shè)置2本地自動打碼,需要配置tensorflow和keras庫,3為云打碼,由于云打碼服務器資源有限(為2h4C的cpu服務器),請不要惡意請求,不然只能關(guān)閉服務器
# ps: 請不要一直依賴云服務器資源,在此向所有提供服務器同學表示感謝
AUTO_CODE_TYPE = 3
# 此處設(shè)置云打碼服務器地址,如果有自建的服務器,可以自行更改
HOST = "120.77.154.140:8000"
REQ_URL = "/verify/base64/"
HTTP_TYPE = "http"
# HOST="12306.yinaoxiong.cn" #備用服務器穩(wěn)定性較差
# REQ_URL="/verify/base64/"
# HTTP_TYPE="https"
# 郵箱配置,如果搶票成功,將通過郵件配置通知給您
# 列舉163
# email: "xxx@163.com"
# notice_email_list: "123@qq.com"
# username: "xxxxx"
# password: "xxxxx
# host: "smtp.163.com"
# 列舉qq ,qq設(shè)置比較復雜,需要在郵箱–>賬戶–>開啟smtp服務,取得授權(quán)碼==郵箱登錄密碼
# email: "xxx@qq.com"
# notice_email_list: "123@qq.com"
# username: "xxxxx"
# password: "授權(quán)碼"
# host: "smtp.qq.com"
EMAIL_CONF = {
"IS_MAIL": True,
"email": "",
"notice_email_list": "",
"username": "",
"password": "",
"host": "smtp.qq.com",
}
# 是否開啟 server醬 微信提醒, 使用前需要前往 http://sc.ftqq.com/3.version 掃碼綁定獲取 SECRET 并關(guān)注獲得搶票結(jié)果通知的公眾號
SERVER_CHAN_CONF = {
"is_server_chan": False,
"secret": ""
}
# 是否開啟cdn查詢,可以更快的檢測票票 1為開啟,2為關(guān)閉
IS_CDN = 1
# 下單接口分為兩種,1 模擬網(wǎng)頁自動撿漏下單(不穩(wěn)定),2 模擬車次后面的購票按鈕下單(穩(wěn)如老狗)
ORDER_TYPE = 2
# 下單模式 1 為預售,整點刷新,刷新間隔0.1-0.5S, 然后會校驗時間,比如12點的預售,那腳本就會在12.00整檢票,刷新訂單
# 2 是撿漏,撿漏的刷新間隔時間為0.5-3秒,時間間隔長,不容易封ip
ORDER_MODEL = 1
# 是否開啟代理, 0代表關(guān)閉, 1表示開始
# 開啟此功能的時候請確保代理ip是否可用,在測試放里面經(jīng)過充分的測試,再開啟此功能,不然可能會耽誤你購票的寶貴時間
# 使用方法:
# 1、在agency/proxy_list列表下填入代理ip
# 2、測試UnitTest/TestAll/testProxy 測試代理是否可以用
# 3、開啟代理ip
IS_PROXY = 0
# 預售放票時間, 如果是撿漏模式,可以忽略此操作
OPEN_TIME = "12:59:50"
# 1=使用selenium獲取devicesID
# 2=使用網(wǎng)頁端/otn/HttpZF/logdevice獲取devicesId,這個接口的算法目前可能有點問題,如果登錄一直302的請改為配置1
# 3=自己打開瀏覽器在headers-Cookies中抓取RAIL_DEVICEID和RAIL_EXPIRATION,這個就不用配置selenium
COOKIE_TYPE = 3
# 如果COOKIE_TYPE=1,則需配置chromeDriver路徑,下載地址http://chromedriver.storage.googleapis.com/index.html
# chromedriver配置版本只要和chrome的大版本匹配就行
CHROME_PATH = "/usr/src/app/chromedriver"
# 為了docker37 準備的環(huán)境變量,windows環(huán)境可以不用管這個參數(shù)
CHROME_CHROME_PATH = "/opt/google/chrome/google-chrome"
# 如果COOKIE_TYPE=3, 則需配置RAIL_EXPIRATION、RAIL_DEVICEID的值
RAIL_EXPIRATION = "1577033439142"
RAIL_DEVICEID = "PuV16sVaV-CTGsFZUuL8JLAk4OhuT1wgUYC_W3L2JZfWx8Ygx8LOPkko3PSOrK5_xSKhXjgyTMS8dBmj1RZHL2CKBTmVs6UG_yptlB4NJbGHldltrLMTUEgoDpSkpX2vzpGXgMQsTRzgOXfuQkAWwS4GjCxSmV3C; BIGipServerpassport=820510986.50215.0000; route=9036359bb8a8a461c164a04f8f50b252"
# 1=>為一直隨機ua,2->只啟動的時候隨機一次ua
RANDOM_AGENT = 2
PASSENGER_TICKER_STR = {
'一等座': 'M',
'特等座': 'P',
'二等座': 'O',
'商務座': 9,
'硬座': 1,
'無座': 1,
'軟座': 2,
'軟臥': 4,
'硬臥': 3,
}
# 保護12306官網(wǎng)請求頻率,設(shè)置隨機請求時間,原則為5分鐘不大于80次
# 最大間隔請求時間
MAX_TIME = 3
# 最小間隔請求時間
MIN_TIME = 1
# 軟件版本
RE_VERSION = "1.2.003"
第二步:啟動前篩選cdn
python3?run.py?c
第三步:啟動服務
python3?run.py?r
成功搶票后就會出現(xiàn)下面的結(jié)果啦!
項目地址:
https://github.com/testerSunshine/12306
程序員為了搶火車票,都干了什么!
程序員為了搶票而寫代碼這件事可以追溯到12306網(wǎng)站剛出現(xiàn)的時候。
2010年初,12306網(wǎng)絡購票剛剛出現(xiàn),一年后GitHub上就已經(jīng)有程序員為了買票而寫腳本了,但是當時僅限于查詢余票。
隨后,越來越多的程序員開始了“面向回家編程”,出的最大的新聞是差點搞垮GitHub。
2012年,一位叫做iFish的大佬開發(fā)的插件,被很多瀏覽器的春節(jié)版本紛紛搭載,連12306官方也引用了里面的一個資源。
這個插件引發(fā)了著名的「12306 訂票助手拖垮 GitHub」事件。
簡單來說,就是這款“訂票助手”使用的文件并不是普通的靜態(tài)文件(例如 gist),而是一個repo 的raw data。這就意味著,每次有人請求這個文件,github都要去訪問這個repo,查找要求的數(shù)據(jù)。
并且,如果一次數(shù)據(jù)請求失敗,那么這個指令就會就每五秒請求一次,直到成功。于是在春節(jié)前十幾天的搶票高峰時,巨大的訪問量導致Github受到DDOS攻擊,不堪負載。
事后作者本人也表示:慌得一批。
之后隨著各種App付費搶票的出現(xiàn),很多人不會選擇碼一堆代碼只為搶一張票,但是程序員心中的執(zhí)念還是始終不會熄滅,“面向回家編程”,再艱難也是值得的!
最后文摘菌也祝愿各位小伙伴們:在今年的春運中成功搶票,順利回家!