微信上其實還有很多你不知道的事,Python微信平臺開發(fā)編寫實錄
本文主要講述如何利用Python開發(fā)微信公眾平臺。
說明:如果你是Python小白,爬蟲小白,覺得本節(jié)課程的代碼晦澀難懂。沒關系,不需要懂,按照步驟一步步操作就可以了。這一節(jié)我們主要是搭框架,幾乎沒有真正的爬蟲代碼。這些代碼和操作,你可能一生也就只用這一次。下一節(jié),我們再講述怎么在這個框架上擴展我們的爬蟲程序。
當然小編這里也準備一份適合你的學習資料爬蟲 ,web開發(fā)的學習資料視頻教程,私信小編“01”都可以免費獲取!
需要的操作:
- 微信公眾賬號的申請。
- 微信接口的獲取,SAE的設置等。
- 簡單的Python爬蟲代碼編寫
需掌握的知識點:
- 了解微信公眾號與云計算平臺之間的連接關系。明確其運行機制。
- 了解web.py的概念,wsgi的機制。
- 了解簡單的python爬蟲知識,json解析,API調(diào)用,urllib庫函數(shù)。
自動回復實現(xiàn)原理
首先了解一下,到底是什么樣的機制能實現(xiàn)微信的自動回復功能呢?(不是微信系統(tǒng)的自動回復)原理就是微信平臺將用戶輸入的文字發(fā)送到云平臺上,然后云平臺上運行的程序捕捉到這一文字信息,就return一個結果,然后云平臺再將該結果返回至微信平臺。最后微信平臺將返回的結果展現(xiàn)給用戶。用一張圖表示一下:
微信開發(fā)者模式與SAE的設置
這一節(jié)我盡量講的細致一些,如果仍有不清楚的,可以私信我。
首先需要兩大平臺支持:
- 微信公眾平臺;這個申請比較簡單。只要有郵箱就可以免費申請個人版的訂閱號。不再贅述。
- 云計算平臺;我這里使用的SAE(新浪的去年本來就不收費,坑爹,今年開始收費了,單純代碼托管最低一天1毛),也可以用騰訊云。
具體步驟:
微信公眾號的申請。
只要有郵箱就可以免費申請個人版的訂閱號。不再贅述。
SAE的申請及設置
注冊登錄SAE之后,選用SAE
創(chuàng)建新項目,SAE暫時只支持Python2.7,Python3暫時用不了。
如果項目比較小,建議填寫SVN,因為可以在線編輯。如果項目比較大,就Git吧。這里選用SVN。
創(chuàng)建第一個版本
可以開始編輯啦~
編寫config.yaml和index.wsgi文件。
WSGI是PythonWeb服務器網(wǎng)關接口(Python Web Server Gateway Interface)。我們使用的是web.py框架。同類型比較強大的框架有Django,F(xiàn)lask等。為什么選用web.py呢,是因為它是輕量級的,而且有著良好的xml解析功能。插句題外話,web.py的開發(fā)者AaronH. Swartz是個十足的天才,可惜英年早逝。有個關于他的一部紀錄片,推薦看一下:互聯(lián)網(wǎng)之子。
好了,言歸正傳,我們首先編寫config.yaml
name: pifuhandashu version: 1 libraries: - name: webpy version: "0.36" - name: lxml version: "2.3.4" ...
這里我們引入了web.py框架以及l(fā)xml模塊,接著我們編寫index.wsgi文件。
# coding: utf-8 import os import sae import web from weixinInterface import WeixinInterface urls = ('/weixin','WeixinInterface') app_root = os.path.dirname(__file__) templates_root = os.path.join(app_root, 'templates') render = web.template.render(templates_root) app = web.application(urls, globals()).wsgifunc() application = sae.create_wsgi_app(app)
這里就是簡單的python利用web.py網(wǎng)頁開發(fā)的知識了。設置了根目錄,模板目錄,/weixin的路由,開啟應用。
為了使頁面顯得更整潔,我們再新建了一個py文件weixinInterface.py(weixinInterface.py和index.wsgi在同一級目錄,見后面的截圖)。
- 編輯weixinInterface.py,大小寫一定要看清啊,不然很容易出錯。注意自己填寫一個專屬的token,這個等會微信公眾號設置里面有用到。
# -*- coding: utf-8 -*- import hashlib import web import lxml import time import os import urllib2,json from lxml import etree class WeixinInterface: def __init__(self): self.app_root = os.path.dirname(__file__) self.templates_root = os.path.join(self.app_root, 'templates') self.render = web.template.render(self.templates_root) def GET(self): #獲取輸入?yún)?shù) data = web.input() signature = data.signature timestamp = data.timestamp nonce = data.nonce echostr = data.echostr #自己的token token = "XXXXXXXXXXX" #注意:填寫之后在微信公眾平臺里輸入的token?。?! #字典序排序 list = [token, timestamp, nonce] list.sort() sha1 = hashlib.sha1() map(sha1.update,list) hashcode = sha1.hexdigest() #sha1加密算法 #如果是來自微信的請求,則回復echostr if hashcode == signature: return echostr
代碼大致講解一下,def __init__(self)是告訴我們模板文件的加載位置。 def GET(self)是應微信公眾平臺的要求,進行的token驗證。這里的驗證采用的是哈希算法。具體可參考微信官方的接口接入說明:微信公眾平臺接入指南。里面有個php示例。本文采用的是python實現(xiàn)。
微信開發(fā)者模式設置
基本設置
修改配置
URL一定要認真填寫,仔細核對。
比如查看url應用信息:
token填寫剛才新浪SAE里面填寫的token,一定要一致。EncodingAESKey可以隨機生成。填完之后點擊提交。如果提示“提交成功”。恭喜你,最關鍵的一步已經(jīng)完成了。這個階段可能要折騰蠻長時間。完成之后,一定要啟用開發(fā)者模式!!!!切記!!!
微信機器人實現(xiàn)
上一步完成之后,我們就可以做一些有趣的事情:微信機器人。不過在此之前,還要完成一小步:模板的創(chuàng)建。由于微信開發(fā)是采用的xml的形式。為了先實現(xiàn)文本形式自動回復(后面可以實現(xiàn)回復音頻,圖文信息等形式),首先新建模板文件夾templates,然后在templates文件夾下創(chuàng)建reply_text.xml文件(文件放置位置見后面的截圖)。根據(jù)微信消息被動回復所示,填入以下代碼:
$def with (toUser,fromUser,createTime,Content) <xml> <ToUserName><![CDATA[$toUser]]></ToUserName> <FromUserName><![CDATA[$fromUser]]></FromUserName> <CreateTime>$createTime</CreateTime> <MsgType><![CDATA[text]]></MsgType> <Content>$content</Content> </xml>
然后,在weixinInterface.py里的def GET(self)后面編寫POST函數(shù)。該函數(shù)用來獲取用戶的ID,發(fā)送的消息類型,發(fā)送的時間等。判斷用戶發(fā)送的消息類型,如果是純文本類型,if mstype == 'text',那么可以進行下一步操作。
def POST(self): str_xml = web.data() #獲得post來的數(shù)據(jù) xml = etree.fromstring(str_xml)#進行XML解析 mstype = xml.find("MsgType").text#消息類型 fromUser = xml.find("FromUserName").text toUser = xml.find("ToUserName").text
為了實現(xiàn)微信機器人,我們需要實現(xiàn)自動回復的內(nèi)容。這里有兩種方式。
- 爬取網(wǎng)上的機器人回復的內(nèi)容,比如找不到小黃雞的接口,我就自己爬蟲爬取它的回復結果。
- 調(diào)用自動能夠回復的機器人API。
這里我選用第二種方法,采用的是圖靈機器人的API。這種方法方便快捷,一般不會被墻。但是自由度不高,可拓展性差。
注冊圖靈機器人賬號,注意是采用圖靈的網(wǎng)頁api,而不是授權。獲取圖靈機器人回復的key。幾行代碼就可以搞定微信機器人自動回復啦~
源碼展示
index.wsgi源碼
# coding: utf-8 import os import sae import web from weixinInterface import WeixinInterface urls = ( '/weixin','WeixinInterface', ) app_root = os.path.dirname(__file__) templates_root = os.path.join(app_root, 'templates') render = web.template.render(templates_root) app = web.application(urls, globals()).wsgifunc() application = sae.create_wsgi_app(app)
config.yaml源碼
name: myzhihu version: 1 libraries: - name: webpy version: "0.36" - name: lxml version: "2.3.4" ...
templates下的reply_text.xml源碼
$def with (toUser,fromUser,createTime,content) <xml> <ToUserName><![CDATA[$toUser]]></ToUserName> <FromUserName><![CDATA[$fromUser]]></FromUserName> <CreateTime>$createTime</CreateTime> <MsgType><![CDATA[text]]></MsgType> <Content>$content</Content> </xml>
weixinInterface.py源碼
# -*- coding: utf-8 -*- import hashlib import web import lxml import time import os import json import urllib from lxml import etree class WeixinInterface: def __init__(self): self.app_root = os.path.dirname(__file__) self.templates_root = os.path.join(self.app_root, 'templates') self.render = web.template.render(self.templates_root) def GET(self): #獲取輸入?yún)?shù) data = web.input() signature=data.signature timestamp=data.timestamp nonce=data.nonce echostr=data.echostr #自己的token token="################" #這里填寫在微信公眾平臺里輸入的token #字典序排序 list=[token,timestamp,nonce] list.sort() sha1=hashlib.sha1() map(sha1.update,list) hashcode=sha1.hexdigest() #sha1加密算法 #如果是來自微信的請求,則回復echostr if hashcode == signature: return echostr def POST(self): str_xml = web.data() #獲得post來的數(shù)據(jù) xml = etree.fromstring(str_xml)#進行XML解析 mstype = xml.find("MsgType").text fromUser = xml.find("FromUserName").text toUser = xml.find("ToUserName").text if mstype == 'text': content = xml.find("Content").text#獲得用戶所輸入的內(nèi)容 key = '#####################' ###圖靈機器人的key api = 'http://www.tuling123.com/openapi/api?key=' key '&info=' info = content.encode('UTF-8') url = api info page = urllib.urlopen(url) html = page.read() dic_json = json.loads(html) reply_content = dic_json['text'] return self.render.reply_text(fromUser,toUser,int(time.time()),reply_content)
尾記
本次教程實現(xiàn)了利用Python開發(fā)微信公眾平臺,能夠自動回復用戶輸入的文字。包括了微信公眾平臺的設置,SAE的設置,相關代碼的編寫等。