通過微信公眾平臺(tái)獲取公眾號(hào)文章的方法示例
我之前自己維護(hù)了一個(gè)公眾號(hào),但因?yàn)閭€(gè)人關(guān)系很久沒有更新了,今天上來緬懷一下,卻偶然發(fā)現(xiàn)了一個(gè)獲取微信公眾號(hào)文章的方法。
之前獲取方法有很多,通過搜狗、清博、網(wǎng)頁端、客戶端等等都還可以,這個(gè)可能并沒有其他的優(yōu)秀,但是操作簡單,很容易理解。
so、 首先需要有一個(gè)微信公眾平臺(tái)的賬號(hào)
微信公眾平臺(tái):https://mp.weixin.qq.com/
登陸之后,進(jìn)入首頁,點(diǎn)擊新建群發(fā)。
選擇自建圖文:
似乎像是公眾號(hào)運(yùn)營教學(xué)了
進(jìn)入編輯頁面之后,點(diǎn)擊超鏈接
彈出選擇框,我們?cè)诳蛑休斎雽?duì)應(yīng)的公眾號(hào)名字,即可出現(xiàn)對(duì)應(yīng)的文章列表
是不是很驚奇,可以打開控制臺(tái),查看一下請(qǐng)求的接口
打開response,里面就是我們需要的文章鏈接
確定了數(shù)據(jù)以后,我們需要分析一下這個(gè)接口。
感覺很簡單,一個(gè)GET請(qǐng)求,攜帶一些參數(shù)。
fakeid是公眾號(hào)的獨(dú)有ID,所以想通過名字直接獲取文章列表,還需要先獲取一下fakeid。
當(dāng)我們輸入公眾號(hào)名字后,點(diǎn)擊搜索。可以看到觸發(fā)了搜索接口,返回了fakeid。
這個(gè)接口所需參數(shù)也不多。
接下來,我們可以用代碼來模擬以上的操作了。
但是還需要使用現(xiàn)有Cookie避免登陸。
目前Cookie的有效期,我還沒有測(cè)試。可能需要及時(shí)更新Cookie。
測(cè)試代碼:
import requests import json Cookie = '請(qǐng)換上自己的Cookie,獲取方法:直接復(fù)制下來' url = "https://mp.weixin.qq.com/cgi-bin/appmsg" headers = { "Cookie": Cookie, "User-Agent": 'Mozilla/5.0 (Linux; Android 10; YAL-AL00 Build/HUAWEIYAL-AL00) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/70.0.3538.64 HuaweiBrowser/10.0.1.335 Mobile Safari/537.36' } keyword = 'pythonlx' # 公眾號(hào)名字:可自定義 token = '你的token' # 獲取方法:如上述 直接復(fù)制下來 search_url = 'https://mp.weixin.qq.com/cgi-bin/searchbiz?action=search_biz&begin=0&count=5&query={}&token={}&lang=zh_CN&f=json&ajax=1'.format(keyword,token) doc = requests.get(search_url,headers=headers).text jstext = json.loads(doc) fakeid = jstext['list'][0]['fakeid'] data = { "token": token, "lang": "zh_CN", "f": "json", "ajax": "1", "action": "list_ex", "begin": 0, "count": "5", "query": "", "fakeid": fakeid, "type": "9", } json_test = requests.get(url, headers=headers, params=data).text json_test = json.loads(json_test) print(json_test)
這樣就能獲取最新的10篇文章了,如果想要獲取更多的歷史文章,可以修改data中的"begin"參數(shù),0是第一頁,5是第二頁,10是第三頁(以此類推)
但是如果想要大規(guī)模抓取的話:
請(qǐng)給自己安排一個(gè)穩(wěn)定的代理,降低爬蟲的速度,準(zhǔn)備多個(gè)賬號(hào),來減少被封禁的可能性。
以上就是本文的全部內(nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持我們。
欄 目:JavaScript
本文標(biāo)題:通過微信公眾平臺(tái)獲取公眾號(hào)文章的方法示例
本文地址:http://mengdiqiu.com.cn/a1/JavaScript/9396.html
您可能感興趣的文章
- 04-02微信挑一挑java代碼 微信挑一挑java代碼怎么做
- 01-10微信小程序批量上傳圖片到七牛(推薦)
- 01-10js通過循環(huán)多張圖片實(shí)現(xiàn)動(dòng)畫效果
- 01-10微信小程序跨頁面數(shù)據(jù)傳遞事件響應(yīng)實(shí)現(xiàn)過程解析
- 01-10微信小程序按順序同步執(zhí)行的兩種方式
- 01-10微信小程序?qū)崿F(xiàn)簽字功能
- 01-10java遇到微信小程序 "支付驗(yàn)證簽名失敗" 問題解決
- 01-10微信小程序如何獲取地址
- 01-10微信小程序自定義模態(tài)彈窗組件詳解
- 01-10微信小程序停止其他視頻 當(dāng)前視頻的實(shí)例代碼


閱讀排行
本欄相關(guān)
- 04-02javascript點(diǎn)線,點(diǎn)線的代碼
- 04-02javascript潛力,javascript強(qiáng)大嗎
- 04-02javascript替換字符串,js字符串的替換
- 04-02javascript移出,js 移入移出
- 04-02包含javascript舍的詞條
- 04-02javascript并行,深入理解并行編程 豆瓣
- 04-02javascript匿名,js匿名方法
- 04-02javascript警報(bào),JavaScript警告
- 04-02javascript遮蓋,JavaScript遮蓋PC端頁面
- 04-02javascript前身,javascript的前身
隨機(jī)閱讀
- 08-05dedecms(織夢(mèng))副欄目數(shù)量限制代碼修改
- 01-10SublimeText編譯C開發(fā)環(huán)境設(shè)置
- 08-05DEDE織夢(mèng)data目錄下的sessions文件夾有什
- 01-10C#中split用法實(shí)例總結(jié)
- 08-05織夢(mèng)dedecms什么時(shí)候用欄目交叉功能?
- 01-10delphi制作wav文件的方法
- 04-02jquery與jsp,用jquery
- 01-11Mac OSX 打開原生自帶讀寫NTFS功能(圖文
- 01-11ajax實(shí)現(xiàn)頁面的局部加載
- 01-10使用C語言求解撲克牌的順子及n個(gè)骰子