您现在的位置是：首页 > 热点事件 > 正文

热点事件

微信python源码（微信 python）

微信python源码

hacker2022-07-01 21:54:28热点事件111

本文目录一览：1、python可以爬微信吗2、python微信源码出售哪里有

本文目录一览：

1、python可以爬微信吗
2、python微信源码出售哪里有
3、Python代码怎么让微信
4、用python怎么设计一个微信的接口
5、python怎么抓取微信阅
6、求python收集微信聊天记录代码每天收集同事们通过微信向我汇报工作情况，汇总成excel表格

python可以爬微信吗

主要思路

从UI获取文本信息是最为简单的方法，于是应该优先逆向UI代码部分。

逆向微信apk

首先解包微信apk，用dex2jar反编译classes.dex，然后用JD-GUI查看jar源码。当然，能看到的源码都是经过高度混淆的。但是，继承自安卓重要组件（如Activity、Service等）的类名无法被混淆，于是还是能从中看到点东西。

首先定位到微信APP package。我们知道这个是 com.tencent.mm。

在 com.tencent.mm

中，我们找到一个 ui

包，有点意思。

展开 com.tencent.mm.ui

，发现多个未被混淆的类，其中发现 MMBaseActivity直接继承自 Activity

， MMFragmentActivity

继承自 ActionBarActivity

， MMActivity

继承自 MMFragmentActivity

，并且 MMActivity

是微信中大多数Activity的父类：

public class MMFragmentActivity

extends ActionBarActivity

implements SwipeBackLayout.a, b.a {

...

}

public abstract class MMActivity

extends MMFragmentActivity {

...

}

public class MMBaseActivity

extends Activity {

...

}

现在需要找出朋友圈的Activity，为此要用Xposed hook MMActivity。

创建一个Xposed模块

参考 [TUTORIAL]Xposed module devlopment，创建一个Xposed项目。

简单Xposed模块的基本思想是：hook某个APP中的某个方法，从而达到读写数据的目的。

小编尝试hook com.tencent.mm.ui.MMActivity.setContentView这个方法，并打印出这个Activity下的全部TextView内容。那么首先需要遍历这个Activity下的所有TextView，遍历ViewGroup的方法参考了SO的以下代码：

private void getAllTextViews(final View v) {if (v instanceof ViewGroup) {

ViewGroup vg = (ViewGroup) v;

for (int i = 0; i vg.getChildCount(); i++) {View child = vg.getChildAt(i);

getAllTextViews(child);

}

} else if (v instanceof TextView ) {

dealWithTextView((TextView)v); //dealWithTextView(TextView tv)方法：打印TextView中的显示文本}

}

Hook MMActivity.setContentView

的关键代码如下：

findAndHookMethod("com.tencent.mm.ui.MMActivity", lpparam.classLoader, "setContentView", View.class, new XC_MethodHook() {...

});

在findAndHookMethod方法中，第一个参数为完整类名，第三个参数为需要hook的方法名，其后若干个参数分别对应该方法的各形参类型。在这里， Activity.setContentView(View view)方法只有一个类型为 View

的形参，因此传入一个 View.class

。

现在，期望的结果是运行时可以从Log中读取到每个Activity中的所有的TextView的显示内容。

但是，因为View中的数据并不一定在 setContentView()时就加载完毕，因此小编的实验结果是，log中啥都没有。

意外的收获

当切换到朋友圈页面时，Xposed模块报了一个异常，异常源从 com.tencent.mm.plugin.sns.ui.SnsTimeLineUI这个类捕捉到。从类名上看，这个很有可能是朋友圈首页的UI类。展开这个类，发现更多有趣的东西：

这个类下有个子类 a

(被混淆过的类名)，该子类下有个名为 gyO的 ListView

类的实例。我们知道， ListView

是显示列表类的UI组件，有可能就是用来展示朋友圈的列表。

顺藤摸瓜

那么，我们先要获得一个 SnsTimeLineUI.a.gyO的实例。但是在这之前，要先获得一个 com.tencent.mm.plugin.sns.ui.SnsTimeLineUI.a的实例。继续搜索，发现 com.tencent.mm.plugin.sns.ui.SnsTimeLineUI有一个名为 gLZ

的 SnsTimeLineUI.a

实例，那么我们先取得这个实例。

经过测试， com.tencent.mm.plugin.sns.ui.SnsTimeLineUI.a(boolean, boolean, String, boolean)这个方法在每次初始化微信界面的时候都会被调用。因此我们将hook这个方法，并从中取得 gLZ。

findAndHookMethod("com.tencent.mm.plugin.sns.ui.SnsTimeLineUI", lpparam.classLoader, "a", boolean.class, boolean.class, String.class, boolean.class, new XC_MethodHook() {@Override

protected void afterHookedMethod(MethodHookParam param) throws Throwable {XposedBridge.log("Hooked. ");

Object currentObject = param.thisObject;

for (Field field : currentObject.getClass().getDeclaredFields()) { //遍历类成员field.setAccessible(true);

Object value = field.get(currentObject);

if (field.getName().equals("gLZ")) {

XposedBridge.log("Child A found.");

childA = value;

//这里获得了gLZ

...

}

});

现在取得了 SnsTimeLineUI.a

的一个实例 gLZ

，需要取得这个类下的 ListView

类型的 gyO

属性。

private void dealWithA() throws Throwable{if (childA == null) {

return;

}

for (Field field : childA.getClass().getDeclaredFields()) { //遍历属性field.setAccessible(true);

Object value = field.get(childA);

if (field.getName().equals("gyO")) { //取得了gyOViewGroup vg = (ListView)value;

for (int i = 0; i vg.getChildCount(); i++) { //遍历这个ListView的每一个子View...

View child = vg.getChildAt(i);

getAllTextViews(child); //这里调用上文的getAllTextViews()方法，每一个子View里的所有TextView的文本...

}

现在已经可以将朋友圈页面中的全部文字信息打印出来了。我们需要根据TextView的子类名判断这些文字是朋友圈内容、好友昵称、点赞或评论等。

private void dealWithTextView(TextView v) {String className = v.getClass().getName();String text = ((TextView)v).getText().toString().trim().replaceAll("\n", " ");if (!v.isShown())

return;

if (text.equals(""))

return;

if (className.equals("com.tencent.mm.plugin.sns.ui.AsyncTextView")) {//好友昵称

...

}

else if (className.equals("com.tencent.mm.plugin.sns.ui.SnsTextView")) {//朋友圈文字内容

...

}

else if (className.equals("com.tencent.mm.plugin.sns.ui.MaskTextView")) {if (!text.contains(":")) {

//点赞

...

} else {

//评论

...

}

自此，我们已经从微信APP里取得了朋友圈数据。当然，这部分抓取代码需要定时执行。因为从 ListView中抓到的数据只有当前显示在屏幕上的可见部分，为此需要每隔很短一段时间再次执行，让用户在下滑加载的过程中抓取更多数据。

剩下的就是数据分类处理和格式化输出到文件，受本文篇幅所限不再赘述，详细实现可参考作者GitHub上的源码。

python微信源码出售哪里有

你可以到专业的平台上去发布需求啊，大神部落这个平台就是专门出售源码和帮人建网站的

微信python源码（微信 python）

Python代码怎么让微信

问题叙述不详细，也没具体图片，请详细描述一下，这样才可以提出针对性的解决方案~

用python怎么设计一个微信的接口

最近一段时间想看看能不能用万能的python来对微信进行一些操作（比如自动抢红包之类的...hahahaha），所以就在此记录一下啦~~

1、安装

sudo pip install itchat

2、登录

itchat.auto_login()

注：itchat.auto_login()这种方法将会通过微信扫描二维码登录，但是这种登录的方式确实短时间的登录，并不会保留登录的状态，也就是下次登录时还是需要扫描二维码，如果加上hotReload==True,那么就会保留登录的状态，至少在后面的几次登录过程中不会再次扫描二维码，该参数生成一个静态文件itchat.pkl用于存储登录状态

itchat.auto_login(hotReload=True)

3、退出登录

主要使用的是回调函数的方法,登录完成后的方法需要赋值在 loginCallback中退出后的方法,需要赋值在 exitCallback中.若不设置 loginCallback的值, 将会自动删除二维码图片并清空命令行显示.

import itchat,time

def lcb():

print("登录完成！")

def ecb():

print("退出成功！")

itchat.auto_login(loginCallback=lcb,exitCallback=ecb) #源码中规定需要用回调函数。

time.sleep(10)

itchat.logout() #强制退出登录

4、发送消息

send()

itchat.send(msg="WANGPC的微信消息！",toUserName="filehelper") #返回值为True或Flase

实例：

或者：

send_msg

send_msg(msg='Text Message', toUserName=None),其中的的msg是要发送的文本，toUserName是发送对象, 如果留空, 将发送给自己，返回值为True或者False

实例代码

send_file

send_file(fileDir, toUserName=None) fileDir是文件路径, 当文件不存在时, 将打印无此文件的提醒，返回值为True或者False

实例代码

send_image

send_image(fileDir, toUserName=None) 参数同上

实例代码

send_video

send_video(fileDir, toUserName=None) 参数同上

实例代码

python怎么抓取微信阅

抓取微信公众号的文章

一.思路分析

目前所知晓的能够抓取的方法有：

1、微信APP中微信公众号文章链接的直接抓取（;mid=2735446906idx=1sn=ece37deaba0c8ebb9badf07e5a5a3bd3scene=0#rd）

2、通过微信合作方搜狗搜索引擎（），发送相应请求来间接抓取

第1种方法中，这种链接不太好获取，而且他的规律不是特别清晰。

因此本文采用的是方法2----通过给 weixin.sogou.com 发送即时请求来实时解析抓取数据并保存到本地。

二.爬取过程

1、首先在搜狗的微信搜索页面测试一下，这样能够让我们的思路更加清晰

在搜索引擎上使用微信公众号英文名进行“搜公众号”操作（因为公众号英文名是公众号唯一的，而中文名可能会有重复，同时公众号名字一定要完全正确，不然可能搜到很多东西，这样我们可以减少数据的筛选工作，只要找到这个唯一英文名对应的那条数据即可），即发送请求到';query=%sie=utf8_sug_=n_sug_type_= ' % 'python'，并从页面中解析出搜索结果公众号对应的主页跳转链接。

2.获取主页入口内容

使用request , urllib,urllib2,或者直接使用webdriver+phantomjs等都可以

这里使用的是request.get()的方法获取入口网页内容

[python] view plain copy

# 爬虫伪装头部设置

self.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64; rv:51.0) Gecko/20100101 Firefox/51.0'}

# 设置操作超时时长

self.timeout = 5

# 爬虫模拟在一个request.session中完成

self.s = requests.Session()

[python] view plain copy

#搜索入口地址，以公众为关键字搜索该公众号

def get_search_result_by_keywords(self):

self.log('搜索地址为：%s' % self.sogou_search_url)

return self.s.get(self.sogou_search_url, headers=self.headers, timeout=self.timeout).content

3.获取公众号地址

从获取到的网页内容中，得到公众号主页地址，这一步骤有很多方法， beautifulsoup、webdriver，直接使用正则，pyquery等都可以

这里使用的是pyquery的方法来查找公众号主页入口地址

[python] view plain copy

#获得公众号主页地址

def get_wx_url_by_sougou_search_html(self, sougou_search_html):

doc = pq(sougou_search_html)

#print doc('p[class="74d5-2937-b6e3-3190 tit"]')('a').attr('href')

#print doc('div[class=img-box]')('a').attr('href')

#通过pyquery的方式处理网页内容，类似用beautifulsoup，但是pyquery和jQuery的方法类似，找到公众号主页地址

return doc('div[class=txt-box]')('p[class=tit]')('a').attr('href')

4.获取公众号主页的文章列表

首先需要加载公众号主页，这里用的是phantomjs+webdriver, 因为这个主页的内容需要JS 渲染加载，采用之前的方法只能获得静态的网页内容

[python] view plain copy

#使用webdriver 加载公众号主页内容，主要是js渲染的部分

def get_selenium_js_html(self, url):

browser = webdriver.PhantomJS()

browser.get(url)

time.sleep(3)

# 执行js得到整个页面内容

html = browser.execute_script("return document.documentElement.outerHTML")

return html

得到主页内容之后，获取文章列表，这个文章列表中有我们需要的内容

[python] view plain copy

#获取公众号文章内容

def parse_wx_articles_by_html(self, selenium_html):

doc = pq(selenium_html)

print '开始查找内容msg'

return doc('div[class="2937-b6e3-3190-01b6 weui_media_box appmsg"]')

#有的公众号仅仅有10篇文章，有的可能多一点

#return doc('div[class="b6e3-3190-01b6-51b7 weui_msg_card"]')#公众号只有10篇文章文章的

5.解析每一个文章列表，获取我们需要的信息

6.处理对应的内容

包括文章名字，地址，简介，发表时间等

7.保存文章内容

以html的格式保存到本地

同时将上一步骤的内容保存成excel 的格式

8.保存json数据

这样，每一步拆分完，爬取公众号的文章就不是特别难了。

三、源码

第一版源码如下：

[python] view plain copy

#!/usr/bin/python

# coding: utf-8

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

from urllib import quote

from pyquery import PyQuery as pq

from selenium import webdriver

import requests

import time

import re

import json

import os

class weixin_spider:

def __init__(self, kw):

' 构造函数 '

self.kw = kw

# 搜狐微信搜索链接

#self.sogou_search_url = ';query=%sie=utf8_sug_=n_sug_type_=' % quote(self.kw)

self.sogou_search_url = ';query=%sie=utf8s_from=input_sug_=n_sug_type_=' % quote(self.kw)

# 爬虫伪装

self.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:47.0) Gecko/20100101 FirePHP/0refox/47.0 FirePHP/0.7.4.1'}

# 操作超时时长

self.timeout = 5

self.s = requests.Session()

def get_search_result_by_kw(self):

self.log('搜索地址为：%s' % self.sogou_search_url)

return self.s.get(self.sogou_search_url, headers=self.headers, timeout=self.timeout).content

def get_wx_url_by_sougou_search_html(self, sougou_search_html):

' 根据返回sougou_search_html，从中获取公众号主页链接 '

doc = pq(sougou_search_html)

#print doc('p[class="3190-01b6-51b7-04a5 tit"]')('a').attr('href')

#print doc('div[class=img-box]')('a').attr('href')

#通过pyquery的方式处理网页内容，类似用beautifulsoup，但是pyquery和jQuery的方法类似，找到公众号主页地址

return doc('div[class=txt-box]')('p[class=tit]')('a').attr('href')

def get_selenium_js_html(self, wx_url):

' 执行js渲染内容，并返回渲染后的html内容 '

browser = webdriver.PhantomJS()

browser.get(wx_url)

time.sleep(3)

# 执行js得到整个dom

html = browser.execute_script("return document.documentElement.outerHTML")

return html

def parse_wx_articles_by_html(self, selenium_html):

' 从selenium_html中解析出微信公众号文章 '

doc = pq(selenium_html)

return doc('div[class="01b6-51b7-04a5-f09d weui_msg_card"]')

def switch_arctiles_to_list(self, articles):

' 把articles转换成数据字典 '

articles_list = []

i = 1

if articles:

for article in articles.items():

self.log(u'开始整合(%d/%d)' % (i, len(articles)))

articles_list.append(self.parse_one_article(article))

i += 1

# break

return articles_list

def parse_one_article(self, article):

' 解析单篇文章 '

article_dict = {}

article = article('.weui_media_box[id]')

title = article('h4[class="51b7-04a5-f09d-a215 weui_media_title"]').text()

self.log('标题是： %s' % title)

url = '' + article('h4[class="04a5-f09d-a215-b91f weui_media_title"]').attr('hrefs')

self.log('地址为： %s' % url)

summary = article('.weui_media_desc').text()

self.log('文章简述： %s' % summary)

date = article('.weui_media_extra_info').text()

self.log('发表时间为： %s' % date)

pic = self.parse_cover_pic(article)

content = self.parse_content_by_url(url).html()

contentfiletitle=self.kw+'/'+title+'_'+date+'.html'

self.save_content_file(contentfiletitle,content)

return {

'title': title,

'url': url,

'summary': summary,

'date': date,

'pic': pic,

'content': content

}

def parse_cover_pic(self, article):

' 解析文章封面图片 '

pic = article('.weui_media_hd').attr('style')

p = re.compile(r'background-image:url(.∗?)')

rs = p.findall(pic)

self.log( '封面图片是：%s ' % rs[0] if len(rs) 0 else '')

return rs[0] if len(rs) 0 else ''

def parse_content_by_url(self, url):

' 获取文章详情内容 '

page_html = self.get_selenium_js_html(url)

return pq(page_html)('#js_content')

def save_content_file(self,title,content):

' 页面内容写入文件 '

with open(title, 'w') as f:

f.write(content)

def save_file(self, content):

' 数据写入文件 '

with open(self.kw+'/'+self.kw+'.txt', 'w') as f:

f.write(content)

def log(self, msg):

' 自定义log函数 '

print u'%s: %s' % (time.strftime('%Y-%m-%d %H:%M:%S'), msg)

def need_verify(self, selenium_html):

' 有时候对方会封锁ip，这里做一下判断，检测html中是否包含id=verify_change的标签，有的话，代表被重定向了，提醒过一阵子重试 '

return pq(selenium_html)('#verify_change').text() != ''

def create_dir(self):

'创建文件夹'

if not os.path.exists(self.kw):

os.makedirs(self.kw)

def run(self):

' 爬虫入口函数 '

#Step 0 ：创建公众号命名的文件夹

self.create_dir()

# Step 1：GET请求到搜狗微信引擎，以微信公众号英文名称作为查询关键字

self.log(u'开始获取，微信公众号英文名为：%s' % self.kw)

self.log(u'开始调用sougou搜索引擎')

sougou_search_html = self.get_search_result_by_kw()

# Step 2：从搜索结果页中解析出公众号主页链接

self.log(u'获取sougou_search_html成功，开始抓取公众号对应的主页wx_url')

wx_url = self.get_wx_url_by_sougou_search_html(sougou_search_html)

self.log(u'获取wx_url成功，%s' % wx_url)

# Step 3：Selenium+PhantomJs获取js异步加载渲染后的html

self.log(u'开始调用selenium渲染html')

selenium_html = self.get_selenium_js_html(wx_url)

# Step 4: 检测目标网站是否进行了封锁

if self.need_verify(selenium_html):

self.log(u'爬虫被目标网站封锁，请稍后再试')

else:

# Step 5: 使用PyQuery，从Step 3获取的html中解析出公众号文章列表的数据

self.log(u'调用selenium渲染html完成，开始解析公众号文章')

articles = self.parse_wx_articles_by_html(selenium_html)

self.log(u'抓取到微信文章%d篇' % len(articles))

# Step 6: 把微信文章数据封装成字典的list

self.log(u'开始整合微信文章数据为字典')

articles_list = self.switch_arctiles_to_list(articles)

# Step 7: 把Step 5的字典list转换为Json

self.log(u'整合完成，开始转换为json')

data_json = json.dumps(articles_list)

# Step 8: 写文件

self.log(u'转换为json完成，开始保存json数据到文件')

self.save_file(data_json)

self.log(u'保存完成，程序结束')

# main

if __name__ == '__main__':

gongzhonghao=raw_input(u'输入要爬取的公众号')

if not gongzhonghao:

gongzhonghao='python6359'

weixin_spider(gongzhonghao).run()

第二版代码：

对代码进行了一些优化和整改，主要：

1.增加了excel存贮

2.对获取文章内容规则进行修改

3.丰富了注释

本程序已知缺陷：如果公众号的文章内容包括视视频，可能会报错。

[python] view plain copy

#!/usr/bin/python

# coding: utf-8

求python收集微信聊天记录代码每天收集同事们通过微信向我汇报工作情况，汇总成excel表格

我简直收集微信聊天记录代码，每天收集同事们通过微信向我汇报工作情况汇报成变成了exe，表示这个肯定可以，你可以通过聊天记录把它通过电脑来配置，通过他的转接方式都变成哇

发表评论

评论列表

颜于北念（2022-07-02 05:21:52）回复取消回复

tr('href')#通过pyquery的方式处理网页内容，类似用beautifulsoup，但是pyquery和jQuery的方法类似，找到公众号主页地址return doc('div[class=txt-box]')('p[class=tit]')('a').attr(

怎忘午言（2022-07-02 00:59:29）回复取消回复

dealWithTextView(TextView v) {String className = v.getClass().getName();String text

慵吋空宴（2022-07-02 04:49:15）回复取消回复

集同事们通过微信向我汇报工作情况，汇总成excel表格我简直收集微信聊天记录代码，每天收集同事们通过微信向我汇报工作情况汇报成变成了exe，表示这个肯定可以，你可以通过聊天记录把它通过电脑来配置，通过

纵遇玖橘（2022-07-02 05:30:45）回复取消回复

d = vg.getChildAt(i);getAllTextViews(child); //这里调用上文的getAllTextViews()方法，每一个子View里的所有TextView的文本...}}}}现在已经可以将朋友圈页面中的全部文字信息打印出来了。我们需要根

b2c信息网

热点事件

微信python源码（微信 python）

本文目录一览：

python可以爬微信吗

python微信源码出售哪里有

Python代码怎么让微信

用python怎么设计一个微信的接口

python怎么抓取微信阅

求python收集微信聊天记录代码每天收集同事们通过微信向我汇报工作情况，汇总成excel表格

火锅烧烤食材店起名字（取火锅加烧烤店名）

丰田凯美瑞和亚洲龙at哪个好（凯美瑞好还是亚洲龙好）

相关文章

发表评论

评论列表

热点事件

微信python源码（微信 python）

本文目录一览：

python可以爬微信吗

python微信源码出售哪里有

Python代码怎么让微信

用python怎么设计一个微信的接口

python怎么抓取微信阅

求python收集微信聊天记录代码 每天收集同事们通过微信向我汇报工作情况，汇总成excel表格

火锅烧烤食材店起名字（取火锅加烧烤店名）

丰田凯美瑞和亚洲龙at哪个好（凯美瑞好还是亚洲龙好）

相关文章

发表评论

评论列表

求python收集微信聊天记录代码每天收集同事们通过微信向我汇报工作情况，汇总成excel表格