基于python实现微信好友数据分析(简单)

一、功能介绍

本文主要介绍利用网页端微信获取数据,实现个人微信好友数据的获取,并进行一些简单的数据分析,功能包括:

1.爬取好友列表,显示好友昵称、性别和地域和签名, 文件保存为 xlsx 格式

2.统计好友的地域分布,并且做成词云和可视化展示在地图上

二、依赖库

1、Pyecharts:一个用于生成echarts图表的类库,echarts是百度开源的一个数据可视化库,用echarts生成的图可视化效果非常棒,使用pyechart库可以在python中生成echarts数据图。

2、Itchat:一个开源的微信个人号接口,使用python调用微信从未如此简单。

3、Jieba:简单的分词操作库。

4、Numpy:NumPy 系统是 Python 的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩 阵。

5、Pandas:pandas 是基于 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。

6、Pillow:图像处理。

7、wxpy:wxpy 在 itchat 的基础上,通过大量接口优化提升了模块的易用性,并进行丰富的功能 扩展。 (微信本身提供)

注:Pyecharts可能安装0.5.*的版本比较好

以上的三方库可以通过命令符(cmd)来实现安装,具体命令:pip install ***

三,操作

from wxpy import * #导入模块

bot = Bot(cache_path=True) #初始化机器人,选择扫码登录

friend_all = bot.friends() #获取微信好友信息

首先出现的是一张二维码,然后扫描登录

成功登录好了就是这种显示

之后就可以进行操作了,好友数量,个人信息

print(len(friend_all)) #好友的数量

print(friend_all[0].raw) #输出个人信息

显示的结果

四、接下来把全部的好友信息转化为一个xlsx文件

获取全部好友信息

for a_friend in friend_all:

NickName = a_friend.raw.get('NickName', None)

#昵称

#Sex = a_friend.raw.get('Sex', None)

Sex = {1: "男", 2: "女", 0: "其它"}.get(a_friend.raw.get('Sex', None), None)

#性别(优化)

City = a_friend.raw.get('City', None)

#城市

Province = a_friend.raw.get('Province', None)

#省份

Signature = a_friend.raw.get('Signature', None)

#个性签名

HeadImgUrl = a_friend.raw.get('HeadImgUrl', None)

#头像地址

HeadImgFlag = a_friend.raw.get('HeadImgFlag', None)

#小Flag

list_0=[NickName, Sex, City, Province, Signature, HeadImgUrl, HeadImgFlag]

#存为一维数组

lis.append(list_0)

#叠加数据

存为xlsx文件

def list_excel(filename,lis):

'''

将列表写入excel中,其中列表中的元素是列表.

filename:保存的文件名(含路径)

lis:元素为列表的列表,如下:

lis = [["名称", "价格", "出版社", "语言"],

["暗时间", "32.4", "人民邮电出版社", "中文"],

["拆掉思维里的墙", "26.7", "机械工业出版社", "中文"]]

'''

import openpyxl

wb = openpyxl.Workbook() #激活worksheet

sheet = wb.active

sheet.title = 'sheet1' #创建一个表格

file_name = filename +'.xlsx'

for i in range(0, len(lis)):

for j in range(0, len(lis[i])):

sheet.cell(row=i+1, column=j+1, value=str(lis[i][j]))

#每行每列的存入数据

wb.save(file_name)

print("写入数据成功!")

list_excel('wechat',lis)

效果如下:

可以看到其好友基本分布再广东省,个性签名也是非常的杀马特

五、实现词云图(我们也可以从存储在本地的 excel 中读取数据进行分析,并查看数据形式。在执行以 下代码之前,我们需要先把 excel 文件加一个列标题行)

例如nickname sex city province signature headImgUrl headImgFlag

#导入模块

from wordcloud import WordCloud

import matplotlib.pyplot as plt

import pandas as pd

from pandas import DataFrame

word_list= df['city'].fillna('0').tolist()

#将 dataframe 的列转化为 list,其中的 nan 用“0”替换

new_text = ' '.join(word_list)

wordcloud = WordCloud(font_path='simhei.ttf', background_color="black").generate(new_text)

#设计图背景颜色,字体

plt.imshow(wordcloud)

plt.axis("off")

plt.show()

还可以将词云图存为HTML形式

#利用 pyechart 做词云

import pandas as pd

#count = df.city.value_counts() #对 dataframe 进行全频率统计,排除了 nan

city_list = df['city'].fillna('NAN').tolist()#将 dataframe 的列转化为 list,其中的 nan 用“NAN” 替换

count_city = pd.value_counts(city_list)#对 list 进行全频率统计

from pyecharts.charts.wordcloud import WordCloud #设置对象

name = count_city.index.tolist()

value = count_city.tolist()

wordcloud = WordCloud(width=1300, height=620)

wordcloud.add("", name, value, word_size_range=[20, 100])

wordcloud.show_config()

wordcloud.render(r'D:\python\wechatcloud.html')

再看看效果:

六、转化为地图形式

注:安装地图数据包:pip install echarts-china-provinces-pypkg pip install echarts-countries-pypkg

province_list = df['province'].fillna('NAN').tolist()

#将 dataframe 的列转化为 list,其中的 nan 用 “NAN”替换

count_province = pd.value_counts(province_list)

#对 list 进行全频率统计

from pyecharts import Map

value =count_province.tolist()

attr =count_province.index.tolist()

map=Map("各省微信好友分布", width=1300, height=700)

map.add("", attr, value, maptype='china', is_visualmap=True,visual_text_color='#000',is_label_show = True)

#显示地图上的省份

map.show_config()

map.render(r'D:\python\wechatProMap.html')

效果:

总结

以上所述是小编给大家介绍的基于python实现微信好友数据分析,希望对大家有所帮助!

以上是 基于python实现微信好友数据分析(简单) 的全部内容, 来源链接: utcz.com/z/312141.html

回到顶部