Python分析

2023-11-16

一、前言

大家好，首先说明的是，这是一篇技术文，也是一篇not技术文，今天分享的是，当我获取了微信小程序英文取名的3500多个微信用户昵称、年龄段后，分析得到下面解果。。。

二、Let's get it

1.基本信息获取

1.访问英文取名的用户基本信接口，获取英文取名用户微信名（NickName）、访问次数（Count）、总数据集（ResponseData），并将微信名存入文件。

# 获取所有用户数量和相关信息
def get_json():
    # 获取入口
    search_url = '英文取名用户接口，欢迎扫码使用英文取名，生成一个最适合你的英文名'
    # 发送http请求,获取请求页面
    search_response =requests.get(search_url)
    # 设置编码
    search_response.encoding ='UTF-8'
    # 将页面转变成json代码格式
    search_json =search_response.json()
    # 获取我们需要的数据,是列表格式
    our_data =search_json['ResponseData']
    list_len = len(our_data)
    print('总用户数有：' + str(list_len))
    user_visit_numbers = 0
    data_research = 0
    NickName = []
    for x in our_data:
        user_numbers = x['Count'] +user_visit_numbers
        if x['NickName'] == '':
            data_research += 1
       NickName.append(x['NickName'])
    print("微信名获取失败量："+str(data_research))
    print(NickName)
    name = ['微信名称']
    file_test =pd.DataFrame(columns=name, data=NickName)
    file_test.to_csv(r'I:/data.csv',encoding='utf-8',index=False)
    print('总访问量：' + str(user_visit_numbers))

运行结果：

总用户数有：3549
微信名获取失败量：0
总访问量：4573

2.读取所有微信名，数据分类

(1)读取微信名

# 读取文件，取出微信名
def get_name():
    NickName = []
    with open('I:/data.csv','r',encoding='utf8') as file :
        i = 0
        for line in file:
            if i == 0:   # 去除表头
                i = 1
                continue
            line = line.strip()    # 去除换行符
            NickName.append(line)
    return NickName

(2)数据分为以下六大类

中文名

变量名

数据类型


全中文昵称	ch_name	list
全英文昵称	en_name	list
中文和数字混合昵称	ch_di_name	list
包含图片表情昵称	img_name	list
其他昵称	other_name	list

# ch ：Chinese
ch_name_number = 0
ch_name = []
# en ：English
en_name_number = 0
en_name = []
# di : digtal
di_name_number = 0
di_name = []
# img : image
img_name_number = 0
img_name = []
# ch_di : Chinese and digtal
ch_di_name = []
# other : other
oth_name_number = 0
oth_name = []

(3)数据分类判断

# 昵称全中文判断
def is_all_ch(keyword):
    for c in keyword:
        # 包含常见中文字符
        if not ('\u4e00' <= c <= '\u9fa5'):
            return False

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

90

00

Python分析的相关文章

如何在多进程系统中实现锁定？

我们正在并行运行许多詹金斯项目我们使用 python 并且选择使用 pyenv 管理虚拟环境不幸的是 pyenv 有一个众所周知的竞争条件 https github com yyuu pyenv issues 174 为了解决这个问题
当我有自定义身份验证模型时，如何登录 Django Rest 可浏览 API？

我有一个自定义用户模型如下所示account models py from django contrib auth modles import AbstractUser from django db models signals impo
如何避免使用 python 处理空的标准输入？

The sys stdin readline 返回之前等待 EOF 或新行所以如果我有控制台输入 readline 等待用户输入相反我想打印帮助并在没有需要处理的情况下退出并显示错误而不是等待用户输入原因我正在寻找一个Pytho
如何使用 Python 3 绕过 HTTP Error 403: Forbidden with urllib.request

您好不是每次都这样但有时在尝试访问 LSE 代码时我会收到每一个烦人的 HTTP 错误 403 禁止消息任何人都知道我如何仅使用标准 python 模块来克服这个问题遗憾的是没有漂亮的汤 import urllib request
从文本文件中删除特定字符

我对 Python 和编码都很陌生我当时正在做一个小项目但遇到了一个问题 44 1 6 23 2 7 49 2 3 53 2 1 68 1 6 71 2 7 我只需要从每行中删除第三个和第六个字符或者更具体地说从整个文件中删除字符
在python中将数据库表写入文件的最快方法

我正在尝试从数据库中提取大量数据并将其写入 csv 文件我正在尝试找出最快的方法来做到这一点我发现在 fetchall 的结果上运行 writerows 比下面的代码慢 40 with open filename a as f writ
是否可以从 Julia 调用 Python 函数并返回其结果？

我正在使用 Python 从网络上抓取数据我想使用这些数据在 Julia 中运行计算是否可以在 Julia 中调用该函数并返回其结果或者我最好直接导出到 CSV 并以这种方式加载数据绝对地看PyCall jl https gith
在Python中从大文件中搜索单词列表

我是新蟒蛇我有一个单词列表和一个非常大的文件我想删除文件中包含单词列表中的单词的行单词列表按排序给出并且可以在初始化期间输入我正在努力寻找解决这个问题的最佳方法我现在正在进行线性搜索这花费了太多时间有什么建议么您可以使用i
创建上下文后将 jar 文件添加到 pyspark

我正在笔记本上使用 pyspark 并且不处理 SparkSession 的创建我需要加载一个包含一些我想在处理 rdd 时使用的函数的 jar 您可以使用 jars 轻松完成此操作但在我的特定情况下我无法做到这一点有没有办法访问sp
使用 Paramiko 进行 DSA 密钥转发？

我正在使用 Paramiko 在远程服务器上执行 bash 脚本在其中一些脚本中存在与其他服务器的 ssh 连接如果我只使用 bash 不使用 Python 我的 DSA 密钥将被第一个远程服务器上的 bash 脚本转发并使用以连接
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
运行 Python 单元测试，以便成功时不打印任何内容，失败时仅打印 AssertionError()

我有一个标准单元测试格式的测试模块 class my test unittest TestCase def test 1 self tests def test 2 self tests etc 我的公司有一个专有的测试工具它将作为命令行
Airflow 1.9 - 无法将日志写入 s3

我在 aws 的 kubernetes 中运行气流 1 9 我希望将日志发送到 s3 因为气流容器本身的寿命并不长我已经阅读了描述该过程的各种线程和文档但我仍然无法让它工作首先是一个测试向我证明 s3 配置和权限是有效的这是在我们
在Raspberry pi上升级skimage版本

我已经使用 Raspberry Pi 2 上的 synaptic 包管理器安装了 python 包然而 skimage 模块版本 0 6 是 synaptic 中最新的可用版本有人可以指导我如何将其升级到0 11 因为旧版本中缺少某些功
如何在亚马逊 EC2 上调试 python 网站？

我是网络开发新手这可能是一个愚蠢的问题但我找不到可以帮助我的确切答案或教程我工作的公司的网站用 python django 构建托管在亚马逊 EC2 上我想知道从哪里开始调试这个生产站点并检查存储在那里的日志和数据库我有帐户信
如何从namedtuple实例列表创建pandas DataFrame（带有索引或多索引）？

简单的例子 from collections import namedtuple import pandas Price namedtuple Price ticker date price a Price GE 2010 01 01 30
如何获取pandas中groupby对象中的组数？

我想知道有多少个独特的组需要执行计算给定一个名为 groupby 的对象dfgroup 我们如何找到组的数量简单快速 Pandaic ngroups 较新版本的 groupby API pandas gt 0 23 提供了此未记录的
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
IndexError - 具有匀称形状的笛卡尔 PolygonPatch

我曾经使用 shapely 制作一个圆圈并将其绘制在之前填充的图上这曾经工作得很好最近我收到索引错误我将代码分解为最简单的操作但它甚至无法执行最简单的循环 import descartes import shapely geome
用于插入或替换 URL 参数的 Django 模板标签

有人知道 Django 模板标签可以获取当前路径和查询字符串并插入或替换查询字符串值吗例如向 some custom path q how now brown cow page 3 filter person 发出请求电话 urlpar

随机推荐

LeetCode 45 跳跃游戏 II（Java）

题目给你一个非负整数数组 nums 你最初位于数组的第一个位置数组中的每个元素代表你在该位置可以跳跃的最大长度你的目标是使用最少的跳跃次数到达数组的最后一个位置假设你总是可以到达数组的最后一个位置示例1 输入 nums 2 3 1
前端华为OBS 上传图片和查看图片

前提是OBS 使用的是SDK BrowserJS 下载SDK BrowserJS 1 前提 npm config set registry https registry npmjs org 2 esdk obs browserjs 3 20
【转】Visual Studio 2010下配置PC-Lint 9.0i

转自 http blog csdn net jbcjay article details 7389543 首先下载PC Lint安装包可以到CSDN资源区搜索下载或者直接到我上传的资源区下载一安装过程下载完安装包后可以直接点击pc
仅需四步，整合SpringSecurity+JWT实现登录认证！

学习过我的mall项目的应该知道 mall admin模块是使用SpringSecurity JWT来实现登录认证的而mall portal模块是使用的SpringSecurity基于Session的默认机制来实现登陆认证的很多小伙伴都
Redis( stringRedisTemplate)添加缓存数据

在redis中添加缓存数据大致思路 1 从redis中获取数据如果存在直接返回客户端 2 不存在查询数据库并写入redis缓存 3 如果从数据库查询为空返回错误信息 4 写入redis缓存并返回数据通过String类型添加商品数
Java如何用JDBC操作数据库（新手入门级）

引入相关依赖包想要用JDBC操作数据库我们就必须要下载JDBC相关的依赖这些依赖其实就是我们用来操作数据库的代码那么什么是JDBC呢 JDBC就是 Java DataBase Connectivity 的简称是数据库连接的意思 J
MapXtreme 2005 for .Net系列------MapControl初尝

这一段时间在闲暇时看看mapXtreme 2005 for net 自己觉得与AE庞大复杂的结构相比 mapXtreme 可谓简单点由于规模比较小所以理解起来比较简单本来先发一篇综述的帖子不过由于条件的限制自己现将这篇帖子发出来
独家

翻译张媛校对卢苗苗本文共8269字建议阅读10分钟用代码将你的数据集进行多维可视化介绍描述性分析是与数据科学或特定研究相关的任何分析生命周期中的核心组成部分之一数据聚合汇总与可视化是支撑数据分析这一领域的主要支柱
通过css设置filter 属性，使整个页面呈现灰度效果，让整个网页变灰

通过css设置filter 属性设置页面整体置灰效果图通过设置 filter 属性为 grayscale 100 页面中的所有元素都会被应用灰色滤镜效果使整个页面呈现灰度效果 filter 属性是用来给元素添加不同的滤镜 graysc
Qt自定义界面类并提升(提升的窗口部件),把OpenGL绘制的图形显示在QT的ui界面上

编译环境 Qt Creator 5 4 0 mingw 最近利用QT做一个上位机界面想用OpenGL将STL文件还原成三维模型并将模型显示出来那么问题来了最简单的显示就直接创建一个窗口显示模型根本就没有用到QT的ui界面现在的
JAVA区块链实战教程-杨长江-专题视频课程

JAVA区块链实战教程 256人已学习课程介绍国内第一套以java语言讲解区块链原理的教程包含实际项目和代码让java从业人员快速了解区块链和区块链原理课程收益 1 区块链理论以node js例子区块链原理有深刻理解 2 区块
一个简单的外部系统调用接口日志记录demo

一实现思想抽取接口共方法作为抽象类然后不同业务实现类继承此抽象类实现具体业务分析可知公共部分就是将外系统入参和接口返回参数记录到数据库将其抽取出来作为基础抽象类的公共方法业务类继承此抽象类使得不用在每一个业务实现类里面重
Selenium基础 — Selenium自动化测试框架介绍

1 什么是selenium Selenium是一个用于Web应用程序测试的工具只要在测试用例中把预期的用户行为与结果都描述出来我们就得到了一个可以自动化运行的功能测试套件 Selenium测试套件直接运行在浏览器中就像真正的用户在操作
spring+springMVC+MyBatis 分页功能代码封装

页面效果图展示分页工具类 Pagination package com wlsq kso util import java io Serializable import java util ArrayList import java ut
【uniapp】原生子窗体subNvue的使用与踩坑

需求最近接到个需求需要在video组件上弹出弹窗也就是覆盖video这个原生组件未播放时弹窗可以覆盖但是当video播放时写的弹窗就覆盖不了了因为video是原生组件层级非常高普通标签是覆盖不了的 map标签同理覆盖原
【前端】Bad control character in string literal in JSON解决方案（详解），JSON.parse(str)/Uncaught SyntaxEr报错解决方法。

问题描述 let text fail station FSW WELDING DRY 2 r n fail resourceid 200118223 r n fail timestamp 2022 12 17 JSON parse text
宝塔部署Springboot项目与踩坑

目录 1 宝塔硬件方面 2 转储数据库 3 开放端口 4 打包maven项目 1 宝塔硬件方面首先在宝塔上安装完成mysql与Tomcat 然后在MySQL的配置文件中添加 skip grant tables 重载配置并启动注意可能会启
tomcat下CSS失效

项目改界面的时候把新界面套用到原有页面上去总是不正常有部分CSS显示不出来弄了半天才发现原来是tomcat缓存的问题把tomcat的缓存也就是work文件夹下的相关文件删除就正常了具体原因好像是因为 tomcat的jsp文件
16.BIO、NIO、AIO 有什么区别？

简单介绍 BIO 就是传统的 java io包它是基于流模型实现的交互的方式是同步阻塞方式也就是说在读入输入流或者输出流时在读写动作完成之前线程会一直阻塞在那里它们之间的调用时可靠的线性顺序它的优点就是代码比较简单直观缺
Python分析

一前言大家好首先说明的是这是一篇技术文也是一篇not技术文今天分享的是当我获取了微信小程序英文取名的3500多个微信用户昵称年龄段后分析得到下面解果二 Let s get it 1 基本信息获取 1 访问英文取名的用户基

Python分析

一、前言

二、Let's get it

Python分析 的相关文章

随机推荐

热门标签

Python分析的相关文章