Python 过滤字母和数字

2023-05-16

实例1

crazystring = 'dade142.!0142f[., ]ad'

# 只保留数字
new_crazy = filter(str.isdigit, crazystring)
print(''.join(list(new_crazy)))
# 只保留字母
new_crazy = filter(str.isalpha, crazystring)
print(''.join(list(new_crazy)))


# 只保留字母和数字
new_crazy = filter(str.isalnum, crazystring)
print(''.join(list(new_crazy)))

# 如果想保留数字0-9和小数点’.’ 则需要自定义函数

new_crazy = filter(lambda ch: ch in '0123456789.', crazystring)
print(''.join(list(new_crazy)))

实例 2

1.正则表达式

import re
L = ['小明', 'xiaohong', '12', 'adf12', '14']
for i in range(len(L)):
    if re.findall(r'^[^\d]\w+', L[i]):
        print(re.findall(r'^\w+$', L[i])[0])
  1. 避开正则表达式
L = ['xiaohong', '12', 'adf12', '14', '晓明']
for x in L:
    try:
        int(x)
    except:
        print(x)

  1. 使用string内置方法
L = ['xiaohong', '12', 'adf12', '14', '晓明']

# 对于python3来说同样还可以使用string.isnumeric()方法
for x in L:
    if not x.isdigit():
        print(x)
# for x in L:
#     if not x.isnumeric():
#         print(x)

实例 3

要进行中文分词,必须要求数据格式全部都是中文,需求过滤掉特殊符号、标点、英文、数字等。当然了用户可以根据自己的要求过滤自定义字符。

import re
x = 'a12121assa'
x = '1我爱你1'
r1 = '[a-zA-Z0-9’!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘’![\\]^_`{|}~]+'

print(re.sub(r1, '', x))

来自
python代码实现简易滤除数字方法_Great haste makes great waste-CSDN博客_python去除字符串数字
[转]Python: 去掉字符串中的非数字(或非字母)字符 - WenLe - 博客园

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python 过滤字母和数字 的相关文章

  • 使用列中的日期范围扩展 pandas 数据框

    我有一个 pandas 数据框 其日期和字符串与此类似 Start End Note Item 2016 10 22 2016 11 05 Z A 2017 02 11 2017 02 25 W B 我需要将其扩展 转换为以下内容 在之间填
  • 使用 Python pdb 检查未处理异常原因的最简单方法是什么?

    我刚刚将所有单元测试数据从 JSON 转换为 YAML 现在代码中的某处引发了异常 更具体地说 这是打印的回溯 Traceback most recent call last File tests test addrtools py lin
  • 在 Python 中静默打印 PDF

    我正在尝试使用 Python 打印 PDF 而不打开 PDF 查看器应用程序 Adobe Foxit 等 我还需要知道打印何时完成 以删除文件 Here http permalink gmane org gmane comp python
  • 有没有纯Python的表类?

    我正在构建一个需要分析表格数据的应用程序 我想执行一些列操作 例如重命名列 删除列以及根据现有列的值计算新列的能力 我的第一选择是 Pandas 之类的东西 但是一个限制是这个项目必须是跨平台的并且非常容易在 virtualenv 中部署
  • 使用组合时如何解决循环依赖?

    我遇到了如下所示的情况 其中每个类都需要另一个类 并且它创建了循环依赖关系 我在使用 ctypes 包装一些 C 代码时遇到了这种情况 已经有很多关于这个主题的帖子 但我发现它们没有帮助 我需要一些例子 Module A from B im
  • 为不带引号的函数获取字符串参数

    我有一个函数 用于从 URL 下载文件并将其写入磁盘 并施加特定的文件扩展名 目前 它看起来像这样 import requests import os def getpml url filename psc requests get url
  • LSTM - 一段时间后预测相同的常数值

    我有一个变量 我想预测未来 30 年的情况 不幸的是我没有很多样品 df pd DataFrame FISCAL YEAR 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 199
  • AttributeError:模块“tensorflow.python.summary.summary”没有属性“FileWriter”

    我收到此错误 尽管我到处都看过file writer tf summary FileWriter path to logs sess graph 被提到为正确的实施this https github com tensorflow tenso
  • 回归模型 statsmodel python

    这更多是一个统计问题 因为代码运行良好 但我正在学习 python 中的回归建模 我在下面使用 statsmodel 编写了一些代码来创建一个简单的线性回归模型 import statsmodels api as sm import num
  • Python:像石英一样的事件调度程序[关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • python-messaging 无法处理 HTTP 请求

    我正在使用下面的代码尝试使用 python messaging 发送彩信https github com pmarti python messaging blob master doc tutorial mms rst https gith
  • Dataframe unstack 性能 - pandas

    我正在尝试拆开数据框 它工作正常 但问题是我正在处理 CSV 文件中的巨大数据集 约 10 亿 这是示例数据集 236539 48512569874 Name Danny 236539 48512569874 Class 12 236539
  • Groupby Sum 忽略几列

    在此数据框中 我想按 位置 进行分组并获得 分数 的总和 但我不希望 纬度 经度 和 年份 在此过程中受到影响 sample pd DataFrame Location A B C A B C Year 2001 2002 2003 200
  • 与 GridSearchCV 的并行错误,与其他方法一起工作正常

    我使用 GridSearchCV 时遇到以下问题 它在使用时给我一个并行错误n jobs gt 1 同时n jobs gt 1与 RadonmForestClassifier 等单一模型配合良好 下面是一个显示错误的简单工作示例 train
  • 如何使用httplib2进行相互证书认证

    我正在使用 httplib2 从我的服务器向另一个 Web 服务发出请求 我们想要使用相互证书身份验证 我了解如何使用证书进行传出连接 h set certificate 但是如何检查应答服务器使用的证书 这张票 http code goo
  • 使用 python 更改目录

    我碰巧发现我无法从 python 代码中更改实际目录 我的测试程序如下 from os import system def sh script system bash c s script sh cd home sh pwd 的输出pwd
  • 使用 matplotlib 在 python3 中对多个形状进行动画处理

    尝试在 python3 中使用 matplotlib 动画函数同时对多个对象进行动画处理 下面写的代码是我到目前为止的位置 我能够创建多个对象并将它们显示在图中 我通过使用包含矩形补丁函数的 for 循环来完成此操作 从这里开始 我希望通过
  • 在 Python 中,如果我有 unix 时间戳,如何将其插入 MySQL 日期时间字段?

    我正在使用 Python MySQLDB 我想将其插入 Mysql 中的 DATETIME 字段 我该如何使用cursor execute 来做到这一点 要将 UNIX 时间戳转换为 Python 日期时间对象 请使用datetime fr
  • Python 单元测试:Nose 失败时重试?

    我有一个随机失败的测试 我想让它在发送错误消息之前重试多次 我将 python 与 Nose 一起使用 我写了以下内容 但不幸的是 即使使用 try except 处理 当第一次尝试测试失败时 Nose 也会返回错误 def test so
  • Python google云函数部署失败-Madmom pip包

    我正在尝试使用 madmom python pip 包部署 Python3 7 Google Cloud Function 但是指定madmom 0 16 1requirements txt 中的内容导致部署失败 当我从requiremen

随机推荐

  • 答“我们的团队项目是否有大泥球?”

    总结了一下 xff0c 产生大泥球的主要原因有下面这些原因 xff1a xff08 1 xff09 一次性代码 xff08 2 xff09 碎片式增长 xff08 3 xff09 为了让软件不出问题 xff08 4 xff09 Copy p
  • JSON是什么

    提起 JSON xff0c 作为如今最受欢迎的数据交换格式 xff0c 可以说是无人不知 无人不晓了 JSON 全称 JavaScript Object Notation xff08 JS 对象简谱 xff09 xff0c 自诞生之初的小目
  • <操作系统> 售票员司机问题(信号量) C语言实现

    问题描述 xff1a 思路 xff1a 代码 xff1a span class token macro property span class token directive keyword include span span class
  • 展锐T7520(ANDROID 11) boot.img解包

    1 make unpack bootimg 或者 prebuilts build tools linux x86 bin ninja f out combined ninja unpack bootimg 2 export PATH 61
  • 连通图(求桥的数量)

    桥 xff1a 连通图中存在的必经之路 xff0c 我们成为桥 xff0c 如果把此路断开 xff0c 连通图便会变成两个图 判断是否是桥的方式 low v gt dfn u 题目链接 AC代码 xff1a include lt bits
  • Lotti引发的java.lang.StackOverflowError

    在项目中将lottie从2 8 0版本进行升级至4 2 0版本后 xff0c 突然出现堆栈内存错误 xff0c 最后查找原因是因为在onAnimationEnd 回调方法中调用resumeAnimation 方法 xff0c 而在resum
  • Ubuntu 服务器操作笔记 之 安装SSH

    1 gt sudo apt get install openssh server 安装SSH 2 gt sudo ps e grep ssh 查询 SSH是否启动 3 gt sudo etc init d ssh start 如果没有 则启
  • 分析APP的安装流程 API29

    先总结一下安装流程 xff0c 以及比较重要的类 PackageInstallerActivity java xff1a 在文件管理器里点击apk后就会调用该类 xff0c 主要用于显示要安装的apk的一些权限信息 InstallAppPr
  • Linux下安装KDE桌面环境

    Linux中有许多桌面应用环境 xff0c 在这其中除了deepin的dde桌面之外 xff0c 界面和功能都很强大好用的就是kde了 下面我来分享一下我的kde安装经过 我的Linux发行版是deepin的v15 11版本 xff0c 尝
  • json去掉指定字段

    lt dependency gt lt groupId gt org json lt groupId gt lt artifactId gt json lt artifactId gt lt version gt 20160810 lt v
  • mac 安装 man中文文档

    配置环境 brew install autotoolsbrew install python3brew install openccbrew install automake 下载源码 https github com man pages
  • 【NLP最佳实践】Huggingface Transformers实战教程

    内容简介 x1f917 手把手带你学 xff1a 快速入门Huggingface Transformers 和鲸链接 xff1a https www heywhale com home activity detail 61dd2a3dc23
  • visual studio配置clang开发环境

    一 安装环境 1 下载visual studio 2 选择工作负载 xff0c 使用c 43 43 的桌面开发 3 选择单个组件 xff0c 搜索clang xff0c 勾选两个组件 4 点击安装 等待安装完成 二 测试环境 xff1a 在
  • DeepSpeed-Chat:最强ChatGPT训练框架,一键完成RLHF训练!

    https github com microsoft DeepSpeedExamples tree master applications DeepSpeed Chat 一个快速 负担得起 可扩展和开放的系统框架 xff0c 用于实现端到端
  • BigCode开放性能超越Copilot的代码生成模型Starcoder

    BigCode释出高效能程式码生成模型StarCoderBase xff0c 与为Python调校的StarCoder xff0c 效能超越GitHub Copilot初期版本所用的OpenAI code cushman 001模型 xff
  • 【LLM系列之FLAN-T5/PaLM】Scaling Instruction-Finetuned Language Models

    论文题目 xff1a Scaling Instruction Finetuned Language Models 论文链接 xff1a https arxiv org pdf 2210 11416 pdf github链接 xff1a ht
  • LlamaIndex :面向QA 系统的全新文档摘要索引

    在这篇博文中 xff0c 我们介绍了一种全新的 LlamaIndex 数据结构 xff1a 文档摘要索引 我们描述了与传统语义搜索相比 xff0c 它如何帮助提供更好的检索性能 xff0c 并通过一个示例进行了介绍 背景 大型语言模型 LL
  • html中各种hr样式

    第一种 lt hr style 61 34 height 2px border none border top 2px dotted 185598 34 gt height 2px 是hr的高度 border none 是没有边框 bord
  • Python爬虫系列(五)360图库美女图片下载

    这几天终于忙完毕设和学校的事情 xff0c 终于有时间来写Python了 xff08 xffe3 xffe3 xff09 前些天在群里看到有人讨论这个360美女图库 的爬取 自己今天也尝试下 xff08 蛮简单 xff09 因为这个网站是下
  • Python 过滤字母和数字

    实例1 crazystring 61 39 dade142 0142f ad 39 只保留数字 new crazy 61 filter str isdigit crazystring print 39 39 join list new cr