python 语法小进阶1

2023-05-16

1、filter 是通过生成 True 和 False 组成的迭代器将可迭代对象中不符合条件的元素过滤掉；而 map 返回的则是 True 和 False 组成的迭代器。

>>> res1 = map(lambda n: n > 5, range(10))
>>> lt1 = list(res1)
>>> print(lt1)
[False, False, False, False, False, False, True, True, True, True]

>>> res2 = filter(lambda n: n > 5, range(10))
>>> lt = list(res2)
>>> print(lt) 
[6, 7, 8, 9]

map和filter都是迭代器，用一次就没了！小心之前用print函数直接把他用没了。

2、用lamda表达式和map函数对数据进行整理。

原来的数据为：

a	c	e
b	d
b	c
a	b	c	d
a	b
b	c
a	b
a	b	c	e
a	b	c
a	c	e

#使用Apriori算法挖掘菜品订单关联规则
from __future__ import print_function
import pandas as pd
# from apriori import * #导入自行编写的apriori函数

inputfile = '../data/menu_orders.xls'
outputfile = '../tmp/apriori_rules.xls' #结果文件
data = pd.read_excel(inputfile, header = None)
print(type(data))
print(u'\n转换原始数据至0-1矩阵...')
ct = lambda x : pd.Series(1, index = x[pd.notnull(x)]) #转换0-1矩阵的过渡函数
b = map(ct, data.as_matrix()) #用map方式执行
# print(list(b))
# print(pd.DataFrame(list(b)))
data = pd.DataFrame(list(b)).fillna(0) #实现矩阵转换，空值用0填充
print(list(b))
print(data)
print(u'\n转换完毕。')

map函数产生的b是迭代器，只能够用一次！如果之前用b做了相关操作，再去用data=xxxxbxxxx的处理代码，那么data将变为一个空矩阵。

下面解释一下lamda表达式，lamda x,一开始这个x是输入x为变量。

之后那个pd.Series(1, index = x[pd.notnull(x)])是返回值（lamda相当于匿名函数）

data.as_matrix（）是把dataframe类型转换为ndarray类型，也就是矩阵类型，我们来看看有什么区别：

print(data)输出如下
   0  1    2    3
0  a  c    e  NaN
1  b  d  NaN  NaN
2  b  c  NaN  NaN
3  a  b    c    d
4  a  b  NaN  NaN
5  b  c  NaN  NaN
6  a  b  NaN  NaN
7  a  b    c    e
8  a  b    c  NaN
9  a  c    e  NaN


print(data.as_matrix())输出如下
[['a' 'c' 'e' nan]
 ['b' 'd' nan nan]
 ['b' 'c' nan nan]
 ['a' 'b' 'c' 'd']
 ['a' 'b' nan nan]
 ['b' 'c' nan nan]
 ['a' 'b' nan nan]
 ['a' 'b' 'c' 'e']
 ['a' 'b' 'c' nan]
 ['a' 'c' 'e' nan]]


print(pd.DataFrame(list(b)))输出如下
     a    c    e    b    d
0  1.0  1.0  1.0  NaN  NaN
1  NaN  NaN  NaN  1.0  1.0
2  NaN  1.0  NaN  1.0  NaN
3  1.0  1.0  NaN  1.0  1.0
4  1.0  NaN  NaN  1.0  NaN
5  NaN  1.0  NaN  1.0  NaN
6  1.0  NaN  NaN  1.0  NaN
7  1.0  1.0  1.0  1.0  NaN
8  1.0  1.0  NaN  1.0  NaN
9  1.0  1.0  1.0  NaN  NaN

可以看到，dataframe不是列表，ndarray是一个以行为单位的列表对象，是一个可以迭代的对象，这样才能成为我们map函数的作用目标，所以，如果我们把map中的as_matrix去掉就会报错。

ct = lambda x : pd.Series(1, index = x[pd.notnull(x)]) #转换0-1矩阵的过渡函数
b = map(ct, data.as_matrix()) #用map方式执行

这两行到底什么意思呢？Series是一个类似于字典的类，Series的第一个参数可以是字典也可以是数组，也可以是值，第二个参数就是index，也就是字典中键，就是什么键，对应前面输入的什么值，个数要一样对应，如果键的个数比值的个数多，是不是后面的键赋值为None?如果值的个数比键的个数多，是不是会报错？这里笔者没有尝试，有兴趣朋友可以查一查。

pd.notnull(x)就会输出一个dataframe，如下

a=[['a','b','a','c',None],['b','b','c']]
a=pd.DataFrame(a)
print(pd.notnull(a))


      0     1     2      3      4
0  True  True  True   True  False
1  True  True  True  False  False

值得一提的是：如果当一个矩阵的整体去用，是没有意义的，必须提取出来一行行或者一列列去用。
还有一点，a[3]其实指的是dataframe a 的第四列。不是第四行
print(a[pd.notnull(a)])
print(a[3][pd.notnull(a[3])])

   0  1  2    3    4
0  a  b  a    c  NaN
1  b  b  c  NaN  NaN



0    c
Name: 3, dtype: object

ct = lambda x : pd.Series(1, index = x[pd.notnull(x)]) #转换0-1矩阵的过渡函数
b = map(ct, data.as_matrix()) #用map方式执行

这里，data.as_matrix()每次把一行数据传入,lamda表达式，作为x，然后提取出这一行不为空值的字符作为键，每一个键对应的值都赋值1，相当于第一行为a:1,c:1,e:1,第二行b:1,d:1，然后最重要的是，用map把每一行得到的Series合并起来，最终生成了一个有空缺值的dataframe，（输出在之前），最后再进行填0操作。

data = pd.DataFrame(list(b)).fillna(0) #实现矩阵转换，空值用0填充，输出如下
print(data)
     a    c    e    b    d
0  1.0  1.0  1.0  0.0  0.0
1  0.0  0.0  0.0  1.0  1.0
2  0.0  1.0  0.0  1.0  0.0
3  1.0  1.0  0.0  1.0  1.0
4  1.0  0.0  0.0  1.0  0.0
5  0.0  1.0  0.0  1.0  0.0
6  1.0  0.0  0.0  1.0  0.0
7  1.0  1.0  1.0  1.0  0.0
8  1.0  1.0  0.0  1.0  0.0
9  1.0  1.0  1.0  0.0  0.0

3、DEBUG 打断点 view as dataframe （在下面变量栏，变量名的最右边）可以很方便地看数据的状态。

所以多用dataframe，比较方便

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

语法小进阶

python 语法小进阶1 的相关文章

Python正则表达式替换除特定单词之外的所有内容

我正在尝试执行以下操作用正则表达式 import re x re compile going you words to replace s I am going home now thank you string to modify pri
Python argparse 作为函数

以这种方式获取命令行参数有什么本质上的错误吗我的意思是把参数解析放入它自己的函数中它会被认为是非 Pythonic 或更严重吗 usr bin python import argparse def getArgs argv None p
使用 pdfkit 和 FastAPI 下载 PDF 文件

我将使用 FastAPI 创建一个 API 将HTML页面到 PDF 文件使用pdfkit 但是它将文件保存到我的本地磁盘当我在线提供此API后用户如何将该PDF文件下载到他们的计算机上 from typing import Opt
在 Python 中比较浮点数是否几乎相等的最佳方法是什么？

众所周知由于舍入和精度问题比较浮点数是否相等有点繁琐例如比较浮点数 2012 年版 https randomascii wordpress com 2012 02 25 comparing floating point number
扭曲多种协议

我希望为我正在从事的项目学习扭曲该项目需要服务器响应 HTTP 请求以及通过 TCP 连接的其他协议 Twisted能够同时处理多种协议吗我想使用 Twisted Web 来帮助处理 HTTP 但同时需要响应其他端口上的 TCP 连接
配置 PIP 以在代理后面工作

我已经安装了 python 3 4 3 附带pip 我想从代理后面使用 pip 所以我执行了以下操作 Created C Users foo pip pip ini并添加了代理配置部分 proxy export http proxy my
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
以编程方式结束/退出粘合作业

我正在使用 Glue 书签来处理数据我的工作是每天安排的但也可以手动启动由于我使用书签有时胶水作业可以在没有新数据要处理的情况下启动然后读取的数据帧为空在这种情况下我想好好地结束我的工作因为它没有什么关系我试过 if
我可以在pycharm中的断点处进入交互模式吗

我是一个相当新的 Pycharm 3 用户正在从事 django 项目我可以在 pycharm3 中的断点处进入交互模式吗这可能吗当程序在断点处停止时我尝试过工具 gt 打开调试命令行但我没有看到控制台打开我怎样才能让它发挥作
统计Sweep算子的Python实现

我正在学习一些用书中缺失的数据进行统计的技术缺失数据的统计分析作者利特尔和鲁宾对于处理单调无响应数据来说一个特别有用的函数是扫频操作员详情见第 148 151 页我知道 R 模块gmm有swp函数可以做到这一点但我想知道是否有
Python3 - 如何将字符串转换为十六进制

我正在尝试将字符串逐个字符转换为十六进制但我无法在Python3中弄清楚它在较旧的 python 版本中我的以下内容有效 test This is a test for c in range 0 len test print 0x s
如何在solidpython中设置特殊变量$fa、$fs、$fn

in 上一个线程 https stackoverflow com questions 54040390 how to save data in stl file after python solid processing显示了如何通过 So
如何在 FastAPI Swagger API 中按方法类型对方法进行排序？

如何在 FastAPI Swagger 自动文档中设置 API 方法的排序顺序我希望所有方法按类型分组 GET POST PUT DELETE 这个答案 https stackoverflow com questions 24951268
Python：两个列表之间的成对比较：列表 a >= 列表 b？

如果我想检查列表中的所有元素 a 1 2 3 6 大于或等于另一个列表中对应的元素 b 0 2 3 5 如果 a i gt b i 对于所有i的则返回 true 否则返回 false 这有逻辑功能吗比如a gt b 谢谢你可以这样做
在解析器/子解析器的开头使用 argparse.REMAINDER

我想实现一个 arg 解析器它允许我将单元测试作为子命令之一运行盲目地将参数传递给 unittest main 例如 foo py unittest args to pass to unittest main 以及其他子命令 foo p
如何动态选择要在flask中使用的模板目录？

默认情况下 Flask 使用存储在 template 目录中的模板文件 flaskapp application py templates hello html 有没有办法根据登录的用户动态选择模板目录这就是我想要的目录结构 flaska
如何将 Django 数据库中的模板标签解释/渲染为 HTML

我正在尝试添加带有来自 Django 管理站点的图像的帖子但安全自动转义关闭过滤器无法解释 Django 的模板标签 My input and page look like 复制图像地址给出http 127 0 0 1 8000 7B
Python struct.pack() 'struct.error: bad char in struct format' 尝试保存字节顺序时

我正在尝试打包一个字符串和字符串的长度 fmt
Paramiko ValueError“p 的长度必须恰好为 1024、2048 或 3072 位”

我正在尝试使用 Python 脚本连接 SFTP 由于 p 错误我无法连接 import paramiko client paramiko SSHClient client load system host keys client con
收到 Python 错误“来自：无法读取 /var/mail/Bio”

我正在运行一个 bio python 脚本这会导致以下错误 from can t read var mail Bio 由于我的脚本与邮件没有任何关系我不明白为什么我的脚本在 var mail 中查找这里似乎有什么问题我怀疑这会有帮助

随机推荐

企业微信开发实战（三、OA审批之回调通知、获取审批单号、审批详情）

文章目录 4 审批申请状态变化回调通知4 1设置接收事件服务器4 1 1 设置入口4 2 配置说明 5 批量获取审批单号5 1概述5 2代码实战5 3试错 6 获取审批申请详情6 1概述6 2代码实战6 3试错源码赞赏 4 审批申请状态变
企业微信开发实战（五、自建应用-审批流程引擎之配置可信任域名、创建审批模版、发起审批）

文章目录四自建应用审批流程引擎1 概述2 创建自建应用审批模板2 1创建自建审批应用2 2配置可信任域名2 3创建审批模版 3 自建应用发起审批3 1概述3 2代码实战3 2 1前端代码3 2 2后端代码 3 3试错源码赞赏四自
解决MYSQL批量插入时，UUID_SHORT出现了1062 -Duplicate entry ‘xxx‘ for key ‘PRIMARY‘

1 问题描述 MYSQL批量插入时 xff0c 使用UUID SHORT出现了1062 Duplicate entry xxx for key PRIMARY 2 场景描述 xff1a 在测试环境可以正常插入 xff0c 但是去到生产就失败
Ant Design Blazor入门（使用ant模板初始化项目及运行github代码）

文章目录一简介二 CMD下载Ant模板1 简介2 下载模板3 CLI命令说明4 创建welcome模板5 创建所有demo页面模板二下载github代码到本地1 简介2 环境要求3 clone代码4 使用npm初始化4 1报npm错
企业微信{“errcode“:60020,“errmsg“:“not allow to access from your ip, hint: [1681129678500613099333714]

配置企业微信小程序时 xff0c 报了如下错误 xff1a 企业微信 errcode 60020 errmsg not allow to access from your ip hint 1681129678500613099333714
ZED摄像头的使用

原链接 https community bwbot org topic 518 运行测试平台小强ROS机器人 1 安装CUDA 1 1 禁用原有的驱动如果你之前安装了nvidia的开源驱动 xff0c 即通过apt get 安装的驱动
头文件包含顺序

头文件包含顺序原理 xff1a 当通过 include指令包含另一个头文件时 xff0c 编译预处理器用头文件的内容取代 include指令 xff0c 也就是说 xff0c 头文件的所有内容最终都会被合并到某一个或某几个源文件中 xff
计算机网络(五): ros下socket编程示例

ros下socket编程示例服务器端 span class token macro property span class token directive keyword include span span class token str
三种方式实现：进度条

1 Bootstrap实现进度条 bootstrap min css下载地址 xff1a https cdn staticfile org twitter bootstrap 3 3 7 css bootstrap min css boot
物理端口与逻辑端口

若 1 端口端口可分为物理端口与逻辑端口所谓逻辑端口指的是计算机内部或交换机路由器内的端口 xff0c 看不见 xff0c 摸不着所谓物理端口 xff0c 就是可见的端口 xff0c 像 xff1a 交换机路由器集线器 RJ11端口
RS485接收数据后发送乱码

序最近调块板子上面有几路485 xff0c 控制芯片STM32F407VE 转换芯片ADM2587 xff0c 使用485转换器连接电脑 xff0c 发现串口助手向板子发送数据后会收到乱码 xff0c 经软硬件联合调试排除bug 一问题
python urllib.parse

urlparse span class token keyword from span urllib span class token punctuation span parse span class token keyword impo
HTTP学习(5)--demo编写(1)

一个基于Java的HTTP服务器demo 前面几篇博客 xff0c 大致介绍了几个方面的例子 xff0c 例如报文解析报文组装等现在打算将这些东西集合起来 xff0c 编写一个小HTTP服务器demo 期间遇到了很多问题 xff0c 也
用Python写一个监督你刷李永乐考研题目的简单小程序

import datetime import xlwings import math month 61 datetime datetime now strftime 39 m 39 date 61 datetime datetime now
对于遗传算法，谈谈个人看法

最近在学习遗传算法 xff0c 小有体会这个用数学方法来模拟生物学过程的算法实在是有很多值得玩味的地方遗传算法要干什么 xff1f 比如Z 61 f x y 我们要找到他在x 0 1 y 0 1 区间上的最大值我们就先随机在x 0 1
AD(altium designer)软件的基础使用(硬件的一些总结，写的有些乱，高手请略过)

1 快捷键 xff1a Ctrl 43 R 复制并重复粘贴 Shift 43 c 取消选择 Space 逆时针旋转对象 Shift 43 space 顺时针旋转对象 X 水平翻转对象 Y 垂直翻转对象 G切换捕捉栅格 V F View中的F
C++字节转换（byte转int 互转）（BCD和HEX转换）

2个字节short int 高低位转化 short int y 61 0x7f21 y 61 y amp 0xff00 gt gt 8 y amp 0x00ff lt lt 8 printf 34 x 34 y 用short型变量储存 xf
王者荣耀-数模论文分享（虽然结果我自己都不信）

基于基础数据的王者荣耀英雄强度评估及英雄设计摘要王者荣耀是当下很火爆的一款手机游戏 xff0c 如何基于当下的双方阵容选择合适的英雄来获得胜利 xff0c 是一个值得探讨的问题 xff0c 现基于游戏数据对于各个英雄的强度进行建模评估
用蚁群算法求解TSP问题

TSP是什么 xff1f TSP全称Travelling salesman problem 中文名 xff1a 旅行商问题就是模拟退火中讲到的14个城市之间巡回旅行 xff0c 求路径最短的问题为什么偏偏找他呢 xff1f 因为这是一个
python 语法小进阶1

1 filter 是通过生成 True 和 False 组成的迭代器将可迭代对象中不符合条件的元素过滤掉 xff1b 而 map 返回的则是 True 和 False 组成的迭代器 gt gt gt res1 61 map lambda n

python 语法小进阶1

python 语法小进阶1 的相关文章

随机推荐

热门标签