IPython笔记本上CSV文件的SQL语句

2024-01-07

我有一个tabledata.csv文件和我一直在使用pandas.read_csv阅读或选择具有特定条件的特定列。

例如，我使用以下代码来选择所有“名称”session_id =1，它在数据科学家工作台上的 IPython Notebook 上运行良好。

             df = pandas.read_csv('/resources/data/findhelp/tabledata.csv')
             df['name'][df['session_id']==1]

我只是想知道在读取 csv 文件后，是否可以以某种方式将其“切换/读取”为 sql 数据库。（我很确定我没有使用正确的术语很好地解释它，对此感到抱歉！）。但我想要的是，我确实想在 IPython 笔记本上使用 SQL 语句来选择具有特定条件的特定行。就像我可以使用类似的东西：

Select `name`, count(distinct `session_id`) from tabledata where `session_id` like "100.1%" group by `session_id` order by `session_id`

但我想我确实需要找到一种方法将 csv 文件更改为另一个版本，以便我可以使用 sql 语句。非常感谢！

这是使用内置 sqlite3 包对 pandas 和 sql 进行快速入门。一般来说，您可以通过一种或另一种方式在 pandas 中执行所有 SQL 操作。但数据库当然有用。您需要做的第一件事是将原始 df 存储在 sql 数据库中，以便您可以查询它。下面列出了步骤。

import pandas as pd
import sqlite3

#read the CSV
df = pd.read_csv('/resources/data/findhelp/tabledata.csv')
#connect to a database
conn = sqlite3.connect("Any_Database_Name.db") #if the db does not exist, this creates a Any_Database_Name.db file in the current directory
#store your table in the database:
df.to_sql('Some_Table_Name', conn)
#read a SQL Query out of your database and into a pandas dataframe
sql_string = 'SELECT * FROM Some_Table_Name'
df = pd.read_sql(sql_string, conn)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

IPython笔记本上CSV文件的SQL语句的相关文章

跟踪 pypi 依赖项 - 谁在使用我的包

无论如何是否可以通过 pip 或 PyPi 来识别哪些项目在 Pypi 上发布可能正在使用我的包也在 PyPi 上发布我想确定每个包的用户群以及可能尝试积极与他们互动预先感谢您的任何答案即使我想做的事情是不可能的这实际上是不
Python zmq SUB 套接字未接收 MQL5 Zmq PUB 套接字

我正在尝试在 MQL5 中设置一个 PUB 套接字并在 Python 中设置一个 SUB 套接字来接收消息我在 MQL5 中有这个 include
将 python2.7 与 Emacs 24.3 和 python-mode.el 一起使用

我是 Emacs 新手我正在尝试设置我的 python 环境到目前为止我已经了解到在 python 缓冲区中使用 python mode el C c C c将当前缓冲区的内容加载到交互式 python shell 中显然使用了什么
SQL - 需要查找重复记录但排除反向事务

我有一张交易表偶尔会有重复条目如果当管理员发现这些重复条目时他们将撤销交易从而创建负值但由于监管要求原始重复条目仍然保留我想创建一个 SQL 查询并使用 Crystal Reports 来制作报告以便管理员轻松查找重复
如何使用 Pandas、Numpy 加速 Python 中的嵌套 for 循环逻辑？

我想检查一下表的字段是否TestProject包含了Client端传入的参数嵌套for循环很丑陋有什么高效简单的方法来实现吗非常感谢您的任何建议 def test parameter a list parameter b list g
将布尔参数传递给 SQL Server 存储过程

我早些时候问过这个问题我以为我找到了问题所在但我没有我在将布尔参数传递给存储过程时遇到问题这是我的 C 代码 public bool upload false protected void showDate object sende
Docker 中的 Python 日志记录

我正在 Ubuntu Web 服务器上的 Docker 容器中测试运行 python 脚本我正在尝试查找由 Python Logger 模块生成的日志文件下面是我的Python脚本 import time import logging
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
pyspark 将 twitter json 流式传输到 DF

我正在从事集成工作spark streaming with twitter using pythonAPI 我看到的大多数示例或代码片段和博客是他们从Twitter JSON文件进行最终处理但根据我的用例我需要所有字段twitter J
Numpy - 根据表示一维的坐标向量的条件替换数组中的值

我有一个data多维数组最后一个是距离另一方面我有距离向量r 例如 Data np ones 20 30 100 r np linspace 10 50 100 最后我还有一个临界距离值列表称为r0 使得 r0 shape Dat
加快网络抓取速度

我正在使用一个非常简单的网络抓取工具抓取 23770 个网页scrapy 我对 scrapy 甚至 python 都很陌生但设法编写了一个可以完成这项工作的蜘蛛然而它确实很慢爬行 23770 个页面大约需要 28 小时我看过scr
从 NumPy ndarray 中选择行

我只想从 a 中选择某些行NumPy http en wikipedia org wiki NumPy基于第二列中的值的数组例如此测试数组的第二列包含从 1 到 10 的整数 gt gt gt test numpy array nump
如何断言 Unittest 上的可迭代对象不为空？

向服务提交查询后我会收到一本字典或一个列表我想确保它不为空我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例现有的替代方案看起来并不正确 self assertTrue
如何在 Windows 命令行中使用参数运行 Python 脚本

这是我的蟒蛇hello py script def hello a b print hello and that s your sum sum a b print sum import sys if name main hello sys
Python：XML 内所有标签名称中的字符串替换（将连字符替换为下划线）

我有一个格式不太好的 XML 标签名称内有连字符我想用下划线替换它以便能够与 lxml objectify 一起使用我想替换所有标签名称包括嵌套的子标签示例 XML
模拟pytest中的异常终止

我的多线程应用程序遇到了一个错误主线程的任何异常终止例如未捕获的异常或某些信号都会导致其他线程之一死锁并阻止进程干净退出我解决了这个问题但我想添加一个测试来防止回归但是我不知道如何在 pytest 中模拟异常终止如果我只
如何计算Python中字典中最常见的前10个值

我对 python 和一般编程都很陌生所以请友善我正在尝试分析包含音乐信息的 csv 文件并返回最常听的前 n 个乐队从下面的代码中每听一首歌曲都是一个列表中的字典条目格式如下 album Exile on Main Street
cv2.VideoWriter：请求一个元组作为 Size 参数，然后拒绝它

我正在使用 OpenCV 4 0 和 Python 3 7 创建延时视频构造 VideoWriter 对象时文档表示 Size 参数应该是一个元组当我给它一个元组时它拒绝它当我尝试用其他东西替换它时它不会接受它因为它说参数不是
使用 z = f(x, y) 形式的 B 样条方法来拟合 z = f(x)

作为一个潜在的解决方案这个问题 https stackoverflow com questions 76476327 how to avoid creating many binary switching variables in gekk
Kivy - 单击按钮时编辑标签

我希望 Button1 在单击时编辑标签 etykietka 但我不知道如何操作你有什么想法吗 class Zastepstwa App def build self lista WebOps getList layout BoxLayo

随机推荐

如何在Flexbox中每行显示3个项目？

我有一个列表我想显示我的li水平元素每行 3 个我一直在努力得到我想要的东西但没有运气有解决办法吗 div class serv ul foreach App Http Controllers HomeController get
是否有 Linq 方法可以将单个项目添加到 IEnumerable 中？

我正在尝试做这样的事情 image Layers 它返回一个IEnumerable对于除Parent层但在某些情况下我只想这样做 image Layers With image ParentLayer 因为与通常使用的数百次相比它只在
Git pull：错误：条目 foo 未更新。无法合并

我正在尝试从远程分支更新我的存储库并且当我执行 git pull 时不断收到此错误我没有进行任何本地更改即使做了我也不需要保留它们我试过了 git reset hard 我遇到了同样的问题似乎唯一有效的方法是删除有问题的文件并再
PDO 获取多个插入 ID

使用 PDO 运行以下查询实际上我使用准备好的语句但有同样的问题 INSERT INTO MyTable MyField VALUES Row1 Row2 如何获取与以下内容相关的记录的 IDRow1 and Row2 db gt l
有 C++ 的在线名称解析器吗？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我收到了一个相当长且令人困惑的链接错误如果我可以将其粘贴到某个网站上的某个文本框中并为我提供未损坏的
Python：通过向上舍入将列表中的 # 个值分配给 bin

我想要一个可以接受一系列和一组垃圾箱的函数并且基本上四舍五入到最近的垃圾箱例如 my series 1 1 5 2 2 3 2 6 3 def my function my series bins my function my seri
Android：DatePicker 无法在 Activity 内工作

在我的应用程序中我有一个选项卡栏我使用 ActivityGroup 将内容加载到每个选项卡中如下所示 public class FirstGroup extends ActivityGroup Keep this in a stati
C++ cin 和 CTRL + Z 问题

我正在阅读 C Primer 5th 我在练习中遇到了一些问题从 cin 读取单词序列并将值存储为向量后你已经阅读了所有单词处理向量并将每个单词更改为大写打印转换后的元素一行八个字我的代码是这样的 include
循环遍历所有表并重命名列

客户给了我一个遗留数据库old data其中包含一堆表我将逐步在新系统中激活它们不幸的是有几个表包含一个名为hash它与我用来处理这个项目的 Ruby on Rails 不太兼容有没有办法告诉MySQL控制台中的MySQL 版本8
JIT 自动内联的方法的大小是多少？

我听说 JIT 自动内联小型方法例如 getter 它们大约有 5 个字节边界是什么有 JVM 标志吗 HotSpot JIT 内联策略相当复杂它涉及许多启发式方法例如调用方方法大小被调用方方法大小 IR 节点计数内联深度调
Zoidberg曲线，无法达到“zoidberg”解

我正在尝试绘制在Matlab中只是为了好玩 I just copied the equation shown there and defined the sgn and theta functions but I can t achieve
在一次替换调用中替换多个字符

我需要将的每个实例替换为空格并将的每个实例替换为空空 var string Please send an information pack to the following address 我试过这个 string replace
解析 XML 命名空间？

使用 JavaScript Ajax 我正在尝试从中提取值
如何在 SVG 中显示占位符图像，直到加载真实图像？

我正在使用 D3 js 渲染包含光栅图像的节点的图形 var mainscreenURL s3 base url viewController screenshot jpeg svg select mainScreen transition
java中使用正则表达式进行字符串匹配

我想像这样匹配电话号码它应该有3 digits except 000 666以及之间的任何数字900 999后面加然后2 digits后面加然后4 digits 例如 123 75 3456 is a match 000 23 345
ruby 中的大括号与前面的字符匹配

我在这里阅读了很多关于使用 Regexp 在 Ruby 中匹配嵌套大括号的文章然而我无法适应我的情况我陷入了困境 Ruby 1 9 书中使用以下内容来匹配一组嵌套大括号 A
DefaultSelenium 和 RemoteWebDriver 有什么区别？

RemoteWebDriver 是 Selenium 2 0 中 DefaultSelenium 的替代品还是两者可以结合使用 RemoteWebDriver 只是用于连接到远程 selenium 服务器的驱动程序您可以将 WebDriv
忽略我对文件的更改，但不要从远程代表中删除它们

我的工作目录中有几个文件存在于远程代表中我总是出于特定原因更改它们是否可以使 git 在提交时忽略这些文件同时这些文件不应从远程代表中删除当我从远程代表中提取更改时不应合并这些文件是否有可能做到这一点 P S git updat
缺少“部署”按钮 Visual Studio 2012

昨天我已在 SharePoint 2013 开发计算机上安装了 Visual Studio 2012 Premium 我还安装了 Office 开发人员工具来获取 SP2013 项目模板打开我的 SP 2010 解决方案文件并成功转换为
IPython笔记本上CSV文件的SQL语句

我有一个tabledata csv文件和我一直在使用pandas read csv阅读或选择具有特定条件的特定列例如我使用以下代码来选择所有名称 session id 1 它在数据科学家工作台上的 IPython Notebook 上

IPython笔记本上CSV文件的SQL语句

IPython笔记本上CSV文件的SQL语句 的相关文章

随机推荐

热门标签

IPython笔记本上CSV文件的SQL语句的相关文章