单击 web.py python 中的按钮时下载/导出 csv 文件

2024-02-19

我正在使用Pythonweb.py构建小型网络应用程序的框架。

它由一个

Home page以 url 作为输入
Reads anchor text and anchor tags从中
将其写入 csv 文件并下载

当我们点击 a 时，就会发生步骤 2 和 3export the links按钮，下面是我的代码

code.py

import web
from web import form
import urlparse
from urlparse import urlparse as ue
import urllib2
from BeautifulSoup import BeautifulSoup
import csv
from cStringIO import StringIO

urls = (
    '/', 'index',
    '/export', 'export',
)

app =  web.application(urls, globals())
render = web.template.render('templates/')

class index:
    def GET(self):
        return render.home()


class export:

    def GET(self):
        i = web.input()
        if i.has_key('url') and i['url'] !='':
            url = i['url'] 
            page = urllib2.urlopen(url)
            html = page.read()
            page.close()


            decoded = ue(url).hostname
            if decoded.startswith('www.'):
                decoded = ".".join(decoded.split('.')[1:])
            file_name = str(decoded.split('.')[0])

            csv_file = StringIO()
            csv_writer = csv.writer(csv_file)
            csv_writer.writerow(['Name', 'Link'])

            soup = BeautifulSoup(html)
            for anchor_tag in soup.findAll('a', href=True):     
                csv_writer.writerow([anchor_tag.text,anchor_tag['href']]) 
            web.header('Content-Type','text/csv')       
            web.header('Content-disposition', 'attachment; filename=%s.csv'%file_name)
            return csv_file.getvalue()

if __name__ == "__main__":
    app.run()

首页.html:

$def with()
<html>
 <head>
   <title>Home Page</title>
 </head>
 <body>
     <form method="GET" action='/export'>
        <input type="text" name="url" maxlength="500" />
        <input class="button" type="submit" name="export the links" value="export the links" />
      </form>
 </body>
</html>

上面的 html 代码显示一个带有文本框的表单，该文本框接受 url ，并有按钮export the links按钮那个downloads/exports带有锚标记链接和文本的 csv 文件。

例如当我们提交http://www.google.co.in然后单击export the links，所有锚点网址和锚文本都保存到csv文件中并成功下载
但例如当我们给出其他网址时http://stackoveflow.com立即并单击export the links按钮，csv 文件（如上面代码所示，使用 url 的域名创建）正在使用标签 links 进行下载，但下载的 csv 文件还包含之前 url 的数据（锚文本和链接），即http://www.google.co.in.

也就是说，数据在来自不同网址的同一个 csv 文件中被覆盖，任何人都可以让我知道上面的代码有什么问题（export class）生成 csv 文件，为什么数据被覆盖而不是创建一个动态创建的具有不同名称的新 csv 文件？

最后，我的目的是下载/导出一个新的 csv 文件，其中包含 url 的域名（在我的代码中如上所述进行切片），每次我们给出新 url 时，都会将数据（锚标记文本和 url ）从 url 写入其中。

任何人都可以扩展/对我的上述代码进行必要的更改，以下载单个 url 的单个 csv 文件.......

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Button

csv

export

webpy

单击 web.py python 中的按钮时下载/导出 csv 文件的相关文章

如何在 Django 管理中以表格格式显示添加模型？

我刚刚开始使用 Django 编写我的第一个应用程序为我的家庭设计的家务图表管理器在本教程中它向您展示了如何添加相关对象 http docs djangoproject com en dev intro tutorial02 cust
创建圆形图像 PIL Tkinter

Currently I have a zoom feature in my application that works very well however I d like the actual zoom box to be a circ
我怎样才能在python cgi中找到上传的文件名

我制作了如下简单的网络服务器 import BaseHTTPServer os cgi import cgitb cgitb enable html
引发 RuntimeError(f"目录 '{directory}' 不存在") RuntimeError: 导入 fitz 时目录 'static/' 不存在

当我运行 extract img py 文件时出现此错误 RuntimeError f 目录 directory 不存在运行时错误导入 fitz 时不存在目录 static 我不明白为什么这会给我发回此错误消息我之前看到过关于这个话题
在 Python 3 中动态导入模块的问题

我遇到的情况是在我的 Python 3 项目中在运行时必须包含某些模块我在用着importlib import module为了这第二次更新我确实找到了一种方法来做一些接近我想要的事情一些额外的代码可能会使我的一些链接稍微偏离一
通过鼻子测试检查某个函数是否发出警告

我正在使用编写单元测试nose http somethingaboutorange com mrl projects nose 0 11 2 我想检查函数是否引发警告该函数使用warnings warn 这是很容易就能做到的事情吗 def
Django 如何从 ManyToManyField 序列化并列出全部

我正在使用 Django 1 9 1 开发移动应用程序后端我实现了关注者模型现在我想列出用户的所有关注者但目前我不得不这样做我还使用 Django Rest 框架这是我的 UserProfile 模型 class UserProf
Python 使用 M2Crypto 通过 S/MIME 对消息进行签名

我现在花了几个小时但找不到我的错误我想要一个简单的例程来创建 S MIME 签名消息稍后可以与 smtplib 一起使用这是我到目前为止所拥有的 usr bin python2 7 coding utf 8 from future
十六进制数的按位异或

我们如何在 Python 中对十六进制数进行异或例如我想要异或 ABCD and 12EF 答案应该是 B922 我使用了下面的代码但它给出了错误的结果 xor two strings of different lengths def
使用字母而不是数字进行顺序计数[重复]

这个问题在这里已经有答案了我需要一种方法将字符串递增到 z 然后将 aa 递增到 az 然后将 ba 递增到 bz 依此类推就像 Excel 工作表中的列一样我将向该方法提供前一个字符串它应该增加到下一个字母 PSEUDO C
Pyinstaller --onefile 警告文件已存在但不应存在

跑步时Pyinstaller onefile 并开始得到结果 exe 会出现多个弹出窗口并显示以下警告 WARNING file already exists but should not C Users myuser AppData L
属性错误：类型对象“图像”没有属性“打开”

Exception in Tkinter callback Traceback most recent call last File C Python34 lib tkinter init py line 1482 in call retu
在ansible中合并字典

我目前正在构建一个使用 ansible 安装 PHP 的角色并且在合并字典时遇到一些困难我尝试了多种方法来做到这一点但我无法让它像我想要的那样工作 A vars file my default values key value my
如何使用 jira-python 设置 fixVersions 字段

我正在尝试使用 jira python 模块 http jira python readthedocs org en latest 更新现有的 JIRA 具体来说我正在尝试设置问题的fixesVersion 列表我已经尝试了一段时间但没
在 MATLAB 中创建共享库

一位研究人员在 MATLAB 中创建了一个小型仿真我们希望其他人也能使用它我的计划是进行模拟清理一些东西并将其变成一组函数然后我打算将其编译成C库并使用SWIG https en wikipedia org wiki SWIG创建一
如何在 Python 中仅列出 zip 存档中的文件夹？

如何仅列出 zip 存档中的文件夹这将列出存档中的每个文件夹和文件 import zipfile file zipfile ZipFile samples sample zip r for name in file namelist pr
使用 Flask-SQLAlchemy 进行多对多多数据库连接

我正在尝试使这个多对多联接与 Flask SQLAlchemy 和两个 MySQL 数据库一起工作并且它非常接近只是它为联接表使用了错误的数据库这是基础知识我有main db and vendor db 表格设置为main db u
从 csv 中读取 pandas 数据帧，以非固定标头开始

我有许多数据文件是由我的实验室中使用的一些相当黑客的脚本生成的该脚本非常有趣因为它在标头之前附加的行数因文件而异尽管它们具有相同的格式并具有相同的标头我正在编写一个批处理来将所有这些文件处理为数据帧如果我不知道位置如何让 pan
在Python中从列表中获取n个项目组的惯用方法？ [复制]

这个问题在这里已经有答案了给定一个列表 A 1 2 3 4 5 6 是否有任何惯用的 Pythonic 方式来迭代它就好像它是 B 1 2 3 4 5 6 除了索引之外这感觉像是 C 的遗留物 for a1 a2 in A i A i
Shap - 颜色条不显示在摘要图中

显示summary plot时不显示颜色条 shap summary plot shap values X train 我尝试过改变plot size 当绘图较高时会出现颜色条但它非常小看起来不应该 shap summary plo

随机推荐

我可以在 Intranet 中访问 ASP.NET 开发服务器吗？

我正在测试 ASP NEt 站点当我执行它时它会启动 ASP NET 开发服务器并打开一个页面现在我想在我拥有的内网中测试它我可以使用这台服务器吗或者我需要在这台机器上配置 IIS 我需要配置一些东西才能让它工作吗我已将 loc
如何使用位图将图像分享到社交媒体？

我需要从 RecyclerAdapter 共享图像因为该图像最初并不存在即使用适配器在 Activity 中加载如何将位图分享到社交媒体每次我在应用程序中单击共享时都会显示没有应用程序可以执行此操作 feedItemView s
删除 ToolStripControlHost 周围的空白

我正在尝试删除 toolstripcontrolhost 控件周围的空白该控件在上下文菜单中托管日历控件请参阅附图和代码 VB Dim menuItem As ToolStripMenuItem New ToolStripMenuIte
在 VBA-Selenium 中按 Enter 和向下键

我想在 vba selenium 中编写一段代码以按 Enter 和向下箭头键所以你可以帮助我吗我已经尝试过下面的代码但它不起作用 selenium keyDownNative 40 For Down Arrow key seleni
如何在Azure VM上推出最新的.net框架？

我使用 azure 门户创建了一个 Azure VM windows sever 2016 它安装了 net 4 6 2 现在我想在其上推出最新的可用 net 框架 4 7 4 7 1 一种选择是下载所需的框架并将其安装在虚拟机上我确信应
子进程的 waitpid 未成功

我正在使用启动一个进程execv并让它写入文件我同时启动一个线程来监视文件以便它的大小不超过使用的特定限制stat st size 现在当达到极限时我waitpid对于子进程但这会引发错误并且我在后台启动的进程变成僵尸进程当我
同一个表上的内连接和左连接

我有两个表 A 和 B 其中有两列 x 和 y 我想在 x 上内连接 A 和 B 但只保留 A 列 y 的值左连接我正在寻找一种组合两个 y 列的方法不能只在 select 语句中指定 A y 我怎样才能做到这一点 Example T
Knockout.js：更新绑定？

当我在 ko applyBindings 之后将任何新元素注入 DOM 时被调用那么淘汰赛将无法识别这些新元素我可以理解为什么会发生这种情况它们只是没有被淘汰索引因此起初我认为在添加新元素后再次调用 ko applyBinding
深入理解MVC.net中的延迟加载和错误处理

我试图对以下问题写出完整详细的答案为什么 Dispose 有效而不是 using var db new DataContext https stackoverflow com questions 23110719 why does di
为什么 WordPress 被认为编程很差劲？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
.NET 中的 ApplicationException 有何用途？

为了引发异常我通常使用内置异常类例如ArgumentNullException and NotSupportedException 但是有时我需要使用自定义异常在这种情况下我会写 class SlippedOnABananaExce
将所有内容都纳入范围内会影响 Angular 性能吗？

我想知道是否有人对在模块内部使用 scope 与普通 JavaScript 对象有什么建议例如我在控制器中有一些变量为了方便起见我将它们附加到 scope 但它们可能只是控制器内的常规对象没有任何功能差异我的问题是当 Angu
颠覆和依赖

我正在尝试为以下问题找到可行的策略我们有几个依赖于我们框架的网络项目所有内容都存储在我们的 SVN 中并拥有自己的项目和所有必要的目录结构主干标签分支在一个示例中我们有项目 webprj01 和 webprj02 并且我们有
如何将 routerLinkActive 与空 routerLink 一起使用

我有以下选项卡栏链接第一个应该是空的
如何使用 POCO 通过 HTTP 基本身份验证进行 HTTP Post？

我正在尝试使用 POCO 进行 HTTP 基本身份验证明文用户名和密码的 HTTP Post 我找到了一个 Get 的示例并尝试修改它但作为一个菜鸟我认为我已经破坏了它的实用性有人知道怎么做吗是的我已经看到了另一个关于此的问题
使用 ctest/cmake 测试非零退出状态

感兴趣的应用程序是一个编译器当它在源代码中遇到错误时它会返回非零退出代码编译器的单元测试由故意触发错误的小片段组成用于添加测试的函数是 function add compiler test test name options add
检测 AngularJS 中自定义过滤器何时完成[重复]

这个问题在这里已经有答案了我有一个自定义过滤器函数我正在调用 ng repeat 指令 div app title div 这显然会影响 appList 中每个应用程序的 assetFilter 函数过滤完成后我想运行另一个函数如
Spring AOP中代理的使用

我正在读一本书其中谈到启用AspectJSpring AOP 的支持下面是书中的一段话要在 Spring IoC 容器中启用 AspectJ 注释支持您只需定义一个空的 bean 配置文件中的 XML 元素 aop aspectj
Azure 表存储 API 是否缓存结果？

当我对 Azure 表存储多次运行相同的查询时它是否使用缓存并加速后续查询换句话说它是否缓存 HTTP 响应 Azure存储肯定使用缓存 http www scribd com doc 73458371 Windows Azure S
单击 web.py python 中的按钮时下载/导出 csv 文件

我正在使用Pythonweb py构建小型网络应用程序的框架它由一个 Home page以 url 作为输入 Reads anchor text and anchor tags从中将其写入 csv 文件并下载当我们点击 a 时就会发

单击 web.py python 中的按钮时下载/导出 csv 文件

单击 web.py python 中的按钮时下载/导出 csv 文件 的相关文章

随机推荐

热门标签

单击 web.py python 中的按钮时下载/导出 csv 文件的相关文章