超简单BeautifulSoup版Csdn博客(摘要视图)爬虫

2023-05-16

csdnSpider.py代码

import bs4
import requests

origin = 'http://blog.csdn.net'
user_agent = ('Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36')

headers = {
           'origin': origin,
           'User-Agent': user_agent,
           }

date = []
for i in  range(1, 5):
    url = 'http://blog.csdn.net/WuLex/article/list/'+str(i)
    r = requests.get(url=url, headers=headers)
    page = r.content.decode('utf-8')
    doc = bs4.BeautifulSoup(page, 'lxml')

    articleList = doc.findAll('div', attrs={'class': 'list_item article_item'})
    for ele  in articleList:
          title=ele.find('span', attrs={'class': 'link_title'}).get_text()
          descripe = ele.find('div', attrs={'class': 'article_description'}).get_text()
          views = ele.find('span', attrs={'class': 'link_view'}).get_text()
          date.append(title + "\r\n" + descripe + "\r\n" + views + "\r\n"+"-------------------------------------------------------------------"+ "\r\n")


with open('blognames', 'w',encoding='utf-8') as f:
    for i in date:
        f.write(i)

运行结果如图

这里写图片描述


这里写图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

超简单BeautifulSoup版Csdn博客(摘要视图)爬虫 的相关文章

随机推荐

  • ESP32设备驱动-Si1145红外接近-紫外 (UV) 指数和环境光传感器驱动

    Si1145红外接近 紫外 UV 指数和环境光传感器驱动 文章目录 Si1145红外接近 紫外 UV 指数和环境光传感器驱动 1 Si1145介绍 2 硬件准备 3 软件准备 4 驱动实现 1 Si1145介绍 Si1145 46 47 是
  • ESP32设备驱动-PCF8575IO扩展器驱动

    PCF8575IO扩展器驱动 文章目录 PCF8575IO扩展器驱动 1 PCF8575介绍 2 硬件准备 3 软件准备 4 驱动实现 1 PCF8575介绍 PCF8575用于两线双向总线 I2C 的 16 位 I O 扩展器专为 2 5
  • ESP32设备驱动-Si4703调频收音机模块驱动

    Si4703调频收音机模块驱动 文章目录 Si4703调频收音机模块驱动 1 Si4703介绍 2 硬件准备 3 软件准备 4 驱动实现 1 Si4703介绍 Si4702 03 FM 无线电接收器系列通过小尺寸和电路板面积 最少的组件数量
  • ESP32设备驱动-PCA9685 LED控制器驱动

    PCA9685 LED控制器驱动 文章目录 PCA9685 LED控制器驱动 1 PCA9685介绍 2 硬件准备 3 软件准备 4 驱动实现 1 PCA9685介绍 PCA9685 是一款 I C 总线控制的 16 通道 LED 控制器
  • 飞桨EasyDL闪退解决方法

    当点击训练时 xff0c 软件消失 xff0c 用cmd运行软件查看输出信息未见异常 解决办法 xff0c 换一台电脑安装 xff0c 很大概率就好了
  • WM_QUIT,WM_CLOSE区别[转]

    总结 我们要使用代码关闭程序的话 应该向窗口发送WM CLOSE或者直接调DestroyWindow HWND 函数 默认情况下WM CLOSE的消息响应就是调用DestroyWindow HWND 函数 所以我们直接调用也达到一样的效果
  • ESP32设备驱动-LIS3DSH加速度传感器驱动

    LIS3DSH加速度传感器驱动 文章目录 LIS3DSH加速度传感器驱动 1 LIS3DH介绍 2 硬件准备 3 软件准备 4 驱动实现 1 LIS3DH介绍 LIS3DSH 是一款超低功耗高性能三轴线性加速度计 属于 纳米 系列 具有嵌入
  • 66老师推荐书单

    应用词汇 四级 星火英语 新要求大学英语词汇星火式巧记速记 精华本 附MP3 光盘1 张 http product dangdang com 23315816 html 词典 柯林斯COBUILD 高阶英语学习词典 英语版 http pro
  • NetAssist 网络助手

    电脑上的网络助手找不到了 xff0c 百度搜各种不能用的和下载要积分啊什么的 xff0c 真是现在鸟大了什么林子都有 xff0c 人家开发者都还免费提供软件的使用 xff0c 你一个使用者居然还拿别人的东西赚积分 xff0c 真TM恶心 x
  • 64位的linux装的hadoop是32位的,需要手工编译

    64位的linux装的hadoop是32位的 coco by coco 2014 07 02 64位的linux装的hadoop是32位的 xff0c 需要手工编译 遇到的问题描述 xff1a root 64 db96 hadoop had
  • Unable to preventDefault inside passive event listener due to target being treated as passive.

    最近做项目经常在 chrome 的控制台看到如下提示 xff1a Unable to preventDefault inside passive event listener due to target being treated span
  • GBK 编码

    GBK编码范围 xff1a 8140 xff0d FEFE xff0c 汉字编码范围见第二节 xff1a 码位分配及顺序 GBK编码 xff0c 是对GB2312编码的扩展 xff0c 因此完全兼容GB2312 80标准 GBK编码依然采用
  • 子类能否重写父类的静态方法?

    今天在看到了一道面试题 xff0c 题目是一道代码阅读题 xff0c 问下面的代码输出结果是什么 xff1f 我最开始的理解 xff1a 上面的代码我们可以看到 xff0c 上面的类中有两个内部类Sub和Super xff0c Sub继承了
  • docker build命令详解

    docker build命令用于根据给定的Dockerfile和上下文以构建Docker镜像 docker build命令的使用格式 xff1a docker build span class token punctuation span
  • Blazor 从入门到放弃

    Blazor 从入门到放弃 Intro Blazor 是微软在 NET 里推出的一个 WEB 客户端 UI 交互的框架 xff0c 使用 Blazor 你可以代替 JavaScript 来实现自己的页面交互逻辑 xff0c 可以很大程度上进
  • WPF知识学习

    RelativeSource 61 RelativeSource AncestorType 61 x Type Window 是一种 WPF XAML 绑定方式 xff0c 它表示要从当前控件的父级元素中找到类型为 Window 的元素 x
  • STM32H7并行读取AD7606数据以及片内AD值不准解决办法

    一 硬件 先了解一下AD7606 xff0c 16位 xff0c 单电源 xff0c 200k采样率 xff0c 8路 xff0c 除了贵没有其他缺点 xff0c 数据相当的稳 xff0c 一个5V供电 xff0c 不用运放的情况下采集电压
  • C#表达式树解析步骤

    C 表达式树是一种将 C 代码表示为对象树的方式 xff0c 它提供了一种在运行时动态构建和执行代码的能力 表达式树可以用于构建 LINQ 查询 动态生成代码 ORM 框架等场景 表达式树的解析过程可以分为两个步骤 xff1a 构建表达式树
  • FluentValidation使用示例

    FluentValidation 是一个 NET 平台下的验证库 xff0c 用于验证对象的属性是否符合预期的规则 它提供了一种简洁的方式来编写验证规则 xff0c 支持链式编程 xff0c 可以轻松地构建复杂的验证逻辑 在 NET 6 中
  • 超简单BeautifulSoup版Csdn博客(摘要视图)爬虫

    csdnSpider py代码 import bs4 import requests origin 61 span class hljs string 39 http blog csdn net 39 span user agent 61