普通人学Python有什么用?能干什么?

2023-11-16

“ 我想学 Python,但是学完 Python 后都能干啥 ?”

相信不少 Python 的初学者,都会遇到上面的这些问题。很多的答案会涌入我们的脑海,因为Python实在是能做太多事情了。但是慢慢静下心来思考,我发现Python主要有三个方面的应用

Python主要有以下四大主要应用

网络爬虫

web开发

人工智能

接下来的文章将和大家详解聊聊这几个方面,正在学Python的朋友也请继续看下去,或许能对你将来的学习之路有所帮助呢。

什么叫网络爬虫?

网络爬虫又称网络蜘蛛,是指按照某种规则在网络上爬取所需内容的脚本程序。众所周知,每个网页通常包含其他网页的入口,网络爬虫则通过一个网址依次进入其他网址获取所需内容。

02

爬虫有什么用?

做为通用搜索引擎网页收集器;(google,baidu)

做垂直搜索引擎;.

科学研究:在线人类行为,在线社群演化,人类动力学研究,计量社会学,复杂网络,数据挖掘,等领域的实证研究都需要大量数据,网络爬虫是收集相关数据的利器;

偷窥,hacking,发垃圾邮件……

爬虫是搜索引擎的第一步也是最容易的一步。

03

用什么语言写爬虫?

C,C++:高效率,快速,适合通用搜索引擎做全网爬取。缺点,开发慢,写起来又臭又长

脚本语言:Perl, Python, Java, Ruby。简单,易学,良好的文本处理能方便网页内容的细致提取,但效率往往不高,适合对少量网站的聚焦爬取。

04

为什么最终选择Python?

用c#,java写的爬虫。区别不大,原理就是利用好正则表达式。只不过是平台问题。后来了解到很多爬虫都是用python写的,于是便一发不可收拾。Python优势很多,总结两个要点:

1、抓取网页本身的接口

相比与其他静态编程语言,如java,c#,C++,python抓取网页文档的接口更简洁;相比其他动态脚本语言,如perl,shell,python的urllib2包提供了较为完整的访问网页文档的API。(当然ruby也是很好的选择)

此外,抓取网页有时候需要模拟浏览器的行为,很多网站对于生硬的爬虫抓取都是封杀的。这是我们需要模拟user agent的行为构造合适的请求,譬如模拟用户登陆、模拟session/cookie的存储和设置。在python里都有非常优秀的第三方包帮你搞定,如Requests,mechanize

2、网页抓取后的处理

抓取的网页通常需要处理,比如过滤html标签,提取文本等。python的beautifulsoap提供了简洁的文档处理功能,能用极短的代码完成大部分文档的处理。

其实以上功能很多语言和工具都能做,但是用python能够干得最快,最干净。

Life is short, u need python.

**2、**web开发

01

什么是web开发呢?

WEB开发就比较好理解了,就是开发网页程序,不需要安装桌面程序直接通过浏览器进行操作的程序。

WEB框架是指那些为了提高WEB程序开发效率而开发出来的中间件基础平台,开发人员不需要从0开始写代码,而是通过调用框架来开发程序,以节省时间和成本。

02

那web开发需要用到哪些知识呢?

1、python基础,最基础的知识点:条件判断,循环,函数,类这些知识;

2、数据库基础知识,数据存在哪里?就是在数据库里,数据库的增删改查是会使用到的。

补充一点,Django和Flask等基于Python的Web框架最近在Web开发中非常流行。

这些Web框架可以帮助你用Python编写服务器端代码(后端代码)。这是在你的额服务器上运行的代码,而不是运行在用户设备和浏览器的代码(前端代码)。

Life is short, u need python.

**3、**人工智能

01

人工智能是什么?

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”,也可能超过人的智能。

02

人工智能的核心语言-python

对于有希望进入AI及大数据行业的人来说,把鸡蛋放在 Python 这个篮子里不但是安全的,而且是必须的。

或者换个方式说,如果你将来想成为下一个时代——人工智能时代的先行者,而不是被这个时代追着往前赶的话,什么都不用想,先闭着眼睛把 Python 学会了。

当然,Python不是没有它的问题和短处,你可以也应该有另外一种甚至几种语言与 Python 形成搭配,但是Python 将坐稳数据分析和 AI 第一语言的位置,这一点毫无疑问。

我甚至认为,由于 Python 坐稳了这个位置,由于这个行业未来需要大批的从业者,更由于Python正在迅速成为全球大中小学编程入门课程的首选教学语言,这种开源动态脚本语言非常有机会在不久的将来成为第一种真正意义上的编程世界语。

普通人学习Python的好处?

学习Python可以提高工作效率,使用Python,用几十行代码写一个简单的爬虫工具,几分钟就能自动抓取指定网站上的成千上万条数据,让你的工作效率得到很大的提升。

如果你以后想做程序员,一定要学习Python,Python相对于其他语言来说比较简单,即使是零基础的普通人也能很快的掌握,一些本来十分繁琐的工作,用Python可以节省一半时间以上。

普通人如果学会了Python,许多机械重复的麻烦事就会变得简单,比如客服可以用Python编写自动回复系统,回复大部分常规性问题,大学生可以利用Python写一些程序,帮助自己自动收集大量的相关资料并自动归类和分析,对写论文有很大的帮助。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

普通人学Python有什么用?能干什么? 的相关文章

  • 使用 Python Multiprocessing Pool.map() 的问题在 Python 3.7.2 中变得棘手,但在 3.6.2 中很快完成

    我刚刚将Python从3 6 2 gt 3 7 2并且遇到了问题multiprocessing图书馆 我在 Django 应用程序中使用它 该应用程序在工作函数中使用 Django 特定的函数 见下文 在我的代码中 我有以下内容 impor
  • 将 JSON 发布到 Python CGI

    我已经安装了 Apache2 并且 Python 可以工作 但我有一个问题 我有两页 一个是 Python 页面 另一个是带有 JQuery 的 Html 页面 有人可以告诉我如何让我的 ajax 帖子正常工作吗
  • 为什么 Python 在导入脚本时只保存脚本的字节码?

    既然执行Python字节码会比运行原始源代码更快 因为Python不需要重新编译 为什么Python在导入脚本时只保存编译后的字节码呢 为每个执行的脚本保存 pyc 文件不是更好吗 无论如何 Python 解释器的启动时间都需要时间 即使您
  • 为什么需要在 Python 方法中显式使用“self”参数? [复制]

    这个问题在这里已经有答案了 当在 Python 中的类上定义方法时 它看起来像这样 class MyClass object def init self x y self x x self y y 但在其他一些语言中 例如 C 您可以使用
  • 键入的完整命令行

    我想获得输入时的完整命令行 This join sys argv 在这里不起作用 删除双引号 另外 我不想重新加入已解析和拆分的内容 有任何想法吗 你太迟了 当键入的命令到达 Python 时 您的 shell 已经发挥了它的魔力 例如 引
  • Flask 中“缺少 CSRF 令牌”,但它在模板中呈现

    问题 当我尝试登录 使用 Flask login 时 我得到Bad Request The CSRF session token is missing但令牌正在呈现 在模板中 secret key 已设置 并且我在本地运行localhost
  • Keras model.predict 函数给出输入形状错误

    我已经在 Tensorflow 中实现了通用句子编码器 现在我正在尝试预测句子的类概率 我也将字符串转换为数组 Code if model model type universal classifier basic class probs
  • 为什么在访问 Python 对象属性时使用 getattr() 而不是 __dict__ ?

    在具有一定程度的 Python 对象自省的源代码示例和 SO 答案中 常见的模式是 getattr some object attribute name string 是否有理由优先选择这种模式 some object dict attri
  • 雅虎财务请求功能出现 404 客户端错误

    yahoo Financials的请求功能出现404 Client Error 直接点击以下网址没有问题 https finance yahoo com quote AAPL financials p AAPL https finance
  • 如何在Windows中的Python 3.9下pip安装pickle?

    我需要pickle https docs python org 3 9 library pickle html module pickle包安装在我的下面Python 3 9在 Windows 10 下 我尝试过的 当尝试与pip inst
  • 使用pathlib获取主目录

    翻看新的pathlib在 Python 3 4 中 我注意到没有任何简单的方法来获取用户的主目录 我能想到的获取用户主目录的唯一方法是使用旧的os path像这样的库 import pathlib from os import path p
  • Python - Unicode 到 ASCII 的转换

    我无法在不丢失数据的情况下将以下 Unicode 转换为 ASCII u ABRA xc3O JOS xc9 I tried encode and decode他们不会这么做 有人有建议吗 Unicode 字符u xce0 and u xc
  • 高级描述熊猫

    有没有像 pandas 那样更高级的功能 通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结 就像这样 A count 1000 000
  • 数据框中 .map(str) 和 .astype(str) 有什么区别

    我有一个数据框 其列名为 col1 和 col2 的整数类型条目 我想将 col1 和 col2 的条目以及其间的 点 连接起来 我搜索并发现添加两个列条目 df col df col1 map str df col2 map str 并添
  • Python:在字典中查找具有唯一值的键?

    我收到一个字典作为输入 并且想要返回一个键列表 其中字典值在该字典的范围内是唯一的 我将用一个例子来澄清 假设我的输入是字典 a 构造如下 a dict a cat 1 a fish 1 a dog 2 lt unique a bat 3
  • Seaborn 中没有线性拟合的散点图

    我想知道是否有办法关闭seaborn中的线性拟合lmplot或者是否有一个等效函数可以生成散点图 当然 我也可以使用 matplotlib 但是 我发现 seaborn 中的语法和美学非常吸引人 例如 我想绘制以下情节 import sea
  • Django 2、python 3.4 无法解码 urlsafe_base64_decode(uidb64)

    我正在尝试通过电子邮件激活用户 电子邮件有效 编码有效 我使用了 django1 11 中的方法 该方法运行成功 在 Django 1 11 中 以下内容成功解码为 28 其中 uidb64 b Mjg force text urlsafe
  • 如何按 pandas 中的值对系列进行分组?

    我现在有一只熊猫Series与数据类型Timestamp 我想按日期对其进行分组 并且每组中有许多行具有不同的时间 看似显而易见的方法类似于 grouped s groupby lambda x x date 然而 熊猫的groupby按索
  • 如何在matplotlib中调整x轴

    I have a graph like this x轴上的数据表示小时 所以我希望x轴设置为0 24 48 72 而不是现在的值 很难看到 0 100 之间的数据 fig1 plt figure ax fig1 add subplot 11
  • pandas.read_fwf 忽略提供的数据类型

    我正在从文本文件导入数据框 我想指定列的数据类型 但 pandas 似乎忽略了dtype input 一个工作示例 from io import StringIO import pandas as pd string USAF WBAN S

随机推荐

  • reGeorg的工具原理

    首先先创建一个socket去运行 去连接想要连接的端口 reGeorgSocksProxy客户端与服务端的通讯是基于session来区分的 并不支持在指定的session下进行 socket set nonblock 设置socket为非阻
  • 碳中和数据合集(含上市公司碳排放、碳减排、排污费、环境税等数据)1990-2022年

    数据简介 推动企业形成绿色生产方式和生活方式 支持有条件的地方和重点行业 重点企业率先达到碳排放峰值 可见 企业已成为应对气候变化 推动低碳转型 助力 双碳 目标实现的主力军 推动其绿色 低碳化转型已成为未来经济发展的必然趋势 此背景下 作
  • linux环境下运行flex,什么是flex?

    昨天装一个软件的时候 configure后遇到下面的问题 错误代码见最后 网上查到有什么 FLEX 2 01 全套下载 客户端 Flex Builder 2 with Charting 集成 Flex Builder 2 Flex 2 SD
  • LeetCode 232. 用栈实现队列

    题目链接 https leetcode cn problems implement queue using stacks 栈的特点是先进后出 而队列的特点是先进先出 我们用两个栈正好能把顺序反过来实现类似队列的操作 stackData 作为
  • navicat连接linux虚拟机上的mysql出现10060的错误解决

    https www cnblogs com mmzs p 9201558 html 我的是当时配置MySQL的时候在iptables文件里面添加了3306但是 我没有保存 所以没有监听到这个端口 弄了一中午 唉 最终通过上面的文章得以解决
  • numpy_diag函数

    diag的函数原型如下 numpy diag v k 0 如果v是一维数组 则函数返回以v为对角线的对角矩阵 如果v是二维数组 则函数返回v的对角线 import numpy as np a np arange 9 reshape 3 3
  • 如何进行技术选型

    在重大产品决策或者大规模应用开发前一般需要进行技术选型 特别是需要开发一个之前没有了解过的系统或者应用时 其目的是为了降低产品研发的技术风险 所以首先需要明确为什么需要技术选型 需要达到什么目的 整个过程需要有一套的组织流程来保证 一般可以
  • SpringBoot实现原理

    一 什么是SpringBoot SpringBoot是一个快速开发框架 快速的将一些常用的第三方依赖整合 原理 通过Maven子父工程的方式 简化XML配置 全部采用注解形式 内置Http服务器 Jetty和Tomcat 最终以java应用
  • 深入Redis命令的执行过程

    深入Redis命令的执行过程 Redis 服务器 Redis 服务器实现与多个客户端的连接 并处理这些客户端发送过来的请求 同时保存客户端执行命令所产生的数据到数据库中 Redis 服务器依靠资源管理器来维持自身的运转 其主要作用是管理 R
  • charles抓取https请求_Charles抓包

    欢迎关注公众号 学习资料不会少 Windows端设置抓取https请求 安装证书 打开Charles 选择 Help SSL Proxying Install Charles Root Certificate 信任证书 弹出安装证书对话框
  • springboot中logback日志配置

    springboot中logback日志配置 前言 默认配置 logback spring xml详细配置 前言 Spring Boot使用Apache的Commons Logging作为内部的日志框架 其仅仅是一个日志接口 在实际应用中需
  • 模拟实现memcpy()memcmp()memmove()

    核心 memcpy 函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置 这个函数在遇到 0 的时候并不会停下来 如果source和destination有任何的重叠 复制的结果都是未定义的
  • crmeb 知识付费伪静态怎么设置?

    伪静态配置 可以通过URL重写隐藏应用的入口文件index php 下面是相关服务器的配置参考 Apache httpd conf配置文件中加载了mod rewrite so模块 AllowOverride None 将None改为 All
  • 程序员开发软件的意义在哪?

    有一篇热文 写了8年的代码 做过的项目都下线了 程序员的意义在哪里 作者8年工作和业余时间开发几十个项目 几乎都关闭了 想当初 很用心的去开发每一个项目 如今 这些项目只能一个个关闭 这真的使我很悲观 我花了那么多的时间精力 去做的事情 竟
  • GitHub怎么搜索项目

    GitHubGitHubGitHub各位应该都很熟悉了 全球最大的开源社区 也是全球最大的同性交友网站 但是大部分同学使用GitHub应该就是通过别人的开源链接 点进去下载对应的项目 而真正使用Github来查找开源项目的还是少数 面试总得
  • Linux系统之安装mariadb方法

    Linux系统之安装mariadb方法 一 检查系统版本 二 配置mariadb的yum源 1 配置yum源 2 替换中科大的源 三 检查yum仓库 1 修改 etc yum conf文件 2 检查yum仓库 四 安装mariadb 五 启
  • Spring的下载与安装(一)

    Spring是一个独立的框架 它不需要依赖于任何Web服务器或容器 它既可在独立的Java SE项目中使用 也可以在Java Web项目中使用 下载Spring地址 https repo spring io libs release loc
  • 新iPad未到 老iPad价格反弹

    新版水货仍维持5500元高位 CFP供图3月25日 新款iPad2在全球各地陆续上市 但国内迟迟没有消息 让不少苹果粉丝将目光重新转向刚刚降价的一代iPad 然而 最受欢迎的WiFi 16G B版本iPad却因货源不足 已出现价格反弹的现象
  • UDP服务器客户端编程流程

    UDP服务器客户端编程流程 UDP编程流程 UDP服务端代码实现 UDP客户端代码实现 UDP服务端客户端代码详解 UDP编程流程 UDP提供的是无连接 不可靠的 数据报服务 UDP是尽最大能力进行传输 但是并不能保证可靠性 TCP的可靠性
  • 普通人学Python有什么用?能干什么?

    我想学 Python 但是学完 Python 后都能干啥 相信不少 Python 的初学者 都会遇到上面的这些问题 很多的答案会涌入我们的脑海 因为Python实在是能做太多事情了 但是慢慢静下心来思考 我发现Python主要有三个方面的应