Python实现“鸟脸识别”系统,看看什么鸟最贪吃~ 初学者也能学会

2023-11-19

梦晨 发自 凹非寺
量子位 报道 | 公众号 QbitAI

网友cldud1245是一个鸟类爱好者(以下简称喂鸟哥),最近打算自学Python。

拥有其他语言编程经验的他,可不打算按部就班从Hello World做起,一上来就挑战图像识别

他用一个摄像头对着自家后院的喂鸟器,拍到来觅食的鸟就尝试判断鸟的种类,并通过Twitter机器人实时发布判断结果。

运行第一天就拍到了17次!最多的时候每十几分钟就有鸟来光顾。

其中卡罗莱纳山雀总共来过8次,就是还不能准确判断是否是同一只。

使用的技术都是开源的!

喂鸟哥把代码放到了Github上开源,只有一个文件、三百多行。来看看他是怎么实现的吧!

作为初学者,他使用的都是已存在的开源项目,没有自己训练新的模型。

目标检测模型使用的是随TensorFlow目标检测API发布的SSD Openimages v4

鸟类分类模型是TensorFlow Hub上由Google发布的基于MobileNet V2的轻量级模型。

图像处理就是经典的Open CV了。

不过鸟类分类模型中给出的结果都是拉丁文学名,为了方便大家看懂他又写了一个爬虫从维基百科上把对应的俗名爬了下来。

另外,该项目Github中有详细的思路解说,感兴趣的话可以去学习一下!

还有进步空间

从Twitter上发布的结果目前看来准确率还有待提高,比如拍到飞行中的鸟识别起来会遇到困难。

有时也会把两只鸟识别成三只。喂鸟哥打算用非极大值抑制 (Non-Maximum Suppression)来修复这个问题。

不过这才是项目运行的第一天。

喂鸟哥使用鸟类百科图册进行测试,结果还是很准确的,所以怀疑摄像头是否还不够清晰

有人建议他,把网友指出正确名称的评论爬取下来,与图片一起再加入数据集进行训练,就可以不断提高精度。

还有人提议下一步要识别鸟的个体身份,看看到底是同一只鸟反复来吃东西,还是只是一个品种的很多只鸟。

One More Thing

回复中有人问到:“但是它能判断照片是不是在国家公园拍摄吗?”

这个梗来自网络漫画网站XKCD在2014年发表的一幅漫画。

如果要判断一张照片是否在国家公园拍摄,只需要判断一下图片的地理标记信息就行了。

但是要判断照片里有没有鸟,则是一个困难的多的问题。

Flickr的工程师看到后接受了这个挑战,用当时刚刚掀起新一轮热潮的深度学习做出了漫画中描述的这款程序Park or Bird(现已停止访问)。

来看看当时的深度卷积神经网络的架构。

随着技术的发展,今天的我们不仅能识别照片中是否有鸟,还能判断鸟的种类,甚至识别鸟的个体身份也不再是天方夜谭。

参考链接:

[1]github项目地址 https://github.com/cmoon4/backyard_birdbot
[2]https://twitter.com/BackyardBirdbot
[3]https://xkcd.com/1425/
[4]https://code.flickr.net/2014/10/20/introducing-flickr-park-or-bird/

—  —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

点这里????关注我,记得标星,么么哒~

加入AI社群,拓展你的AI行业人脉

量子位「AI社群」招募中!欢迎AI从业者、关注AI行业的小伙伴们扫码加入,与50000+名好友共同关注人工智能行业发展&技术进展

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python实现“鸟脸识别”系统,看看什么鸟最贪吃~ 初学者也能学会 的相关文章

随机推荐

  • 使用 SpringBoot 访问 MySQL 数据库

    一 目标 创建一个 MySQL 数据库 构建一个 Spring 应用程序 并将其连接到新创建的数据库 二 准备工作 1 最喜欢的文本编辑器或 IDE 2 Java 17或更高版本 3 Gradle 7 5 或Maven 3 5 三 初始化项
  • 使用Python制作酷炫的二维码

    参考 https www cnblogs com zhuwjwh p 11401312 html 制作动图二维码只需要原始图像是动图就可以哦 制作动图可以参考我之前的博客
  • 量化编程环境python库安装包

    必装工具包 1 ccxt conda没有 2 pandas 3 pathos 并发计算 conda没有 4 websocket 获取实时数据 conda没有 5 ntplib 用于时间校对 conda没有 6 cryptography 加密
  • Qt中 gui 模块和 widgets 模块的区别

    作者 billy 版权声明 著作权归作者所有 商业转载请联系作者获得授权 非商业转载请注明出处 简述 在Qt5下 QWidget系列从QtGui中被剥离出去 成为单独的QtWidget模块 随着Qt Quick2的引入 QtDeclarat
  • 【JavaScript】js继承

    es6 extends继承 原型式继承 构造函数继承 组合式继承 一 es6 extends继承 scala复制代码 class Child extends Parent constructor super this name 张三 let
  • Java课程设计之学习成绩管理系统

    package System import java awt import java awt event import java io import javax swing import javax swing table Abstract
  • JavaScript的slice()方法最详解

    JavaScript slice 方法怎么用 最详尽最易懂的讲解 1 JavaScript slice 方法的定义 slice 方法可提取字符串的某个部分 并以新的字符串返回被提取的部分 2 1 JavaScript slice 方法的语法
  • 基于LLMs的多模态大模型(Flamingo, BLIP-2,KOSMOS-1,ScienceQA)

    前一篇博客已经整理了不训练视觉模型的文章们 基于LLMs的多模态大模型 Visual ChatGPT PICa MM REACT MAGIC 本篇文章将介绍一些需要训练视觉编码器来适配多模态大模型的工作们 这也是目前最为流行的研究思路 其实
  • 2022 如何在 GitHub 上搭建个人网站(github.io)

    前言 目前 想要搭建自己的项目演示 又想要免费的服务 这时就可以使用 GitHub 提供的免费Pages服务 github io 前置 有GitHub账号 熟练使用git版本管理 成果展示 步骤 第一步 新建仓库 在GitHub上 创建一个
  • 下一步准备给自研引擎换皮

    抄完osg osgearth 鬼火引擎最低版本 以及ogre的大部分后 看到消息处理都通过窗口 突然顿悟 引擎都是类似的 下一步给自研引擎换皮 全换成ogre的皮 渲染流程类似osg的 多线程渲染 无非就是在哪个线程wglMakeCurre
  • 云原生热门话题|什么是可观测性-Observability

    code杂坛 关注一线大厂 互联网时讯 各技术栈 产品 开源社区 等最新讯息 1 可观测性引入 可观测性 术语源于几十年前的控制理论 在许多实际问题中 控制系统的状态变量不是由直接测量得到的 而是通过某种观测方法得到的 由某种观测系统所得到
  • 深大自考本科所需课程

    自考本科需要通过课程 网络经济与企业管理 数据结构导论 运筹学基础 信息资源管理 中国近代史纲要 计算机原理 马克思主义基本原理概论 数据库系统原理 管理经济学 软件开发工具 C 程序设计 英语2 操作系统概论 管理信息系统 计算机网络原理
  • 【OpenCV学习笔记】【编程实例】五 (霍夫圆检测)

    GetCircle cpp 定义控制台应用程序的入口点 圆形检测代码demo 载入数张包含各种形状的图片 检测出其中的圆形 include cv h include highgui h include
  • 排队论(Queuing Theory)

    目录 简介 一 基本概念 1 1 排队过程的一般表示 1 2 排队系统的组成和特征 1 2 1 输入过程 1 2 2 排队规则 1 2 3 服务过程 1 3 排队模型的符号表示 1 4 排队系统的运行指标 二 输入过程与服务时间的分布 2
  • 【MySQL】—— 在windows下的MySQL安装与配置

    更新日志 2020 11 13 文章发布 说明 本文地址 MySQL 在windows下的MySQL安装与配置 https blog csdn net maixiaochai article details 109676520 关于 Mai
  • 2FSK调制解调实验

    一 2FSK原理 频移键控是利用载波的频率变化来传递数字信息 数字频率调制是数据通信中使用较 早的一种通信方式 由于这种调制解调方式容易实现 抗噪声和抗衰减性能较强 因此在 中低速数字通信系统中得到了较为广泛的应用 在2FSK中 载波的频率
  • 树与二叉树(二叉树的表示,性质,遍历,还原)

    1 基本术语 A 或B 是I的祖先 I是A 或B 的子孙 D是I的双亲 I是D的孩子 节点的孩子个数称为节点的度 树中节点的最大度数称为树的度 度大于0的节点称为分支节点 度等于0的节点称为叶节点 定义树根为第一层 则 树的深度 高度 为5
  • 数据库开发三:JDBC数据库开发入门三(PrepareStatement的使用及预处理原理)

    目录 一PrepareStatement使用 二预处理原理 文章相关视频出处 https developer aliyun com lesson 1694 13598 spm 5176 10731542 0 0 4a023fdbjxoV5w
  • Java准确获取Word/Excel/PPT/PDF的页数(附Word页数读不准的处理办法)

    Java准确获取Word Excel PPT PDF的页数 附Word页数读不准的处理办法 1 需求背景 2 环境准备工作 2 1 JACOB介绍及安装 2 2 Microsoft Office Word的设置 3 代码 3 1 代码示例
  • Python实现“鸟脸识别”系统,看看什么鸟最贪吃~ 初学者也能学会

    梦晨 发自 凹非寺 量子位 报道 公众号 QbitAI 网友cldud1245是一个鸟类爱好者 以下简称喂鸟哥 最近打算自学Python 拥有其他语言编程经验的他 可不打算按部就班从Hello World做起 一上来就挑战图像识别 他用一个