盘点一下不到100行的给力代码

2023-11-10


作者:景略集智       

https://jizhi.im/blog/post/short_and_excellent_code


只需10行Python代码,我们就能实现计算机视觉中目标检测。

from imageai.Detection import ObjectDetection
import os

execution_path = os.getcwd()

detector = ObjectDetection()
detector.setModelTypeAsRetinaNet()
detector.setModelPath( os.path.join(execution_path , "resnet50_coco_best_v2.0.1.h5"))
detector.loadModel()
detections = detector.detectObjectsFromImage(input_image=os.path.join(execution_path , "image.jpg"), output_image_path=os.path.join(execution_path , "imagenew.jpg"))

for eachObject in detections:
print(eachObject["name"] + " : " + eachObject["percentage_probability"] )

没错,用这寥寥10行代码,就能实现目前AI产品中应用广泛的目标检测技术。

看完了代码,下面容我们聊聊目标检测背后的技术背景,并解读这10行Python代码的由来和实现原理。

目标检测简介

人工智能的一个重要领域就是计算机视觉,它是指计算机及软件系统识别和理解图像与视频的科学。计算机视觉包含很多细分方向,比如图像识别、目标检测、图像生成和图像超分辨率等。其中目标检测由于用途广泛,在计算机视觉领域的意义最为深远。

目标检测是指计算机和软件系统能够定位出图像/画面中的物体,并识别出它们。目标检测技术已经广泛应用于人脸检测、车辆检测、人流量统计、网络图像、安防系统和无人车等领域。和其它计算机视觉技术一样,目标检测未来会进一步成为人工智能的重要组成部分,有着广阔的发展前景。

不过,在软件应用和系统中使用现代目标检测方法以及根据这些方法创建应用,并非简单直接。早期的目标检测实现主要是应用一些经典算法,比如OpenCV中支持的算法。然而这些算法的表现并不稳定,在不同情况下差异巨大。

2012年深度学习技术的突破性进展,催生了一大批高度精准的目标检测算法,比如R-CNN,Fast-RCNN,Faster-RCNN,RetinaNet和既快又准的SSD及YOLO。使用这些基于深度学习的方法和算法,需要理解大量的数学和深度学习框架。现在全世界有数以百万计的开发者在借助目标检测技术创造新产品新项目,但由于理解和使用较为复杂困难,仍有很多人不得要领。

为了解决这个困扰开发者们的问题,计算机视觉专家Moses Olafenwa带领团队推出了Python库ImageAI,能让开发人员只需寥寥数行代码就能很容易的将最先进的计算机视觉技术应用到自己的项目和产品中。

我们开头所示的10行代码实现,就是要用到ImageAI。

如何借助ImageAI轻松实现目标检测

使用ImageAI执行目标检测,你只需以下4步:

1.在电脑上安装Python 2.安装ImageAI及其环境依赖 3.下载目标检测模块文件 4.运行示例代码,就是我们展示的那10行

下面我们一步步详细讲解。

1)从Python官网下载和安装Python 3

https://python.org/

2)通过pip安装如下环境依赖

1.Tensorflow

pip install tensorflow

2.Numpy

pip install numpy

3.SciPy

pip install scipy

4.OpenCV

pip install opencv-python

5.Pillow

pip install pillow

6.Matplotlib

pip install matplotlib

7.H5py

pip install h5py
  1. Keras

    pip install keras
  2. ImageAI

    pip install

github.com

3)通过该链接下载RetinaNet 模型文件用于目标检测。

到了这里我们已经安装好了所有依赖,就可以准备写自己的首个目标检测代码了。 创建一个Python文件,为其命名(比如FirstDetection.py),然后将如下代码写到文件中,再把RetinaNet模型文件以及你想检测的图像拷贝到包含该Python文件的文件夹里。

FirstDetection.py

from imageai.Detection import ObjectDetection
import os

execution_path = os.getcwd()

detector = ObjectDetection()
detector.setModelTypeAsRetinaNet()
detector.setModelPath( os.path.join(execution_path , "resnet50_coco_best_v2.0.1.h5"))
detector.loadModel()
detections = detector.detectObjectsFromImage(input_image=os.path.join(execution_path , "image.jpg"), output_image_path=os.path.join(execution_path , "imagenew.jpg"))

for eachObject in detections:
print(eachObject["name"] + " : " + eachObject["percentage_probability"] )

然后运行代码,等待控制台打印结果。等控制台打印出结果后,就可以打开FirstDetection.py所在的文件夹,你就会发现有新的图像保存在了里面。比如下面两张示例图像,以及执行目标检测后保存的两张新图像。

目标检测之前:

640?wx_fmt=jpeg

640?wx_fmt=jpeg

目标检测之后:

640?wx_fmt=png

640?wx_fmt=jpeg

我们可以看到图像上显示了检测出的物体名称及概率。

解读10行代码

下面我们解释一下这10行代码的工作原理。

from imageai.Detection import ObjectDetection
import os

execution_path = os.getcwd()

在上面3行代码中,我们在第一行导入了ImageAI目标检测类,在第二行导入Python os类,在第三行定义了一个变量,获取通往我们的Python文件、RetinaNet模型文件和图像所在文件夹的路径。

detector = ObjectDetection()
detector.setModelTypeAsRetinaNet()
detector.setModelPath( os.path.join(execution_path , "resnet50_coco_best_v2.0.1.h5"))
detector.loadModel()
detections = detector.detectObjectsFromImage(input_image=os.path.join(execution_path , "image.jpg"), output_image_path=os.path.join(execution_path , "imagenew.jpg"))

在上面5行代码中,我们在第一行定义我们的目标检测类,在第二行设定RetinaNet的模型类型,在第三行将模型路径设置为RetinaNet模型的路径,在第四行将模型加载到目标检测类中,然后我们在第五行调用检测函数,并在输入和输出图像路径中进行解析。

for eachObject in detections:
print(eachObject["name"] + " : " + eachObject["percentage_probability"] )

在上面两行代码中,我们迭代了第一行中detector.detectObjectFromImage函数返回的所有结果,然后打印出第二行中模型对图像上每个物体的检测结果(名称和概率)。

ImageAI支持很多强大的目标检测自定义功能,其中一项就是能够提取在图像上检测到的每个物体的图像。只需将附加参数extract_detected_objects=True解析为detectObjectsFromImage函数,如下所示,目标检测类就会为图像物体创建一个文件夹,提取每张图像,将它们保存在新创建的文件夹中,并返回一个包含通过每张图像的路径的额外数组。

detections, extracted_images = detector.detectObjectsFromImage(input_image=os.path.join(execution_path , "image.jpg"), output_image_path=os.path.join(execution_path , "imagenew.jpg"), extract_detected_objects=True)

我们用前面的第一张图像作为例子,可以得到图像中检测到的各个物体的单独图像:

640?wx_fmt=png

ImageAI提供了很多功能,能够用于各类目标检测任务的自定义和生产部署。包括:

-调整最小概率:默认概率小于50%的物体不会显示,如有需要,你可以自行调整这个数字。 -自定义目标检测:使用提供的CustomObject类,你可以检测一个或多个特定物体。 -调整检测速度:可以通过将检测速度设为“快”“更快”“最快”三个不同等级,调整检测速度。 -输入输出类型:你可以自定义图像的路径,Numpy数组或图像的文件流为输入输出。

诚然,单看这10行代码每一行,谈不上惊艳,也借助了不少库,但是仅用10行代码就能让我们轻松实现之前很麻烦的目标检测,还是能谈得上“给力”二字。

python爬虫与人工智能

640?wx_fmt=jpeg

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

盘点一下不到100行的给力代码 的相关文章

  • IR2104电机驱动

    目录 一 IR2104的引脚定义 二 IR2104的内部原理 三 半桥驱动原理分析 四 全桥驱动原理分析 五 电感电流回流路径的建立 六 自举电容容值的计算与自举二极管选型 七 mos管发热可能的问题 八 推荐阅读 一 IR2104的引脚定
  • R语言中如何进行PCA分析?利用ggplot和prcomp绘制基因表达量分析图

    学习笔记的主要内容是在R语言中利用ggplot2进行PCA分析和绘图 包括简单分析与操作流程 对比不同方式得到的结果差异 提供脚本代码供练习 PCA分析的原理 在处理基因差异表达数据时 有时候需要分析其中因素的影响最大 判断结果的关系 这个
  • InstructGPT:彻底改变人工智能驱动的语言模型

    目录 什么是InstructGPT 人工智能驱动的语言模型的演变 InstructGPT 模型与 GPT 3 相比如何 通过 OpenAI API 访问 InstructGPT 1 访问platform openai com并创建或登录您的
  • Linux中select poll和epoll的区别

    原文地址 http www cnblogs com bigwangdi p 3182958 html 在Linux Socket服务器短编程时 为了处理大量客户的连接请求 需要使用非阻塞I O和复用 select poll和epoll是Li
  • Node.js Modules 模块

    模块 https nodejs org docs v9 2 0 api modules html Node js has a simple module loading system In Node js files and modules
  • 美国移动网络运营商:是时候关闭 3G 了

    整理 祝涛 出品 CSDN ID CSDNnews 你的手机现在正使用什么样的网络服务呢 是4G还是5G呢 如果美国地区的用户依然停留在3G 他们可能需要在手机服务提供商关闭3G网络之前升级 以避免失去服务 美国联邦通信委员会 Federa
  • 华为OD机试 -扑克牌大小(C++ & Java & JS & Python)

    描述 扑克牌游戏大家应该都比较熟悉了 一副牌由54张组成 含3 A 2各4张 小王1张 大王1张 牌面从小到大用如下字符和字符串表示 其中 小写joker表示小王 大写JOKER表示大王 3 4 5 6 7 8 9 10 J Q K A 2
  • 联想Y9000X Opencore引导黑苹果Catalina10.15.6安装教程

    Y9000X 2020黑苹果安装教程 非商业用途 仅用于自己记录学习研究 Y9000X Opencore 安装双硬盘双系统教程 电脑配置 前期准备 安装流程 1 写入U盘镜像 2 更换EFI文件 3 磁盘分区 4 系统安装 5 将U盘中的E
  • [c++]opencv 鼠标响应函数传入外部参数(图像)问题

    参考博客 https blog csdn net my lord article details 53927865 https blog csdn net aiyueyueaoe article details 118192972 http
  • C语言开发MicroPython模块(添加module)

    MicroPython添加模块框架模式相对简单 只需要按照定义好的固定框架就可以添加模块 module 一 向固件里面添加module 1 1 编写mymodule c文件 在ports esp32文件夹下新建一个文件mymodule c
  • 域/AD域

    域 定义 域模型是针对大型网络的管理需求设计的 域就是共享用户账号 计算机账号和安全策略的计算机集合 组成 域网络的组成 一般情况下 有三种计算机 域控制器 上存储着Active Directoy 成员服务器 负责提供邮件 数据库 DHCP
  • Flink学习22:窗口的划分

    1 简介 主要有2种窗口 一个基于时间窗口 一个是基于数量窗口 时间窗口中起止时间是 左闭右开 2 时间概念 2 1 事件生成时间 EventTime 指的是数据在设备上产生的时间 这种模式下 不管数据何时到达或者顺序如何 都能得到一致的结
  • 从设备树(dtb格式数据)中解析出bootargs

    1 函数调用关系 start kernel setup arch setup machine fdt early init dt scan nodes 遍历设备树的节点 解析出重要的信息用于内核启动 of scan flat dt 解析设备
  • 四、STL容器:map

    4 map 4 1 简介 map是key value构成的集合 4 2 操作 map是键值对
  • VUE工程的keep-alive缓存机制(全部缓存、部分缓存、定向缓存)

    目录 应用场景 解决思路 一 缓存所有页面 二 缓存部分页面 三 页面缓存了 有的功能需要再进入后 仍然重新执行的怎么办 四 执行前进刷新 后退时候缓存 五 页面B进入页面A需要缓存 页面C进入页面A不需要缓存 应用场景 1 vue工程 很
  • 如何用r压缩列联表_如何用R的基础绘图系统作图?

    R的基础绘图系统由Ross Ihaka编写 功能非常强大 主要由graphics包和grDevices包组成 它们在启动R时会自动加载 基础绘图系统中有两类函数 一类是高水平作图函数 另一类是低水平作图函数 所谓高水平作图函数是用于直接产生
  • react使用代理(跨域问题)

    在src文件夹下建文件setupProxy js const proxy require http proxy middleware module exports function app app use proxy api target
  • 蚂蚁金服新一代数据可视化引擎 G2

    新公司已经呆了一个多月 目前着手一个数据可视化的项目 数据可视化肯定要用到图形库如D3 Highcharts ECharts Chart等 经决定我的这个项目用阿里旗下蚂蚁金服所开发的G2图表库 官方地址 https antv alipay
  • 100-Days-Of-ML系列Day

    今天继续学习机器学习算法 KNN KNN是通过测量不同特征值之间的距离进行分类的一种算法 它的思路是 如果一个样本在特征空间的k个最相似 即特征空间中最近邻 的样本大多数属于某一个类别 则该样本也属于这个类别 其中k通常是不大于20的整数
  • 扫描服务器的端口信息是什么,远程shell扫描服务器的端口号

    远程shell扫描服务器的端口号 内容精选 换一换 Linux云服务器一般采用SSH连接方式 使用密钥对进行安全地无密码访问 但是SSH连接一般都是字符界面 有时我们需要使用图形界面进行一些复杂操作 本文以Ubuntu 18 04操作系统为

随机推荐

  • 机器学习的数据准备:为什么它如此重要,我们应该怎么做?

    作者 Nandhini TS 编译 CDA数据分析师 编码是成功的业务模型的前提 建立成功的AI ML模型有3个方面 算法 数据和计算 虽然建立准确的算法和计算技能的应用是过程的一部分 但这是什么基础呢 使用正确的数据奠定基础 从自动驾驶汽
  • stm32 FATFS文件系统如何减少Flash和RAM占用,FATFS移除中文文件名,FATFS移除动态内存

    FATFS 下载地址 FATFS源码下载 FATFS 移植的过程中 主要用到三个文件 ff c diskio c ffconf h 移植FATFS不需要过多的操作 过程很是方便 步骤为 补全 diskio c 中的存储介质底层驱动文件 一般
  • Digger PRO - Voxel enhanced terrains

    资源链接在文末 Digger PRO 是一个简单但强大的工具 可以直接从 Unity 编辑器或游戏中创建天然洞穴和悬岩 会让你感觉自己手中握有一个体素地形 且毫无瑕疵 它实际上保持着最新 最快且可靠的 Unity 地形系统 并在你需要的地方
  • 【数据库】数据库的bak格式备份与还原

    一 前言 这些天忙于处理评教的事情 其中接触了很多的新的知识 话说数据库的备份已经不是很新鲜了 但是感觉自己很有必要去总结一下 以便以后自己查看 或者是给新的朋友一点点启示 在开始之前有几个问题 二 数据库备份与还原 1 什么是bak文件
  • 单例模式(饿汉式单例 VS 懒汉式单例)

    所谓的单例模式就是保证某个类在程序中只有一个对象 一 如何控制只产生一个对象 1 构造方法私有化 保证对象的产生个数 创建类的对象 要通过构造方法产生对象 构造方法若是public权限 对于类的外部 可以随意创建对象 无法控制对象个数 构造
  • 【Java笔记】包装类(Wrapper)与自动拆装箱的使用

    针对八种基本数据类型定义相应的引用类型 就是包装类 有了包装类 我们就可以将基本数据类型变成类 从而调用类的方法 目录 八种包装类 基本数据类型与包装类的相互转换 自动装箱与自动拆箱 基本数据类型 包装类与String的相互转换 包装类常见
  • 嵌入式C语言知识复习和提高

    文章目录 前言 基础知识 main函数 防BUG 注释 重要 关键字 标识符命名 驼峰命名 常量类型 变量 printf 1 输出不同类型数据 2 输出不同宽度数据 3 不同类型数据长度归类 scanf函数 运算符 sizeof 运算符 优
  • c#10(密封类和密封方法,异常)

    密封类和密封方法 异常 一 密封类 密封类可以用来限制扩展性 如果密封了某个类 则其他类不能从 该类继承 如果密封了某个成员 则派生类不能重写该成员的实现 默认情况下 不应该密封类和成员 密封可以防止对库的类型和成员进行自定义 C 中使用密
  • 调用百度翻译接口c++api

    这是我之前录制的一个视频 里面有比较具体的讲解 哔哩哔哩自制的讲解视频 百度的接口api介绍网站 先贴个运行效果 界面没有做比较漂亮的优化 看起来比较丑哈哈哈哈啊 但是五脏俱全哦 贴个图吧 具体的实现思路此处不再赘述 源代码下载百度网盘链接
  • n的阶乘的位数

    输入N求N的阶乘的10进制表示的长度 例如6 720 长度为3 Input 输入N 1 lt N lt 10 6 Output 输出N的阶乘的长度 Sample Input 6 Sample Output 3 include
  • 如何使用 Selenium 实现自动化操作?

    目录 前言 一 关于Selenium 1 1 为什么选择它作为web自动化的测试工具 1 2 Selenium操作浏览器的原理 二 实现一个简单的自动化 2 1 使用自动化操作浏览器 2 2 Selenium常用的API 2 2 1 查找页
  • ffmpeg拆分合成音视频

    拆 ffmpeg i a mp4 an vcodec copy out mp4 ffmpeg i a mp4 vn acodec copy out amr 合 ffmpeg i out mp4 i out amr ok mp4
  • C++基础知识(二十五)--- STL案例之演讲比赛

    问题 24个人 分4组 每组6人 三轮比赛 每轮淘汰一半 第三轮6人决出前三名 10个评委打分 选手最终得分是去掉最高最低取平均 思路 1 用 vector 存储编号 编号对应选手 2 用 map 保存选手信息 键值是编号 实值是选手 3
  • 如何将旧硬盘数据完美迁移到新硬盘

    1 创建一个PE启动盘 准备一个装有PE的U盘或者移动硬盘 可以到网上下载一个PE工具盘的ISO文件 然后用UltraISO打开ISO文件 点击启动菜单选择写入硬盘映像 写入方式USB HDD 写入完成之后 再点击 便捷启动 选择写入新的硬
  • python array保存为csv文件,并加载

    import numpy numpy savetxt train x csv train x delimiter train x csv numpy loadtxt open train x csv rb delimiter skiprow
  • win10远程桌面连接ubuntu20(RDP)

    此方法是基于RDP Remote Display Protocol 协议 1 安装xrdp sudo apt get install xrdp 2 开启rdp服务 systemctl start xrdp 3 使rdp开机自启 system
  • IDEA 如何自动导入(import)

    如果大家正在使用一个未曾导入 import 过的类 或者它的静态方法或者静态字段 IDEA 会给出对应的建议 只要按下 option 和回车就可以接受建议 但我觉得这样做仍然很麻烦 不够智能化 怎么办呢 打开 IDEA 的首选项 找到 Ed
  • H2数据库-快速指南

    H2数据库 简介 H2是开源的轻量级Java数据库 它可以嵌入Java应用程序中或以客户端 服务器模式运行 H2数据库主要可以配置为作为内存数据库运行 这意味着数据将不会持久存储在磁盘上 由于具有嵌入式数据库 因此它不用于生产开发 而主要用
  • 成为Qt开发大牛,从入门到精通,一步一步走完整个学习路线!

    简介 本文为 C QT 学习路线大纲 资料 文章底部 Qt 可以做什么 Qt 虽然经常被当做一个 GUI 库 用来开发图形界面应用程序 但这并不是 Qt 的全部 Qt 除了可以绘制漂亮的界面 包括控件 布局 交互 还包含很多其它功能 比如多
  • 盘点一下不到100行的给力代码

    作者 景略集智 https jizhi im blog post short and excellent code 只需10行Python代码 我们就能实现计算机视觉中目标检测 from imageai Detection import O