2020 年度最佳的23个机器学习项目!(附源代码)

2023-11-14

↑↑↑关注后"星标"Datawhale

每日干货 & 每月组队学习,不错过

 Datawhale干货 

来源:大数据文摘,整理:数据派THU

本文约5300字,建议阅读10分钟。

本文为你介绍23种机器学习项目创意,以获取有关该增长技术的真实经验。


我们都知道,教科书上所学与实际操作还是有出入的,那关于机器学习有什么好的项目可以实操吗?

我们为你推荐这篇文章,在本教程中,涵盖面向初学者,中级专家和专家的23种机器学习项目创意,以获取有关该增长技术的真实经验。这些机器学习项目构想将帮助你了解在职业生涯中取得成功、和当下就业所需的所有实践。

通过项目学习是你短期内能做的最好投资,这些项目构想使你能够快速发展和增强机器学习技能。语言上,这些机器学习项目可以用Python,R或任何其他工具开发。

面向初学者的机器学习项目

在本部分中,我们列出了针对初学者/初学者的顶级机器学习项目,如果你已经从事基础机器学习项目,请跳至下一部分:中级机器学习项目

1.鸢尾花分类项目

项目构想:鸢尾花有不同的种类,你可以根据花瓣和萼片的长度来区分它们。这是机器学习初学者预测新鸢尾花种类的基础项目。

数据集:鸢尾花分类数据集 

https://archive.ics.uci.edu/ml/datasets/Iris

2. Emojify –使用Python创建自己的表情符号

项目构想:该机器学习项目的目标是对人的面部表情进行分类并将其映射为表情符号。我们将建立一个卷积神经网络来识别面部表情。然后,我们将使用相应的表情符号或头像来映射这些情感。

源代码:Emojify项目

https://data-flair.training/blogs/create-emoji-with-deep-learning/  

3.使用机器学习进行贷款预测

项目构想:该ML项目背后的构想是建立一个模型,该模型将对用户可以贷款多少进行分类。它基于用户的婚姻状况,教育程度,受抚养人数和就业情况。我们可以为此项目建立一个线性模型。

数据集:贷款预测数据集 

https://www.kaggle.com/altruistdelhite04/loan-prediction-problem-dataset

4.住房价格预测项目

项目构想:数据集包含波士顿剩余区域的房价。房子的费用根据犯罪率,房间数量等各种因素而变化。对于初学者来说,这是一个很好的ML项目,它可以根据新数据预测价格。

数据集:房屋价格预测数据集 

https://www.cs.toronto.edu/~delve/data/boston/bostonDetail.html

5. MNIST数字分类机器学习项目

项目构想:MNIST数字分类python项目使机器能够识别手写数字。该项目对于计算机视觉可能非常有用。在这里,我们将使用MNIST数据集使用卷积神经网络训练模型。

数据集:MNIST数字识别数据集 

https://drive.google.com/file/d/1hJiOlxctFH3uL2yTqXU_1f6c0zLr8V_K/view

源代码:手写数字识别项目

https://data-flair.training/blogs/python-deep-learning-project-handwritten-digit-recognition/

6.使用机器学习预测股价

项目构想:有许多可用于股票市场价格的数据集。这个机器学习初学者的项目旨在根据上一年的数据预测股票市场的未来价格。

数据集:股票价格预测数据集

https://www.kaggle.com/c/two-sigma-financial-news/data

源代码:股票价格预测项目

https://data-flair.training/blogs/stock-price-prediction-machine-learning-project-in-python/

7.泰坦尼克号生存计划

项目构想:这将是一个有趣的项目,因为我们将预测某人是否会在泰坦尼克号飞船中幸存下来。对于这个初学者的项目,我们将使用泰坦尼克号数据集,其中包含幸存者和在泰坦尼克号飞船中死亡的人的真实数据。

数据集:《泰坦尼克号生存》数据集 

https://www.kaggle.com/c/titanic

8.葡萄酒质量检测项目

项目构想:在该项目中,我们可以构建一个界面来预测红酒的质量。它将使用葡萄酒的化学信息,并基于机器学习模型,它将为我们提供葡萄酒质量的结果。

数据集:葡萄酒质量数据集 

https://archive.ics.uci.edu/ml/datasets/wine+quality

9.假新闻检测项目

项目构想:虚假新闻像野火一样传播,这在这个时代是一个大问题。我们可以学习如何将假新闻与真实新闻区分开。我们可以使用监督学习来实现这样的模型。

数据集:检测虚假新闻数据集 

https://drive.google.com/file/d/1er9NJTLUA3qnRuyhfzuN0XUsoIC4a-_q/view

源代码:假新闻检测项目 

https://data-flair.training/blogs/advanced-python-project-detecting-fake-news/

到目前为止,如果对DataFlair提出的的机器学习项目有任何问题,欢迎留言。

10.竞赛练手项目

天池-零基础入门数据挖掘赛事
https://tianchi.aliyun.com/competition/entrance/231784/introduction

天池-零基础入门 cv 赛事

https://tianchi.aliyun.com/competition/entrance/531795/introduction

天池-零基础入门 nlp 赛事

https://tianchi.aliyun.com/competition/entrance/531810/introduction

中级机器学习项目

1.音乐流派分类机器学习项目

项目构想:该python机器学习项目的思想是开发一个机器学习项目,并自动对音频中的不同音乐流派进行分类。我们需要使用它们的频域和时域低级特征对这些音频文件进行分类。

源代码:音乐流派分类项目 

https://data-flair.training/blogs/python-project-music-genre-classification/

2.比特币价格预测器项目

项目构想:比特币价格预测器是一个有用的项目。区块链技术正在发展,并且有许多数字货币在上升。该项目将帮助你使用以前的数据预测比特币的价格。

数据集:比特币价格预测数据集 

https://www.kaggle.com/team-ai/bitcoin-price-prediction/version/1

3. Uber数据分析项目

项目构想:该项目可用于对超级数据执行数据可视化。该数据集包含纽约市中的450万个超级拾取器。为了分析行程,需要精美地表示很多数据,以便可以进一步改善业务。

数据集:Uber数据分析数据集 

https://drive.google.com/file/d/1emopjfEkTt59jJoBH9L9bSdmlDC4AR87/view

源代码:Uber数据分析项目 

https://data-flair.training/blogs/r-data-science-project-uber-data-analysis/

4.人格预测项目

项目构想:Myers Briggs类型指示器是一种个性类型系统,根据内向,直觉,思维和感知能力将一个人分为16个不同的个性。我们可以根据他们在社交媒体上发布的帖子的类型来确定其个性。

数据集:个性预测数据集 

https://www.kaggle.com/datasnaek/mbti-type

5. Xbox游戏预测项目

项目构想:人们在搜索时生成的数据可用于预测用户的兴趣。BestBuy消费电子公司已提供了来自用户的数百万次搜索的数据,我们将预测用户最有兴趣购买的Xbox游戏。这将用于向游客推荐游戏。

数据集:Xbox游戏预测数据集 

https://www.kaggle.com/c/acm-sf-chapter-hackathon-small/overview

6.信用卡欺诈检测项目

项目构想:使用卡进行大量交易的公司需要发现系统中的异常情况。该项目旨在建立信用卡欺诈检测模型。我们将使用交易及其标签作为欺诈或非欺诈来检测客户进行的新交易是否为欺诈。

数据集:信用卡欺诈检测数据集

https://drive.google.com/file/d/19BOhwz52NUY3dg8XErVYglctpr5sjTy4/view

源代码:信用卡欺诈检测项目

https://data-flair.training/blogs/data-science-machine-learning-project-credit-card-fraud-detection/

7.芭比与大脑项目

项目构想:芭比娃娃等儿童玩具具有一组预定义的单词,可以重复说。我们可以使用机器学习方法使芭比娃娃有一些头脑。当玩具可以用不同的句子理解和说话时,它会更加吸引人。这是一个出色的项目,将改善孩子们的学习过程。

8.使用机器学习进行客户细分

项目构想:客户细分是一种根据客户的购买历史,性别,年龄,兴趣等对客户进行细分的技术。获取此信息非常有用,以便商店可以在个性化营销方面获得帮助,并为客户提供相关的信息交易。在该项目的帮助下,公司可以运行特定于用户的活动并提供特定于用户的报价,而不是向所有用户广播相同的报价。

数据集:客户细分数据集

https://drive.google.com/file/d/19BOhwz52NUY3dg8XErVYglctpr5sjTy4/view

源代码:客户细分项目

https://data-flair.training/blogs/r-data-science-project-customer-segmentation/

在机器学习项目创意文章的下一部分,我们将为内行人士介绍一些高级项目创意。

高级机器学习项目

1.使用机器学习进行情感分析

项目构想:情感分析是分析用户情感的过程。我们可以将他们的情绪分为正面,负面或中性。了解如何进行情感分析是一个很棒的项目,并且如今已被广泛使用。这是最受欢迎的机器学习项目之一。其背后的原因是每家公司都试图了解客户的情绪,如果客户满意,他们会留下来。该项目可能显示出减少客户流失的途径。

数据集:情感分析数据集 

http://ai.stanford.edu/~amaas/data/sentiment/

源代码:情感分析项目

https://data-flair.training/blogs/data-science-r-sentiment-analysis-project/

2.安然调查项目

项目构想:安然公司(Enron)在2000年倒闭,但可提供数据进行调查。该数据库包含500,000名在公司工作的真实员工的电子邮件,因此数据对于执行数据分析非常有用,许多数据科学家都使用此数据集。

数据集:安然调查数据集 

https://www.cs.cmu.edu/~enron/

3.语音情感识别机器学习项目

项目构想:这是最好的机器学习项目之一。语音情感识别系统使用音频数据。它以语音的一部分作为输入,然后确定说话者以何种情绪说话。我们可以识别出不同的情绪,例如快乐,悲伤,惊讶,生气等。该项目可能有助于在与呼叫中心通话期间识别客户情绪。

数据集:语音情感识别数据集

https://drive.google.com/file/d/1wWsrN2Ep7x6lWqOXfr4rpKGYrJhWc8z7/view

源代码:语音情感识别项目

https://data-flair.training/blogs/python-mini-project-speech-emotion-recognition/

4.抓非法捕鱼项目

项目构想:这是一个有趣的机器学习项目。海洋上有许多船,船,不可能手动跟踪每个人的活动。这将是一个了不起的项目,它可以通过卫星和地理位置数据识别非法偷猎动物并捕捞捕鱼活动。Global Fishing Watch免费提供实时数据,可用于构建系统。

数据集:捕捉非法捕鱼数据集 

https://globalfishingwatch.org/map-and-data/

5.使用协同过滤的在线杂货推荐

项目构想:协作过滤是一项很棒的技术,可根据相似用户的反应来过滤出用户可能喜欢的项目。杂货店推荐系统将是一个使客户意识到自己想要的东西的好项目。

6.使用机器学习的电影推荐系统

项目构想:推荐系统无处不在,无论是在线购买应用程序,电影流媒体应用程序还是音乐流媒体。他们都根据目标客户推荐产品。电影推荐系统是增强你的作品集的绝佳项目。

数据集:电影推荐系统数据集 

https://drive.google.com/file/d/1Dn1BZD3YxgBQJSIjbfNnmCFlDW2jdQGD/view

源代码:电影推荐系统项目 

https://data-flair.training/blogs/data-science-r-movie-recommendation/

7.车牌自动识别系统

项目构想:该机器学习项目的目的是检测和识别车辆的牌照号,并读取印在牌照上的牌照号。这可能是用于安全扫描,流量监视等的良好应用程序。

源代码:自动车牌识别项目

https://techvidvan.com/tutorials/python-project-license-number-plate-recognition/

编辑:于腾凯,校对:林亦霖  

“干货学习,三连

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

2020 年度最佳的23个机器学习项目!(附源代码) 的相关文章

随机推荐

  • windows

    1 准备工作 准备U盘 格式化U盘 注意选择格式化的文件系统 可以鼠标右键C盘查看 然后将U盘格式化 好像是跟电脑引导模式相关UEFI gt NTFS 如果格式化的时候没有选对文件系统 那么在BIOS界面可能无法识别到U盘 进入官网下载制作
  • 04_kibana 7.4.2 安装和配置指南

    本文大纲 1 Kibana 的下载方式 1 官网直接下载 2 Linux 服务器直接下载 需要能够访问互联网的服务器 2 修改配置 3 kibana 的关闭和重启 首先 值得高兴的是kibana7 x 已经有官方中文的啦 更加方便我们的开发
  • WebGL系列 - 裁剪空间矩阵优化

    该系列仅为记录自己的学习相关知识 以 2d 的顶点着色器为例
  • 模型评估相关参数学习

    training process loss accurancy val loss val accurancy testing process classification report label predict digits 8 labe
  • 【服务器】交换机带外管理和带内管理

    一 交换机的带外管理是什么 在带外管理模式中 网络的管理控制信息与用户网络的承载业务信息在不同的逻辑信道传送 带外管理最大的优势在于 当网络出现故障中断时数据传输和管理都可以正常进行 不同的物理通道传送管理控制信息和数据信息 两者完全独立
  • Activiti 学习(二)—— Activiti 流程定义和部署

    概述 在这一节 我们将创建一个 Activit 工作流 并启动这个流程 主要包含以下几个步骤 定义流程 按照 BPMN 的规范 使用流程定义工具 用流程符号把整个流程描述出来 部署流程 把画好的流程定义文件 加载到数据库中 生成表的数据 流
  • No module named 'numpy.core._multiarray_umath'

    导入tensorflow后遇到No module named numpy core multiarray umath 原因是numpy的当前版本过低 解决办法 更新numpy的版本 命令行输入 pip install i https pyp
  • java if oracle,JAVA使ORACLE 实现DROP TABLE IF EXISTS的功能

    JAVA使ORACLE 实现DROP TABLE IF EXISTS的功能 ORACLE没有MYSQL等数据库的DROP TABLE IF EXISTS 使用起来非常不便 删表还要求表必须存在 不存在则删表报错 太麻烦了 如果能实现其他数据
  • 学习Spring必学的Java基础知识(8)----国际化信息

    b size x large 引述 size b 要学习Spring框架的技术内幕 必须事先掌握一些基本的Java知识 正所谓 登高必自卑 涉远必自迩 以下几项Java知识和Spring框架息息相关 不可不学 我将通过一个系列分别介绍这些J
  • MySql 查询方法总结

    一 示例数据 dept表 emp表 二 查询方法 1 內连查询 a 隐式内连 select xxx from xxx where 条件 b 显示内连 select xxx from xxx inner jion xxx on 条件 2 外连
  • IDEA 接口方法不能跳转到实体类实现方法的问题

    IDEA 接口方法不能跳转到实体类实现方法的问题 问题描述 原因分析 解决方案 总结 问题描述 没有跳入到实体类实现方法的I 向下的箭头图标 原因分析 原因极大可能是因为编辑器自带的代码高亮工具 Syntaxhighlighte 失效 以下
  • 版本号对比 -- Python实现

    相同位数版本号大小比较 1 def abc str1 str2 2 if str1 or str2 3 print 输入包含空字符串 请重新输入 4 return 输入包含空字符串 请重新输入 5 elif str1 str2 6 prin
  • Unity3D项目输出到iOS设备体验

    很久以前就听说过这个软件个了 当时觉得有cocos2d就够用了 开发一般的手机游戏应该不成问题了 后来还学习了一下cocos3d 最近突然想看一下这个传说中的Unity3D 安装上之后 里边自带有一个demo 点了一下播放按键 发现这个de
  • 半监督结点分类

    3 半监督结点分类 我们已经介绍过了一个简单但是灵活的可在图上进行有效信息传播的模型f X A 现在我们可以回过头来看半监督结点分类的问题了 就像本文的介绍中所简要概述的那样 我们可以通过在数据集X和基础图结构的邻接矩阵A上调整来我们的模型
  • netty权威指南学习笔记二——netty入门应用

    经过了前面的NIO基础知识准备 我们已经对NIO有了较大了解 现在就进入netty的实际应用中来看看吧 重点体会整个过程 按照权威指南写程序的过程中 发现一些问题 当我们在定义handler继承ChannelHanderAdapter时候
  • linux脚本

    程序后台运行 nohup java jar xxx jar gt hello log 后台运行java jar命令 并且将日志输出到hello log文件 防火墙 开启防火墙 systemctl start firewalld 开放指定端口
  • 子组件多次复用且传参到父组件时遇到的一些问题。

    问题描述 我们都知道 父子组件之间传参用props 子向父用 emit 兄弟间有bus 但是今天遇到个问题 A组件是一个selector选择器小组件 根据传参不同选择项目也不同 返回结果也不同 B组件中使用了4次A组件 传参都不一样 且需要
  • H5页面中添加微信公众号关注链接

    用下面地址做个链接 点击就会跳转到公众号关注页面 点击关注按钮 就能直接关注 https mp weixin qq com mp profile ext action home biz 替换公众号uin base6 wechat redir
  • CH10-图形图像处理

    目标 掌握常用绘图类的使用 能够绘制不同的图形 掌握Matrix类的使用方式 能够实现为图片添加特效的功能 掌握动画的使用 能够实现补间动画与逐帧动画的效果 图形图像在Android应用中会经常用到 如一些程序的图标 界面的美化等都离不开图
  • 2020 年度最佳的23个机器学习项目!(附源代码)

    关注后 星标 Datawhale 每日干货 每月组队学习 不错过 Datawhale干货 来源 大数据文摘 整理 数据派THU 本文约5300字 建议阅读10分钟 本文为你介绍23种机器学习项目创意 以获取有关该增长技术的真实经验 我们都知