腾讯广告算法大赛冠军、Kaggle Grandmaster倾力打造,涵盖Kaggle、阿里天池等赛题...

2023-11-17

随着互联网时代的到来,以及计算机硬件性能的提升,人工智能在近几年可以说是得到了爆发式的增长。互联网时代带来了大量的信息,这些信息是名副其实的大数据。另外,性能极佳的硬件也使得计算机的计算能力大大增强,这二者结合到一起,人工智能的蓬勃兴盛就变成了自然而然的事情。机器学习作为一种传统的、可解释性较强的算法,在人工智能三驾马车之算法中也占有一席之地。

一本《机器学习算法竞赛实战》应运而生,意在帮助机器学习初学者通过实战的方法从虽然优美但是略显枯燥的各种公式和理论当中脱离出来,感受机器学习在实际应用中的奥秘,而竞赛则是一种最特殊的实战。

算法竞赛时代

2010 年,全球著名算法竞赛平台 Kaggle 举办了第一场竞赛 Forecast Eurovision Voting,奖金为 1000 美元。

2015 年,国内第一场算法竞赛在天池举办,比赛题目是阿里移动推荐算法,奖金为 30 万元人民币,吸引了 7000 多人参加。虽然国内的算法竞赛起步时间晚于国外,但从 2015 年开始,在全球举办的一共 1000 多场赛事中,中国就举办了 400 多场,并且场次的年均增长率高达 108.8%,累计有超过 120 万人参加,奖金累计达到 2.8 亿元人民币。在算法竞赛的举办场次拥有如此高增长率的情况下,其技术价值、业务价值和创新价值自然不容小觑。

对于有志于进军机器学习相关领域从事研究或者相关工作的初学者来说,竞赛是性价比极高的一个实战选择,可以说是零门槛,任何人都能参加。

易于学习的竞赛宝典

对于想参加机器学习竞赛的初学者来说,一本内容友好的图书极其重要,可以少走很多弯路。这本《机器学习算法竞赛实战》合理地规划了章节架构,作者们除了仔细的讨论外,还采纳了国内多名顶尖竞赛选手的建议,深入剖析算法的本质内容,还结合多个领域模块进行了实战讲解。全书分为五个部分,作者还给每部分都取了一个名字。

PART.

01

磨刀事半,砍柴功倍

第一部分以算法竞赛的通用化流程为主,介绍竞赛中各个部分的核心内容和具体工作,且每章都配有具体的实战部分,以便加深理解。

PART.

02

物以类聚,人以群分

第二部分主要介绍用户画像相关的问题,构建完善的标签体系是用户画像的核心,也是解决用户画像类赛题的关键,比如个性化推荐和金融风控等问题都需要以用户画像作为支撑。为了帮助读者加快对此类竞赛问题的学习、理解,会讲解具体的竞赛案例,即 Kaggle 平台的 Elo Merchant Category Recommendation。

1bbf566d079e4c8e24c83481f84074cf.png

(题目背景:想象一下,当你在一个不熟悉的地方饿着肚子想要找好吃的东西时,你是不是会得到基于你的个人喜好而被专属推荐的餐馆,且该推荐还附带着你的信用卡提供商为你提供的附近餐馆的折扣信息。

目前,巴西最大的支付品牌之一 Elo 已经与商家建立了合作关系,以便向顾客提供促销或折扣活动。但这些促销活动对顾客和商家都有益吗?顾客喜欢他们的活动体验吗?商家能够看到重复交易吗?要回答这些问题,个性化是关键。

Elo 建立了机器学习模型,以了解顾客生命周期中从食品到购物等最重要方面的偏好。但到目前为止,那些学习模型都不是专门为个人或个人资料量身定做的,这也就是这场竞赛举办的原因。

在这场竞赛中,需要参赛者开发算法,通过发现顾客忠诚度的信号,识别并为个人提供最相关的机会。你的意见将改善顾客的生活,帮助 Elo 减少不必要的活动,为顾客创造精准正确的体验。)

PART.

03

以史为鉴,未来可期

第三部分以时间序列预测问题为主,先讲述这类问题的常见解题思路和技巧,然后分析两个具体的实战案例,分别是天池平台的全球城市计算 AI 挑战赛和Kaggle 平台的Corporación Favorita Grocery Sales Forecasting。

17dfd425cd1915086a0957edb0d2f4d1.png

(题目背景:在实体杂货店里,销量预测和顾客采购量之间的关系总是很微妙。如果销量预测得多,而顾客采购得少,那么杂货店的商品就会积压过多,尤其对易腐商品的影响较大;如果销量预测较少,而顾客采购量较大,那么商品很快就会卖光,短时间内顾客的体验会变差。 

随着零售商不断增加新地点、新产品,以及季节性口味的变化多样和产品营销的不可预测, 问题变得更加复杂。位于厄瓜多尔的大型杂货零售商 Corporación Favorita 也非常清楚这点,其经营着数百家超市,售卖的商品超过 20 万种。

于是 Corporación Favorita 向 Kaggle 社区提出了挑战,要求其建立一个可以准确预测商品销量的模型。Corporación Favorita 目前依靠主观预测来备份数据,很少通过自动化工具执行计划, 他们非常期待通过机器学习实现在正确的时间提供足够正确的商品,来更好地让顾客满意。)

PART.

04

精准投放,优化体验

计算广告相关的业务大多是很好的竞赛题目,第四部分主要介绍了计算广告的核心技术和业务,包括广告召回、广告排序和广告竞价。实战案例部分则包括两道赛题,分别是 2018 腾讯广告算法大赛——相似人群拓展,以及 Kaggle 平台的 TalkingData AdTracking Fraud Detection Challenge。

PART.

05

听你所说,懂你所写

第五部分基于自然语言处理相关的内容进行讲解,包括常见任务和常见技术,实战案例部分是 Kaggle 平台上的经典竞赛 Quora Question Pairs。

这本书可以说是算法竞赛领域一本系统性介绍竞赛的书,不仅包含竞赛的基本理论知识,还结合多个方向和案例详细阐述了竞赛中的上分思路和技巧。

本书还附赠读书思维导图,轻松定位学习要点。

284a33ececa4fd37c92498f746d0c32d.png

本书特色

1

腾讯广告算法大赛两届冠军、Kaggle Grandmaster倾力打造

2

赛题案例来自 Kaggle、阿里天池、腾讯广告算法大赛

3

按照问题建模、数据探索、特征工程、模型训练、模型融合的步骤讲解竞赛流程

适合谁读

  • 对算法竞赛感兴趣的人。兴趣是最大的驱动力,为了让算法竞赛变得更加有趣和更加多样性,本书增加了很多扩展与探索性的内容,从多个方向、多个领域进行介绍和实战。

  • 想要研究机器学习或深度学习算法实战的人。实战的最佳方式之一是参加一场算法竞赛,加深对理论知识的理解,这也是本书的核心思想。

  • 计算机相关专业的人。机器学习或深度学习算法作为目前计算机行业一个火热的就业方向,值得去深入研究。本书提供了很好的实战讲解,帮助读者知其然,并知其所以然。

76670eef566f3f4e6d120ce09a0357fa.png

《机器学习算法竞赛实战》

王贺 刘鹏 钱乾 著

本书是算法竞赛领域一本系统介绍竞赛的图书,书中不仅包含竞赛的基本理论知识,还结合多个方向和案例详细阐述了竞赛中的上分思路和技巧。

全书分为五部分:第一部分以算法竞赛的通用流程为主,介绍竞赛中各个部分的核心内容和具体工作;第二部分介绍了用户画像相关的问题;第三部分以时间序列预测问题为主,先讲述这类问题的常见解题思路和技巧,然后分析天池平台的全球城市计算 AI 挑战赛和 Kaggle 平台的Corporación Favorita Grocery Sales Forecasting;第四部分主要介绍计算广告的核心技术和业务,包括广告召回、广告排序和广告竞价,其中两个实战案例是 2018 腾讯广告算法大赛——相似人群拓展和Kaggle 平台的TalkingData AdTracking Fraud Detection Challenge;第五部分基于自然语言处理相关的内容进行讲解,其中实战案例是 Kaggle 平台上的经典竞赛 Quora Question Pairs。

作者简介

王贺(鱼遇雨欲语与余),现任职于小米商业算法部,从事应用商店广告推荐的研究和开发。从 2018 年至 2020 年多次参加国内外算法竞赛,共获得 5 次冠军和 5 次亚军,是 2019 年和 2020 年腾讯广告算法大赛的冠军。毕业于武汉大学计算机学院,硕士学位,研究方向为图数据挖掘。

刘鹏,华为技术有限公司算法工程师,从事电信运营商和智能运维领域的算法研究和开发工作。2016 年本科毕业于武汉大学数学基地班,保研至中国科学技术大学自动化系,硕士期间研究方向为复杂网络与机器学习,2018 年起多次获得机器学习相关竞赛奖项。

钱乾,数程科技大数据技术负责人,工作方向为物流领域的智能算法应用。本科就读于美国佐治亚理工大学,研究方向包括机器学习、深度学习、自然语言处理等。

目录抢先看

(向右划动查看)

ecf716908d452414a6850177f14b781e.png

6fade8eb81b36ace7dc088be0cfd3440.png

4eff0ee226011609aa24a70a484bb73e.png

c348f969668fda022b1ada554d80d5cd.png

d2f6498693703bad20db7b86d80722af.png

9ae6d3d237b521b1740b9a177075fd2b.png

56619d62b97e20fca0b96682d35cce32.png

文末福利

小伙伴们本期一起来聊聊算法竞赛吧!参加过算法竞赛的伙伴们来分享一下自己的准备经验。正在准备参加竞赛的伙伴们来说说自己遇到的问题。我们会在精选留言中选出 3 位获得赠书。留言截至:2021.9.25。

☟☟ 京东购买

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

腾讯广告算法大赛冠军、Kaggle Grandmaster倾力打造,涵盖Kaggle、阿里天池等赛题... 的相关文章

随机推荐

  • oracle 碎片是什么意思,Oracle碎片整理全面解析

    Oracle 作为一种大型数据库 广泛应用于金融 邮电 电力 民航等数据吞吐量巨大 计算机网络广泛普及的重要部门 对于系统管理员来讲 如何保证网络稳定运行 如何提高数据库性能 使其更加安全高效 就显得尤为重要 作为影响数据库性能的一大因素
  • IRP的同步问题

    转载自 http zhan renren com debugman tagId 178558 page 2 checked true 一 前言 对设备的任何操作都会最终转化为IRP请求 而IRP一般都是由操作系统异步发送的 异步处理IRP有
  • OpenCV(三十三):计算轮廓面积与轮廓长度

    1 介绍轮廓面积与轮廓长度 轮廓面积 Contour Area 是指轮廓所包围的区域的总面积 通常情况下 轮廓面积的单位是像素的平方 轮廓长度 Contour Length 又称周长 Perimeter 表示轮廓的闭合边界的长度 轮廓的边界
  • 搞懂clientHeight、offsetHeight、scrollHeight、offsetTop、scrollTop的区别

    https juejin cn post 7018372558999257102
  • Linux系统 Ubuntu18.04安装的详细教程(提供18.04ubuntu镜像)

    文章目录 一 镜像安装 二 vim更新 gcc ifconfig下载 三 共享文件夹设置 设置 使用 测试共享文件夹是否能使用 这步可以省略 四 另外 虚拟机名称 全名 用户名 镜像文件下载 链接 https pan baidu com s
  • 心情不美丽,爬了一些美图,独自欣赏!

    小屌丝 鱼哥 咋了 心情不美丽 小鱼 嗯 小屌丝 晚上撸串去 小鱼 不 小屌丝 蹦迪 小鱼 不 小屌丝 喝酒 小鱼 不 小屌丝 猎艳 小鱼 于是乎 一段代码上来 某网站的美女图片被下载下来 直接上代码 coding utf 8 auth c
  • js中一些常用的正则

    let reg new RegExp 电话号码 let reg 1 35789 d 9 身份证号 let reg 1 9 d 16 dX d 17 d X 18 65年龄 let reg 18 19 2 5 0 9 6 0 5 密码校验 d
  • 数据库分组排序和优化策略

    数据库分组排序和优化策略 1 分组排序 查询每个部门的最高平均工资 select deptno avg sal from emp group by deptno order by avg sal limit 0 1 查询到平均工资大于200
  • Burpsuite xssvalidator测试工具使用方法

    一 安装方法 Extend搜索xss可以找到该工具 选择后点安装就行 下载phantomjs 2 1 1 windows 然后cmd终端里执行 phantomjs exe xss js 开启后是这样的 二 使用测试 打开一个有xss的网页测
  • iPhone手机UDID获取方法

    UDID iOS设备的唯一识别码 每台iOS设备都有一个独一无二的编码 这个编码 就称为识别码 也叫做UDID Unique Device Identifier 一 通过Xcode查看 手机连接电脑 打开Xcode 选择window gt
  • 理解文本编码,ASCII、Unicode、UTF8、字节序和乱码-word打开是乱码

    原文网址提示有风险 基础知识 在计算机的内部 信息都是以二进制的方式存储的 二进制的一位 bit 可以表示0和1 位也叫做比特 位作为单位太小 为了便于使用 通常使用字节 byte 来表示二进制 一个字节有8位 可以表示256种 2的8次方
  • Docker+Jenkins+Golang 持续集成交付实战

    最近因公司发展需要 增加了一些go语言开发 对项目要求使用jenkins go docker自动部署上线 一 安装jenkins 1 安装Jenkins 详情见centos使用docker搭建jenkins jenkins使用方法见jenk
  • 使用face_recognition(一)人脸识别

    关于使用face recognition 安装方面还是有些坑的 之前用的是python3 5 pip安装出错 需要dlib什么的 按照网上的教程弄 还是有问题 搞了一天搞不定 后来看到说用python3 6比较简单 就换了个版本 结果pip
  • Ubuntu 14.04升级openssh7.7p1

    安装流媒体kurento 指定操作系统是Ubuntu 14 04 用户最近安全漏洞扫描 Ubuntu主机的ssh版本太低 OpenSSH 6 6 1p1 需要需要对该主机的SSH版本进行升级 准备升级的安全包 本次升级我准备了三个文件 op
  • 【学术探讨】万能密码原理剖析

    作者主页 士别三日wyx 作者简介 CSDN top100 阿里云博客专家 华为云享专家 网络安全领域优质创作者 推荐专栏 对网络安全感兴趣的小伙伴可以关注专栏 网络安全入门到精通 万能密码 顾名思义 就是可以 登录任意网站 的账号和密码
  • ORA-28040: 没有匹配的验证协议 问题解决

    出现这类问题 是因为 jar包不匹配造成 更换ojdbc jar包可以解决 下载ojdbc7 jar 用以前的jar包会出问题 以前的jar包会出现ora 28040 没有匹配的验证协议 项目使用的 ojdbc14报错 更换oidbc6解决
  • linux环境文件或者文件夹打包

    1 linux zip压缩 压缩当前文件夹下所有文件 压缩为a zip 命令行的方法是怎样 常用格式 zip r fileName zip 文件夹名 1 把 home目录下面的data目录压缩为data zip zip r data zip
  • java for循环删除元素_JAVA中循环删除list中元素的方法总结

    JAVA中循环遍历list有三种方式for循环 增强for循环 也就是常说的foreach循环 iterator遍历 1 for循环遍历list for int i 0 i if list get i equals del list rem
  • 第十二届蓝桥杯 ——左孩子右兄弟

    问题描述 对于一棵多叉树 我们可以通过 左孩子右兄弟 表示法 将其转化成一棵二叉树 如果我们认为每个结点的子结点是无序的 那么得到的二叉树可能不唯一 换句话说 每个结点可以选任意子结点作为左孩子 并按任意顺序连接右兄弟 给定一棵包含 N N
  • 腾讯广告算法大赛冠军、Kaggle Grandmaster倾力打造,涵盖Kaggle、阿里天池等赛题...

    随着互联网时代的到来 以及计算机硬件性能的提升 人工智能在近几年可以说是得到了爆发式的增长 互联网时代带来了大量的信息 这些信息是名副其实的大数据 另外 性能极佳的硬件也使得计算机的计算能力大大增强 这二者结合到一起 人工智能的蓬勃兴盛就变