AI圈最新深度学习量化算法!

2023-11-19

文章摘自AAAI21译者一元

量化交易和投资决策是复杂的金融任务,依赖于准确的股票选择。

目前深度学习学习的策略使用于股票的问题的方案面临两个重大局限。

  • 他们不直接优化利润方面的投资目标;
  • 将每只股票视为独立于其他股票,忽略了相关股票之间的丰富信号股票价格变动。

本文基于该局限性,将股票预测重新表述为一个学习排序问题,并提出了STHAN-SR,一种用于股票选择的神经超图结构,从而定制一种新的时空注意超图网络结构,

  • 通过联合建模股票相互依赖性及其价格的时间演变,根据利润对股票进行排序。

在三个市场上进行为期六年的实验,我们发现STHAN-SR显著优于最先进的神经股票预测方法。我们通过对STHAN-SR的空间和时间组件进行烧蚀和探索性分析来验证我们的设计选择,并证明其实用性。

目前深度学习用于股票投资的策略,存在两大问题:

1. 问题1

并不是直接对投资收益进行优化;

- 之所以出现这种差距,是因为股票预测通常是作为一项分类任务来预测股票走势(价格上涨、下跌或无重大变化)或作为一项回归任务来预测股票价格,而不是选择预期利润最大的股票 。

- 但是高的预测性能并不总是导致股票的最有利可图的选择。此类分类和回归优化的目的是为了提高价格变动的准确性或最小化预测股票收益的误差,而不一定是为了直接获得利润。

- 这一差距暗示了优化预测性能和优化股票选择以实现利润最大化之间的差距,并引导我们思考股票选择的新。

2. 问题2

将股票价格的波动认为是相互独立的,或者利用一个过度简化的股票市场模型,用一个由单个股票之间的成对关系组成的图,但实际上,这与真实的市场函数相反。

  • 股票是相互关联的,在股票之间复杂的高阶关系中存在着丰富的信号;
  • 可用的公司信息可用于识别可能影响其他股票价格的股票之间的联系,例如具有相同CEO或属于相同行业的股票。
    • 如下图所示:最近的C2019冠状病毒疾病爆发,我们观察到,属于旅行和运输等行业的公司股价下跌,而与医疗保健相关股票的股价上涨相反。

我们将股票预测表述为一个LTR问题,我们的模型直接针对盈利股票的排名进行优化。基于领域知识,我们将股票之间的高阶相互依存关系建模为使用三种不同类型的股票关系构建的超图。

STHAN-SR:: Spatio Temporal Hypergraph Attention Network,STHAN-SR在利润:回报率、风险调整方面均显著优于最新方法。

股票走势预测通常表述为回归和分类问题。传统金融模型侧重于技术分析,只依赖数字特征。

基于有效市场假说的较新模型被归类为基本面分析,并考虑了金融新闻、社交媒体等数字因素以外的股票影响因素。尽管这些模型取得了成功,这些方法的一个局限性是,它们假设股票运动彼此独立,这妨碍了它们学习相关股票研究潜在模式的能力。第二个主要限制是,以前的工作没有直接优化利润最大化,因为它们没有明确选择预期收入最高的顶级股票.

一项新的围绕使用基于图形的方法来表示股票之间的成对关系展开,使用元数据,例如:

  • 股票行业数据和公司CEO之间的链接(Sawhney et al.2020a);
  • (Kim et al.2019)提出了一种基于注意的图形神经网络用于股票运动预测。

他们表明,并非所有股票都具有同等的相关性,而且通常将大量成对股票关系分解会增加股票图中的噪声,从而降低预测性能。类似地,(Feng等人,2019b)用时间卷积扩充图卷积网络(GCN),并证明用股票间关系扩充时间股价演化方法的实用性。尽管在基于图形的股票运动预测方面取得了这些进步,但现有模型的一个简化之处是,它们假设股票以成对方式相关。以这种方式对本质上更好地表示为超图的股票数据进行分解会导致重要的高阶关系信息丢失。

超图学习由于能够从高阶关系中提取模式(Feng等人,2019c)。最近的工作(Zhang、Zou和Ma 2019)表明,由于信息丢失,将高阶关系分解为一组成对关系的传统方法表现不佳,而最近的方法,如深度超网络嵌入(Tu等人,2018)仅限于固定长度的超边,导致泛化性差。

我们将股票预测定义为一个LTR的问题,另:

这样对于每一天,我们都有一个排序的列表,排序越高的股票在第天对应的收益率就会越高,我们的目标是希望在每天对应的每个股票的排序预测的愈加准确。

1. 股票价格时间演变

历史股价已被证明是未来股票趋势的有力指标(Jeanblanc、Yor和Chesney,2009年),并在金融文献中广泛使用(Li等人,2020年;Kim等人,2019年)。我们使用前T个交易日的历史价格信息作为STHAN-SR的输入特征。

  • 我们计算每只股票的五个时间特征、1天收益率、5、10、20和30天移动平均数,它们代表每日、每周和每月的趋势。

2. 时间Attention

3. Hawkes Attention

Hawkes过程是一个时间点计数过程,它模拟了一段时间内事件到达的序列。每一个事件都“激发”了这一过程,因为随后到达的机会会增加一段时间。

  • 在股票市场中,诸如盈利通知单的发布、危机情况等事件会影响未来价格,并且这种影响会随着时间的推移而衰减。

4. 空间股票超图特征抽取

股票超图构建

5. 超图卷积

6. 超图Attention

7. LTR和网络优化

本篇文章 我们将股票预测转化为一种学习,通过基于领域知识的超图对问题进行排序和建模。我们提出了STHAN-SR,一种用于股票预测的神经超图模型。我们提出了时间霍克斯注意,并用空间超图卷积和注意来补充它,以捕获股票市场中的时空依赖性。STHAN-SR在六年内的三个全球市场的利润显著优于最先进的方法。通过烧蚀和定性实验,我们探讨了STHAN-SR的有效性,并阐述了其在算法交易中的实际适用性。我们提出的模型可以推广到跨不同领域问题的超图时空学习,如流量预测和基于会话的推荐系统。在未来,我们的目标是探索时间演化超图,以捕捉动态市场相关性,并纳入在线新闻和社交媒体等其他数据源。

参考文献

AI圈最新DL炒股算法!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

AI圈最新深度学习量化算法! 的相关文章

随机推荐

  • Python Excel操作模块XlsxWriter之写入worksheet.write()

    worksheet write wirte row col args 向工作表单元格写入普通的数据 参数 row 单元格所在的行 索引从0开始计数 col 单元格所在的列 索引从0开始计数 args 传递到子方法的附加参数诸如数字 字符串
  • 端口介绍

    文章来源 https m toutiaocdn com group 6680437870504706572 app news article timestamp 1563010542 req id 201907131735410100230
  • Linux lvm管理讲解及命令

    作者 小刘在C站 个人主页 小刘主页 每天分享云计算网络运维课堂笔记 努力不一定有回报 但一定会有收获加油 一起努力 共赴美好人生 夕阳下 是最美的绽放 树高千尺 落叶归根人生不易 人间真情 前言 目录 一 lvm管理 1 Logical
  • mysql sql优化方法_一个MySql Sql 优化技巧分享

    有天发现一个带inner join的sql 执行速度虽然不是很慢 0 1 0 2 但是没有达到理想速度 两个表关联 且关联的字段都是主键 查询的字段是唯一索引 sql如下 SELECTp item token p item product
  • 如何在小程序实现人脸识别的方法

    1 获取用户授权 在小程序中实现人脸识别需要先获取用户的授权 用户需要允许小程序访问他们的摄像头和图像数据 这样才能进行人脸识别 2 采集图像数据 在获得用户授权后 小程序可以通过摄像头或者相册功能 采集用户的面部图像数据 3 使用图像处理
  • Java-private构造方法

    private 构造函数一般用于Singleton模式 指的是整个应用只有本类的一个对象 一般这种类都有一个类似getInstance 的方法 class A public String name 构造函数限定为private 不可以直接创
  • 标准差(Standard Deviation), 标准误差(Standard error),变异系数 (Coefficient of Variance )的区别与联系

    标准差 Standard Deviation 中文环境中又常称均方差 是离均差平方的算术平均数的平方根 用 表示 标准差是方差的算术平方根 标准差能反映一个数据集的离散程度 平均数相同的两组数据 标准差未必相同 标准误差 Standard
  • 学习Flask之Flask-Login 用户会话管理

    Flask Login 用户控制用户会话管理 简单点说 就是控制登录 如果是自己写的登录系统 一般都是通过操作session 然后后台根据session 来判断权限 Flask Login 就是负责这部分 直接开始 安装 pip insta
  • System.Data.OracleClient 需要 Oracle 客户端软件 version 8.1.7 或更高版本

    同学的电脑连接实验室的服务器时出现 System Data OracleClient 需要 Oracle 客户端软件 version 8 1 7 或更高版本 而我自己的电脑可以轻松连接服务器的数据库 首先 实验室用的是Oracle 12c
  • 力扣 942. 增减字符串匹配 双指针解法C++

    给定只含 I 增大 或 D 减小 的字符串 S 令 N S length 返回 0 1 N 的任意排列 A 使得对于所有 i 0 N 1 都有 如果 S i I 那么 A i lt A i 1 如果 S i D 那么 A i gt A i
  • TensorRT(11):python版本序列化保存与加载模型

    TensorRT系列传送门 不定期更新 深度框架 TensorRT 文章目录 一 序列化保存模型 二 反序列化加载模型 三 完整代码 楼主曾经在TensorRT 7 python版本使用入门一文中简要记录了python版本是序列化与反序列化
  • 成为编程高手的二十二条军规

    1 大学生活丰富多彩 会令你一生都难忘 但难忘有很多种 你可以学了很多东西而难忘 也会因为什么都没学到而难忘 2 计算机专业是一个很枯燥的专业 但即来之 则安之 只要你努力学 也会发现其中的乐趣的 3 记住 万丈高楼平地起 基础很重要 尤其
  • 数据挖掘:数据(数据对象与属性类型)

    一 概述 现实中的数据一般有噪声 数量庞大并且可能来自异种数据源 数据集由数据对象组成 一个数据对象代表一个实体 数据对象 又称样本 实例 数据点或对象 数据对象以数据元组的形式存放在数据库中 数据库的行对应于数据对象 列对应于属性 属性是
  • WIN10下怎么找到MYSQL数据库中存储数据的位置。

    版权声明 本文为博主原创文章 遵循 CC 4 0 BY SA 版权协议 转载请附上原文出处链接和本声明 本文链接 https blog csdn net qq 36098284 article details 79841920 今天我想找到
  • C++中Template的用法

    模板 Template 指C 程序设计设计语言中采用类型作为参数的程序设计 支持通用程序设计 C 的标准库提供许多有用的函数大多结合了模板的观念 如STL以及IO Stream 函数模板 函数模板定义一族函数 template1 cpp i
  • LDSC:连锁不平衡回归分析

    欢迎关注 生信修炼手册 LDSC全称如下 linkage disequilibrium score regression 简称LDSR或者LDSC 在维基百科中 对该技术进行了简单介绍 通过GWAS分析可以识别到与表型相关的SNP位点 然而
  • Kettle同步表数据null处理

    kettle同步数据时会将空字符串 自动转换为 null 如果表字段非空则会报错 解决方案如下 方案一 kettle菜单栏 编辑 编辑kettle properties文件 配置项 KETTLE EMPTY STRING DIFFERS F
  • 制作及运行 WebUI(NovelAI)Docker 镜像

    准备 Novel AI 模型文件 下载地址 magnet xt urn btih 5bde442da86265b670a3e5ea3163afad2c6f8ecc 只需要部分下载其中的文件 必须的文件 文件 stableckpt anime
  • Node.js知识点详解(一)基础部分

    模块 Node js 提供了exports 和 require 两个对象 其中 exports 是模块公开的接口 require 用于从外部获取一个模块的接口 即所获取模块的 exports 对象 接下来我们就来创建hello js文件 代
  • AI圈最新深度学习量化算法!

    文章摘自AAAI21 译者 一元 量化交易和投资决策是复杂的金融任务 依赖于准确的股票选择 目前深度学习学习的策略使用于股票的问题的方案面临两个重大局限 他们不直接优化利润方面的投资目标 将每只股票视为独立于其他股票 忽略了相关股票之间的丰