时间序列数据和 LSTM 中分类的实体嵌入

2023-12-22

我正在尝试解决时间序列问题。简而言之，对于每个客户和材料（SKU代码），我过去都下了不同的订单。我需要建立一个模型来预测每个客户和材料下一次订单之前的天数。

我想做的是在 Keras 中构建一个 LSTM 模型，其中对于每个客户和材料，我有 50 个最大填充的历史时间步长，并且我使用数字的混合（自上一个订单以来的天数、AVG过去 60 天内订单之间的天数等...）和分类特征（SKU 代码、客户代码、SKU 类型等...）。

对于分类，我尝试使用流行的实体嵌入技术。我从 Github 上发布的一个示例开始，该示例没有使用 LSTM（它使用 input_lengh = 1 进行嵌入），并将其推广到可以处理更高输入的嵌入，我可以将其提供给 LSTM。

下面是我的代码。

from keras.regularizers import l2,l1

input_models=[]
output_embeddings=[]
numerics = ['int16', 'int32', 'int64', 'float16', 'float32', 'float64']

## features is this list features =['CAT_Cliente_le','CAT_Famiglia_le','CAT_Materiale_le','CAT_Settimana','CAT_Sotto_Famiglia_le','NUM_Data_diff_comprato','NUM_Data_diff_comprato_avg','NUM_Data_diff_comprato_avg_sf','NUM_Qty','NUM_Rank']

for categorical_var in np.arange(len(features)-5):    

 #Name of the categorical variable that will be used in the Keras Embedding layer
 cat_emb_name= features[categorical_var]+'_Embedding'

 # Define the embedding_size, max size is 10
 no_of_unique_cat = dataset_train.loc[:,features[categorical_var]].nunique()
 embedding_size = int(min(np.ceil((no_of_unique_cat+1)/2), 10 ))

 #One Embedding Layer for each categorical variable
 input_model = Input(shape=(MAX_TIMESTEP,)) 
 output_model = Embedding(no_of_unique_cat+1, embedding_size, name=cat_emb_name,input_length=MAX_TIMESTEP,mask_zero=True)(input_model)

 #Appending all the categorical inputs
 input_models.append(input_model)

 #Appending all the embeddings
 output_embeddings.append(output_model)

#Other non-categorical data columns (numerical). I have 5 of them
input_numeric = Input(shape=(MAX_TIMESTEP,len(['1','2','3','4','5']),))
mask_numeric = Masking(mask_value=0., input_shape=(MAX_TIMESTEP,5))(input_numeric)
input_models.append(input_numeric)
output_embeddings.append(mask_numeric)

output = Concatenate(axis=2)(output_embeddings)

output = LSTM(
           units= 25,
           input_shape=(MAX_TIMESTEP, 4),
           use_bias=True,
           kernel_initializer=he_normal(seed=14),
           recurrent_initializer=he_normal(seed=14),
           unit_forget_bias = True,
           return_sequences=True)(output)

output = TimeDistributed(Dense(1))(output)

model = Model(inputs=input_models, outputs=output)
model.compile(loss='mae', optimizer=SGD(lr=0.2, decay=0.001, momentum=0.9, nesterov=False),
          #clipvalue=0.75), epsilon=None, decay=0.00000, amsgrad=False),
          metrics=['mape'])`

我观察到： -模型仅通过数字特征表现出良好的性能 -添加分类对提高性能没有任何帮助（我至少希望模型通过生成非常具体的规则而过度拟合，例如客户 X 在 5 天后在 Z 周订购了材料 Y），但这永远不会发生

我的问题是，像这样在 LSTM 中使用实体嵌入在概念上是否存在错误？我应该改变什么吗？

预先非常感谢

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

时间序列数据和 LSTM 中分类的实体嵌入的相关文章

InvalidArgumentError：loc 处需要可广播形状（未知）

背景我对 Python 和机器学习完全陌生我只是尝试根据在互联网上找到的代码建立一个 UNet 并希望将其适应我正在处理的情况当试图 fit将UNet训练数据我收到以下错误 InvalidArgumentError required
基于在线鲁棒主成分分析（RPCA）模型，结合长短期记忆（LSTM）循环网络的商品需求预测（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码数据
如何将 Bert 嵌入提供给 LSTM

我正在研究用于文本分类问题的 Bert MLP 模型本质上我试图用基本的 LSTM 模型替换 MLP 模型是否可以创建带有嵌入的 LSTM 或者最好创建一个带有嵌入层的 LSTM 更具体地说我很难尝试创建嵌入矩阵因此我可以使用
加载张量板失败

错误无法启动 TensorBoard 以 1 退出标准错误的内容回溯最近一次调用最后一次文件 home arshad anaconda3 bin tensorboard 第 10 行位于 sys exit run main 文件
从Python API而不是saved_model_cli中提取（或设置）输入/输出TF张量名称信息

我使用 Keras TF2 5 训练了一个简单的模型并将其保存为已保存模型 tf saved model save my model path to model 如果我通过检查它 saved model cli show dir path
TfLite LSTM 模型

我还没有找到任何可以使用的预训练 lstm 模型 tfLite 是否提供了任何预训练的 lstm 模型我尝试创建 tflite 模型但在转换时遇到问题您能提供创建 tfLite 模型的确切脚本吗 tfLite 是否有任何用于创建最新版
检查目标时出错：预期 time_distributed_5 有 3 个维度，但得到形状为 (14724, 1) 的数组

尝试建立单输出回归模型但最后一层似乎有问题 inputs Input shape 48 1 lstm CuDNNLSTM 256 return sequences True inputs lstm Dropout dropouts 0 l
张量流中 LSTM 的正则化

Tensorflow 提供了一个很好的 LSTM 包装器 rnn cell BasicLSTM num units forget bias 1 0 input size None state is tuple False activatio
keras.backend的clear_session()方法没有清理拟合数据

我正在研究不同类型数据质量的拟合精度结果的比较好数据是特征值中没有任何NA的数据坏数据是特征值中具有 NA 的数据坏数据应该通过一些值修正来修复作为值修正它可能会用零或平均值替换 NA 在我的代码中我尝试执行多个拟合过程
seq2seq 中的 TimeDistributed(Dense) 与 Dense

鉴于下面的代码 encoder inputs Input shape 16 70 encoder LSTM latent dim return state True encoder outputs state h state c encod
__init__() 收到意外的关键字参数“inputs”

class Model def init self self model Sequential self model add Conv2D 24 3 2 valid input shape 75 75 3 self model add Ba
Python - 基于 LSTM 的 RNN 需要 3D 输入？

我正在尝试构建一个基于 LSTM RNN 的深度学习网络这是尝试过的 from keras models import Sequential from keras layers import Dense Dropout Activatio
无法挤压 dim[1]，预期维度为 1，得到 499

我正在尝试制作一个自动编码器但遇到了上述错误查看 Stack Exchange 上的其他帖子并没有帮助这是完整的错误 InvalidArgumentError Can not squeeze dim 1 expected a dime
如何获取基于Keras的LSTM模型中每个epoch的一层权重矩阵？

我有一个基于 Keras 的简单 LSTM 模型 X train X test Y train Y test train test split input labels test size 0 2 random state i 10 X t
在 Keras 中使用 Subtract 层

我正在 Keras 中实现所描述的 LSTM 架构here http nlp cs rpi edu paper multilingualmultitask pdf 我认为我已经非常接近了尽管我在共享层和特定语言层的组合方面仍然存在问题这
Tensorflow 2：如何在 GPU 和 CPU 之间切换执行？

In tensorflow1 X 独立keras2 X 中我曾经使用以下代码片段在 GPU 上的训练和 CPU 上运行推理之间切换由于某种原因我的 RNN 模型速度要快得多 keras backend clear session de
尝试理解 Pytorch 的 LSTM 实现

我有一个包含 1000 个示例的数据集其中每个示例都有5特征 a b c d e 我想喂7LSTM 的示例以便它预测第 8 天的特征 a 阅读 nn LSTM 的 Pytorchs 文档我得出以下结论 input size 5 hid
PyTorch LSTM：运行时错误：无效参数 0：张量的大小必须匹配，维度 0 除外。维度 1 为 1219 和 440

我有一个基本的 PyTorch LSTM import torch nn as nn import torch nn functional as F class BaselineLSTM nn Module def init self su
ValueError：无法解释优化器标识符：

我尝试运行此代码但出现此错误请任何人过去也遇到过相同的错误 sgd optimizers SGD lr 0 01 decay 1e 6 momentum 0 9 nesterov True 编译模型 model compile opti
如何设置 1dCNN+LSTM 网络（Keras）的输入形状？

我有以下想法要实施 Input gt CNN gt LSTM gt Dense gt Output 输入有 100 个时间步长每个步长有一个 64 维特征向量 A Conv1D层将在每个时间步提取特征 CNN 层包含 64 个滤波器每个

随机推荐

如何在Linux中做一个假的鼠标滚轮移动

我正在尝试模拟键盘和鼠标事件我已经成功制作了假键盘 keydown keyup 假鼠标按钮按下向上和假鼠标移动但我没有找到如何做假鼠标滚轮移动有人可以向我解释一个在 C 中执行此操作的简单方法吗鼠标移动和鼠标按钮按下 Displa
在Python中，我可以根据其他参数指定函数参数的默认值吗？

假设我有一个带有两个参数的 python 函数但我希望第二个参数是可选的默认值是作为第一个参数传递的任何参数所以我想做这样的事情 def myfunc arg1 arg2 arg1 print arg1 arg2 但那是行不通的我
将 json 反序列化为匿名类型列表

我有一个 json 如下 a b c d a e c f a g c h 现在我想将其反序列化为匿名类型 foo 的对象列表 var foo new a string empty c string empty 代码是 ServiceStac
Angular 清除子表单数据并重置验证

我正在尝试创建一个子表单 div 使用 Angular js 有一种数据有很多字段标题可用日期 Price 都有required对他们进行验证一旦我提交了该数据我将对其进行所需的操作但我想重置子表单以便所有字段都不脏并且表单在
Android Aidl错误sdk构建工具29.0.0

我升级了 Android 应用程序以开始使用 SDK 29 和构建工具 29 0 0 在 Android Studio 中编译时出现错误进程命令 C Users ma fo AppData Local Android Sdk build
EmguCV SURF - 确定匹配的点对

我目前正在修改 EmguCV 版本 3 0 0 2157 SurfFeature 示例在这里看到的 https github com neutmute emgucv blob master Emgu CV Example SURFFeat
当列包含因子时，使用 OR 对数据框进行子集化

我想在 R 中创建一个数据框的子集该子集基于一列因子中的一个或另一个值但似乎我无法使用与因子值 Example fake data x lt sample 1 100 9 nm lt c a a a b b b c c c fake
numpy 数组的最大大小是多少？

我正在尝试创建一个包含 2 708 000 000 个元素的矩阵当我尝试创建这个大小的 numpy 数组时它给了我一个值错误有什么方法可以增加最大数组大小吗 a np arange 2708000000 ValueError Trac
当只有用户选择特定复选框时，如何显示 jquery 复选框列表的选定项目以及标签
当文本长于标签大小时调整标签的文本大小？

我有一个显示文件名的标签我必须设置AutoSize标签的False用于设计因此当文件名文本长于标签大小时它会像图片中那样被剪切 label1 Size new Size 200 32 label1 AutoSize false 当文
移动数据输入 - 移动友好的数据网格

我面临以下挑战我需要使用 html5 和 js 将桌面订单输入 Web 应用程序重新设计到移动设备我正在尝试找到一种正确的方式来输入订单因为移动设备与桌面设备有很大不同我需要能够将自动完成和图像添加到数据网格中这是可选的有这样的
Apache Flink：当我修改存储的对象时，MapState 是否会自动更新？

是否有必要使用MapState put 手动更新状态还是当我修改对象时状态是否自动更新 private transient MapState
在 C# 中对列表进行排序（使用各种参数）

我有一个对象列表该对象具有不同的领域例如年龄和姓名现在有时我想按姓名排序有时按年龄排序附加有时是递增顺序有时是递减顺序现在我明白我应该在我的对象中实现 Comparable 接口并重写 CompareTo 方法但是当我想支持
Vue - 您可能需要一个额外的加载器来处理这些加载器的结果

我使用 Vue 和 babel 我有一个导出的函数 file a js export async function get 我需要将此导出函数连接到 MyClass 的静态方法 file b js import myInterface fr
在 Java 中使用各种日历时区（不使用 Joda Time）

我正在寻找一种根据用户输入获取各个时区的当前时间的方法我知道我可以使用乔达时间 http joda time sf net 但这是唯一的方法吗 Java 中没有一个选项可以做到这一点吗我尝试了以下代码它为所有 3 个系统输出提供了相同
如何使用 matlab 从图像中去除纹理？

如何使用傅立叶变换找出导致表面纹理的频率分量然后我必须把它们去掉以获得没有纹理的光滑表面 This http www flickr com photos 63036721 N02 5733958932 in photostream是图像
如何处理原始Python套接字中的ssl连接？

我正在编写一个程序来下载给定的网页由于某些限制我只需要使用原始 python 套接字来进行所有连接因此我与给定域对象的响应标头中的 Host 字段建立套接字连接然后发送 GET 请求现在当 url 是 https url
如何将文本附加到 jenkinsfile 中的文件

如何将文本追加到文件中Jenkinsfile注入詹金斯BUILD ID 我希望看到 version 1 0 25 其中 25 是BUILD ID 这是我的尝试 import hudson EnvVars node stage version
Kubernetes 服务和集群与 Google Compute Engine 对象之间有什么关系？

我正在设置几个在 Google Container Engine 上运行的服务流量通过 Google HTTP 负载均衡器使用路径映射传入有一个关于设置基于内容的负载平衡的很好的谷歌教程here https cloud google c
时间序列数据和 LSTM 中分类的实体嵌入

我正在尝试解决时间序列问题简而言之对于每个客户和材料 SKU代码我过去都下了不同的订单我需要建立一个模型来预测每个客户和材料下一次订单之前的天数我想做的是在 Keras 中构建一个 LSTM 模型其中对于每个客户和材料我有 5

时间序列数据和 LSTM 中分类的实体嵌入

时间序列数据和 LSTM 中分类的实体嵌入 的相关文章

随机推荐

热门标签

时间序列数据和 LSTM 中分类的实体嵌入的相关文章