我有一个大型数据集(约 3000 万个数据点,具有 5 个特征),我已使用 K 均值将其减少到 200,000 个集群。数据是大约 150,000 个时间步长的时间序列。我想要训练模型的数据是每个时间步上特定簇的存在。预测模型的目的是生成一个广义序列,类似于从单词序列训练的模型中生成语法正确的句子。考虑此数据的最简单方法是,我尝试根据当前视频帧中的像素预测下一个视频帧中的像素,以便生成近似原始序列的新帧序列。
每个时间步长的原始稀疏表示将是 200,000 个二进制值,表示该时间步长中存在或不存在哪些簇。请注意,任何一个时间步长中可能存在的簇不超过 200 个,因此这种表示形式非常稀疏。
将这个稀疏向量转换为更适合使用 Tensorflow 进行时间序列预测的稠密向量的最佳表示是什么?
我最初想到的是在每个时间步对向量进行训练的 RNN / LSTM,但由于训练向量的大小,我现在想知道卷积方法是否更合适。
请注意,除了一些简单的教程之外,我实际上并未使用过 Tensorflow,但之前使用过 OpenCV ML 函数。请在您的回复中将我视为新手。
谢谢。
None
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)