在 Word2Vec 中合并预训练模型？

2024-01-09

我已经下载了 1000 亿字的 Google 新闻预训练矢量文件。除此之外，我还在训练自己的 3GB 数据，生成另一个预训练的矢量文件。两者都有 300 个特征维度和超过 1GB 的大小。

我如何合并这两个巨大的预训练向量？或者我如何训练一个新模型并在另一个模型之上更新向量？我看到基于 C 的 word2vec 不支持批量训练。

我正在寻找从这两个模型计算单词类比。我相信从这两个来源学习的向量会产生相当好的结果。

没有直接的方法可以合并单独培训课程的最终结果。

即使对于完全相同的数据，初始种子或线程调度抖动的轻微随机化也会导致不同的最终状态，使得向量只能在同一会话内完全可比较。

这是因为每个会话都会发现a有用的向量配置...但是有许多同样有用的配置，而不是单一的最佳配置。

例如，无论您达到什么最终状态，都会有许多旋转/反射，这些旋转/反射在训练预测任务上可以完全一样好，或者在某些其他任务（例如类比求解）上表现完全一样好。但这些可能的替代方案中的大多数都没有可以混合和匹配以进行有用的相互比较的坐标。

使用先前训练运行的数据预加载模型might使用新数据进行更多训练后可以改善结果，但我不知道对这种可能性有任何严格的测试。效果可能取决于您的具体目标、参数选择以及新旧数据的相似程度，或者代表将使用向量的最终数据。

例如，如果 Google 新闻语料库与您自己的训练数据或您将使用词向量理解的文本不同，则使用它作为起点可能只会减慢您的训练速度或产生偏差。另一方面，如果您对新数据进行足够长时间的训练，最终预加载值的任何影响都可能会被稀释为零。（如果您确实想要“混合”结果，则可能必须同时对新数据进行训练，并以交错目标将向量推回先前的数据集值。）

结合独立会议的结果的方法可能会成为一个很好的研究项目。也许 word2vec 语言翻译项目中使用的方法——学习词汇空间之间的投影——也可以在不同运行的不同坐标之间进行“翻译”。也许将一些向量锁定在适当的位置，或者对“预测新文本”和“保持接近旧向量”的双重目标进行训练将带来有意义的改进组合结果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

Word2Vec

在 Word2Vec 中合并预训练模型？的相关文章

Python Sci-Kit 学习：多标签分类 ValueError：无法将字符串转换为浮点数：

我正在尝试使用 scikit learn 0 17 进行多标签分类我的数据看起来像 training Col1 Col2 asd dfgfg 1 2 3 poioi oiopiop 4 test Col1 asdas gwergwger
在 model.fit() 期间记录 Keras 中每个时期的计算时间

我想比较不同模型之间的计算时间在拟合期间每个时期的计算时间被打印到控制台 Epoch 5 5 160000 160000 10s 我正在寻找一种方法来存储这些时间其方式与模型指标类似模型指标保存在每个时期并可通过历史对象获取尝试以
将 freebase 向量与 gensim 一起使用

我正在尝试使用 Google 发布的 freebase 单词嵌入但我很难从 freebase 名称中获取单词 model gensim models Word2Vec load word2vec format freebase vecto
WEKA 的重采样过滤器 - 如何解释结果

我目前正在努力解决机器学习问题而我必须处理大量不平衡的数据集也就是说有六个类 1 2 6 不幸的是有例如对于 1 类有 150 个示例实例对于 2 有 90 个实例对于 3 类只有 20 个实例所有其他类都无法训练因为
如果我使用不同数量的核心，XGBoost 会产生相同的结果吗？

我在两台机器上安装了完全相同版本的 XGBoost 0 4 两台机器之间的唯一区别是 RAM 和内核数量 8 与 16 使用完全相同的数据我无法重现相同的结果它们略有不同小数点后第四第五位种子保留为默认值它是高度特定于实现的但
朴素分类器 matlab

在 matlab 中测试朴素分类器时即使我在相同的样本数据上进行训练和测试我也会得到不同的结果我想知道我的代码是否正确是否有人可以帮助解释这是为什么 dimensionality reduction columns 6 U S V
实例标准化与批量标准化

据我所知批量归一化通过将激活转向单位高斯分布来帮助加快训练速度从而解决梯度消失问题批量归一化行为在训练使用每个批次的平均值 var 和测试时间使用训练阶段的最终运行平均值 var 时应用不同另一方面实例归一化充当本文提到的对比
Node2vec 的工作原理

我一直在读关于node2vec https cs stanford edu jure pubs node2vec kdd16 pdf嵌入算法我有点困惑它是如何工作的作为参考 node2vec 由 p 和 q 参数化并通过模拟来自节点的
我的 R 平方分数为负，但使用 k 倍交叉验证的准确度分数约为 92%

对于下面的代码我的 r 平方分数为负但使用 k 折交叉验证的准确度分数为 92 这怎么可能我使用随机森林回归算法来预测一些数据数据集的链接在下面的链接中给出 https www kaggle com ludobenistant hr
Tensorflow 的 LSTM 输入

I m trying to create an LSTM network in Tensorflow and I m lost in terminology basics I have n time series examples so X
使用sklearn进行多标签特征选择

我希望使用 sklearn 对多标签数据集执行特征选择我想要获得最终的功能集across标签然后我将在另一个机器学习包中使用它我打算使用我看到的方法here https stackoverflow com questions 1640
AttributeError：类型对象“Word2Vec”没有属性“load_word2vec_format”

我正在尝试实现 word2vec 模型并收到属性错误 AttributeError 类型对象 Word2Vec 没有属性 load word2vec format 下面是代码 wv Word2Vec load word2vec format
scikit-learn RandomForestClassifier 中的子样本大小

如何控制用于训练森林中每棵树的子样本的大小根据 scikit learn 的文档随机森林是一种适合许多决策的元估计器数据集的各个子样本上的树分类器并使用平均以提高预测准确性并控制过度拟合子样本大小始终与原始输入样本相同大小但如
mlflow 如何使用自定义转换器保存 sklearn 管道？

我正在尝试使用 mlflow 保存 sklearn 机器学习模型这是一个包含我定义的自定义转换器的管道并将其加载到另一个项目中我的自定义转换器继承自 BaseEstimator 和 TransformerMixin 假设我有 2 个项
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
如何确定 Keras Conv2D 函数中的“filter”参数

我刚刚开始我的 ML 之旅并且已经完成了一些教程对我而言不清楚的一件事是如何为 Keras Conv2D 确定过滤器参数我读过的大多数资料只是将参数设置为 32 没有任何解释这只是经验法则还是输入图像的尺寸起作用例如 CIF
预测测试图像时出现错误 - 无法重塑大小数组

我正在尝试使用 TensorFlow 和 Keras 在 Python 中进行图像识别并且我已经关注了下面的博客 https stackabuse com image recognition in python with tensorfl
当训练和测试的特征数量不同时，如何处理生产环境中的One-Hot Encoding？

在做某些实验时我们通常在 70 上进行训练在 33 上进行测试但是当您的模型投入生产时会发生什么可能会发生以下情况训练集 Ser Type Of Car 1 Hatchback 2 Sedan 3 Coupe 4 SUV 经过
将姓名拆分为名字和姓氏 Java（Android OCR）[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我使用本机 Android JAVA 创建了一个 OCR 光学字符识别应用程序我可以将图像转换为文本视图但是我如何使用这些词分别识别名
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y

随机推荐

.NET 主要版本和发布分支的 git 分支策略

对于包含多个类库的 NET 项目我当前使用以下 git 分支策略 feature 1 master v PR v release 7 0 v I branch
iPhone 7/7plus 上的空 snapshotView

我的第一个问题是最近我将 Xcode 更新到 8 并且resizableSnapshotView该方法在某些模拟器上无法正常工作 snapshotView 在所有 iOS9 10 的测试设备和 iPhone6s 下的模拟器上都运行良好但
Qt 安卓.获取设备屏幕分辨率

我正在 Android 设备上使用 qt 5 3 进行开发我无法获取屏幕分辨率对于旧的 qt 5 版本此代码有效 QScreen screen QApplication screens at 0 largh screen gt ava
通过合并日期时间和日期列上的两个 DF 查找昨天的高价

我正在尝试合并两个 df 其中一个 df 有一个datetime列另一个只有一个date柱子我的申请是找到昨天的high使用 OHLC 数据集的价格我在下面附加了一些起始代码但我将描述我正在寻找的内容鉴于这种intraday数据集
从 Git 中删除过时的提交

我已经进行了一些测试提交以测试提交挂钩并且始终将索引重置为我最后一次正常提交现在这些过时的提交仍然存在 gt git reflog fcdabf7 HEAD 0 reset moving to fcdabf7e01845d6f000f
如何在javascript中完全获取具有重复键的JSON

我试图从 url 获取 JSON 但在响应对象中重复的键被删除有没有什么方法可以完全获取它而不删除重复的键这是我的js代码 document ready function var s getJSON new json console l
关键帧不是关键帧？ AV_PKT_FLAG_KEY 未解码为 AV_PICTURE_TYPE_I

解码标志中包含 AV PKT FLAG KEY 的数据包后我原本期望得到 I 帧但结果却得到了 P 帧拨打电话后 avcodec decode video2 codecCtx frame frameFinished packet mp
iOS 呈现动画为“推”的视图控制器（左右动画）

目前我有一个视图控制器呈现其他视图控制器我想做的是重新创建推送视图控制器时使用的默认动画我目前的做法是 FirstViewController IBAction private func push sender AnyObject l
如何捕获 ASCX 控件（而不是隐藏代码）引发的异常？

我有一个很大的 ASPX 页面其中包含许多 ASCX 控件如果控件引发异常它应该记录异常并仅隐藏其自身所有其他控件仍应呈现如何处理从前端文件 ASCX 而不是代码隐藏引发的各个 ASCX 的异常例如尝试使用以下方法引用无效属
算法 CRC-12

我正在尝试对 12 位 CRC 和算法执行 crc table 但总是得到错误的结果你能帮助我吗要创建 crc 表我尝试 void crcInit void unsigned short remainder int dividend
为什么我的 Perl 代码中会收到“调用得太早以检查原型”警告？

我有一个像这样的 Perl 文件 use strict f1 sub f3 f2 sub f1 sub f2 简而言之 f1在定义之前被调用因此 Perl 发出警告 f1 调用得太早无法检查原型但情况也是如此f2 唯一的区别是它是从另
如何抑制整个命名空间文件的 StyleCop 警告

我正在使用 Style Cop 版本 4 7 全局抑制并不适用于选定命名空间的每个成员我在同一命名空间 StyleCopSample Test 中有两个文件当我在第一个文件中设置抑制消息时仅针对该文件抑制消息但第二个文件仍然会收到警
R 裁剪栅格的无数据

我想裁剪一些栅格的无数据部分图像的示例1 https i stack imgur com hkr4d png其中无数据为黑色无需手动定义范围任何想法您可以使用trim删除只有外部行和列NA values library raster
同时是 Kotlin 成员和扩展

为了更多地了解 Kotlin 并使用它我正在开发一个示例 Android 应用程序我可以在其中尝试不同的事情然而即使在搜索该主题一段时间后我仍无法找到以下问题的正确答案让我们在 View 类上声明一个虚拟扩展函数 fun V
当我的程序出现分段错误时，即使设置了 RUST_BACKTRACE=1，为什么我也得不到回溯？

我想查看随机分段错误的回溯所以我设置了RUST BACKTRACE 1环境变量通常它会打印回溯信息但这次不打印为什么不RUST BACKTRACE work RUST BACKTRACE 1 target debug grin mi
重写 Javascript Map 的相等函数

我想在 Javascript 中创建一个 Map 字典其中键是数字数组值是某个对象我想从地图中检索以前使用相同数组内容存储的值即如果我有一个包含某些内容的数组我想检索以前为具有相同内容的数组存储的值如果有在大多数其他语言中
异步/等待和缓存

我的服务层正在缓存大量对 memcached 的 Db 请求这是否导致无法使用 Async Await 例如我怎么能等待这个 public virtual Store GetStoreByUsername string username
NSString 内部结构 - 长度如何工作？

我有一个关于 NSString 内部结构的问题我想检查字符串长度基本上我想知道 NSString 是否知道它的长度每次计数计数并缓存结果我应该存储它的长度并每次计算或调用长度方法吗为了测试一个字符串我可以测试 nil 或询问它
xml dom解析器在java中按名称查找标签

我有一个 xml 我只想获取城市和温度我尝试了以下方法 HttpParams httpParameters new BasicHttpParams HttpClient httpclient new DefaultHttpClient h
在 Word2Vec 中合并预训练模型？

我已经下载了 1000 亿字的 Google 新闻预训练矢量文件除此之外我还在训练自己的 3GB 数据生成另一个预训练的矢量文件两者都有 300 个特征维度和超过 1GB 的大小我如何合并这两个巨大的预训练向量或者我如何训练一个

在 Word2Vec 中合并预训练模型？

在 Word2Vec 中合并预训练模型？ 的相关文章

随机推荐

热门标签

在 Word2Vec 中合并预训练模型？的相关文章