比赛细节笔记总结

2023-11-05

2020-10-06

  1. res 的思想,与 ensemble 的 思想 , 加入很多层 ensemble 一下 也算是集成模型 res 的思想 一般是加比较好
  2. 序列问题可以加入 pos embedding: an照 transformer 的方法加入 embedding
  3. 在 gcn 的邻接矩阵里加入一个 conv2d 等于 atten 吗
  4.         `nn.BatchNorm1d(out_dim),
         	 nn.Dropout(0.1),
         	 nn.LeakyReLU()`  在一个模块后面加入 这三个优化项 其中 bn要加在dp之前 有科学依据
    
  5. 模型可以很深 加很多 res 模块就没事了…

2020-10-07
6. wavenet 的模板get 在 github
7. transformer 的模板 get 在 github
8. transformer 训练的时候要加入 mask 来正则化
9. transformer 可以屏蔽掉句子里的一些 无用的词汇
10. 损失函数一定要改,什么样的损失函数就有什么样的模型 #??#
11. 加入对抗训练提高性能
12. 加入分数据集的方法 skf 等 在 github

2020-10-8
13. stacking 不能只做简单的带权平均 具体stacking方法 见csdn
14. 调bert 见 github
15. bert 是上游的embedding生成器,transformer layer 是特征提取器 两者是不一样的
16. 保存val最优的模型不可取,大佬说的
17. 伪造label方法 :回归fl 也是可以做的

2020-10-9
18. 快照学习 – pytorch 版本 pytorch keras 见知乎
19. Backward Elimination 不错的集成方法 集成
20. 今天就到这吧

2020-10-11
21. pytorch 固定部分参数训练
22. get 了一整套 训练保存框架 感觉简单易用 看了 mlm的 具体训练方式, 合并成一个文件保存到了github,余弦退火啥的详见余弦退火
23. fast.ai 高级api ,未完待续

2020-10-19
24. 要对整个过程进行神经网络方面的模拟,建模、motivaition正确结果就会是好的
25.nn 特征的维度不在于有多少,但需要精妙的设计
25. nn 建模就像讲故事,要把来龙去脉讲得合理 然人看完说一声合理 , 而不是觉得简单粗暴 , 虽然神经网络不可以解释,但是机理要能说清楚

2020-10-20
26. 数据预处理: 1. clap 2. 对y 进行变换 3. 数据清理 4. 归一化 或者 加权 5. label smoothing
27. label smoothing: tf实现很容易改成 pytorch 实现 改一下损失函数
29. Lookahead 优化器
30. pooling 的所用 scale不变性 , 平移旋转不变性 , 等 可以将不同形态的同性质 提取出来 学习到本质
31. 加入 ae pretrain 作为分类任务的初始权重

AE的pre-train一般来说只是对自身的拟合。但是这样的权值用来初始化其他任务,比如分类任务为什么效果会好呢?小白,不是很懂。。

其实我已经在评论中回复过了,我在说下:pretrain目前的研究认为,获得了一个比较好的初值。这个初值直接对应一个隐层表达,隐层表达直接作用于最终分类

  1. VAE 吹的天花乱坠,实际上也就这么几行 VAE pytoch 实现

2020-10-22
33. 比 relu 更好用: gelu()gelu
34. mesh 也是好的激活函数

2020-10-24
35. 看文章要看完整哦,模型只是一部分,如何训练,数据如何喂进去大有讲究
36. 今日学习transformer 学到很多
37. 全局 xsiver 参数都要初始化 或者pre train 比随机初始化稳定多了

for p in model.parameters():
        if p.dim() > 1:
            nn.init.xavier_uniform(p)
  1. Note: This part is very important. Need to train with this setup of the model.
    意思是训练的梯度设置也非常重要,不按照这个策略做得不到这个结果

  2. 老师训练策略…
  3. transformer 不需要循环也可以依次预测 见blog

2020-10-24
41. 在lstm中 h0=c0 是隐层的初始化状态,一般是零向量。
42. 模型与真实事件,模型需要贴近真实事件关系模型,所以真实事件的数据要能反映真实事件的力学模型。数据要能贴合力学模型所描绘的关系。
模型是对真实事件的一种简化,去除掉了随机性,去除掉了神秘力量(无关紧要的数据之间的联系),真实数据要贴合模型,满足模型的力学关系,关系不足欠拟合,或者有没建模到的神秘扰动,都会使训练出来的模型不好,所以说模型决定了预测的上限,数据决定了模型训练的上限(数据不贴合模型会使模型的效果不好,达不到模型的上限,会折上加折,确信),那么怎样去捕捉没有建模到的神秘扰动呢… 加一个不同类型的并行layer上去 加一个小权重加上去… 感觉世界线收束了 , 在我看到万能提取器之前先这么干吧…现在看不到数学层,感觉下一步就是使用数学层进行建模。目前道行不够

2020-10-25
43. 多任务学习,共享表示:本质上是对模型的完整建模,只单个任务不足以对整个模型进行表示。
44. 多语言任务学习: 不同的语言,不同类型的数据不共用一套参数,multi 思路

2020-10-26
45. 提取side信息 用不同的层 提取加一个小权重,加起来 或逐元素相乘 或者max
46. 同样的层设置不同参数 也可以提取不同的信息
47. 多对一attention ,lookahead 加 Radam 见 github
48. 今日学习 nni 自动调参 感觉吊吊的

2020-10-27
49. 自动调参大成功 详见 服务器nni 与 nni文档 感觉芜湖起飞
50. 假期一个月写作 最大的收获就是 学会了这个 embedding 类型 见 github

2020-11-3
51. [类别特征编码] 感觉看了也没啥用(https://blog.csdn.net/weixin_39671140/article/details/84801409)

处置妥当的情况下,无论是线性模型,还是非线性模型,目标编码都是最佳的编码方式。

  1. 自动特征工程
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

比赛细节笔记总结 的相关文章

  • 在 pandas 中重新采样

    我在另一个话题上问了一个问题Link https stackoverflow com questions 33446776 how to resample starting from the first element in pandas
  • 内部错误:当前事务被中止,命令被忽略直到事务块结束

    使用多处理库在子进程中执行数据库调用时出现此错误 Visit Pastie http pastie org 811424 内部错误 当前事务被中止 命令被忽略直到 交易块结束 这是一个 Postgresql 数据库 使用psycopg2司机
  • 计算 scikit-learn 逻辑回归模型的残差偏差

    有没有办法计算残差scikit learn 逻辑回归模型 http scikit learn org stable modules generated sklearn linear model LogisticRegression html
  • 图像从部署到heroku的django web应用程序中消失

    我正在开发一个 django 项目 使用 django Rest 框架编写 REST API 以在 Android 应用程序中使用它们 我的主要想法是在 Django 中开发后端 在 Android 中开发前端 项目部署在 Heroku 上
  • Python 3.4 多重处理不适用于 py2exe

    这与以下内容几乎相同这个问题 https stackoverflow com questions 26001133 python multiprocessing process executes a wrong target package
  • 如何使用 pyodbc 和 MS-Access 在 Python Cursor.execute 中查看真实的 SQL 查询

    我在 Python 中使用以下代码 使用 pyodbc 作为 MS Access 基础 cursor execute select a from tbl where b and c x y 没关系 但是出于维护目的 我需要知道发送到数据库的
  • 如何使用Python内置的map和reduce函数计算字符串中的字母频率

    我想使用Python的map和reduce内置函数来计算字符串中字母的频率 谁能提供一些关于我如何做到这一点的见解 到目前为止我所得到的 s the quick brown fox jumped over the lazy dog Map
  • 继续在文件的同一行写入

    我已经使用以下命令打开了要写入的文件 data open input a 使用循环 我想在同一行中向文件写入一些单词 在每次循环迭代之后我想添加一个换行符 while loop for loop do something if some c
  • 在Python中的自定义类中实现“with object() as f”的使用

    我必须在 python 中打开一个类似文件的对象 它是通过 dev 的串行连接 然后关闭它 在我的班级的几种方法中 这已经完成了好几次 我的做法是在构造函数中打开文件 然后在析构函数中关闭它 不过 我遇到了奇怪的错误 我认为这与垃圾收集器有
  • 在Python中单击按钮时隐藏标签

    在 Python Tkinter 中单击按钮时如何隐藏现有标签 这实际上取决于您使用的几何管理器 如果你使用 lbl Tkinter Label parent 要创建标签 您将使用以下方法之一来隐藏它 lbl grid forget lbl
  • python 解码部分 utf-8 字节数组

    我从不了解 UTF 8 规则的通道获取数据 因此 有时当 UTF 8 使用多个字节来编码一个字符并且我尝试将部分接收到的数据转换为文本时 我在转换过程中遇到错误 根据接口的性质 没有任何结束的流 我无法找出数据何时已满 因此我需要处理部分
  • 在 python 中检查堆栈中的局部变量

    我编写了一个小函数 它在堆栈中查找一级并查看其中是否有变量 但是我如何将这个函数变成一个可以在堆栈中一直查找直到找到一个局部变量并购买某个特定名称的函数 import inspect def variable lookup variable
  • 与 pandas 的时间序列相关性

    我有一些颗粒物传感器和 CSV 其时间序列如下 传感器A date value date 2017 11 30 00 00 00 30 11 17 0 00 49 2017 11 30 00 02 00 30 11 17 0 02 51 2
  • python 正则表达式:匹配空格字符或字符串结尾

    我想匹配文本中的空格字符或字符串结尾 import re uname abc assert re findall s s uname uname assert re findall s s uname uname aa assert not
  • 在包含一些通配符的大型列表中进行成员资格测试

    当列表包含特殊类别时 如何测试某个短语是否在大型 650k 短语列表中 例如 我想测试这个短语是否 he had the nerve 在列表中 确实如此 但是在 he had DETERMINER nerve where DETERMINE
  • 分段错误(核心转储),执行线程

    我试图在 python 中运行一个程序 该程序打开一个程序并从其标准输出中读取 当我运行程序代码时 出现分段错误错误 但是当我将代码放入函数 Myfunc 中的线程外时 它可以正常工作 我不明白发生了什么 这是我的代码 class Work
  • 使用 CustomCallback() 类在训练时实现冻结层

    我正在尝试在 TensorFlow 中训练自定义 CNN 模型 我想以某种方式在训练仍在运行时冻结特定时期模型的某些层 我已经实现了冻结层 但我必须在某些时期训练模型 然后在我想要冻结的特定层中将可训练属性更改为 False 然后编译模型
  • 如何捕获密码提示

    我有以下代码 更新为包括 pexpect import sys import subprocess import pexpect print 0 ssh subprocess Popen ssh A t email protected cd
  • 如何在 Pandas 的时间序列图上绘制垂直线?

    如何绘制垂直线 vlines 在熊猫系列情节中 我正在使用 Pandas 绘制滚动平均值等 并且想用垂直线标记重要位置 是否可以使用vlines或类似的东西来完成这个 在这种情况下 x 轴是datetime plt axvline x po
  • Python 终端菜单?终端着色?终端进度显示?

    我有一个广泛使用 Python 2 风格 的项目 我想知道是否有终端菜单库或类似的东西 我希望通过使用箭头键突出显示选项 一些颜色等简化一些选项 为我的脚本注入一些风味和活力 我隐约记得有一种方法可以制作 bash shell 终端菜单 但

随机推荐

  • AOP获取方法返回值

    我们用Spring的AOP切面做日志收集或者记录的时候 在springboot中用 Aspect注解 比如 Aspect public class AdviceTest Before execution com abc service ma
  • xtu p1040 汉诺塔

    描述 约19世纪末 在欧州的商店中出售一种智力玩具 在一块铜板上有三根杆 最左边的杆上自上而下 由小到大顺序串着由64个圆盘构成的塔 目的是将最左边杆上的盘全部移到中间的杆上 条件是一次只能移动一个盘 且不允许大盘放在小盘的上面 这是一个著
  • Windows 7 64位机上搭建Android开发环境

    1 从http www oracle com technetwork java javase downloads jdk7 downloads 1880260 html下载Java JDK 根据机子本身配置 选择jdk 7u25 windo
  • Java整合GPT-3.5和GPT-4,让PPT制作变得更加轻松智能化

    在当今的商业环境中 PPT演示文稿已成为一种重要的沟通工具 然而 创建高质量的PPT往往耗时且繁琐 基于这个痛点 本文将介绍如何使用Java整合GPT 3 5 4 根据PPT模板自动生成完整的PPT 我们将使用Apache POI库操作来P
  • 通过ref使元素动态高度

    observeResize this nextTick gt const moreEditBoxHeight new ResizeObserver entries gt for let entry of entries 执行其他操作 let
  • centos8 安装docker环境

    CentOS8官方源不可用 需要切换到阿里云的centos8的源 先安装yum utils组件后 再增加docker源后 才可以进行docker的安装使用 备份centos8原有源信息 cp r etc yum repos d etc yu
  • 谈谈滞后补偿器与PI控制及其原理分析

    本文一览 1 什么是滞后补偿器以及和PI控制的联系 2 PI控制对系统的影响 1 什么是超前补偿器以及和PI控制的联系 上一篇文章提到了超前补偿器 超前这个词的含义就是相位提前 相位提前所带来的的好处就是减少振荡 加快系统的稳定 但是使用超
  • Android 状态栏、标题栏、屏幕高度

    http xqjay19910131 yahoo cn iteye com blog 1435249 android 状态栏 标题栏 屏幕高度 博客分类 android app 1 获取状态栏高度 decorView是window中的最顶层
  • VS2019配置Qt5.14.2以及在线配置Qt5.15.2

    简单记录下配置过程 一 配置Qt5 14 2 1 官网下载QT Index of archive qt 5 14 5 14 2 2 下载后 双击exe进行安装 博主这里安装到了目录D Qt Qt5 14 2 结合自己的路径 完毕后 环境变量
  • php关注获取微信code,基于PHP方法,微信公众号小程序获取code,access_token,openid,用户信息...

    发起获得code值链接 public function doPageGetcode appid yourappid 修改你的appid if appid return this gt result 10008 参数错误 这里的 redire
  • 蓝桥杯(Java) -day03

    1 蓝桥杯 Java day01 2 蓝桥杯 Java day02 一 滑行 蓝桥杯 2023省赛模拟题 滑行 问题描述 小蓝准备在一个空旷的场地里面滑行 这个场地的高度不一 小蓝用一个 n 行 m 列的矩阵来表示场地 矩阵中的数值表示场地
  • Flutter 图片选取及裁剪

    在开发项目里修改用户头像的功能 涉及到图片选取及裁剪 基本实现步骤如下 1 pubspec yaml 添加 image picker 1 0 1 image cropper 4 0 1 dependencies image picker 1
  • VMware ESXI 6 开启VT-x硬件虚拟化技术

    一般虚拟化主ESXi都会开启BIOS中的CPU虚拟化技术 INTEL叫VT x AMD的叫AMD V ESXI 6 0 CPU虚拟化是在web端设置的 在客户端vSphere中没有这个设置 切记
  • Qt中的坐标体系和内存回收

    目录 坐标体系 窗口的坐标原点 窗口的相对坐标 示例 内存回收 1 自动垃圾回收机制 2 对象树机制 示例 坐标体系 窗口的坐标原点 在Qt中 坐标系统一般是以窗口左上角为原点 向右为正方向X轴 向下为正方向Y轴 窗口的相对坐标 在一个 Q
  • GPU及GPU通用计算编程模型简介

    以下内容来自网络总结 NVIDIA公司在1999年发布GeForce256时首先提出GPU 图形处理器 的概念 随后大量复杂的应用需求促使整个产业蓬勃发展至今 GPU英文全称Graphic Processing Unit 中文翻译为 图形处
  • 报错记录torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 90.00 MiB (GPU 0; 7.93 GiB to

    torch cuda OutOfMemoryError CUDA out of memory Tried to allocate 90 00 MiB GPU 0 7 93 GiB total capacity 758 34 MiB alre
  • poi 解析word文档 一分钟入门,超简单

    最近一段时间再研究文件解析和转换 网上找了好多资料用的版本都是比较老的 干脆自己去啃poi了 今天开始分享给大家 先从最近简单的做起 花不多说直接开始 项目基于maven构建
  • 酒店宽带运营系统远程命令执行

    他是在社会的最低层挣扎 为了几个钱而受尽折磨 但他已不仅仅将此看作是谋生活命 职业的高贵与低贱 不能说明一个人生活的价值 恰恰相反 他现在倒很 热爱 自己的苦难 通过一段血火般的洗礼 他相信 自己历尽千辛万苦而酿造出的生活之蜜 肯定比轻而易
  • adb devices错误提示:adb server version (39) doesn‘t match this client (41)

    问题 当前client版本41 与server端的版本不匹配 当前版本过高引起的 client就是你电脑已经安装的adb程序的版本 而server 是你的服务端 将要connect的设备 我这里用的是Genymotion虚拟器 解决方法 步
  • 比赛细节笔记总结

    2020 10 06 res 的思想 与 ensemble 的 思想 加入很多层 ensemble 一下 也算是集成模型 res 的思想 一般是加比较好 序列问题可以加入 pos embedding an照 transformer 的方法加