以分类变量（枚举）作为输入的神经网络

2024-04-02

我正在尝试使用神经网络解决一些机器学习问题，主要是使用NEAT进化（增强拓扑的神经进化）。

我的一些输入变量是连续的，但其中一些具有分类性质，例如：

物种：{狮子，豹子，老虎，美洲虎}
行业：{医疗保健、保险、金融、IT、广告}

起初，我想通过将类别映射到离散数字来对这样的变量进行建模，例如：

{狮子：1，豹子：2，老虎：3，美洲虎：4}

但恐怕这会在变量上添加某种任意拓扑。老虎不是狮子和豹子的总和。

通常采用什么方法来解决这个问题？

不幸的是，这儿没有good解决方案，每个都会导致某种问题：

正如您所提到的，您的解决方案是添加拓扑；它可能没那么糟糕，因为 NN 可以拟合任意函数并表示“if”，但在许多情况下它会（因为 NN 经常陷入某些局部最小值）。
您可以以以下形式对数据进行编码is_categorical_feature_i_equal_j，这不会产生任何额外的拓扑，但会以二次方的方式增加特征数量。因此，代替“物种”，您会得到特征“is_lion”、“is_leopard”等，并且只有其中一个是相等的1当时
如果与可能的分类值相比数据量很大（例如，您有 10000 个 od 数据点，并且只有 10 个可能的分类值），也可以将问题分成 10 个独立的问题，每个问题都针对一个特定值进行训练（因此我们有“狮子的神经网络”“美洲虎的神经网络”等）

这两种方法适用于“极端”情况 - 一种方法的计算成本非常低，但可能导致高偏差，而第二种方法则引入了很多复杂性，但不应影响分类过程本身。最后一种很少可用（由于假设了少量的分类值），但在机器学习方面相当合理。

Update

8年里发生了很多事情。解决方案 2 绝对是最受欢迎的一种，随着计算量的增长、神经网络的广泛采用以及稀疏输入的支持，成本现在可以忽略不计

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

enums

neuralnetwork

以分类变量（枚举）作为输入的神经网络的相关文章

Google Inceptionism：按类别获取图像

在著名的 Google Inceptionism 文章中 http googleresearch blogspot jp 2015 06 inceptionism going deeper into neural html http goo
未初始化的枚举变量值

我使用 enum 声明新类型 DAY 然后从中声明两个变量 day1 和 day2 然后当我使用未初始化的值时我应该看到 0 到 6 之间的值因为 enumlist 中的值介于 0 到 6 之间但我收到了这些值改为 858993460
现代 CNN（卷积神经网络）作为 DetectNet 旋转不变吗？

众所周知用于目标检测的 nVidia DetectNet CNN 卷积神经网络基于 Yolo DenseBox 的方法 https devblogs nvidia com parallelforall deep learning obj
使用 Serde 反序列化时有没有办法允许未知的枚举标签？ [复制]

这个问题在这里已经有答案了我正在反序列化一个标记的枚举 derive Deserialize enum Foo A A B B C C 如果 Serde 遇到一个不存在的标签A B or C 那么就会抛出错误有没有办法为未知标签添加包罗
将枚举类型绑定到文本框

我将 textbox text 值绑定到枚举类型我的枚举看起来像这样 public enum Type Active Selected ActiveAndSelected 我不想完成的是在文本框上显示活动模式而不是活动等等可以这
C# 按键枚举混淆：Keys.Alt 或 Keys.RButton |键.Shift键|按键.Alt

我正在尝试测试是否按下了 Alt 键我有一张类似于以下的支票 private void ProcessCmdKey Keys keyData if keyData Keys Alt System Console WriteLine Alt
实例标准化与批量标准化

据我所知批量归一化通过将激活转向单位高斯分布来帮助加快训练速度从而解决梯度消失问题批量归一化行为在训练使用每个批次的平均值 var 和测试时间使用训练阶段的最终运行平均值 var 时应用不同另一方面实例归一化充当本文提到的对比
帮助我在 Python 中实现反向传播

EDIT2 新的训练集 Inputs 0 0 0 0 0 0 1 0 0 0 2 0 0 0 3 0 0 0 4 0 1 0 0 0 1 0 1 0 1 0 2 0 1 0 3 0 1 0 4 0 2 0 0 0 2 0 1 0 2 0 2
带数据注释的枚举类型的 Json.NET 自定义序列化

我想序列化一个枚举类型以便它返回一个数组其中枚举作为对象其中包含值名称和数据注释值我需要序列化方面的帮助这是我到目前为止所做的枚举 public enum Status Display Name Active status
从成员函数返回枚举

我想实现返回枚举的函数 class myClass private res res public enum res ok fail res getRes bool checkRes res r other function that cha
如何向 MySQL 中的 ENUM 类型列添加更多成员？

MySQL 参考手册没有提供关于如何执行此操作的明确示例我有一个 ENUM 类型的国家地区名称列我需要向其中添加更多国家地区实现此目的的正确 MySQL 语法是什么这是我的尝试 ALTER TABLE carmake CHANG
Xcode 6 代码编辑器异常行为

截至最近我在使用 Xcode 6 代码编辑器时遇到了一些麻烦最终导致编辑窗口中的焦点快速变化在编辑文本时跳转到同一文件中完全不同的位置一切就是这样开始的最近编辑器拒绝上下滚动挂起停止显示行号或任何其他文本我该怎么做才能让它
C#中Enum中定义的value__是什么

What value 可能在这里 value MSN ICQ YahooChat GoogleTalk 我运行的代码很简单 namespace EnumReflection enum Messengers MSN ICQ YahooChat
WPF ComboBox 中具有本地化名称的枚举

我有一个列出枚举的组合框 enum StatusEnum Open 1 Closed 2 InProgress 3
如何反转 dropout 来补偿 dropout 的影响并保持期望值不变？

我正在学习神经网络中的正则化deeplearning ai课程在dropout正则化中教授说如果应用dropout 计算出的激活值将比不应用dropout时测试时更小因此我们需要扩展激活以使测试阶段更简单我理解这个事实但我
JAXB 枚举字段未序列化

我有以下课程 package dictionary import java io Serializable import java util Objects import javax xml bind annotation XmlEleme
如何获取在代码中 attrs.xml 中创建的枚举

我创建了一个自定义视图找到它here https bitbucket org informatic0re awesome font iconview 具有枚举类型的可声明样式属性在 xml 中我现在可以为我的自定义属性选择枚举条目之一
在监督分类中，使用partial_fit() 的MLP 比使用fit() 的表现更差

我正在使用的学习数据集是灰度图像flatten让每个像素代表一个单独的样本第二张图像在训练后将被逐像素分类Multilayer perceptron MLP 前一个分类器我遇到的问题是MLP当它一次接收到所有训练数据集时表现更好 fit
Java：枚举：NoClassDefFoundError

我在 J2EE 应用程序中使用枚举时遇到问题我在无状态服务 bean 内的 switch case 中使用枚举在运行时我在 switch 语句上看到以下异常 Caused by java lang NoClassDefFoundErr
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法

随机推荐

使用 NSLayoutManager 计算每个字形的帧

在这个线程上 Core Text 在 iOS 中计算字母框架 https stackoverflow com questions 21443625 core text calculate letter frame in ios 他们能够使用
DebugDiag 和 MVC4 没有提供可用的堆栈跟踪

我刚刚在我们的生产服务器上遇到了高 CPU 问题并决定在本地练习调试此类情况以便将来为此做好准备但是当我尝试调试本地 MVC4 站点时我没有获得与教程相同的信息堆栈跟踪做问题有谁知道是否可以获得更多信息的堆栈跟踪我希望在某个地
MKAnnotation - 地图图钉标注在其他地图图钉后面弹出

我的地图图钉可以非常密集地填充因此当选择一个图钉时标注会弹出但大部分被所有其他地图图钉遮挡我可以将地图图钉放在前面它有一个代表选定的地图图钉不是点击标注选择引脚有什么解决方法的建议吗如果您使用自定义注释视图您可以为选定的
具有可变列数的 Infragistics XamDataGrid

我需要能够支持 XamDataGrid 它在设计时不会有一定数量的列例如应用程序将运行从服务器获取一些数据并创建一些对象根据服务器的响应每次运行应用程序时可能会有不同数量的对象这是我的意思的一个例子假设我调用某个服务并返回带有
添加依赖后无法合并dex

我收到错误错误任务 app transformDexArchiveWithExternalLibsDexMergerForPaidFreeDebug 执行失败 java lang RuntimeException com android
仅在全日历中允许后台事件发生 eventOverlap

有没有办法避免事件重叠就像 fullcalendar 配置中的 eventOverlap false 一样但另一方面允许背景事件重叠我想将一些事件作为背景事件渲染到我的日历中就像信息一样其他日历中已经有一些事件但允许我在顶部创建
使用 Rally API 通过迭代获取用户故事

我不知道如何在 Rally 中获取一个用户故事的所有字段现在我需要获取最后 5 次迭代并计算每次迭代的完成点我设法通过指定来获取迭代type iteration 但不知道如何获取这些迭代的用户故事以及如何指定仅完成我应该和Tas
Node.js 作为服务，exec 不起作用

我正在使用 nssm 将 Node js 项目作为服务运行当用户单击我的 Nodejs 网站上的按钮时它应该运行require child process exec cmd c batfile bat function res send
CakePHP 分页 - 如何从 url 中删除“page:”以获得更好的 seo/更干净的 URL

当我使用 CakePHP Paging 时我得到一个像这样的 url http example com php page 2 我必须在控制器视图和routes php中更改什么才能创建这样的工作网址 http example com p
修改实体框架中实体的属性会导致验证错误

我试图简单地加载一个实体修改一个属性然后将其保存回数据库 var db new NewsletterContext var newsletter db Newsletters Find x gt x ID newsletterID ne
AFNetworking POST 请求中的 JSON 数据混乱

我正在使用 AFNetworking for Objective C 发送请求当我 NSLog 参数时这是我发送的对象 games id 50 p 8 ts 0 tt tw 0 ys 35150 yt 156424496 37 4166
EventStore 基础知识 - 事件元数据/元数据和事件数据之间有什么区别？

我刚刚开始使用理解事件存储 https geteventstore com 或此处可能已知的 get event store 我已经阅读了有关客户预测和订阅的文档并准备开始在一些内部项目中使用我无法完全克服的一件事是是否有一个指南
有没有办法在 Redis 和关系数据库中使用带有 @RedisHash 的实体？

我正在使用Spring引导为了将我的实体保存在关系数据库上我配置了一个数据源和我的域类例如 Entity Table schema schema name name tb name public class table name ex
Javascript：如何将相同的事件侦听器重新附加到重复出现的元素？

在我的代码中我有一个 h1 容器里面有 h1 元素如下所示 div h1 Title H1 h1 div 然后我将一个事件侦听器附加到 h1 元素以便在用户单击 h1 元素时提醒 h1 文本 var h1 document get
Java 8 中函数式接口的用途是什么？

我在 Java 8 中遇到了一个新术语函数式接口我在使用时只能找到它的一种用途lambda 表达式 Java 8提供了一些内置的函数式接口如果我们想定义任何函数式接口那么我们可以使用 FunctionalInterface注解它将
python中装饰器类的解释

在阅读一些 python 模块时我遇到了这个装饰器类 this decorator lets me use methods as both static and instance methods class omnimethod obje
有什么方法可以让 git 直接使用 .pac （代理自动配置）脚本吗？

我的公司网络使用 PAC 脚本 http proxyconf xxx yy ss proxy pac http proxyconf xxx yy ss proxy pac 在 git config 命令中使用 PAC 脚本不起作用 git
使用 ECB 模式的 CryptoJS AES 加密使用相同的参数会产生不同的结果

正如本文中提到的answer https stackoverflow com a 47096284 940030 我可以使用 ECB 模式将转换后的值反转回纯文本而不仅仅是将其与另一个哈希值进行比较但是使用以下代码片段 const x
排序链表最简单的方法

我正在尝试为链表编写非常基本的排序方法我遇到了未处理的异常我犯了什么错误这是我的代码 struct LinkedNode structure for linked list int data struct LinkedNode nex
以分类变量（枚举）作为输入的神经网络

我正在尝试使用神经网络解决一些机器学习问题主要是使用NEAT进化增强拓扑的神经进化我的一些输入变量是连续的但其中一些具有分类性质例如物种狮子豹子老虎美洲虎行业医疗保健保险金融 IT 广告起初我想通过将类别映射

以分类变量（枚举）作为输入的神经网络

Update

以分类变量（枚举）作为输入的神经网络 的相关文章

随机推荐

热门标签

以分类变量（枚举）作为输入的神经网络的相关文章