如果您的标准可以表示为现有模块和标准的组合,那么最好使用容器简单地构造这样的组合。唯一的问题是标准容器被设计为仅与模块一起使用,而不是与标准一起使用。区别在于:forward
方法签名:
module:forward(input)
criterion:forward(input, target)
幸运的是,我们可以自由定义自己的容器,它也可以使用标准。例如,顺序:
local GeneralizedSequential, _ = torch.class('nn.GeneralizedSequential', 'nn.Sequential')
function GeneralizedSequential:forward(input, target)
return self:updateOutput(input, target)
end
function GeneralizedSequential:updateOutput(input, target)
local currentOutput = input
for i=1,#self.modules do
currentOutput = self.modules[i]:updateOutput(currentOutput, target)
end
self.output = currentOutput
return currentOutput
end
下面是如何实现的图解nn.CrossEntropyCriterion
具有这个通用的顺序容器:
function MyCrossEntropyCriterion(weights)
criterion = nn.GeneralizedSequential()
criterion:add(nn.LogSoftMax())
criterion:add(nn.ClassNLLCriterion(weights))
return criterion
end
检查一切是否正确:
output = torch.rand(3,3)
target = torch.Tensor({1, 2, 3})
mycrit = MyCrossEntropyCriterion()
-- print(mycrit)
print(mycrit:forward(output, target))
print(mycrit:backward(output, target))
crit = nn.CrossEntropyCriterion()
-- print(crit)
print(crit:forward(output, target))
print(crit:backward(output, target))