成本函数和梯度似乎有效，但 scipy.optimize 函数无效

2024-03-21

我正在为 Andrew NG Coursera 课程编写 Matlab 代码，并将其转换为 python。我正在研究非正则化逻辑回归，在编写梯度和成本函数后，我需要类似于 fminunc 的东西，经过一番谷歌搜索后，我找到了几个选项。它们都返回相同的结果，但与 Andrew NG 的预期结果代码中的内容不匹配。其他人似乎让它正常工作，但我想知道为什么我的特定代码在使用 scipy.optimize 函数时似乎没有返回所需的结果，但在代码前面的成本和梯度部分却返回了预期的结果。

我正在使用的数据可以在下面的链接中找到；

ex2data1 https://drive.google.com/file/d/0B2hAHTxAKpLdUVdRR0QyaV9pRmc/view?usp=sharing

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import scipy.optimize as op


#Machine Learning Online Class - Exercise 2: Logistic Regression

#Load Data
#The first two columns contains the exam scores and the third column contains the label.

data = pd.read_csv('ex2data1.txt', header = None)
X = np.array(data.iloc[:, 0:2]) #100 x 3
y = np.array(data.iloc[:,2]) #100 x 1
y.shape = (len(y), 1)


#Creating sub-dataframes for plotting
pos_plot = data[data[2] == 1]
neg_plot = data[data[2] == 0]


#==================== Part 1: Plotting ====================
#We start the exercise by first plotting the data to understand the 
#the problem we are working with.

print('Plotting data with + indicating (y = 1) examples and o indicating (y = 0) examples.')

plt.plot(pos_plot[0], pos_plot[1], "+", label = "Admitted")
plt.plot(neg_plot[0], neg_plot[1], "o", label = "Not Admitted")
plt.xlabel('Exam 1 score')
plt.ylabel('Exam 2 score')
plt.legend()
plt.show()


def sigmoid(z):
    '''
    SIGMOID Compute sigmoid function
    g = SIGMOID(z) computes the sigmoid of z.
    Instructions: Compute the sigmoid of each value of z (z can be a matrix,
    vector or scalar).
    '''
    g = 1 / (1 + np.exp(-z))
    return g


def costFunction(theta, X, y):
    '''
    COSTFUNCTION Compute cost and gradient for logistic regression
    J = COSTFUNCTION(theta, X, y) computes the cost of using theta as the
    parameter for logistic regression and the gradient of the cost
    w.r.t. to the parameters.
    '''
    m = len(y) #number of training examples

    h = sigmoid(X.dot(theta)) #logisitic regression hypothesis
    J = (1/m) * np.sum((-y*np.log(h)) - ((1-y)*np.log(1-h)))

    #h is 100x1, y is %100x1, these end up as 2 vector we subtract from each other
    #then we sum the values by rows
    #cost function for logisitic regression
    return J

def gradient(theta, X, y):
    m = len(y)
    grad = np.zeros((theta.shape))
    h = sigmoid(X.dot(theta))
    for i in range(len(theta)): #number of rows in theta
        XT = X[:,i]
        XT.shape = (len(X),1)
        grad[i] = (1/m) * np.sum((h-y)*XT) #updating each row of the gradient
    return grad


#============ Part 2: Compute Cost and Gradient ============
#In this part of the exercise, you will implement the cost and gradient
#for logistic regression. You neeed to complete the code in costFunction.m


#Add intercept term to x and X_test
Bias = np.ones((len(X), 1))
X = np.column_stack((Bias, X))


#Initialize fitting parameters
initial_theta = np.zeros((len(X[0]), 1))


#Compute and display initial cost and gradient
(cost, grad) = costFunction(initial_theta, X, y), gradient(initial_theta, X, y)

print('Cost at initial theta (zeros): %f' % cost)
print('Expected cost (approx): 0.693\n')
print('Gradient at initial theta (zeros):')
print(grad)
print('Expected gradients (approx):\n -0.1000\n -12.0092\n -11.2628')


#Compute and display cost and gradient with non-zero theta
test_theta = np.array([[-24], [0.2], [0.2]]);
(cost, grad) = costFunction(test_theta, X, y), gradient(test_theta, X, y)

print('\nCost at test theta: %f' % cost)
print('Expected cost (approx): 0.218\n')
print('Gradient at test theta:')
print(grad)
print('Expected gradients (approx):\n 0.043\n 2.566\n 2.647\n')


result = op.fmin_tnc(func = costFunction, x0 = initial_theta, fprime = gradient, args = (X,y))
result[1]


Result = op.minimize(fun = costFunction, 
                                 x0 = initial_theta, 
                                 args = (X, y),
                                 method = 'TNC',
                                 jac = gradient, options={'gtol': 1e-3, 'disp': True, 'maxiter': 1000})


theta = Result.x
theta

test = np.array([[1, 45, 85]]) 
prob = sigmoid(test.dot(theta))
print('For a student with scores 45 and 85, we predict an admission probability of %f,' % prob)
print('Expected value: 0.775 +/- 0.002\n')

这是一个非常难以调试的问题，并且说明了该问题的文档记录不足的一个方面scipy.optimize界面。该文档模糊地表明theta将作为vector:

一个或多个变量的标量函数的最小化。

一般来说，优化问题的形式如下：
minimize f(x) subject to

g_i(x) >= 0,  i = 1,...,m
h_j(x)  = 0,  j = 1,...,p 
其中 x 是一个或多个变量的向量。

重要的是它们的真正含义vector最原始意义上的一维数组。所以你必须预料到，无论何时theta被传递到您的回调之一中，它将作为一维数组传递。但在numpy，一维数组的行为有时与二维行数组不同（显然，也与二维列数组不同）。

我不知道为什么它会在你的情况下引起问题，但无论如何它很容易修复。您只需在成本函数和梯度函数的顶部添加以下内容：

theta = theta.reshape(-1, 1)

这保证了theta正如预期的那样，将是一个二维列数组。完成此操作后，结果就是正确的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

成本函数和梯度似乎有效，但 scipy.optimize 函数无效的相关文章

将 geojson 文件下载到 jupyter 中的 folium 中

我想要一张欧洲地图作为 json 文件这样我就可以使用 geojson 将其作为图层放置在 Folium 地图上这样我就可以将我的数据集嵌入到其中以显示欧洲哪个国家的酒精含量最高我在从 GitHub 获取 json 文件以在 jy
Python 错误：将 statsmodels 与一行数据一起使用时，对象的 len() 未调整大小

我可以使用 statsmodel 的 WLS 加权最小二乘回归 http statsmodels sourceforge net devel generated statsmodels regression linear model WLS
如何使用格式保存 Tkinter 文本小部件的内容

我在 python 中使用 Tkinter 在文本窗口中显示输出我发现使用 get 功能我可以从此窗口检索文本内容但我有用不同背景颜色标记的文本部分是否可以将内容与这些颜色一起复制到文件例如 html 或 doc 中没有对你想要的
使用 scipy、python、numpy 进行非线性 e^(-x) 回归

下面的代码为我提供了一条最佳拟合线的平坦线而不是沿着 e x 模型的一条适合数据的漂亮曲线谁能告诉我如何修复下面的代码以使其适合我的数据 import numpy as np import matplotlib pyplot as pl
ipython/jupyter 中的 tk 问题

我正在尝试编写一个用于从 ipython jupyter 笔记本启动的 gui 但在笔记本中使用 tkinter 时遇到了麻烦特别是在让 tk gui 窗口正常关闭方面如何从 jupyter 制作启动 tkinter gui 然后在不
PyQt5 的 OpenGL 模块和版本控制问题（调用不正确的 _QOpenGLFunctions_(ver)）

我一直在努力得到PyQt5 helloGL 示例代码 https github com baoboa pyqt5 blob master examples opengl hellogl py编译当我尝试构建解决方案时我得到 Traceb
R.scale() 和 sklearn.preprocessing.scale() 之间的区别

我目前正在将数据分析从 R 转移到 Python 当在 R 中缩放数据集时我将使用 R scale 根据我的理解它将执行以下操作 x mean x sd x 为了替换该函数我尝试使用 sklearn preprocessing sca
如何使用Peewee查询多个相似的数据库？

我遇到了使用 Peewee 查询多个数据库的问题我有 2 个现有的 mysql 数据库让我们将它们命名为 A 和 B 结构相似因为它是两个 Bugzilla 数据库我使用 Pwiz 生成模型 modelsA py 和 modelsB
错误：tensorflow：无法匹配检查点的文件

我正在训练一个张量流模型在每个时期之后我都会保存模型状态并腌制一些数组到目前为止我的模型执行了 2 个纪元并且保存状态的文件夹包含以下文件 checkpoint model e knihy preprocessed txt e0 c
如何在solidpython中设置特殊变量$fa、$fs、$fn

in 上一个线程 https stackoverflow com questions 54040390 how to save data in stl file after python solid processing显示了如何通过 So
在 Python 中通过网络发送对象的最佳方式是什么？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我需要通过网络发送对象我将使用 Twisted 并且我刚刚开始查看它的文档据我所知 python实现套接字的唯一方式是通过文本那么我如何使
__author__ 的起源是什么？

使用私有元数据变量的约定在哪里 author 一个模块内部从何而来 This http mail python org pipermail python dev 2001 March 013328 htmlPython 邮件列表线程似乎暗示
AppEngine 警告 - OpenBLAS 警告 - 无法确定该系统上的 L2 缓存大小

我尝试在 GC AppEngine 上部署应用程序部署过程中没有错误但应用程序无法运行仅显示加载页面日志中唯一一个奇怪的原始日志 OpenBLAS WARNING could not determine the L2 cache s
如何在 Python 中连接两个列表？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动如何在 Python 中连接两个列表 Example listone 1 2 3 lis
Python-使用元组作为列表索引[重复]

这个问题在这里已经有答案了我有一个元组列表 tuples list 1 0 2 3 3 2 2 0 我想访问二维数组的元素a例如使用其中一些元组 for i in range 3 print a tuples list i 应该输出的值
如何单独捕获这些异常？

我正在编写一个与 Quickbooks 交互的 Python 程序连接到 Quickbooks 时根据问题的不同我可能会遇到以下两个常见异常之一 pywintypes com error 2147352567 Exception oc
`numpy.diff` 和 `scipy.fftpack.diff` 在微分时给出不同的结果

我正在尝试计算一些数据的导数并且正在尝试比较有限差分的输出和谱方法的输出但结果却截然不同我无法弄清楚到底为什么考虑下面的示例代码 import numpy as np from scipy import fftpack as sp
如何使用 PySpark 预处理图像？

我有一个项目需要为 1 设置大数据架构 AWS S3 SageMaker 的概念验证使用 PySpark 预处理图像 2 执行 PCA and 3 训练一些机器或深度学习模型我的问题是了解如何使用 PySpark 操作图像数据但无法在
重写 __cmp__ python 函数

嗨我是压倒一切的 cmp 如果传递的第二个对象是None 或者如果它不是一个实例someClass 然后返回 1 我不明白这里到底发生了什么 class someClass def cmp self obj if obj None ret
如何使用多阶段构建减小 python (docker) 图像大小？

我正在寻找一种使用 python 和 Dockerfile 创建多阶段构建的方法例如使用以下图像第一张图片安装所有编译时要求并安装所有需要的 python 模块第二张图片将所有已编译构建的包从第一个映像复制到第二个映像而不

随机推荐

Mongoid has_and_belongs_to_many 关联

我试图让 mongoid 来保存关联但我只能让一侧工作如果我有以下测试 test should add a user as a follower when a user follows the group do cali group f
没有“isPresent()”检查的“Optional.get()”

我有以下 Java 搜索代码 return getTableViewController getMe getColumns stream filter gt Database equalsColumnName getId columnId
ActionController::Live 是否可以检查连接是否仍然有效？

我正在尝试使用 Rails 4 的实时流媒体来实现文本事件流它工作得很好我遇到的唯一麻烦是我无法在不发送任何消息的情况下检查连接是否有效我想到的唯一解决方案是使用循环刻度生成器创建支持通道以便某些后台任务会定期向那里发送消息但看
调用构造函数重新初始化对象

是否可以使用类的构造函数重新初始化类的对象有点给定 A 类 A a a A 最后一条语句不是初始化而是赋值但它可能会执行您想要的操作
如何在jboss中生成resteasy的wadl文件

我想为我的项目生成一个 wadl 文件该文件使用resteasy Jboss 6 4 Maven 有很多关于球衣的例子但不是关于resteasy的有人用它来resteasy吗 Resteasy 从 3 0 14 Final 开始支持
对 Cassandra 术语感到困惑（行与分区）

我希望有人能够消除我对 Cassandra 中的行和分区之间的区别的困惑我认为一行将是一组列就像在 SQL 数据库中如架构中指定的那样按分区键跨节点分布并按每个分区内的集群键排序但后来我遇到了这个教程 https academy
我应该如何处理非常非常长的 URL？

我想知道这是否是一个错误但现在我对所有搜索 URL 都使用 GET 原因是通过 GET Url 用户可以简单地复制地址栏上的链接并轻松共享或保存例如 Google 似乎也使用 GET Url 表单由于它是一个带有过滤器排序器等的搜
在nodebox opengl中向图形的边缘添加标签

我正在尝试向图表中的每个边添加标签如下所示基本上上面的每个边缘都有标签在中心当我向每个图表添加边时我尝试添加标签就像这样对于图表g g add edge label edge distance 经过一番研究我发现这样的标签是可
将值分配给特定的 data.table 列和行

仍然理解这个伟大的包有人可以解释一下这个错误的原因吗谢谢 library data table DT lt data table id LETTERS var1 rnorm 26 var2 rnorm 26 gt DT 2 list v
如何在heroku上的两个不同应用程序之间共享worker？

我有两个独立的应用程序在heroku上运行并指向同一个数据库第一个负责user interface第二个为admin interface 我在用sidekiq with redis对于后台作业处理我添加了一个工作人员并且可以通过设置指
对大文件使用 Rijndael 加密

我面临的情况是我需要安全地加密解密 n 长度的文件最好使用 Rijndael 但绝对是 256 位加密我以前玩过加密并且非常高兴地加密解密了字符串和字节数组但是因为我不知道文件的大小并且有问题的文件可能非常大 2 5gb
从 VB.NET 应用程序将文件发送到 PHP 脚本

我需要将一些数据从内部网络上的 SQL DB 服务器发送到外部 Web 服务器我希望通过编写一个每天调用一次的 VB NET 应用程序来实现此目的该应用程序将大约 1 MB 的数据发送到 Web 服务器上的 PHP 脚本然后将其存储在
node.js -- 同步执行命令并获取结果

我试图在 node js 中同步执行 child process 是的我知道这很糟糕我有充分的理由并检索 stdout 上的任何输出但我不太清楚如何我发现这个帖子 Node js同步执行系统命令 https stackoverfl
如何在 VBA Sub 中应用 SumIf 公式？出现错误 1004

我正在尝试创建一个 Sub 来放置SUMIF单元格中的公式我已将问题简化为简单的设置 Private Sub CommandButton1 Click Cells 2 3 Formula SUMIF A1 A5 D1 B1 B5 End
Azure 云存储帐户的连接字符串

如何创建到云存储帐户的连接字符串以便可以访问表 blob 和队列示例代码表示赞赏如果您在 Azure 门户中查看相关存储帐户下的内容并查看左侧导航栏中的访问密钥项则会显示提供的两个密钥以及访问存储帐户所需的整个连接字符串
链接 C++ 流

我正在考虑将几个 C iostream 链接在一起以过滤输入两次我正在使用 gzstreams 读取 zlib 压缩文件并且正在考虑编码一个从流中读取并执行编码转换的流也许通过传递一个打开的流作为构造函数参数您认为这可以最好地实现
水晶报表-关闭数据库连接

这是C Visual Studio 2008 VS2008附带的水晶报表我有一个驻留在 DLL 中的水晶报表查看器表单 DLL 负责加载水晶报表基于报表文件名并将报表显示在窗体上当我完成水晶报表后我对加载的报表文档对象调用 dis
Yeomen webapp 生成器在 Windows 上的 grunt 构建上失败

我正在尝试 yeomen 脚手架工具唯一的问题是我遇到了一些问题和咕噜声我正在尝试使用 webapp 生成器组装一个简单的网站搭建应用程序并使用grunt serve工作完美仅在使用时失败grunt build 它失败并显示以下消息
在for循环中取消NSOperation？

我正在尝试使用在后台线程上实现搜索NSOperation on iOS 我不想子类化NSOperation所以这就是我正在做的 searchQueue cancelAllOperations NSInvocationOperation op
成本函数和梯度似乎有效，但 scipy.optimize 函数无效

我正在为 Andrew NG Coursera 课程编写 Matlab 代码并将其转换为 python 我正在研究非正则化逻辑回归在编写梯度和成本函数后我需要类似于 fminunc 的东西经过一番谷歌搜索后我找到了几个选项它们都

成本函数和梯度似乎有效，但 scipy.optimize 函数无效

成本函数和梯度似乎有效，但 scipy.optimize 函数无效 的相关文章

随机推荐

热门标签

成本函数和梯度似乎有效，但 scipy.optimize 函数无效的相关文章