如何计算逻辑回归精度

2024-04-06

我是机器学习和 Python 编码的完全初学者，我的任务是从头开始编码逻辑回归，以了解幕后发生的情况。到目前为止，我已经编码了假设函数、成本函数和梯度下降，然后编码了逻辑回归。然而，在打印精度编码时，我得到的输出较低（0.69），该输出不会随着迭代次数的增加或学习率的变化而改变。我的问题是，我下面的准确性代码有问题吗？任何指向正确方向的帮助将不胜感激

X = data[['radius_mean', 'texture_mean', 'perimeter_mean',
   'area_mean', 'smoothness_mean', 'compactness_mean', 'concavity_mean',
   'concave points_mean', 'symmetry_mean', 'fractal_dimension_mean',
   'radius_se', 'texture_se', 'perimeter_se', 'area_se', 'smoothness_se',
   'compactness_se', 'concavity_se', 'concave points_se', 'symmetry_se',
   'fractal_dimension_se', 'radius_worst', 'texture_worst',
   'perimeter_worst', 'area_worst', 'smoothness_worst',
   'compactness_worst', 'concavity_worst', 'concave points_worst',
   'symmetry_worst', 'fractal_dimension_worst']]
X = np.array(X)
X = min_max_scaler.fit_transform(X)
Y = data["diagnosis"].map({'M':1,'B':0})
Y = np.array(Y)

X_train,X_test,Y_train,Y_test = train_test_split(X,Y,test_size=0.25)

X = data["diagnosis"].map(lambda x: float(x))

def Sigmoid(z):
    if z < 0:
        return 1 - 1/(1 + math.exp(z))
    else:
        return 1/(1 + math.exp(-z))

def Hypothesis(theta, x):
    z = 0
    for i in range(len(theta)):
        z += x[i]*theta[i]
    return Sigmoid(z)

def Cost_Function(X,Y,theta,m):
    sumOfErrors = 0
    for i in range(m):
        xi = X[i]
        hi = Hypothesis(theta,xi)
        error = Y[i] * math.log(hi if  hi >0 else 1)
        if Y[i] == 1:
            error = Y[i] * math.log(hi if  hi >0 else 1)
        elif Y[i] == 0:
            error = (1-Y[i]) * math.log(1-hi  if  1-hi >0 else 1)
        sumOfErrors += error

    constant = -1/m
    J = constant * sumOfErrors
    #print ('cost is: ', J ) 
    return J

def Cost_Function_Derivative(X,Y,theta,j,m,alpha):
    sumErrors = 0
    for i in range(m):
        xi = X[i]
        xij = xi[j]
        hi = Hypothesis(theta,X[i])
        error = (hi - Y[i])*xij
        sumErrors += error
    m = len(Y)
    constant = float(alpha)/float(m)
    J = constant * sumErrors
    return J

def Gradient_Descent(X,Y,theta,m,alpha):
    new_theta = []
    constant = alpha/m
    for j in range(len(theta)):
        CFDerivative = Cost_Function_Derivative(X,Y,theta,j,m,alpha)
        new_theta_value = theta[j] - CFDerivative
        new_theta.append(new_theta_value)
    return new_theta


def Accuracy(theta):
    correct = 0
    length = len(X_test, Hypothesis(X,theta))
    for i in range(length):
        prediction = round(Hypothesis(X[i],theta))
        answer = Y[i]
    if prediction == answer.all():
            correct += 1
    my_accuracy = (correct / length)*100
    print ('LR Accuracy %: ', my_accuracy)



def Logistic_Regression(X,Y,alpha,theta,num_iters):
    theta = np.zeros(X.shape[1])
    m = len(Y)
    for x in range(num_iters):
        new_theta = Gradient_Descent(X,Y,theta,m,alpha)
        theta = new_theta
        if x % 100 == 0:
            Cost_Function(X,Y,theta,m)
            print ('theta: ', theta)    
            print ('cost: ', Cost_Function(X,Y,theta,m))
    Accuracy(theta)

initial_theta = [0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]  
alpha = 0.0001
iterations = 1000
Logistic_Regression(X,Y,alpha,initial_theta,iterations)

这是使用来自威斯康星州乳腺癌数据集的数据（https://www.kaggle.com/uciml/breast-cancer-wisconsin-data https://www.kaggle.com/uciml/breast-cancer-wisconsin-data），我权衡了 30 个特征 - 尽管将特征更改为已知相关的特征也不会改变我的准确性。

Python 为我们提供了这个 scikit-learn 库，使我们的工作更加轻松，这对我有用：

from sklearn.metrics import accuracy_score

y_pred = log.predict(x_test)

score =accuracy_score(y_test,y_pred)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何计算逻辑回归精度的相关文章

将 transaction.commit_manually() 升级到 Django > 1.6

我继承了为 Django 1 4 编写的应用程序的一些代码我们需要更新代码库以使用 Django 1 7 并最终更新到 1 8 作为下一个长期支持版本在一些地方它使用旧风格 transaction commit manually and
如何使用 colorchecker 在 opencv 中进行颜色校准？

我有数码相机获取的色彩检查器图像我如何使用它来使用 opencv 校准图像按照以下颜色检查器图像操作您是想问如何进行颜色校准或如何使用 OpenCV 进行校准为了进行颜色校准您可以使用校准板的最后一行灰色调以下是您应该逐步进行
在 python 3 中使用子进程

我使用 subprocess 模块在 python 3 中运行 shell 命令这是我的代码 import subprocess filename somename py in practical i m using a real fil
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
“一旦获取切片就无法更新查询”。最佳实践？

由于我的项目的性质我发现自己不断地从查询集中取出切片如下所示 Thread objects filter board requested board id order by updatedate 10 但这给我带来了实际对我选择的元素进
PyTorch 给出 cuda 运行时错误

我对我的代码做了一些小小的修改以便它不使用 DataParallel and DistributedDataParallel 代码如下 import argparse import os import shutil import time
ImportError：运行 jupyter Notebook 时没有名为 IPython.paths 的模块？

我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是当我运行 jupyter Notebo
小部件之间的自定义信号

尝试将信号从一个 gtk EventBox 子级发送到另一个在 init HeadMode 第 75 行上出现错误类型错误未知信号名称消息发送 why usr bin env python coding utf8 import p
根据 Pandas 中的列表对多列进行排序

感谢有关如何根据 pandas 中的倍数列表对给定多列进行排序的任何提示如下所示 import pandas as pd sort a a d e sort b s1 s3 s6 sort c t1 t2 t3 df pd DataFra
编辑 Jupyter Notebook 时 VS Code 中缺少“在选择中查找”

使用 Jupyter Notebook 时 VSCode 中缺少在选择中查找按钮它会减慢开发速度所以我想请问有人知道如何激活它吗第一张图显示了在 python 文件中的搜索替换第二张图显示了笔记本电脑中缺少的按钮 Python
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
揭秘sharedctypes性能

在 python 中可以在多个进程之间共享 ctypes 对象然而我注意到分配这些对象似乎非常昂贵考虑以下代码 from multiprocessing import sharedctypes as sct import ctypes
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
Werkzeug 中的线程和本地代理。用法

首先我想确保我正确理解了功能的分配分配本地代理功能以通过线程内的模块包共享变量对象我对吗其次用法对我来说仍然不清楚也许是因为我误解了作业我用烧瓶如果我有两个或更多模块 A B 我想将对象C从模块A导入到模块B 但我
使用 pybtex 将 bibtex 转换为格式化的 HTML 参考书目，例如哈佛风格

我正在使用 Django 并将 bibtex 存储在我的模型中并且希望能够以格式化 HTML 字符串的形式向我的视图传递引用使其看起来像哈佛引用样式使用中描述的方法Pybtex 无法识别 bibtex 条目 https stackov
Flask 应用程序的测试覆盖率不起作用

您好想在终端的 Flask 应用程序中测试删除路由我可以看到测试已经过去它说 test user delete test app LayoutTestCase ok 但是当我打开封面时它仍然是红色的这意味着没有覆盖它请有人向我
从列表python的单个列表中删除子列表

我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时它不适用于我
导入错误：无法导入名称“时间戳”

我使用以下代码在 python 3 6 3 中成功安装了 ggplot conda install c conda forge ggplot 但是当我使用下面的代码将其导入笔记本时出现错误 from ggplot import Impor
[cocos2d-x]当我尝试在 Windows 10 中运行“python android-build.py -p 19 cpp-tests”时出现错误

当我尝试运行命令时python android build p cpp tests 我收到如图所示的错误在此之前我收到了另一条关于 Android SDK Tools 版本兼容性的错误消息所以我只是将 sdk 版本从 26 0 0
tkinter：打开一个带有按钮提示的新窗口[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案用户如何按下 tkinter GUI 中的按钮来打开新窗口我只需要非常简单的解决方案如果代码也能被解释那就太好了这

随机推荐

使用非静态数据成员和嵌套类构造函数的类内初始化时出错

下面的代码非常简单我预计它应该可以正常编译 struct A struct B int i 0 B b A const B b B b b 我已经使用 g 版本 4 7 2 4 8 1 clang 3 2 和 3 3 测试了此代码除了
有效填充具有许多 if else 语句的多维数组

我想以特定且有效的方式填充 4dim numpy 数组因为我不太了解所以我开始用 if else 语句编写代码但这看起来不太好可能很慢而且我也不能真正确定我是否考虑了每种组合这是我停止写下的代码 sercnew2 numpy z
我可以在不使用 android 上的 firebase 事件监听器的情况下获得价值吗？

我正在使用新版本的 Google Firebase 实时数据库制作 Android 应用程序当数据更改添加删除移动等时我使用 ValueEventListener 和 ChildEventListener 获取数据现在我有一个
如何使用 python 和 win32 api 将彩色文本写入文本框？

基本上我想使用 python 将彩色文本写入另一个应用程序的文本框窗口总体思路是 win32gui SendMessage hwnd EM SETCHARFORMAT SCF SELECTION format 其中格式是字符格式 http
使用 IDE 上下文行为创建 Java 注释

我创建了一个注释 Highlights this method is declared in XML public interface FromXML 我在类似这样的方法上使用它 FromXML public void onSomethin
在WP7中预初始化BackgroundAudioPlayer？

当我在 Windows Phone 7 应用程序中使用 BackgroundAudioPlayer 时第一次要播放歌曲时需要花费大量时间来加载有没有什么方法可以在播放第一首曲目之前预初始化BackgroundAudioPlayer 以便
链接具有不兼容依赖项的库

我正在开发一个需要两个第三方库的 C 项目 libfoo so and libbar so 我的操作系统是Linux libfoo so动态链接到 libpng14 so 14 1 4 8 EDIT 1 libbar so似乎静态链接到未
Facebook iframe 应用程序授权后重定向到 Facebook 页面选项卡

我在授权后将用户重定向回 Facebook 页面中的应用程序选项卡时遇到问题我总是最终进入独立的应用程序画布页面 Edit 它本来是一个选项卡中的应用程序在 Facebook 页面内我想做授权然后重定向用户返回页面选项卡但当你这
如何创建工具提示来显示单个控件的多个验证错误？

我试图通过控件上的工具提示来显示控件的多个验证错误但没有找到实现此目的的方法我可以通过具有如下样式的工具提示轻松显示控件的单个验证错误
简单：Python 要求输入两次

这是我的代码 def calculator value1 value2 function input Function if function return value1 value2 if function return value1 v
glassfish：部署应用程序时出现 IOException：无效的 zip 文件

通过 CLI 部署 EAR 时会出现以下错误 Exception while deploying the app EnterpriseLegacy java io IOException invalid zip file file hom
在 SearchView 上显示错误消息

我在 ActionBar 中使用 SearchView 我想知道如果输入无效是否可以显示错误类似于EditText s showError method 我知道这可能是反模式因为任何搜索都不应无效我配置了SearchView以某种方
Docker 镜像中不包含 wwwroot 中的静态文件

只是玩了一下我得到了一个 Visual Studio 解决方案包含 3 个项目这三个都是需要的一个项目一是应用程序的 UI 当然它包含 wwwroot 中的静态文件我想对应用程序进行 docker 化 Dockerfile
将浮点数转换为字节数组的 C 函数

我正在尝试创建一个函数来接受浮点变量并将其转换为字节数组我找到了一段有效的代码片段但如果可能的话希望在函数中重用它我也在使用 Arduino 环境但我知道它接受大多数 C 语言目前工作 float variable 1 11 b
data.table中扩展窗口（累积计算）：如何提高性能

我对在不同时间步骤收集的数据进行了分组在每个时间步内都有多个值注册每个值可能在时间步内或时间步之间出现一次或多次一些玩具数据 df lt data frame grp rep 1 2 each 8 time c rep 1 3 re
Django REST 框架：对象级别权限帮助

按照本教程操作 http django rest framework org tutorial 1 serialization html http django rest framework org tutorial 1 serializa
OAuth2 是否允许使用非密码或自定义凭据进行授权？

我正在使用 Spring Security OAuth2 客户端应用程序我们拥有的发出密码授予请求传递用户的用户名和密码正如草案所规定的那样我需要此机制还支持其他类型的凭据例如卡号 PIN 码甚至是预先验证的无需密码的授
迁移 admin.0001_initial 在数据库“default”上的依赖项 app.0001_initial 之前应用

我正在尝试为我的项目制作定制的用户模型Django My 模型 py class myCustomeUser AbstractUser id models AutoField primary key True username models
`sqlite3` 忽略 `sqlite3_busy_timeout`？

I use sqlite3在多线程应用程序中它是用SQLITE THREADSAFE 2 在观察窗口中我看到sqlite gt busyTimeout 600000 我 e 应该有 10 分钟的超时时间然而 sqlite3 step回报
如何计算逻辑回归精度

我是机器学习和 Python 编码的完全初学者我的任务是从头开始编码逻辑回归以了解幕后发生的情况到目前为止我已经编码了假设函数成本函数和梯度下降然后编码了逻辑回归然而在打印精度编码时我得到的输出较低 0 69 该输出不会随

如何计算逻辑回归精度

如何计算逻辑回归精度 的相关文章

随机推荐

热门标签

如何计算逻辑回归精度的相关文章