我的机器学习--线性回归

2023-11-06

1. 最小二乘法

上述方法可以直接得到线性回归方程

import numpy as np
import matplotlib.pyplot as plt
x=2*np.random.rand(100,1)
y=4+3*x+np.random.randn(100,1)
plt.plot(x,y,'.')
x=np.c_[np.ones((100,1)),x]
#公式
theta=np.linalg.inv(x.T.dot(x)).dot(x.T).dot(y)

test_x=np.array([[0],[2]])
test_x_b=np.c_[np.ones((2,1)),test_x]
predict_y=test_x_b.dot(theta)

plt.plot(test_x,predict_y,'r--')
plt.axis([0,2,0,15])
plt.show()

2.通过sklearn库函数

from sklearn.linear_model import LinearRegression
import numpy as np
x=2*np.random.rand(100,1)
y=4+3*x+np.random.randn(100,1)
lin_reg=LinearRegression()
lin_reg.fit(x,y)
#获取theta
print(lin_reg.coef_)
#获取偏置值
print(lin_reg.intercept_)

3.批量梯度下降

import numpy as np
x=2*np.random.rand(100,1)
y=4+3*x+np.random.randn(100,1)
learning_rate=0.01
iterations=1000
x_b=np.c_[np.ones((100,1)),x]
m=100
theta=np.random.randn(2,1)
for i in range(iterations):  #迭代次数
    gradients=2/m*(x_b).T.dot(x_b.dot(theta)-y)  
    theta=theta-learning_rate*gradients
print(theta)

4.随机梯度下降

import numpy as np
x=2*np.random.rand(100,1)
y=4+3*x+np.random.randn(100,1)
x_b=np.c_[np.ones((x.shape[0],1)),x];
n_epochs=50
m=x_b.shape[0]
theta=np.random.randn(2,1)
learning_rate=0.01
for epoch in range(n_epochs):   #迭代次数
    for i in range(m):          #每次迭代过程中随机选择样本优化的次数 
        random_index=np.random.randint(m)
        xi=x_b[random_index:random_index+1]
        yi=y[random_index:random_index+1]
        gradients=2*xi.T.dot(xi.dot(theta)-yi)
        theta=theta-learning_rate*gradients
print(theta)

5.小批量梯度下降

import numpy as np
x=2*np.random.rand(100,1)
y=4+3*x+np.random.randn(100,1)
x_b=np.c_[np.ones((x.shape[0],1)),x];
n_epochs=50     #迭代次数
minibatch=16    #小批量处理的个数
m=x_b.shape[0]
learing_rate=0.01
theta=np.random.randn(2,1)
for epoch in range(n_epochs):
    shuffled_indices=np.random.permutation(m)  #每次迭代中打乱下标，这样每次迭代按顺序选取的样本不同
    x_b_shuffled=x_b[shuffled_indices]
    y_shuffled=y[shuffled_indices]
    for i in range(0,m,minibatch):
        xi=x_b_shuffled[i:i+minibatch]
        yi=y_shuffled[i:i+minibatch]
        gradients=2/minibatch*xi.T.dot(xi.dot(theta)-yi)
        theta=theta-learing_rate*gradients
print(theta)

6.多元线性回归

import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression
x=6*np.random.rand(100,1)-3
y=0.5*x**2+x+np.random.randn(100,1)
plt.plot(x,y,'r.')
plt.axis([-4,4,-5,10])
ploy=PolynomialFeatures(degree=2,include_bias=False)
#将x变成含有x，x^2，degree为要添加的维度，include_bias为是否添加偏置项
x_ploy=ploy.fit_transform(x)
print(x[0])
print(x_ploy[0])
"""
[-2.84058046]
[-2.84058046  8.06889736]
"""
lin_reg=LinearRegression()
lin_reg.fit(x_ploy,y)
print(lin_reg.coef_)
print(lin_reg.intercept_)
"""
[[0.99806951 0.49324959]]
[-0.02205689]
"""
x_pred=np.linspace(-3,3,100).reshape(100,1)
x_pred_ploy=ploy.transform(x_pred)
y_pred=lin_reg.predict(x_pred_ploy)
plt.plot(x_pred,y_pred,'--')
plt.show()

6.建立流水化

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression
import numpy as np
import matplotlib.pyplot as plt
x=6*np.random.rand(100,1)-3
y=x**3+2*x**2+x*5+np.random.randn(100,1)
plt.plot(x,y,'.')
poly=PolynomialFeatures(degree=3,include_bias=False)   #实例出转化维度的对象
std=StandardScaler()                                   #标准化
lin_reg=LinearRegression()                             #线性回归
polynomial_reg=Pipeline([('poly_features',poly),
                         ('StandardScaler',std),
                         ('lin_reg',lin_reg)])
#该类会依次调用前面函数的fit（）和transfrom（）函数，只调用最后一个函数的fit（）函数
polynomial_reg.fit(x,y)
print(lin_reg.coef_)
print(lin_reg.intercept_)
x_test=np.linspace(-3,3,100).reshape(100,1)
x_test_p=poly.transform(x_test)
y_test=lin_reg.predict(x_test_p)
plt.plot(x_test,y_test)
plt.show()

7.正则化------岭回归

α表示正则化系数

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import Ridge
import numpy as np
import matplotlib.pyplot as plt
plt.figure(figsize=(14,6))
np.random.seed(42)
x=3*np.random.rand(20,1)
y=0.5*x+np.random.randn(20,1)/1.5+1
plt.plot(x,y,'.')
poly=PolynomialFeatures(degree=10,include_bias=False)
std=StandardScaler()
lin_reg=Ridge(alpha=0.5)   
#正则化系数，正则化系数越大，表示theta越平均，即函数曲线越平
polynomial_reg=Pipeline([('poly_features',poly),
                         ('StandardScaler',std),
                         ('lin_reg',lin_reg)])
polynomial_reg.fit(x,y)
x_test=np.linspace(0,3,100).reshape(100,1)
x_test_p=poly.transform(x_test)
y_test=polynomial_reg.predict(x_test)
plt.plot(x_test,y_test)
plt.show()

梯度下降含义

在线性回归问题中，误差函数是一个开口向上的二次函数

建立训练以及测试数据集

from sklearn.model_selection import train_test_split
import pandas as pd
data=pd.read_excel("")
X=data[:,0]
y=data[:,1]
#训练数据集0.8，测试数据集0.2
X_train,X_test,y_train,y_test=train_test_split(X,y,train_size=0.8)
#或者：X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习

线性回归

人工智能

我的机器学习--线性回归的相关文章

深度好文：最全的大模型 RAG 技术概览

本文是对检索增强生成 Retrieval Augmented Generation RAG 技术和算法的全面研究对各种方法进行了系统性的梳理涉及了 RAG 流程中的数据拆分向量化查询重写查询路由等等在做 RAG 的小伙伴一定知道
【卡尔曼滤波】粗略模型和过滤技术在模型不确定情况下的应用研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文献
用通俗易懂的方式讲解：如何用大语言模型构建一个知识问答系统

传统搜索系统基于关键字匹配在面向游戏攻略技术图谱知识库等业务场景时缺少对用户问题理解和答案二次处理能力本文探索使用大语言模型 Large Language Model LLM 通过其对自然语言理解和生成的能力揣摩用户意图并对
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【多源数据融合】基于Dempster-Shafer理论的信念对数相似度测量及其在多源数据融合中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
基于java的ssh医院在线挂号系统设计与实现

基于java的ssh医院在线挂号系统设计与实现 I 引言 A 研究背景和动机基于Java的SSH医院在线挂号系统设计与实现的研究背景和动机随着信息技术的迅速发展和应用医院在线挂号系统已成为医院管理的重要组成部分传统的挂号方式存在许多
用CHAT分析高校体育智慧教学体系构建与探索研究现状

CHAT回复现阶段高校体育智慧教学体系的构建与探索研究还处于初级阶段但全球数字化转型大潮的推动下一些较为前沿的研究和实践已经开始出现 1 教学平台的建设很多高校已经开始尝试使用在线教育平台进行体育教学把传统的面对面授课模式转变为
打造完美人像，PixCake像素蛋糕助您一键修图

您是否曾经为自己的人像照片需要进行繁琐的修图而感到困扰是否曾经想要打造出完美的自拍照却不知道该如何下手现在我们为您推荐一款强大的人像处理技术修图软件 PixCake像素蛋糕 PixCake像素蛋糕是一款基于AI人像处理技术的修图软件
明日 15:00 | NeurIPS 2023 Spotlight 论文

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入哔哩哔哩直播通道扫码关注AITIME哔哩哔哩官方账号预约直播 1月17日 15 00 16 00 讲者介绍黄若孜腾讯AI LAB游戏AI研究员 2020年复旦大学硕士毕业后
性能大减80%，英伟达芯片在华“遇冷”，我方霸气回应：不强求

中国这么大一块市场谁看了不眼馋在科技实力大于一切的今天高端芯片的重要性不言而喻作为半导体产业发展过程中不可或缺的一环芯片技术也一直是我国技术发展的一大心病在美西方等国的联手压制下我国芯片技术发展处处受阻至今也未能在高端芯片
如何快速申请GPT账号？

详情点击链接如何快速申请GPT账号一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Gemini以及大模型
手把手教你用 Stable Diffusion 写好提示词

Stable Diffusion 技术把 AI 图像生成提高到了一个全新高度文生图 Text to image 生成质量很大程度上取决于你的提示词 Prompt 好不好前面文章写了一篇文章一份保姆级的 Stable Diffusion
用通俗易懂的方式讲解：使用 LlamaIndex 和 Eleasticsearch 进行大模型 RAG 检索增强生成

检索增强生成 Retrieval Augmented Generation RAG 是一种结合了检索 Retrieval 和生成 Generation 的技术它有效地解决了大语言模型 LLM 的一些问题比如幻觉知识限制等随着 RAG
AI在广告中的应用——预测性定位和调整

营销人员的工作就是在恰当的时间将适合的产品呈现在消费者面前从而增加他们购买的可能性随着时间的推移营销人员能够深入挖掘越来越精准的客户细分市场他们不仅具备了实现上述目标的能力而且这种能力还在呈指数级提升在AI技术帮助下现在的营销
AI帮助终结全球饥饿问题

全球饥饿问题是牵动人心的头等大事 5月28日是世界饥饿日这一问题更值得关注让人人都能吃饱的想法不仅令人向往而且很快就会变成现实与大多数新事物引进一样对于在控制世界粮食供应这样复杂的任务中AI究竟应该发挥多大的作用人们还踟蹰不前
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
史上最全自动驾驶岗位介绍

作者自动驾驶转型者编辑汽车人原文链接 https zhuanlan zhihu com p 353480028 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心求职交流技术交流群本
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
自动驾驶离不开的仿真！Carla-Autoware联合仿真全栈教程

随着自动驾驶技术的不断发展研发技术人员开始面对一系列复杂挑战特别是在确保系统安全性处理复杂交通场景以及优化算法性能等方面这些挑战中尤其突出的是所谓的长尾问题即那些在实际道路测试中难以遇到的罕见或异常驾驶情况这些问题暴露了实车
对中国手机作恶的谷歌，印度CEO先后向三星和苹果低头求饶

日前苹果与谷歌宣布合作发布了 Find My Device Network 的草案旨在规范蓝牙追踪器的使用在以往苹果和谷歌的生态形成鲜明的壁垒各走各路如今双方竟然达成合作发生了什么事首先是谷歌安卓系统的市场份额显著下滑数年来

随机推荐

OpenCV 3.3.1及Contrib附加库安装教程及问题Undefined reference to cv::xfeatures2d

INSTALL OPENCV ON UBUNTU OR DEBIAN 1 KEEP UBUNTU OR DEBIAN UP TO DATE sudo apt get y update sudo apt get y upgrade sudo
cpp课程设计实验题：编写程序，定义抽象基类Shape(形状)，由它派生出3个派生类: Circle(圆形)、Rectangle(矩形)和Square 正方形)，用函数函数ShowArea()分别显

编写程序定义抽象基类Shape 形状由它派生出3个派生类 Circle 圆形 Rectangle 矩形和Square 正方形用函数函数ShowArea 分别显示各种图形的面积最后还要显示所有图形的总面积要求用基类指针数组使它的
adb 指令

1 基本指令指令 adb version 显示 adb 版本指令 adb help 帮助信息查看 adb 所支持的所有命令指令 adb start server 启动 adb 服务指令 adb kill server 关闭 adb
Unity 分帧加载和分块加载

分帧加载和分块加载在我们实际做项目的时候往往会遇见需要创建大量数据的时候这时如果在一帧里面大量创建数据那我们的游戏就会发生卡顿从而降低了用户的体验为了解决这种情况可以使用使用分帧加载使得每帧只加载固定数量的数据来解决也可以使用
经纬度坐标与距离的相互转换及其实现

经纬度坐标与距离的相互转换 1 经纬度与距离角度的换算关系 2 Python代码实现 1 经纬度与距离角度的换算关系 a 在纬度相等的情况下经度每隔0 00001度距离相差约1米每隔0 0001度距离相差约10米每隔0 001度
【ElementUI组件优化】自定义icon图标的使用

风雨里做个大人阳光下做个小孩前端经常会用到UI提供的各种图表推荐阿里的图标库如果UI要求不是很严格我们可以自己在图标库中找到想要的图标搜索之后可以点击下载在ElementUI中使用Icon图标组件使用非常简单同时在图标按钮
微信小程序如何实现（点击发送弹幕）

扫一扫以上小程序许愿灯池可以查看具体点击发送弹幕功能效果图点击祝福一下吧即可弹出弹幕直接上代码 index wxml
spark学习7：RDD编程

1 目录 2 创建RDD 两种方式 2 1从文件系统加载 sc textFile 方法来加载文件数据并将文件数据转换为RDD 2 1 1 从本地文件加载数据 val rdd1 sc textFile file home hzp Docum
error:LNK2005 函数已经在*.obj中定义

出现上面的错误只要原因有如下几个 1 头文件的重复包含包含的头文件中含有变量函数类的定义在其他使用的地方多次包含造成重复包含产生LNK2005错误有两种解决方法 1 使用宏在头文件head h中加入 ifndef HEAD
IM系统的MQ消息中间件选型：Kafka还是RabbitMQ？

1 前言在IM这种讲究高并发高消息吞吐的互联网场景下 MQ消息中间件是个很重要的基础设施它在IM系统的服务端架构中担当消息中转消息削峰消息交换异步化等等角色当然MQ消息中间件的作用远不止于此它的价值不仅仅存在于技术上更重要的
华北电力大学计算机专业学什么,华北电力大学计算机专业与杭州电子科技大学计算机专业哪一个强...

技校网专门为您推荐的类似问题答案问题1 北京工业大学华北电力大学北京西安电子科技大学这三个学校的信息安全专业哪个比较不要相信一个新设置的专业我就上华电一个新兴专业就业这个费劲啊华电还是电力为主弱电方面就业不是很好推荐西电
定时执行shell脚本，让其停掉在重启

bin bash appname zhihu data 0 0 1 SNAPSHOT jar binPath u01 isi zhihu data monitor ps ef grep appname grep v grep wc l if
【猴博士】概率论与数理统计笔记总结（完结）

前言视频在B站看视频在MOOC看是笔记可能不全其他没写的章节是因为我考试不考就没看了概率论第一章随机事件和概率概率论与数理统计猴博士笔记 p1 p2 古典概型几何概型概率论与数理统计猴博士笔记 p3 4 事件
51单片机实验1-流水灯的设计（流水灯，蜂鸣器，爆闪灯）

关于软件的使用我们用的是proteus和keil软件关于软件的安装和使用这里就不在说明了如果软件还没有安装可以参考 proteus安装 Proteus软件的安装与使用方法超详细 http t csdn cn ZaUjM keil安装
电阻上下拉是最常见的用法，那你是不是真的吃透了它？给小白讲讲上拉电阻和下拉电阻！----------------源自玩转单片机与嵌入式

上拉和下拉电阻主要用于正确偏置数字电路门电路的输入以防止它们在没有输入条件时的状态是随机浮动的数字逻辑门可用于连接外部电路或设备但必须注意确保其输入或输出正常工作并提供预期的开关条件一为什么要用上下拉电阻现代数字逻辑门 IC 和
应届日记之TreeUtiles工具类的使用

今天遇到一个问题需要将数据库里面的省市查出来返回给前端树形结构用到了TreeUtiles工具类将list组装成一棵树返回 param list param primaryfieldName param parentFieldName
C++ New对象和直接声明对象的区别

1 new出来的对象需要使用指针接收而直接声明的不用例如 A a new A 与A a 2 new出来的对象是直接使用堆空间而局部声明一个对象是放在栈中 3 new出来的对象类似于申请空间因此需要delete销毁而直接声明的对象则
动态路由权限，按钮的权限，菜单权限分别是怎么实现的

首先什么是前端权限控制就是当用户登录之后根据不用用户拥有的权限动态添加 addRoutes 用户能访问的路由页面和能看到的菜单页面 v for 动态路由权限 1 本质就是利用addRoutes这个api来实现动态添加路由权限然后还可以
robotstudio喷涂组件paintapplicator没有显色效果

因为part这里只能选择仿真之前已经存在的部件若是像仿真后用source组件生成的新物体就选择不了即使你使用传感器让传感器将检测到的物体传给part 也一样没有喷涂的颜色效果如果一定要实现可以参照这个视频 https www b
我的机器学习--线性回归

1 最小二乘法上述方法可以直接得到线性回归方程 import numpy as np import matplotlib pyplot as plt x 2 np random rand 100 1 y 4 3 x np random r

我的机器学习--线性回归

我的机器学习--线性回归 的相关文章

随机推荐

热门标签

我的机器学习--线性回归的相关文章