局部权重线性回归(Locally weighted linear regression)

news/2023/6/10 21:51:56

在线性回归中,因为对參数个数选择的问题是在问题求解之前已经确定好的,因此參数的个数不能非常好的确定,假设參数个数过少可能拟合度不好,产生欠拟合(underfitting)问题,或者參数过多,使得函数过于复杂产生过拟合问题(overfitting)。因此本节介绍的局部线性回归(LWR)能够降低这种风险。

欠拟合与过拟合

首先看以下的图 
过拟合与欠拟合
对于图中的一系列样本点,当我们採用y=θ0+θ1x形式的时候,我们可能产生最左边图形式的拟合曲线;假设我们採用y=θ0+θ1x+θ2x2时候,我们就能够产生中间的拟合曲线;假设採用形式,便会产生最右边的拟合曲线。从三张图中我们能够看出来,第一条曲线存在欠拟合问题,第三条的曲线存在过拟合问题。

局部权重线性回归(Locally weighted linear regression)

在主要的线性回归问题中,首先我们构造出预測函数h(x),然后变化參数θ使得误差函数最小化,一旦θ确定,以后不会改变,全部的预測值都会使用着一个參数: 
 
相比之下,局部权重线性回归方法运行例如以下的算法: 
 
 
x代表须要预測的值的输入,x(i)表示的是训练的样本的输入值。从w(i)的表达式我们能够看出,x(i)x2能够理解成训练值与预測值之间的距离,当距离越大w≈0,反之,距离越小,w≈1。因此,当距离须要计算的x非常远的训练样本值会在最小化时候变为0,而仅仅使用x周围的局部点预測线性函数。例如以下图 
 
w中的τ称为带宽(bandwidth)參数,能够控制x周围的概念,即控制距离x多远能够參与线性函数的预计,τ越大,參与的点越多,反之,參与的点越少。 
因为局部权重线性回归方法每个预測每个点时候都须要又一次计算一次 
θ的值,因此,算法费时间复杂度会非常高,是一种non-parametric算法。前面的基本线性回归是一种parametric学习算法。

个人博客:http://www.houlaizhexq.com     houlaizhexq.github.io

转载于:https://www.cnblogs.com/mfrbuaa/p/3960470.html


https://dhexx.cn/news/show-17251.html

相关文章

前台页面优化全攻略(四)

通过前几篇文章,你应该已经掌握了很多优化网站的方法。现在你的网站加载速度已经很快了,但是你必须持续的监控你的网站,了解它的大小变化,要不然一段时间过去之后,它可能又成为了一个胖子。 如今每个页面平均已经达到1…

mysql索引优化 - explain性能分析详细概述

expain出来的信息有10列,分别是id、select_type、table、type、possible_keys、key、key_len、ref、rows、Extra 概要描述: id:选择标识符 select_type:表示查询的类型。 table:输出结果集的表 partitions:匹配的分区 type:表示表的连接类型 possible_k…

mysql索引优化 - 单表如何使用索引优化 以及 常见的索引失效的原因分析

1. 全值匹配我最爱,查询的字段按照顺序在索引中都可以匹配到! 建立索引 CREATE INDEX idx_age_deptid_name ON emp(age,deptid,NAME); EXPLAIN SELECT SQL_NO_CACHE * FROM emp WHERE emp.age30 EXPLAIN SELECT SQL_NO_CACHE * FROM emp WHERE emp.age…

c#解析Josn(解析多个子集,数据,可解析无限级json)

首先引用 解析类库 using System; using System.Collections.Generic; using System.Linq; using System.Text;namespace BPMS.WEB.Common {public class CommonJsonModel : CommonJsonModelAnalyzer{private string rawjson;private bool isValue false;private bool isModel…

mysql索引优化 - 多表关联查询优化

1 left joinEXPLAIN SELECT * FROM class LEFT JOIN book ON class.card book.card;LEFT JOIN条件用于确定如何从右表搜索行, 左边一定都有, #所以右边是我们的关键点,一定需要建立索引。结论:在优化关联查询时,只有在…

mysql索引优化 - 子查询优化

结论: 在范围判断时,尽量不要使用 not in 和 not exists,使用 left join on xxx is null 代替。 取所有不为掌门人的员工,按年龄分组! select age as 年龄, count(*) as 人数 from t_emp where id not in (select ceo…

树莓派折腾---红外探测

先上个图: 用到的配件: 1.主角:树莓派 2.配角:红外探测 3.打杂:面包板,杜邦线,蜂鸣器,LED,电阻 红外探测有三个针脚,两端的是供电,中间是信号输出…

mysql索引优化 - 排序分组优化

where 条件和 on 的判断这些过滤条件,作为优先优化的部分,是要被先考虑的! 其次,如果有分组和排序,那么 也要考虑 grouo by 和 order by。1. 必须有过滤,才会用到索引 结论:where,li…

UIView详解

来源:http://blog.csdn.net/chengyingzhilian/article/details/7894276 UIView表示屏幕上的一块矩形区域,它在App中占有绝对重要的地位,因为IOS中几乎所有可视化控件都是UIView的子类。负责渲染区域的内容,并且响应该区域内发生的…

jmeter基础入门(HTTP,TCP,SQL查询,新增,查看报告)

示例下载地址 https://download.csdn.net/download/qq_41712271/20398149有坑的地方 1 发送TCP请求,注意Tcp client classname,如下图,这里发送16进制,所以写 BinaryTCPClientImpl TCPClientImpl:纯文本为内容进行发送 BinaryT…