【机器学习

2024-07-15 07:37:52| 来源: 网络整理| 查看: 265

文章目录 1. 损失函数、期望风险、经验风险2. 经验风险最小化和结构风险最小化2.1 结构风险（正则化）2.2 两者的定义 3. 训练误差与测试误差4. 过拟合与欠拟合4.1 过拟合及解决方法4.2 交叉验证4.3 欠拟合 5. 泛化误差与泛化误差上界5.1 泛化误差5.2 泛化误差上界 6. 生成模型与判别模型7. 最大似然估计7.1 极大似然估计7.2 最大似然估计与经验风险关系

1. 损失函数、期望风险、经验风险

常见的损失函数：在这里插入图片描述

注意：损失函数不一定是上面的4个，也可以自定义损失函数。比如：感知机的损失函数就是自定义：误分类点到超平面的距离。

期望风险在这里插入图片描述

经验风险在这里插入图片描述

2. 经验风险最小化和结构风险最小化 2.1 结构风险（正则化）

结构风险：指为经验风险加上正则项，用于对模型的参数个数（即模型复杂度）进行限制在这里插入图片描述

2.2 两者的定义

用于表明什么是最优模型，即求最小化的目标函数是谁？

经验风险最小化：指经验风险最小的模型就是最优模型。在这里插入图片描述

结构风险最小化：为了防止过拟合而提出来的，指结构风险最小的模型就是最优模型。在这里插入图片描述

因此，在机器学习三要素中，第三步使用算法求解最优模型时，有两个角度。

3. 训练误差与测试误差

训练误差：模型在训练集上的经验风险在这里插入图片描述

测试误差：模型在测试集上的经验风险在这里插入图片描述

4. 过拟合与欠拟合 4.1 过拟合及解决方法

在这里插入图片描述

过拟合：求得的最优模型过于复杂导致预测效果不好。比如上面的M = 4时求得的最优化模型，虽然训练误差为，但是训练误差缺很大。而评价一个模型的好坏是根据泛化能力(≈ 泛化误差上界 ≈ 测试误差) 来衡量的，训练误差越小越好。解决方法： ① 增加样本量【为什么增加样本量可以防止过拟合？具体见泛化误差上界这一节】 ② 交叉验证：取参数复杂度的平均，故可以防止过拟合。 ③ 使用结构风险最小化而不是经验风险最小化【为什么结构风险最小化可以防止过拟合？见“正则化”这一节】 4.2 交叉验证

在这里插入图片描述

4.3 欠拟合 5. 泛化误差与泛化误差上界 5.1 泛化误差

泛化误差：指模型在测试集上的期望风险。在这里插入图片描述

区分：测试误差是模型在测试集上的经验风险。

作用：对于不同复杂度下得到的最优化模型，我们可以使用泛化误差来衡量模型的好坏。泛化误差越小，模型越好。

5.2 泛化误差上界

和期望风险与经验风险的一样，由于 P(x, y) 是不知道的，也求不出来，所以转而使用泛化误差上界来代替泛化误差去评估模型的好坏。在这里插入图片描述

可以观察到泛化误差上界与 N成反比，所以样本容量越大，模型越好。这就解释了为什么增加样本容量可以防止过拟合。可以观察到泛化误差上界与 d成反比。参数越多，d越大，导致泛化误差上界越大，模型就越差。

注意：有时候近似的用测试误差来代替泛化误差上界。

6. 生成模型与判别模型

注意：生成模型与判别模型都是监督学习中的概念。而监督模型中的模型模型有两类：概率模型P(y | x) 与决策模型 y = f(x)。

定义：在这里插入图片描述

区别 / 特点：

① 生成模型关心的是输入x与输出y的关系。即关心训练数据本身的特性，而不关心各类的边界在哪； ② 判别模型关心的是输入x，该输出什么y，关心各类的边界在哪，而不关心训练数据本身的特性。根据公式容易知道：由生成模型可以得到判别模型，但由判别模型得不到生成模型。当存在隐变量（当我们找不到引起某一现象的原因的时候，我们就把这个在起作用但是无法确定的因素，叫“隐变量”）时，仍可以利用生成方法学习，此时判别方法不能用。生成模型收敛速度快判别模型的准确率高判别模型是直接求决策模型或概率模型，所以抽象程度更高，往往可以用来简化问题。

代表算法：在这里插入图片描述

例子1：在这里插入图片描述

例子2：在这里插入图片描述

7. 最大似然估计 7.1 极大似然估计区分：概率与似然概率是已知模型和参数，去预测数据。似然是已知数据，推模型和参数。概率函数与似然函数：对于P(x | θ) 函数，x表示某一个具体的数据；θ 表示模型的参数。如果参数θ已知，样本x未知，是推数据，所以P(x | θ) 函数叫概率函数。如果参数x已知，样本θ未知，是推参数，所以P(x | θ) 函数叫似然函数。

似然函数的自变量是θ，因变量是P(x | θ)。如果取θ = θ1，那么 P(x | θ1) 表示在 θ1 下，样本x出现的概率。

最大似然估计：指使似然函数最大。即找到参数 θ 的一个估计值，使得当前样本x出现的可能性最大。

最大似然估计有一个前提：所有的采样都是独立同分布的，因此可以进行如下恒等变形在这里插入图片描述

例子：

7.2 最大似然估计与经验风险关系

当损失函数是对数损失函数时，经验风险最小化等价于极大似然估计。

在这里插入图片描述

【本文地址】

公司简介

联系我们

今日新闻

点击排行

实验室常用的仪器、试剂和: 说到实验室常用到的东西，主要就分为仪器、试剂和耗

不用再找了，全球10大实验: 01、赛默飞世尔科技（热电）Thermo Fisher Scientif

三代水柜的量产巅峰T-72坦: 作者：寞寒最近，西边闹腾挺大，本来小寞以为忙完这

通风柜跟实验室通风系统有: 说到通风柜跟实验室通风，不少人都纠结二者到底是不

集消毒杀菌、烘干收纳为一: 厨房是家里细菌较多的地方，潮湿的环境、没有完全密

实验室设备之全钢实验台如: 全钢实验台是实验室家具中较为重要的家具之一，很多

图片新闻

实验室药品柜的特性有哪些: 实验室药品柜是实验室家具的重要组成部分之一，主要

小学科学实验中有哪些教学: 计算机计算器一般打孔器打气筒仪器车显微镜

实验室各种仪器原理动图讲: 1.紫外分光光谱UV分析原理：吸收紫外光能量，引起分

高中化学常见仪器及实验装: 1、可加热仪器：2、计量仪器：（1）仪器A的名称：量

微生物操作主要设备和器具: 今天盘点一下微生物操作主要设备和器具，别嫌我啰嗦

浅谈通风柜使用基本常识: 　众所周知，通风柜功能中最主要的就是排气功能。在

【机器学习

【机器学习

今日新闻

点击排行

推荐新闻

图片新闻

专题文章