新闻搜索
新闻详情
杏运娱乐-杏运娱乐注册登录平台-首页-策略产品经理:通俗易懂了解机器学习原理(下篇)
作者:管理员    发布于:2022-12-02 20:13:42    文字:【】【】【

  杏运娱乐-杏运娱乐注册登录平台-首页-策略产品经理:通俗易懂了解机器学习原理(下篇)(主管:QQ66306964 主管:skype live:.cid.6c7b79dae5ec9830)新博88新博88娱乐注册作为策略产品经理,简单理解有关机器学习的相关原理,可以更了解核心的应用场景,从而助推策略产品经理去更好地服务于业务。本篇文章里,作者针对机器学习的部分算法原理与应用场景进行了一定解读,一起来看。

  支持向量机可以算是机器学习当中比较难的部分了,一般很多学习机器学习的同学学到这个部分都会选择 狗带放弃 ,但是我们还是要坚持去通俗易懂的理解,尽量帮助大家深入浅出。

  SVM 一般用于解决二分类问题(也可以解决多分类和回归问题,目前主要的应用场景就是图像分类、文本分类以及面部识别等场景),归根结底就是一句话最大化离平面最近的点到到平面之间的距离,这个其实就叫支持向量;类似图中的直线,对两边的点形成的超平面(绿色虚线与红色虚线)能够最大。

  新博88娱乐注册

  在机器学习的上篇中讲到线性回归为一元线性回归,一元也就是一个自变量加上一个因变量,杏运娱乐-杏运娱乐注册登录平台-首页-这种在二维坐标轴可以表示成(x,y);假设有两类要用来区分的样本点,一类用黄色的 ● ,另一类用红色的 □ ,中间这条直线就是用来讲两类样本完全分开的分类函数,用数学化的方式描述图片就是:

  训练的核心目标:以训练的样本为研究的对象,找到一条直线能够将两类样本能够有效分开,一个线性函数能够把样本进行分开的话,我们就称之为样本的线性可分性:

  当样本点位(x1,x2,y)的时候,找到上述这条直线进行平面样本点分割,其中区域 y = 1(图中的类 +1)的点用下述公式表达:

  上述就是线性可分的明确定义,由此类推用更高维度的超平面可以通过增加 x 维度来表达,我们认为这种表达方式会比较的麻烦会用矩阵表达式来进行代替:

  大家要厘清一个概念,在公式当中 X 不是代表横坐标,而是样本的向量表达式,假如上图最下方的红框坐标是(5,1),那么这个对应的列向量表达式如下所示;其中 WT 代表是一个行向量,就是我们所说的位置参数,X 是一组列向量,是已经知道的样本数据,Wi 表示的就是 Xi 的系数,行向量和列向量相乘就得到了 1*1 的矩阵,也就是一个实数了:

  机器学习就是找到通过学习的算法找到最合适超参 Wi,支持向量机有两个目标:第一个是使间隔最大化,第二个是使样本正确分类;

  我们都学过欧式距离公式,二维空间当中的点位(x,y)到 对应直线的距离可以表示为,

  根据下图可以指导,支持向量到超平面的距离就是 d,其他点到超平面的距离就会大于 d;

  公式两边同时除以 d,并且我们令 wd = 1(方便公式推导,对目标函数本身无影响),可以得到下列式:

  我们就得到了最大间隔下的两个超平面,分别为过绿色原点的平面和过黄色三角的平面,我们来最大化这个距离就可以得到:

  为了简化问题,再把 w 里面的根号去除一下,所以我们最终优化问题可以得到要求解决的 w:

  朴素贝叶斯是基于贝叶斯定理和条件独立性假设的分类方法,属于生成模型(工业界多用于垃圾邮件分类、信用评估以及钓鱼网站监测等场景),核心思想就是学习输入输出的联合概率模型 P ( X,Y ) ,然后使用条件概率公式求得 P ( Y X ) - 表示在 X 发生的条件下,Y 事件发生的概率。Arthur 先带大家回顾一下大学数学概率论的基础知识,便于大家能够快速理解。

  我知道了贝叶斯公式之后,怎么用其原理来做分类呢,跟随 Arthur 按照下面的思路一起推演:

  在朴素贝叶斯中我们把条件概率分布做独立性假设,解耦特征与特征之间的关系,每个特征都视为单独的条件假设:

  P(不出门|晴朗,工作日)>

  P(出门|晴朗,工作日),因此我们判定小明这一天多半是不出门的;

  p ( x ) 为 0 的时候,也就是某个特征下,样本数量为 0。则会导致 y = 0;所以 x 需要引入 Laplace 校准,在所有类别样本计数的时候加 1,这样可以避免有个式子 P ( X ) 为 0 带来最终的 y = 0。

  以上都是介绍的特征离散值可以直接进行样本数量统计,统计概率值;如果是连续值,可以通过高斯分布的方式计算概率。

  给策略产品、运营讲机器学习系列到这里就结束了,该系列的文章目的是在为转型策略产品,或者是已经从事策略产品、策略运营方向的同学通俗易懂的了解机器学习算法原理与思想。

  很多文科同学 / 运营会觉得看着策略公式就头大,其实怎么去推导不是我介绍这篇文章的目的,理解核心的思想与应用场景,如何和业务贴近服务才是关键,我们毕竟不是算法,需要间隔两者工作职责和范围边界。

  希望这个系列真正能做到普及策略产品经理的工作,更深入浅出的普及到关于机器学习的知识。

脚注信息
新博88娱乐网站 Copyright(C)2022-2032
百度地图 谷歌地图