机器学习理论入门-统计学习之逻辑斯蒂回归与最大熵

在讲逻辑斯蒂回归之前先复习下感知机的一些知识：

感知机的公式：f(x) = sign(w·x + b) 输出+1或-1

那么问题来了，1.只输出-1和+1是不是太生硬了？这样的判别方式真的有效吗？

2.超平面左侧0.001距离的点和超平面右侧0.001距离的点真的有天壤之别吗？

同时感知机的缺陷不容忽视：感知机通过梯度下降更新参数，但在sign函数中，x=0是间断点，不可微

怎么解决极小距离带来的+1和-1的天壤之别？2.怎么让最终的预测式子连续可微呢？

逻辑斯蒂回归可以解决以上问题

逻辑斯蒂回归

逻辑斯蒂回归的定义

P(Y = 1|x) = 取值范围：（0 1）

P(Y = 0|x) = 取值范围：（0 1）

用图表表示为

若将P(Y=1|x)记作A，P(Y=0|x)记作B，则 A/A+B + B/A+B = 1

逻辑斯蒂回归是连续可微的

参数估计

逻辑斯蒂回归模型学习时，对于给定的训练数据集 T = {(,)，(,)...，(,)} , 其中，,{0,1},可以应用极大似然估计法估计模型参数，从而得到逻辑斯蒂回归模型。

设： P(Y = 1 | x) = (x)，P(Y = 0|x) = 1 - (x)

似然函数为

对数似然函数为

上图的对数似然函数看似简单的三个步骤，其用到了很多知识，下面进行详细步骤说明，如些图

再次说明下，机器学习有关对数的小知识点：和熵有关的默认，简写成log；和商没有关系的默认,简写成log或ln

似然函数对w的求导

总结

1.逻辑斯蒂以输出概率的形式解决了极小距离带来的+1和-1的天壤之别。同时概率也可以作为模型输出的置信程度

2.逻辑斯蒂使得最终的模型函数连续可微。训练目标与预测目标达成了一致

3.逻辑斯蒂采用了极大似然估计来估计参数

最大熵

什么是最大熵？

在我们猜测概率时，不确定的部分我们认为是等可能的，就好像骰子一样，我们知道有6个面，因此认为每个面的概率是1/6，也就是等可能

换句话说，趋向于均匀分布，最大熵使用的就是这么一个朴素的道理：

凡是我们知道的，就把它考虑进去，凡是不知道的，通通均匀分布

终极目标是求概率 P(Y | X)

熵：H(P) = -

将终极目标代入熵：H(P) = -

做些改变，调整熵：

H(P) = H(y | x) = -

注：1.H(P) = H(y | x)为条件熵

2. 代表从训练集中统计出来的

下面看下训练集中的统计概率：

(X=x) =

特征函数及特征函数f(x,y)关于经验分布(x,y)的期望值

特征函数f(x,y)关于模型P(Y|X)与经验分布(x)的期望值：

最大熵模型

拉格朗日乘子法：

总结

1.最大熵强调不提任何建设，以熵最大为目标

2.将终极目标代入熵的公式后，将其最大化

3.在训练集中寻找现有的约束，计算期望，将其作为约束。使用拉格朗日乘子法得到P(y|x)，之后使用优化算法得到P(y|x)中的参数w

参考视频链接：https://www.bilibili.com/video/BV1i4411G7Xv?p=6&vd_source=7621d9b6568d814ad80158fea1c47dcc

#头条创作挑战赛#

展开阅读全文

页面更新：2024-04-29

标签：逻辑对数简写天壤之别概率函数终极目标入门模型机器距离参数

1 2 3 4 5

都支持PD快充，iPhone 12 Pro Max和iPhone 13 Pro Max有哪些区别

前言2021年9月，Apple官网发布了iPhone 13系列超大杯旗舰机 iPhone 13 Pro Max，相比较与上代12系列也拥有更多的提升，但最终是否合适用户，也需要根据自身情况考量。即使在14系列手机已然发布一段时间，但仍有不少用户对前两

iPhone的“印度制造”时代即将开始了吗？

（CNN报道）苹果为了确保关键供应链的安全将目光投向中国以外的地区。受到新冠和地缘政治紧张局势的影响，苹果公司的iPhone供应链变的紧张。苹果公司认为印度已成为世界第二大经济体的一个有吸引力的潜在替代品。而中国

负债高企，深陷亏损泥潭，科陆电子叒要募资补流

图片来源：视觉中国2月14日，科陆电子（002121.SZ）发布2022年度非公开发行A股股票预案（修订稿），拟募集8.28亿元，而此次募资目的是还债。钛媒体APP注意到科陆电子的负债率高企，不禁令人好奇科陆电子负债高企的背后究竟发生了什么？负

K60焊的大门哪会那么容易踢开，大存储 + 2K屏 + 无线充依旧无敌

这两天讨论最多的就是友商来射门，K60这位结实的焊门员能不能顶得住的问题，很多人觉得K60招架不住了，结果卢伟冰略施小计好像风向又变了，好像现在压力又来到友商这边了，不得不佩服小米高层的决策力，但是也反映出中端市场的

字节跳动旗下Pico出货量大增硬刚Meta旗下Quest 2

雷递网乐天 2月14日字节跳动旗下TikTok在海外攻城略地之际，其在争夺虚拟现实市场也取得进展。据外媒披露，字节跳动旗下的Pico增加了虚拟现实头戴设备领域的出货量，正与Meta旗下Quest 2展开激烈竞争。市场研究公司IDC的

ChatGPT概念股回落海天瑞声连涨后震荡

每经记者：可杨每经编辑：张海妮随着ChatGPT概念股的回落，兔年来股价翻番的海天瑞声（SH688787，股价204.00元，市值87.31亿元）今日（2月14日）同样盘中一度转跌。海天瑞声是一家AI训练数据提供商，随着开年来ChatGPT概念火热，该公司的

2022年度10大智能农机申报开始啦

随着5G、人工智能、物联网、区块链等技术在现代农业领域的广泛应用，“智能农机”也成为了近几年农机行业中的热门词汇。从世界范围来看，约翰迪尔、爱科、凯斯纽荷兰等国际农机巨头都在大力布局智能农机、精准农业装备的

Redmi Note 12T，这次的「小金刚」很硬

不得不说，自打小米执着冲高端之后，「性价比」的大旗就落到了红米的肩上。可想而知，每次红米发新机都会引来一大批关注。其中 K 系列和 Note 系列，则是焦点中的焦点。前者号称「旗舰焊门员」，以足够划算的价格堆足够有

友宝冲刺上市，曾“错失”最好时机

这是灵兽第1270篇原创文章对未来的友宝而言，或难有新故事维系过往的“高光时刻”。作者/十里ID/lingshouke时隔半年，友宝在线再次发布招股书准备冲刺港股。这家成立于2012年的无人零售领域“最大玩家”似乎已经很久没

碰瓷ChatGPT！昆仑万维，揭秘成长背后的真相

作者/星空下的锅包肉编辑/菠菜的星空排版/星空下的车厘子 2023年开年，由美国人工智能实验室OpenAI发布的ChatGPT彻底火出了圈。虽然，ChatGPT可能还算不上一个合格的聊天工具人，但却很有可能成为现有搜索引擎的颠覆者。其

美国云计算巨头在东南亚遭遇中企激烈竞争 - 百能云芯

称霸全球的美国云计算公司在东南亚正面临来自中国企业的激烈竞争，包括华为、阿里巴巴、与腾讯，特别是在泰国和印尼等新兴市场，中企正以更低的价格压过美国竞争对手，抢下对价格较为敏感的客户。云服务器 | 百能云芯元器件

联想方案服务刷屏多个机场聚焦方案服务

2月14日，主题为“联想方案服务，陪伴智能化转型每一步”的联想新年度广告登陆国内多家机场。联想此次聚焦方案服务具有里程碑式的意义，也表明了联想已经完成了服务转型布局。同时宣告，联想已逐渐从一家硬件公司蜕变成3S全

工信部再次重拳出击！通报46款违规APP，手机厂商也毫不手软

近期，工信部依据《个人信息保护法》《网络安全法》《电信条例》《电信和互联网用户个人信息保护规定》等法律法规，针对APP相关隐私权限的问题加大了整治力度，违规获取个人信息、过度索权等现象进行了整治。其中，包括墨迹

文心ERNIE 3.0 Tiny新升级！端侧压缩部署“小” “快” “灵”！

近年来，随着深度学习技术的迅速发展，大规模预训练范式通过一次又一次刷新各种评测基线证明了其卓越的学习与迁移能力。在这个过程中，研究者们发现通过不断地扩大模型参数便能持续提升深度学习模型的威力。然而，参数的指数

中国作为“世界工厂”，没有任何一个企业能代替他

有传言称，Apple正计划将其产品从中国转移。有些人认为此事对中国经济造成了极大的破坏，而另一些人则认为这对中国来说是一个很好的机会。在中国，苹果是怎么回事？假如真的要搬家，那会是怎样的结果呢？即使将来苹果真把它从中

上滑加载更多 ↓

机器学习理论入门-统计学习之逻辑斯蒂回归与最大熵

逻辑斯蒂回归

最大熵

都支持PD快充，iPhone 12 Pro Max和iPhone 13 Pro Max有哪些区别

iPhone的“印度制造”时代即将开始了吗？

负债高企，深陷亏损泥潭，科陆电子叒要募资补流

K60焊的大门哪会那么容易踢开，大存储 + 2K屏 + 无线充依旧无敌

字节跳动旗下Pico出货量大增硬刚Meta旗下Quest 2

ChatGPT概念股回落海天瑞声连涨后震荡

2022年度10大智能农机申报开始啦

Redmi Note 12T，这次的「小金刚」很硬

友宝冲刺上市，曾“错失”最好时机

碰瓷ChatGPT！昆仑万维，揭秘成长背后的真相

美国云计算巨头在东南亚遭遇中企激烈竞争 - 百能云芯

联想方案服务刷屏多个机场聚焦方案服务

工信部再次重拳出击！通报46款违规APP，手机厂商也毫不手软

文心ERNIE 3.0 Tiny新升级！端侧压缩部署“小” “快” “灵”！

中国作为“世界工厂”，没有任何一个企业能代替他

探索哪种金属持有细胞功能“入门证”：新模型阐明生命的

荣耀90新机渲染图及部分参数被曝光，核心配置还算良心

国产机器人为68岁阿姨换膝关节，更快更准还能延长使用寿

看懂这些参数，让你在买音响时少走十年弯路

原新三板企业小i机器人更新赴美上市招股书，计划融资520

亏了24亿，优必选“人形机器人”商业化还没真正动起来

打造全球探测距离最远雷达，电科网通助力中国复眼成功“

懒人的清洁神器，这是像人一样会「思考」的云鲸J3扫拖机

愈发明朗，男篮以锋线群为主，吴前大概率无缘国家队

亚马逊旗下Zoox以员工为乘客在公共道路上测试机器人出