o年,人工智能领域正处于深度学习的快展时期,但在训练深层神经网络时,仍存在一些无法绕过的核心难题,其中“梯度消失”
和“梯度爆炸”
问题尤其突出。
当马库斯和林枫的对话逐渐转向这些人工智能瓶颈时,他们自然聊到了这个话题。
对于人工智能涉及到的梯度消失和梯度爆炸这个问题,对于前世就从事人工智能方面工作的林枫来说,他自然是不陌生。
梯度消失和梯度爆炸是神经网络训练中常见的问题。
了解梯度消失和梯度爆炸先要了解神经网络。
简单说,神经网络是一种模仿人脑工作原理的计算模型。
它由很多“神经元”
组成,这些神经元分成多层,数据会从一层传到另一层,最终得到一个结果。
训练神经网络的过程就是不断调整这些神经元之间的“连接强度”
,让网络的输出越来越接近我们想要的结果。
为了调整神经网络中的这些连接强度,我们需要用到一种叫“梯度”
的东西。
简单来说,梯度就是用来指引我们“往哪里走”
的方向,就像你爬山时要知道往哪边是上坡、哪边是下坡。
我们通过“梯度”
来知道哪些参数需要调整,从而让网络的表现变得更好。
那“梯度消失”
和“梯度爆炸”
又是什么呢?
假设你在玩一个滑滑梯,当你站在滑梯的最高处,往下滑时,你能很快感受到度在增加,因为坡度很大。
但是,如果滑到快要到底部的地方,坡度变得很小,你几乎就感觉不到滑动的度了。
这里的“坡度”
就像是“梯度”
——当坡度变小,滑动的度也变小。
在神经网络中,类似的事情也会生。
如果我们给网络很多层,它们之间的梯度会越来越小,传到前面几层时,梯度几乎“消失”
了。
这就是“梯度消失”
问题。
梯度太小,无法有效调整那些神经元的连接强度,网络的训练就会变得非常困难。
想象你在爬一个大山,山的坡度越来越平,最终你几乎感受不到自己在上升了,这时你很难再判断该怎么继续往上爬。
请关闭浏览器阅读模式后查看本章节,否则将出现无法翻页或章节内容丢失等现象。
十月要开的新文给谁当儿子不是当快穿求收藏本文文案顾晨的师弟师妹们外出历练时不慎被困幻境,成了凡人世界凄惨的炮灰角色。为救师兄妹,顾晨踏入幻境。顾晨五岁成功召唤本命灵兽,八岁修成最年轻的高级驭...
国之将亡,必有妖孽。大唐天佑四年时,本应该覆灭的唐朝却不知为何得以续了两百年余年,可自此之后,妖魔纵生,天下大乱。自乱世而来的秦白能够通过打铁垂钓烹饪刺绣行医等获得各类神通,即修行诡异法门纸人赶尸符咒蛊虫又历经一个个熟悉但诡异的故事,板桥客栈倩女幽魂画皮河神青蛇画中仙,西游降魔...
一代兵王,回归都市,入赘豪门,你以为很享受吃软饭可是一门技术活...
...
作为一个喜爱虐主的作者,刘攀表示怎么伤读者的心怎么写,怎么虐主怎么来。奈何,上天有好生之德,在又一本毒书即将完结的之时,他穿越了,变成了自己笔下连名字都木有的一个跑龙套。为穿越暗暗窃喜的刘攀表示哼,真以为我会跟着套路走吗?当然是抢钱抢法宝抢女人了,然而,当初未填完的巨坑狠狠打了他的脸另外书友裙246825550...
作为玛丽苏本苏,天生万人迷的姜滢,总是会因为自己的魅力太大而面临困扰。直到她绑定了系统,只要有人对她产生贪念她就会越来越美。姜滢我似乎并不需要做什么,那些人,就会义无反顾地为我做一切呢。被太...