o年,人工智能领域正处于深度学习的快展时期,但在训练深层神经网络时,仍存在一些无法绕过的核心难题,其中“梯度消失”
和“梯度爆炸”
问题尤其突出。
当马库斯和林枫的对话逐渐转向这些人工智能瓶颈时,他们自然聊到了这个话题。
对于人工智能涉及到的梯度消失和梯度爆炸这个问题,对于前世就从事人工智能方面工作的林枫来说,他自然是不陌生。
梯度消失和梯度爆炸是神经网络训练中常见的问题。
了解梯度消失和梯度爆炸先要了解神经网络。
简单说,神经网络是一种模仿人脑工作原理的计算模型。
它由很多“神经元”
组成,这些神经元分成多层,数据会从一层传到另一层,最终得到一个结果。
训练神经网络的过程就是不断调整这些神经元之间的“连接强度”
,让网络的输出越来越接近我们想要的结果。
为了调整神经网络中的这些连接强度,我们需要用到一种叫“梯度”
的东西。
简单来说,梯度就是用来指引我们“往哪里走”
的方向,就像你爬山时要知道往哪边是上坡、哪边是下坡。
我们通过“梯度”
来知道哪些参数需要调整,从而让网络的表现变得更好。
那“梯度消失”
和“梯度爆炸”
又是什么呢?
假设你在玩一个滑滑梯,当你站在滑梯的最高处,往下滑时,你能很快感受到度在增加,因为坡度很大。
但是,如果滑到快要到底部的地方,坡度变得很小,你几乎就感觉不到滑动的度了。
这里的“坡度”
就像是“梯度”
——当坡度变小,滑动的度也变小。
在神经网络中,类似的事情也会生。
如果我们给网络很多层,它们之间的梯度会越来越小,传到前面几层时,梯度几乎“消失”
了。
这就是“梯度消失”
问题。
梯度太小,无法有效调整那些神经元的连接强度,网络的训练就会变得非常困难。
想象你在爬一个大山,山的坡度越来越平,最终你几乎感受不到自己在上升了,这时你很难再判断该怎么继续往上爬。
请关闭浏览器阅读模式后查看本章节,否则将出现无法翻页或章节内容丢失等现象。
穿越一人之下,成为张之维的师弟,张太初开局觉醒众力仙途系统,只要猛收弟子,就能反馈修为。然而碍于本身狂暴的性格,张太初却无心收徒,只靠天赋便修到人仙之姿,更是在得知张怀义被逼叛逃,田晋中被废后暴怒下山。张太初凭什么拥有无敌于世的实力,却要在乎世人看法?我就是要给老田报仇!凭什么大耳贼要回龙虎山,师父才能保他?天师在哪,此地便该是龙虎山!于是,张太初一人一剑,直接杀穿异人界,更是在关山峡谷约战天下异人,亲手灭杀各大家族,结束了甲申之乱!直到罗天大醮开启,天下异人再聚龙虎山,师兄张之维才意识到,这位杀神师弟七十多年都从未改变性格!...
曾经以为身处地狱,后来发现,有他的地方就是天堂末世到来,夏初错估人心,能核被毁,身体残疾。所有人都想将她往死里踩,唯独陆聿修倾尽所有的对她好,就算最后为了她丢掉性命,他也无怨无悔夏初拖着残躯...
刚创小号没多久的路浔,穿越到了天尘这款仙侠类游戏中,明明是个玩家,却莫名其妙的带着nc模版。至于真正的玩家,则将在三年后降临。如今,他首先要面对的是一个要把他抓去当炉鼎的女魔头这号好像...
陈覆穿越进了娱乐天王。书中男主陆可聆狂拽酷霸,一心事业,从无名群演做起,一路登顶视帝影帝,创办经纪公司,翻手云覆手雨,最终被誉为娱乐圈帝王。陈覆回想着记忆中的原著内容,一推眼镜,决定做一个...
未婚夫背叛,唐沫儿一不小心招惹上了京都豪门贵胄顾墨寒。某天,唐沫儿捏着手里的两道红杠杠,怒,顾少,你为什么要搞大我的肚子顾墨寒将一个小奶娃塞到她怀里,老婆,乖,那是二胎。于是唐沫儿奶完了大...
陈玲玲穿进一本年代文。书里,她爸是男主,她妈是早死的原配。她妈因公牺牲,单位照顾他们父女,分了两室一厅的房子,还给她爸调了岗,让父女俩在物资匮乏的七十年代过得非常不错。然后,女主这个她爸的白月光...