博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
关于神经网络训练的一些建议笔记
阅读量:5317 次
发布时间:2019-06-14

本文共 747 字,大约阅读时间需要 2 分钟。

关于网络训练时的参考建议:

1.train loss不断下降,test loss不断下降,网络正在学习

2.train loss不断下降,test loss趋于不变,网络过拟合,需要增大数据;减小网络规模dropout;权重衰减或正则化L2等

3.train loss趋于不变,test loss趋于不变,遇到瓶颈,需要减少学习率和批处理大小

4.train loss趋于不变,test loss不断下降,数据集100%有问题

5.train loss不断上升,test loss不断上升,可能网络结构设计不当,超参设置不当,bug等

6.train loss不断上下跳动,可能学习率过大或批处理太小

7.batchnorm:如果每个batch输入的数据都具有不同的分布,会给网络的训练带来困难,数据经过一层层网络计算后,数据分布

也会发生变化,此现象称为 internal covariate shift(内部协变量漂移),之前的解决方法是:较小的学习率;小心的初始化参数;数据白化处理

internal:发生在网络内部

covariate shift:发生在输入层

让每个隐层节点的激活输入分布固定下来,这样就避免internal covariate shift

8.偏差:模型结果和实际结果的偏离程序

9.方差:模型结果围绕着实际结果波动的程度

10.偏差大:不了解数据和数据形态;增加维度,如多项式、高阶项,减少正则参数

11.方差大:波动(可能来自无关紧要的离群值)、不收敛、模型没有找到数据变换的节奏、提供的数据变化不丰富;增加样本,减少特征集合size、增大正则参数

转载于:https://www.cnblogs.com/little-horse/p/10590830.html

你可能感兴趣的文章
Node.js 入门:Express + Mongoose 基础使用
查看>>
一步步教你轻松学奇异值分解SVD降维算法
查看>>
objective-c overview(二)
查看>>
python查询mangodb
查看>>
驱动的本质
查看>>
Swift的高级分享 - Swift中的逻辑控制器
查看>>
Python数据分析入门案例
查看>>
vue-devtools 获取到 vuex store 和 Vue 实例的?
查看>>
内存地址对齐
查看>>
创新课程管理系统数据库设计心得
查看>>
Could not resolve view with name '***' in servlet with name 'dispatcher'
查看>>
pandas 修改指定列中所有内容
查看>>
lua语言入门之Sublime Text设置lua的Build System
查看>>
vue.js基础
查看>>
电脑的自带图标的显示
查看>>
[转载] redis 的两种持久化方式及原理
查看>>
C++ 删除字符串的两种实现方式
查看>>
ORA-01502: 索引'P_ABCD.PK_WEB_BASE'或这类索引的分区处于不可用状态
查看>>
Java抽象类和接口的比较
查看>>
MyBaits学习
查看>>