Transcript for:
神经网络评价与调优

Hello大家好, 欢迎观看机器学习简介系列视频 今天我们会聊聊在做好了属于自己的神经网络之后应该如何来评价自己的神经网络呢 从评价当中我们如何改进我们的神经网络 其实评价神经网络的方法和评价其他机器学习的方法大同小异 我们首先说说为什么要评价或者检验学习到的神经网络在神经网络的训练当中神经网络可能会因为各种各样的问题 出现学习 学习的效率不高, 或者是因为干扰太多, 学到最后并没有很好的学到规律。 而这其中的原因可能是多方面的, 可能是数据问题, 学习效率等参数的问题。 为了检验评价生育网络, 避免和改善这些问题, 我们通常会把收集到的数据分为训练数据和测试数据。 一般用于训练的数据可以是所有数据的 70%剩下的30% 可以拿来训练 来测试学习结果 如果你想问为什么要分开这两批 那就想想我们读书的日子 考试题和作业题大部分都是不一样的吧这也是同一个道理接着对于神经网络的评价基本上是基于这30% 的测试结果 想想期末考试虽然花的时间少但是占的总成绩肯定要比你平时的作业分多吧所以说这30% 虽然少 但是很重要 然后我们就可以 可以开始画图了 评价机器学习可以从误差这个值开始 随着训练时间的变长优秀的神经网络能够预测到更精准的答案 预测误差也会更少到最后能够提升的空间变小曲线也趋于水平班上的差声 从不及格到80分已经很不容易了 再往上冲刺100分就变成了更难的事情了机器学习也一样 所以如果你的机器学习误差曲线谢谢 是这样一条曲线就已经是很不错的学习成果了除了误差曲线我们可以看它的精确度曲线 最好的精度是趋向于百分之百的精度 比如在神经网络的分类问题中 100个样本中 我们有90张样本分类正确那就是说我们的预测精度是 90%不过不知道大家有没有想过对于回归的问题呢怎样看预测值是连续数字的精度呢 这时我们可以引用R2 在测量回归问题的精度 R2给出的最大精度也是100% 所以分类和回归问题就有了统一的精度标准 除了这些评分标准 我们还有很多其他的测量标准 比如说F1 分数用于测量不均衡数据的精度 由于时间有限我们会在今后的视频中继续详细讲解有时候 意外是猝不及防的 比如说有时候我们明明每一道 作业习题都会做 可是考试分数为什么总是比作业分低呢 原来我们只复习了作业题并没有深入拓展研究作业反映出来的知识这件事情也发生在机器学习中我们就叫做过拟合 我们再回到误差曲线 不过这时我们也把 训练误差画出来 红色的是训练误差黑色��是测试误差 训练时的误差比测试的误差小 网络虽然学习到了知识 但是对于平时作业太过依赖到了考试的时候却不能随机应变 没有成功的把作业的知识扩展开来 在机器学习当中 解决过拟合的方法也有很多 比如L1 L2的正规化 Job Out方法 神经网络当中有很多的参数 我们怎么确定 哪样的参数能够更有效的解决现有的问题呢 这时交叉验证也就是最好的途径了交叉 调查验证不仅仅可以用于神经网络的调参 还可以用于其他信息学习的方法的调参 同样是选择你想观看的误差值或者是精确度不过横坐标不再是学习时间 而是你要测试的某一参数比如说神经网络的乘数我们逐渐增加神经层然后对于每一个不同层结构的神经网络求出最终的误差值或者精确度或在途中我们知道神经层越多计算机所要消耗的时间或资源 所以我们只需要找到那一个可以满足误差要求 又可以节约支援的成结构 比如说误差在0.005以下都能接受 那我们就可以采用30层的神经成结构这些就是这段视频所包含的检验神经网络的方法如果你对机器学习感兴趣的话欢迎订阅我的频道观看我用当下最流行的编程语言Python 和它的机器学习模块来实现验证的各种方法謝謝