
148
|
第
4
章
oreil.ly/pTgS9
)对输入空间进行采样以创建一组输入,特别是在并非所有的输入组合
在物理上都是可能的情况下。
在这种情况下,过拟合在技术上是可行的(见图
4-5
,图中空心圆被错误估计为带 ×
的圆)。
图
4
-
5
: 如果输入空间是采样的而不是列表的,则需要注意限制模型的复杂度。
但是,即使在这里,也可以看到机器学习模型可以在已知数据上进行插值。
计算始
终是确定性的,只有输入点可以随机选择。因此,这些已知的数据不包含噪声,并
且由于不存在无法观测的变量,因此未采样点的误差将严格受模型复杂度的限制。
在这里,过拟合的危险来自模型的复杂度,而不是来自对噪声的拟合。当数据集的
大小大于自由参数的数量时,过拟合就不是一个大问题。因此,对输入空间采用蒙
特卡洛方法进行选择的情况下,使用低复杂度模型和适度正则化的组合,为避免不
可接受的过拟合提供了一种实用的方法。
数据驱动的离散化
虽然对于某些
PDE
可以得出封闭形式的解,但使用数值方法得到确定解的方法更
为流行。
PDE
的数值方法已经得到了深入的研究,并且有许多书籍(
https://oreil.ly/
RJWVQ
)、课 程(
http://oreil.ly/wcl_n
)和 期 刊(
https://msp.org/apde
)专门介绍该专题。
一种常见的方法是使用类似于龙格-库塔(
Runge-Kutta
)方法的有限差分方法来求
解常微分方程。这通常是通过离散化
PDE
的微分算子并在原始域的时空网格上找到
离散问题的解来完成的。但是,当问题的维数变大时,由于维数灾难,灾难这种基 ...