
2.2
创建仿真数据集
|
25
2.2
创建仿真数据集
问题描述
生成一个仿真数据集。
解决方案
scikit-learn
提供了很多创建仿真数据集的方法。其中有三个方法非常有用。如果需要用
一个仿真数据集来做线性回归,
make_regression
是一个不错的选择 :
#
加载库
from sklearn.datasets import make_regression
#
生成特征矩阵、目标向量以及模型的系数
features, target, coefficients = make_regression(n_samples = 100,
n_features = 3,
n_informative = 3,
n_targets = 1,
noise = 0.0,
coef = True,
random_state = 1)
#
查看特征矩阵和目标向量
print('Feature Matrix\n', features[:3])
print('Target Vector\n', target[:3])
Feature Matrix
[[ 1.29322588 -0.61736206 -0.11044703]
[-2.793085 0.36633201 1.93752881]
[ 0.80186103 -0.18656977 0.0465673 ]]
Target Vector
[-10.37865986 25.5124503 19.67705609]
如果需要创建一个仿真数据集来做分类,可以使用 ...