如何使用TensorFlow使用Auto MPG数据集将数据标准化以预测燃油效率?

Tensorflow是Google提供的一种机器学习框架。它是一个开放源代码框架,与Python结合使用以实现算法,深度学习应用程序等等。可以使用下面的代码行在Windows上安装'tensorflow'软件包-

pip install tensorflow

Tensor是TensorFlow中使用的数据结构。它有助于连接流程图中的边缘。该流程图称为“数据流程图”。张量不过是多维数组或列表。

回归问题背后的目的是预测连续或离散变量的输出,例如价格,概率,是否下雨等等。

我们使用的数据集称为“自动MPG”数据集。它包含了1970年代和1980年代汽车的燃油效率。它包括诸如重量,马力,位移等属性。因此,我们需要预测特定车辆的燃油效率。

我们正在使用Google合作实验室来运行以下代码。Google Colab或Colaboratory可以帮助通过浏览器运行Python代码,并且需要零配置和对GPU(图形处理单元)的免费访问。合作已建立在Jupyter Notebook的基础上。

以下是代码片段-

示例

print("Separating the label from features")

train_features = train_dataset.copy()

test_features = test_dataset.copy()

train_labels = train_features.pop('MPG')

test_labels = test_features.pop('MPG')

print("训练数据集的均值和标准差: ")

train_dataset.describe().transpose()[['mean', 'std']]

print("Normalize the features since they use different scales")

print("Creating the normalization layer")

normalizer = preprocessing.Normalization()

normalizer.adapt(np.array(train_features))

print(normalizer.mean.numpy())

first = np.array(train_features[3:4])

print("Every feature has been individually normalized")

with np.printoptions(precision=2, suppress=True):

print('First example is :', first)

print()

print('Normalized data :', normalizer(first).numpy())

代码信用-https://www.tensorflow.org/tutorials/keras/regression

输出结果

Separating the label from features

训练数据集的均值和标准差:

Normalize the features since they use different scales

Creating the normalization layer

[ 5.467 193.847 104.135 2976.88 15.591 75.934 0.168 0.197

0.635]

Every feature has been individually normalized

First example is : [[ 4. 105. 63. 2125. 14.7 82. 0. 0. 1. ]]

Normalized data : [[−0.87 −0.87 −1.11 −1.03 −0.33 1.65 −0.45 −0.5 0.76]]

解释

  • 目标值(标签)与特征分开。

  • 标签是为进行预测而需要训练的值。

  • 对功能进行了归一化,以使训练稳定。

  • Tensorflow中的``标准化''功能可对数据进行预处理。

  • 创建第一层,并将均值和方差存储在该层中。

  • 调用此层时,它将返回已标准化每个要素的输入数据。

以上是 如何使用TensorFlow使用Auto MPG数据集将数据标准化以预测燃油效率? 的全部内容, 来源链接: utcz.com/z/337253.html

回到顶部