PHP前端开发

Keras:通过详细示例了解基础知识

百变鹏仔 4天前 #Python
文章标签 示例

开发者们大家好,

如果您是深度学习新手,您可能遇到过 keras 这个名字。但它到底是什么?它是如何工作的?在这篇文章中,我将从头开始解释所有内容,并向您展示一个使用 keras 构建简单深度学习模型的分步示例。我还将解释诸如 mnist 数据集 之类的关键概念,以便您可以轻松理解!

1.什么是keras?

keras 是一个用 python 编写的开源高级神经网络 api。它允许开发人员使用用户友好的界面快速轻松地构建深度学习模型。 keras 位于 tensorflow 等更复杂的深度学习框架之上,让您可以专注于构建模型,而不会被底层复杂性所困扰。

2. 为什么使用 keras?

3.什么是mnist?

mnist 数据集 是机器学习领域最著名的数据集之一。它包含 70,000 张手写数字 (0-9) 图像。每个图像都是灰度图片,大小为 28x28 像素。目标是将这些图像分类为十个数字类别之一。

以下是 mnist 数据集中的一些数字示例:

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9]

使用 keras 时,您经常会看到教程中使用 mnist 数据集,因为它简单、易于理解,并且非常适合测试新模型。


4. 使用 keras 构建简单的神经网络(逐步)

现在让我们使用 keras 构建一个简单的神经网络来对这些手写数字进行分类。我们将一步步进行。

第 1 步:安装 tensorflow(keras 与 tensorflow 捆绑在一起)

首先,您需要安装 tensorflow,因为 keras 是最新版本中 tensorflow 的一部分。您可以通过 pip 安装它:

pip install tensorflow

第2步:导入所需的库

我们将导入构建和训练模型所需的 tensorflow 和 keras 特定库。

import tensorflow as tffrom tensorflow.keras import layers, models

这里,tensorflow.keras 是 tensorflow 中的 keras api。

步骤 3:加载 mnist 数据集

keras 提供了对 mnist 等数据集的轻松访问。我们将加载数据集并将其分为训练集和测试集。

# load the mnist datasetmnist = tf.keras.datasets.mnist(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

在此步骤中,train_images 和 train_labels 保存训练数据,而 test_images 和 test_labels 保存测试数据。

train_images中的每张图像都是28x28像素的灰度图像,train_labels包含每张图像对应的数字标签(0-9)。

步骤 4:预处理数据

接下来,我们需要对图像的像素值进行归一化,以使模型训练更加高效。图像中的每个像素值都在 0 到 255 之间。我们将图像除以 255,将这些值缩放到 0 到 1 之间。

# normalize pixel values to be between 0 and 1train_images = train_images / 255.0test_images = test_images / 255.0

第 5 步:构建模型

现在让我们使用 keras 构建我们的神经网络。我们将创建一个顺序模型,它允许我们将层堆叠在另一个之上。

# build the modelmodel = models.sequential([    layers.flatten(input_shape=(28, 28)),      # flatten the 28x28 images into a 1d vector of 784 pixels    layers.dense(128, activation='relu'),      # add a fully-connected (dense) layer with 128 neurons    layers.dense(10, activation='softmax')     # output layer with 10 neurons (one for each digit 0-9)])

第 6 步:编译模型

接下来,我们需要编译模型。这是我们指定优化器损失函数评估指标
的地方

# compile the modelmodel.compile(optimizer='adam',              loss='sparse_categorical_crossentropy',              metrics=['accuracy'])

第 7 步:训练模型

现在,我们准备好训练模型了!我们将对其进行 5 epochs 训练(即模型将遍历整个训练数据集 5 次)。

# train the modelmodel.fit(train_images, train_labels, epochs=5)

第 8 步:评估模型

模型训练完成后,我们可以评估其在测试数据上的性能。

# Evaluate the modeltest_loss, test_acc = model.evaluate(test_images, test_labels)print(f'Test accuracy: {test_acc}')

这将为我们提供模型在测试数据集上的准确性。


5. 幕后发生了什么?

简单来说:

  1. 数据预处理:我们对数据进行归一化,使训练更加高效。
  2. 模型定义:我们使用顺序 api 构建了一个简单的前馈神经网络。
  3. 编译:我们选择了正确的损失函数和优化器来指导模型的学习。
  4. 训练:模型学会了通过多次遍历数据集将图像映射到数字。
  5. 评估:最后,我们检查了模型对未见过的数据的泛化程度。

6. 下一步该何去何从?

keras 简化了构建和训练神经网络的过程,使其成为初学者的理想起点。一旦您熟悉了基本模型,您就可以尝试更复杂的架构,例如卷积神经网络(cnn)循环神经网络(rnn)

随意使用 keras 更深入地探索深度学习世界,尝试不同的模型,并突破可能的界限!


到目前为止,您对 keras 有何看法?