tensorflow学习笔记-MNIST Tensorflow Mechanics 101

今天把教程MNIST Tensorflow Mechanics 101过了一遍。

对于想自己把整个代码敲一遍的同学，可能会遇到以下的几个问题：

1.关于数据的理解

对于前面的Deep MNIST for Experts中，label的编码采取的是one-hot编码，因此在后面计算accuracy时，需要采用argmax函数，得到数字（0-9）。而在本教程中label直接就是0-9的数字，不是采用的one-hot编码。对于这样的数据，后面计算损失函数时，采用的是sparse_softmax_cross_entropy_with_logits函数，计算起来非常方便。

2.模型的训练如何体现的

在计算图中，我们会定义一个train_op,对于这个操作的运行就体现了模型的训练。因此，我们使用sessiion运行时，一定要fetch这个操作。

_, loss_value = sess.run([train_op,loss], 
                         feed_dict={image_placeholder: batch[0], label_placeholder: batch[1]})

否则不加上train_op的话，模型是得不到训练的，参数也不会更新。

3.模型控制参数FLAGS相关

flags = tf.app.flags
FLAGS = flags.FLAGS
flags.DEFINE_boolean("fake_data", False, 'If true, use fake data for unit testing')
flags.DEFINE_string("train_dir", 'data', 'Directory to put the data')
flags.DEFINE_integer("batch_size", 100, "batch size , must be divided evenly into the datasize")
flags.DEFINE_integer('hidden1_units', 128, 'number of units in hidden layer 1')
flags.DEFINE_integer('hidden2_units', 32, 'number of units in hidden layer 2')
flags.DEFINE_integer('max_train_steps', 4000, 'number of the max training steps')

这里定义的都是一些模型参数，当然，假如你是自己写代码的话，刚开始也不会知道自己后面要用到哪些参数。可是在ipython notebook时，假如在后面定义的话，你会遇到错误AttributeError。因此，这里最好你还是把参数都在前面一起定义，然后在后面使用。

4.TensorBoard可视化

TensorBoard是一个用来帮助我们理解和可视化tensorflow的web应用。目前支持5种可视化，scalars, images, audio, histograms, 和graph。对于scalar，我们可以将scalar_summary操作附在我们感兴趣的例如 learning rate 和loss函数的输出节点上。对于histograms,当我们想可视化某一层的激活函数的分布或者梯度和权重的分布时，可以将histogram_summary操作附在相应的梯度输出和权重变量。另外，神器，tf.merge_all_summaries可以将我们想可视化的所有数据组合到一个操作中，这样使用起来非常方便。首先是取出session中的summary操作，然后将其传给SummaryWriter用于将其写入事件文件中。这样就可以用tensorboard可视化这些数据。具体如何使用，可以查看一下教程对于本教程中的，图如下：统计的另一个scalar交叉熵如下:

5.python notebook源码链接

代码在这里

参考链接

https://www.tensorflow.org/versions/r0.10/tutorials/mnist/tf/index.html https://github.com/tensorflow/tensorflow/blob/r0.10/tensorflow/tensorboard/README.md