TensorboardでMNISTのデータをグリグリ回して観察してみた[PCA][t-SNE]

7月 27, 2020

f:id:Vastee:20181113124153p:plain

TensorFlow 0.12から"Embedding Visualization"というものが追加され, データをグリグリ回しながら3次元的に観察できるようになった.

そこで, 本記事では下の方のわかりやすい説明を参考に(ほぼコピペだが)MNISTのデータをグリグリ回して観察することに挑戦.

本記事のコードを順番通りに実行すれば, MNISTの可視化が行えるようになっている. 自身でデータをダウンロードする必要ないので楽ちんだ.

また, ソースに%matplotlib inlineの記述があったので, JupyterNotebookで実行した.

www.pinchofintelligence.com

まずはライブラリとパスを追加

%matplotlib inline
import matplotlib.pyplot as plt
import tensorflow as tf
import numpy as np
import os
from tensorflow.contrib.tensorboard.plugins import projector
from tensorflow.examples.tutorials.mnist import input_data
LOG_DIR = 'minimalsample'
NAME_TO_VISUALISE_VARIABLE = "mnistembedding"
TO_EMBED_COUNT = 500
path_for_mnist_sprites =  os.path.join(LOG_DIR,'mnistdigits.png')
path_for_mnist_metadata =  os.path.join(LOG_DIR,'metadata.tsv')

MNISTのデータをダウンロードしてくる

ちなみにMNISTのサイズは28*28=784

mnist = input_data.read_data_sets("MNIST_data/", one_hot=False)
batch_xs, batch_ys = mnist.train.next_batch(TO_EMBED_COUNT)

MNISTをTensorflowで扱うためEmbedding

embedding_var = tf.Variable(batch_xs, name=NAME_TO_VISUALISE_VARIABLE)
summary_writer = tf.summary.FileWriter(LOG_DIR)

データを可視化する為のパラメータの設定

リンク元のコードのようにパスの指定すると, ファイルが読み取れないので2点修正した.

config = projector.ProjectorConfig()
embedding = config.embeddings.add()
embedding.tensor_name = embedding_var.name
# Specify where you find the metadata
embedding.metadata_path = "metadata.tsv"
# 1つ目の修正はココ! 
# Specify where you find the sprite (we will create this later)
embedding.sprite.image_path = "mnistdigits.png"
# 2つ目の修正はココ! 
embedding.sprite.single_image_dim.extend([28,28])
# Say that you want to visualise the embeddings
projector.visualize_embeddings(summary_writer, config)

データを保存

sess = tf.InteractiveSession()
sess.run(tf.global_variables_initializer())
saver = tf.train.Saver()
saver.save(sess, os.path.join(LOG_DIR, "model.ckpt"), 1)

分割された画像を作成するための関数の定義

def
create_sprite_image(images):
"""Returns a sprite image consisting of images passed as argument. Images should be count x width x height"""
if
isinstance(images, list):
images = np.array(images)
img_h = images.shape[1]
img_w = images.shape[2]
n_plots = int(np.ceil(np.sqrt(images.shape[0])))
spriteimage = np.ones((img_h * n_plots ,img_w * n_plots ))
for i in
range(n_plots):
for j in
range(n_plots):
this_filter = i * n_plots + j
if this_filter < images.shape[0]:
this_img = images[this_filter]
spriteimage[i * img_h:(i + 1) * img_h,
j * img_w:(j + 1) * img_w] = this_img
return spriteimage
def
vector_to_matrix_mnist(mnist_digits):
"""Reshapes normal mnist digit (batch,28*28) to matrix (batch,28,28)"""
return np.reshape(mnist_digits,(-1,28,28))
def
invert_grayscale(mnist_digits):
""" Makes black white, and white black """
return
1-mnist_digits

分割された画像を表示

to_visualise = batch_xs
to_visualise = vector_to_matrix_mnist(to_visualise)
to_visualise = invert_grayscale(to_visualise)
sprite_image = create_sprite_image(to_visualise)
plt.imsave(path_for_mnist_sprites,sprite_image,cmap='gray')
plt.imshow(sprite_image,cmap='gray')

f:id:Vastee:20181113111903p:plain:w300

メタデータを保存

with
open(path_for_mnist_metadata,'w') as f:
f.write("Index\tLabel\n")
for index,label in
enumerate(batch_ys):
f.write("%d\t%d\n" % (index,label))

Tensorboardを開く

コマンドプロンプトから以下のコマンドを実行し,

tensorboard –logdir=minimalsample

Webブラウザhttp://127.0.0.1:6006に接続すれば可視化結果が見れる.(筆者の環境ではなぜかFirefoxでは見れないのだが, Chromiumにすると見れるようになった)

PCA

Posted by vastee