double DQN batch form modified

brian · wooridle · commit 35f57adf3d53 · 2017-05-16T00:36:09.000+09:00
diff --git a/Code 2. Cartpole/1. DQN/Cartpole_DQN.py b/Code 2. Cartpole/1. DQN/Cartpole_DQN.py
@@ -4,7 +4,6 @@
 import random
 import numpy as np
 from collections import deque
-import tensorflow as tf
 from keras.layers import Dense
 from keras.optimizers import Adam
 from keras.models import Sequential
@@ -18,7 +17,7 @@
 class DQNAgent:
     def __init__(self, state_size, action_size):
         # if you want to see Cartpole learning, then change to True
-        self.render = False
+        self.render = True
 
         # get size of state and action
         self.state_size = state_size
@@ -102,8 +101,6 @@ def train_replay(self):
 
         # and do the model fit!
         self.model.fit(update_input, target, batch_size=self.batch_size, epochs=1, verbose=0)
-        #hist = self.model.fit(update_input, update_target, batch_size=batch_size, epochs=1, verbose=0)
-        #self.avg_loss += hist.history['loss'][0]
 
     # load the saved model
     def load_model(self, name):
@@ -157,7 +154,7 @@ def save_model(self, name):
                 score = score if score == 500 else score + 100
                 scores.append(score)
                 episodes.append(e)
-                pylab.plot(episodes, scores, 'b')
+                #pylab.plot(episodes, scores, 'b')
                 # pylab.savefig("./save_graph/Cartpole_DQN.png")
                 print("episode:", e, "  score:", score, "  memory length:", len(agent.memory),
                       "  epsilon:", agent.epsilon)