飞道的博客

如何用 CNN 玩转 AlphaGo 版的五子棋?

293人阅读  评论(0)

作者 | 李秋键

责编 | 郭   芮

出品 | CSDN(ID:CSDNnews)

近几年来,AI在游戏方面的发展如火如荼,尤其是自从阿法狗AI围棋战胜围棋之后,更是引起了AI发展的狂潮,同时也引起了很多AI游戏的应用与深化发展。其实游戏中的AI有着非常悠久的历史,相当多的游戏都是围绕着对抗“敌人”展开,而这个“敌人”,就是AI,其中包含一些行为方式固定没有一丁点变化的低级AI,也有一些引入随机因素稍微高级一点的AI,不过这里的AI本质上是一段固定的程序脚本,如果玩家掌握到其中的规律,游戏性就会瞬间降低。 

而深度学习的AI版本却是不同,他有着多层位的参数与多方向的选择,拓展了其中AI的智能性,让玩家找到其中的规律性变得基本不可能,这也是深度学习的重要意义之一。今天,我们就将利用CNN实现智能五子棋。

实验前的准备

首先我们使用的python版本是3.6.5。所测试的系统有windows10,windows7,Linux系统以及苹果系统。从这点也可以看出python多平台和多拓展性、易于迁移的优点。

所使用的的python库有tkinter,其目的是用来规划棋盘布局,实现下棋功能;SGFfile用来读取棋谱和加载训练模型;os库用来读取和存储本地文件;TensorFlow库用来建立CNN网络模型以及训练等事项。

棋盘的建立

1、初始化棋盘:

其中各参数设定意义如下:初始化:someoneWin:标识是否有人赢了;humanChessed:人类玩家是否下了;IsStart:是否开始游戏了;player:玩家是哪一方;playmethod:模式,和robot下棋,还是和ai下棋;bla_start_pos:黑棋开局时下在正中间的位置;bla_chessed:保存黑棋已经下过的棋子;whi_chessed:保存白棋已经下过的棋子;board:棋盘;window:窗口;var:用于标记选择玩家颜色的一个变量;var1:用于标记选择robot或者ai的一个变量;can:画布,用于绘出棋盘;net_board:棋盘的点信息;robot:机器人;sgf:处理棋谱;cnn:cnnc神经网络。

其中代码如下:


   
  1. def __init__(self):
  2. self.someoneWin = False
  3. self.humanChessed = False
  4. self.IsStart = False
  5. self.player = 0
  6. self.playmethod = 0
  7. self.bla_start_pos = [ 235, 235]
  8. self.whi_chessed = []
  9. self.bla_chessed = []
  10. self.board = self.init_board()
  11. self.window = Tk()
  12. self.var = IntVar()
  13. self.var.set( 0)
  14. self.var1 = IntVar()
  15. self.var1.set( 0)
  16. self.window.title( "myGoBang")
  17. self.window.geometry( "600x470+80+80")
  18. self.window.resizable( 0, 0)
  19. self.can = Canvas( self.window, bg= "#EEE8AC", width= 470, height= 470)
  20. self.draw_board()
  21. self.can.grid(row= 0, column= 0)
  22. self.net_board = self.get_net_board()
  23. self.robot = Robot( self.board)
  24. self.sgf = SGFflie()
  25. self.cnn = myCNN()
  26. self.cnn.restore_save()
  27. def init_board(self):
  28. "" "初始化棋盘" ""
  29. list1 = [[- 1]* 15 for i in range( 15)]
  30. return list1

2、棋盘布局:

其主要功能就是画出棋盘和棋子。具体代码如下:


   
  1. def draw_board(self):
  2. """画出棋盘"""
  3. for row in range( 15):
  4. if row == 0 or row == 14:
  5. self.can.create_line(( 25, 25 + row * 30), ( 445, 25 + row * 30), width= 2)
  6. else:
  7. self.can.create_line(( 25, 25 + row * 30), ( 445, 25 + row * 30), width= 1)
  8. for col in range( 15):
  9. if col == 0 or col == 14:
  10. self.can.create_line(( 25 + col * 30, 25), ( 25 + col * 30, 445), width= 2)
  11. else:
  12. self.can.create_line(( 25 + col * 30, 25), ( 25 + col * 30, 445), width= 1)
  13. self.can.create_oval( 112, 112, 118, 118, fill= "black")
  14. self.can.create_oval( 352, 112, 358, 118, fill= "black")
  15. self.can.create_oval( 112, 352, 118, 358, fill= "black")
  16. self.can.create_oval( 232, 232, 238, 238, fill= "black")
  17. self.can.create_oval( 352, 352, 358, 358, fill= "black")
  18. def draw_chessed(self):
  19. """在棋盘中画出已经下过的棋子"""
  20. if len(self.whi_chessed) != 0:
  21. for tmp in self.whi_chessed:
  22. oval = pos_to_draw(*tmp[ 0: 2])
  23. self.can.create_oval(oval, fill= "white")
  24. if len(self.bla_chessed) != 0:
  25. for tmp in self.bla_chessed:
  26. oval = pos_to_draw(*tmp[ 0: 2])
  27. self.can.create_oval(oval, fill= "black")
  28. def draw_a_chess(self, x, y, player=None):
  29. """在棋盘中画一个棋子"""
  30. _x, _y = pos_in_qiju(x, y)
  31. oval = pos_to_draw(x, y)
  32. if player == 0:
  33. self.can.create_oval(oval, fill= "black")
  34. self.bla_chessed.append([x, y, 0])
  35. self.board[_x][_y] = 1
  36. elif player == 1:
  37. self.can.create_oval(oval, fill= "white")
  38. self.whi_chessed.append([x, y, 1])
  39. self.board[_x][_y] = 0
  40. else:
  41. print(AttributeError( "请选择棋手"))
  42. return

3、判断胜负条件:

根据是否是五子连在一线判断输赢。


   
  1. def have_five( self, chessed):
  2. "" "检测是否存在连五了" ""
  3. if len(chessed) == 0:
  4. return False
  5. for row in range( 15):
  6. for col in range( 15):
  7. x = 25 + row * 30
  8. y = 25 + col * 30
  9. if self.check_chessed((x, y), chessed) == True and \
  10. self.check_chessed((x, y + 30), chessed) == True and \
  11. self.check_chessed((x, y + 60), chessed) == True and \
  12. self.check_chessed((x, y + 90), chessed) == True and \
  13. self.check_chessed((x, y + 120), chessed) == True:
  14. return True
  15. elif self.check_chessed((x, y), chessed) == True and \
  16. self.check_chessed((x + 30, y), chessed) == True and \
  17. self.check_chessed((x + 60, y), chessed) == True and \
  18. self.check_chessed((x + 90, y), chessed) == True and \
  19. self.check_chessed((x + 120, y), chessed) == True:
  20. return True
  21. elif self.check_chessed((x, y), chessed) == True and \
  22. self.check_chessed((x + 30, y + 30), chessed) == True and \
  23. self.check_chessed((x + 60, y + 60), chessed) == True and \
  24. self.check_chessed((x + 90, y + 90), chessed) == True and \
  25. self.check_chessed((x + 120, y + 120), chessed) == True:
  26. return True
  27. elif self.check_chessed((x, y), chessed) == True and \
  28. self.check_chessed((x + 30, y - 30), chessed) == True and \
  29. self.check_chessed((x + 60, y - 60), chessed) == True and \
  30. self.check_chessed((x + 90, y - 90), chessed) == True and \
  31. self.check_chessed((x + 120, y - 120), chessed) == True:
  32. return True
  33. else:
  34. pass
  35. return False
  36. def check_win( self):
  37. "" "检测是否有人赢了" ""
  38. if self.have_five( self.whi_chessed) == True:
  39. label = Label( self.window, text= "White Win!", background= '#FFF8DC', font=( "宋体", 15, "bold"))
  40. label.place(relx= 0, rely= 0, x= 480, y= 40)
  41. return True
  42. elif self.have_five( self.bla_chessed) == True:
  43. label = Label( self.window, text= "Black Win!", background= '#FFF8DC', font=( "宋体", 15, "bold"))
  44. label.place(relx= 0, rely= 0, x= 480, y= 40)
  45. return True
  46. else:
  47. return False

得到的UI界面如下:

深度学习建模

1、初始化神经网络:

其中第一层和第二层为卷积层,第四层为全连接层,接着紧接着连接池化和softmax。和一般的CNN网络基本无异。基本参数见代码,如下:


   
  1. def __init__(self):
  2. '' '初始化神经网络' ''
  3. self.sess = tf.InteractiveSession()
  4. # paras
  5. self.W_conv1 = self.weight_varible([ 5, 5, 1, 32])
  6. self.b_conv1 = self.bias_variable([ 32])
  7. # conv layer-1
  8. self.x = tf.placeholder(tf.float32, [None, 225])
  9. self.y = tf.placeholder(tf.float32, [None, 225])
  10. self.x_image = tf.reshape( self.x, [- 1, 15, 15, 1])
  11. self.h_conv1 = tf.nn.relu( self.conv2d( self.x_image, self.W_conv1) + self.b_conv1)
  12. self.h_pool1 = self.max_pool_2x2( self.h_conv1)
  13. # conv layer-2
  14. self.W_conv2 = self.weight_varible([ 5, 5, 32, 64])
  15. self.b_conv2 = self.bias_variable([ 64])
  16. self.h_conv2 = tf.nn.relu( self.conv2d( self.h_pool1, self.W_conv2) + self.b_conv2)
  17. self.h_pool2 = self.max_pool_2x2( self.h_conv2)
  18. # full connection
  19. self.W_fc1 = self.weight_varible([ 4 * 4 * 64, 1024])
  20. self.b_fc1 = self.bias_variable([ 1024])
  21. self.h_pool2_flat = tf.reshape( self.h_pool2, [- 1, 4 * 4 * 64])
  22. self.h_fc1 = tf.nn.relu(tf.matmul( self.h_pool2_flat, self.W_fc1) + self.b_fc1)
  23. # dropout
  24. self.keep_prob = tf.placeholder(tf.float32)
  25. self.h_fc1_drop = tf.nn.dropout( self.h_fc1, self.keep_prob)
  26. # output layer: softmax
  27. self.W_fc2 = self.weight_varible([ 1024, 225])
  28. self.b_fc2 = self.bias_variable([ 225])
  29. self.y_conv = tf.nn.softmax(tf.matmul( self.h_fc1_drop, self.W_fc2) + self.b_fc2)
  30. # model training
  31. self.cross_entropy = -tf.reduce_sum( self.y * tf.log( self.y_conv))
  32. self.train_step = tf.train.AdamOptimizer( 1e- 3).minimize( self.cross_entropy)
  33. self.correct_prediction = tf.equal(tf.argmax( self.y_conv, 1), tf.argmax( self.y, 1))
  34. self.accuracy = tf.reduce_mean(tf.cast( self.correct_prediction, tf.float32))
  35. self.saver = tf.train.Saver()
  36. init = tf.global_variables_initializer() # 不存在就初始化变量
  37. self.sess.run(init)
  38. def weight_varible(self, shape):
  39. '' '权重变量' ''
  40. initial = tf.truncated_normal(shape, stddev= 0. 1)
  41. return tf.Variable(initial)
  42. def bias_variable(self, shape):
  43. '' '偏置变量' ''
  44. initial = tf.constant( 0. 1, shape=shape)
  45. return tf.Variable(initial)
  46. def conv2d(self, x, W):
  47. '' '卷积核' ''
  48. return tf.nn.conv2d(x, W, strides=[ 1, 1, 1, 1], padding= 'SAME')
  49. def max_pool_2x2(self, x):
  50. '' '池化核' ''
  51. return tf.nn.max_pool(x, ksize=[ 1, 2, 2, 1], strides=[ 1, 2, 2, 1], padding= 'SAME')

2、保存和读取模型:


   
  1. def restore_save(self, method=1):
  2. '''保存和读取模型'''
  3. if method == 1:
  4. self.saver.restore(self.sess, 'save\model.ckpt')
  5. #print("已读取数据")
  6. elif method == 0:
  7. saver = tf.train.Saver(write_version=tf.train.SaverDef.V2)
  8. saver.save(self.sess, 'save\model.ckpt')
  9. #print('已保存')

3、建立预测函数和训练函数:


   
  1. def predition(self, qiju):
  2. '''预测函数'''
  3. _qiju = self.createdataformqiju(qiju)
  4. pre = self.sess.run(tf.argmax(self.y_conv, 1), feed_dict={self.x: _qiju, self.keep_prob: 1.0})
  5. point = [ 0, 0]
  6. l = pre[ 0]
  7. for i in range( 15):
  8. if ((i + 1) * 15) > l:
  9. point[ 0] = int(i* 30 + 25)
  10. point[ 1] = int((l - i * 15) * 30 + 25)
  11. break
  12. return point
  13. def train(self, qiju):
  14. '''训练函数'''
  15. sgf = SGFflie()
  16. _x, _y = sgf.createTraindataFromqipu(qiju)
  17. for i in range( 10):
  18. self.sess.run(self.train_step, feed_dict={
  19. self.x: _x,
  20. self.y: _y
  21. })
  22. self.restore_save(method= 0)
  23. def train1(self, x, y):
  24. '''另一个训练函数'''
  25. for i in range( 100):
  26. self.sess.run(self.train_step, feed_dict={
  27. self.x: x,
  28. self.y: y,
  29. self.keep_prob: 0.5
  30. })
  31. print( '训练好了一次')
  32. #self.restore_save(method=0)

4、生成数据:


   
  1. def createdataformqiju(self, qiju):
  2. '''生成数据'''
  3. data = []
  4. tmp = []
  5. for row in qiju:
  6. for point in row:
  7. if point == -1:
  8. tmp.append( 0.0)
  9. elif point == 0:
  10. tmp.append( 2.0)
  11. elif point == 1:
  12. tmp.append( 1.0)
  13. data.append(tmp)
  14. return data

其中此处CNN在棋盘应用和图像识别的不同之处在于,图像识别加载的参数来自于图像本身的像素值作为训练的参数,而此处训练的参数则是自定义的棋盘棋谱参数,比如说棋盘左上角的位置参数等等各个位置参数都是预先设定好的,通过加载棋谱即可以让电脑知道此时黑白棋子在哪个位置。然后通过加载各个位置以及胜负情况进行判断,最终电脑加载模型即可预测可能胜利的下棋位置,达到智能下棋效果。

最终效果:

作者简介:李秋键,CSDN 博客专家,CSDN达人课作者。硕士在读于中国矿业大学,开发有安卓武侠游戏一部,VIP视频解析,文意转换写作机器人等项目,发表论文若干,多次高数竞赛获奖等等。

声明:本文为作者原创投稿,未经允许请勿转载。

【End】

《原力计划【第二季】- 学习力挑战》正式开始!
即日起至 3月21日,千万流量支持原创作者,更有专属【勋章】等你来挑战

推荐阅读 

谁说国产编译器没救了?这个 C/C++ 和 JavaScript 编译器来了 | 程序人生 2020

中国开发者真实画像:Java长盛,偏爱Windows操作系统,鲜少参与开源项目

用于小型图形挖掘研究的瑞士军刀:空手道俱乐部的图表学习Python库

罗永浩欲直播带货,京东说可以帮忙联系

MySQL数据库无完整备份删库,除了跑路还能怎么办?

Libra新编程语言 :Move 的所有权模型灵感来源原来是它……

你点的每一个在看,我认真当成了喜欢


转载:https://blog.csdn.net/csdnnews/article/details/104809974
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场