山有扶苏提示您:看后求收藏(第1542章 夏铭的大礼,制霸娱乐圈山有扶苏,山有扶苏,新笔趣阁),接着再看更方便。

请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,避免出现内容无法显示或者段落错乱。

冰河。

是一款关于围棋的人工智能程序。

而这款人工智能为了应对围棋的复杂性,结合了监督学习和强化学习的优势。

它通过训练形成一个策略网络,将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。

然后,训练出一个价值网络对自我对弈进行预测,以  -1(对手的绝对胜利)到1(冰河的绝对胜利)的标准,预测所有可行落子位置的结果。

这两个网络自身都十分强大,而冰河围棋将这两种网络整合进基于概率的蒙特卡罗树搜索中,实现了它真正的优势。

在获取棋局信息后,冰河围棋会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。

在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为冰河围棋的最终选择。

在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,冰河围棋的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

而冰河人工智能系统,主要由几个部分组成:

一、策略网络(Policy  Network),给定当前局面,预测并采样下一步的走棋;

首发域名m.xsbiquge。la

二、快速走子(Fast  rollout),目标和策略网络一样,但在适当牺牲走棋质量的条件下,速度要比策略网络快1000倍;

三、价值网络(Value  Network),给定当前局面,估计是白胜概率大还是黑胜概率大;

四、蒙特卡洛树搜索(Monte  Carlo  Tree  Search),把以上这四个部分连起来,形成一个完整的系统。

第一大脑:落子选择器(move-picker)。

第二大脑:棋局评估器(position-evaluator)。

本章未完,点击下一页继续阅读。

其他类型小说相关阅读More+

撑死之后(美食)

十三千月

修炼在骑士世界的领主

妖僧出逃(书坊)

重生之长心

冰川蝴蝶

直播修仙:请道友相信科学

倒霉啊倒霉

52赫兹与48分钟

连城雪

重生之王者时代

澄夏