樊麾

时间：2026-01-05 22:04:29编辑：思创君

alphago战胜了人类世界围棋冠军是哪一年

2016年3月AlphaGo在围棋人机大战中击败围棋世界冠军李世石。2016年3月9日，围棋人机大战首局在韩国首尔四季酒店打响。赛前猜先阿尔法围棋猜错，李世石选择黑棋，率先展开布局。黑棋布局走出新型，阿尔法应对不佳，出现失误。李世石抓住电脑布局不擅长应对新型的弱点获得不错的局面。围棋的胜负关键往往是中盘阶段，阿尔法围棋之后的下法变得强硬，双方展开接触战。李世石抓住机会，围住一块大空，在大局上抢得先机。就在观战棋手都认为李世石占优的情况下，他却放出了非常业余的手法，瞬间使微弱的优势化为乌有，还变成了劣势。进入官子，阿尔法围棋根本不犯一点错误，等阿尔法围棋下了186手，李世石算清后投子认输。比赛规程李世石与阿尔法围棋的围棋人机大战为五番棋挑战，但无论比分如何将下满五局，比赛采用中国围棋规则，执黑一方贴3又3/4子（即7.5目），各方用时为2小时，3次60秒的读秒机会。五局比赛分别于2016年3月9日、3月10日、3月12日、3月13日和3月15日在韩国首尔钟路区四季酒店进行。

后AlphaGo时代崭露头角的围棋al都有什么？

绝艺，星阵，凤凰。阿尔法围棋（AlphaGo）是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人，由谷歌（Google）旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。其主要工作原理是“深度学习”。2017年5月27日，在柯洁与阿尔法围棋的人机大战之后，阿尔法围棋团队宣布阿尔法围棋将不再参加围棋比赛。2017年10月18日，DeepMind团队公布了最强版阿尔法围棋，代号AlphaGo Zero。操作过程阿尔法围棋（AlphaGo）为了应对围棋的复杂性，结合了监督学习和强化学习的优势。它通过训练形成一个策略网络（policy network），将棋盘上的局势作为输入信息，并对所有可行的落子位置生成一个概率分布。然后，训练出一个价值网络（value network）对自我对弈进行预测，以 -1（对手的绝对胜利）到1（AlphaGo的绝对胜利）的标准，预测所有可行落子位置的结果。这两个网络自身都十分强大，而阿尔法围棋将这两种网络整合进基于概率的蒙特卡罗树搜索（MCTS）中，实现了它真正的优势。新版的阿尔法围棋产生大量自我对弈棋局，为下一代版本提供了训练数据，此过程循环往复。在获取棋局信息后，阿尔法围棋会根据策略网络（policy network）探索哪个位置同时具备高潜在价值和高可能性，进而决定最佳落子位置。在分配的搜索时间结束时，模拟过程中被系统最频繁考察的位置将成为阿尔法围棋的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后，阿尔法围棋的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

上一篇：002583

下一篇：没有了