编者按: AlphaGO又回来了。这一次的对手,是世界排名第一的人类棋手柯洁。 本周二,棋手柯洁以1/4子惜败,“输得没脾气”。 本周四,棋手柯洁中盘投子认输,“下得热血沸腾”。 昨天,AlphaGO连笑组合逆转了AlphaGO古力组合;而5位世界冠军组团对抗,中盘认输…… 今天,也许,是棋手柯洁与AlphaGO的最后一战…… 柯洁说:“和去年相比,AlphaGO‘判若两人’,去年很接近人类,今天完全换了一个模样。”这位在年初取得快棋赛60连胜,杀得中日韩顶级棋手溃不成军;如今又在慢棋赛中面对人类第一棋手连下两城的的AlphaGOMaster到底经历了怎样的成长?称霸围棋之后又将瞄向哪里? 我们找到了美国电气电子工程师学会(IEEE)的专家杨小康,再来聊聊这位“判若两人”的AI。 科学人:据说这次的AlphaGo是使用了谷歌研发的张量处理器(TPU)的单机版,这是否代表着人工智能的一大进步?这种进步有怎样的意义? 杨小康:AlphaGo战胜李世乭这个事件,已经确立了人工智能领域的新的里程碑。去年的AlphaGo是分布式版本,今年升级版的AlphaGo是在单机上运行的,只需要一台具有TPU的机器即可运行。这次对阵柯洁的AlphaGO的物理服务器上部署了4个TPU,这在技术上有改良,但称不上重大进步。 最主要的改良是算法。去年的版本是“学人+自学”,此次比赛的版本完全是“自学”。在左右互博的过程中自我提升。 第二个方面的改良是算法的优化。优化之后的算法,有更强大的策略网络和价值网络,降低了搜索的宽度,减少了候选项,降低了计算复杂性,也大大减少了硬件需求。 这两方面进步的意义在于,“自学”摆脱了对棋谱大数据的外部依赖,而单机版更节能、更便捷、更利于行业应用拓展。 科学人:从跟李世石对手的AlphaGo,到Master,到和柯洁对战的新AlphaGo,他们的技术或算法差异在哪?如果他们互相对决,会出现怎样的局面? 杨小康:DeepMind把AlphaGo粗略分成几个版本: 第一代,是击败樊麾的AlphaGoFan。与Zen/CrazyStone等之前的围棋软件相比,棋力要高出4子。 第二代,是击败李世乭的AlphaGoLee。与上一代相比,棋力高出3子。AlphaGOLee用了两招:1)利用深度卷积网络,模仿高手,寻找好的落点;2)利用深度强化学习,形成左右互搏,自我进化,期间参照高手棋局加速蒙特卡洛树搜索速度。 第三代,是柯洁如今的对手,也是年初60连胜的AlphaGoMaster。相比于击败李世乭的版本,棋力又再次提升3子。AlphaGoMaster只用“左右互博”一招制敌,这意味着它具备了更高水平的强化学习算法,拥有更强大的策略/价值网络,能够在左右互博中不断发现全新的好棋与好局。对于AlphaGOMaster来说,最好的棋谱再不是来自于人类,而是来自于AlphaGo自身。 科学人:新AlphaGo的人工智能技术未来最可能应用在什么领域?它将从哪些方面影响我们的生活,或为我们带来怎样的便利? 杨小康:AlphaGo的第一招“深度卷积神经网络”的思想实际上最初用于图像识别,这在城市监控、自动驾驶、人脸识别等领域广泛应用,在很大程度上改变了人类生产生活。 AlphaGo的第二招“深度强化学习神经网络”,这是目前人工智能最热门的研究课题之一。更一般而言,结合了机器学习到的知识和深度搜索与模拟技术的现代启发式搜索方法在许多决策问题上都有很大的潜力。 可以预计AlphaGo会继续开辟人工智能的应用前沿。包括DeepMind在内的国内外人工智能领域的公司和研究人员,应以遵循伦理和安全的方式,进行算法的开发,打造通用型人工智能技术,共同造福人类。在人类的未来生活中,智能助手和智能机器人将广泛服务业人类日常生活,为人们减轻体力和脑力的劳动负担,方便生活中的方方面面。 科学人:如果本次比赛AlphaGo再次获胜,是否代表在围棋领域的人工智能已经触及技术天花板? 杨小康:AlphaGo是最新深度学习方法、棋谱大数据以及最新超算体系的总和;它还以现代科学技术指数发展原理继续进化,并且没有任何情绪波动。既然AlphaGo是这样的一个人工智能系统,是不是它已经在科学原理上已经战胜了人类棋手?在此我想说,作为人类个体,李世乭、柯洁和众多棋手虽然告负,但对人类整体来说,这无疑是人类自我挑战的新的里程碑! 从纯技术的角度看,当人工智能发展到一定阶段后,在很多特定领域超越人类是技术的必然。我们承认这是技术发展的规律,此次柯洁再次挑战AlphaGo的结局在技术上其实早已注定,只是给了AlphaGo多了一次科学原理的验证和技术上的改良而言。 从人类情感的角度看,围棋是人类智慧皇冠上的明珠,AlphaGo更是人类智慧明珠上的明珠,此次挑战更像是人类对皇冠上的明珠的再次深情回眸,是悲壮,更是荣光! 科学人:你预测AlphaGo的下一个挑战领域是什么? 杨小康:DeepMind团队曾经透露下一阶段会转移目标,向暴雪的即时战略游戏《星际争霸》发起挑战。但AlphaGo最大的挑战是如何将自己下棋的技艺转化为造福人类的现实应用,从现在击败人类的阿尔法狗,进化到陪伴人类下围棋的“陪Ta狗”(BetaGo),或是其他类似的类人智能助理,比如: 1)人工智能给日常生活带来的最大影响体现在翻译方面。它实现了语言之间的互译。施密特称这是一件不可思议的事情,人工智能技术的应用大大提高了翻译过程中语言之间的转换速度及准确性。而目前谷歌只用了一个小团队就实现了这项技术,这是一个很大的进步。 2)未来五年人工智能技术的应用将给医疗领域带来巨大的变化。因为人类在医疗领域产生了丰富的数据,而这套系统可以利用这些数据进行训练学习,未来做出产品应用于医疗领域。 3)未来人工智能发展的可能方式是人和人工智能的结合。人工智能成为了人类助手。比如一个化学家,他可能无法看完所有的科研论文,但通过与一个专门的机器模型的对话解决问题,节省时间,提升科研效率。 科学人:谷歌的张量处理器(TPU)是为神经网络量身订造的芯片,请问它进行的运算具体是什么,又是应用在神经网络计算的什么方面呢?是在训练和应用中都有用吗? 杨小康:这次同柯洁对阵的AlphaGo,采用了谷歌自研的第二代TPU。TPU(TensorProcessingUnit)中的Tensor是指数学上的张量,它是线性代数中的基本数据类型。深度学习所使用算法,绝大多数可以被映射为底层的线性代数运算。线性代数运算有两大特点:Tensor的数据流动非常规整且可预期;计算密度很高,即每个数据都会历经非常多次的计算。这两大特点使得线性代数运算特别适合做硬件加速,每个晶体管都可以用做有明确意义的运算或存储。由于TPU是针对线性代数运算优化的专用芯片,它非常适用于加速深度学习算法,但无法运行CPU上跑的Java或C++程序,也无法运行GPU上的CUDA程序。 科学人:TPU的具体架构是什么样的呢?是比GPU更特化,给每套数据都配备专用的特殊计算电路吗?是否仍然保留了现在甚至未来神经网络计算可能需要的部分泛用性? 杨小康:TPU性能强劲的秘诀,是因为它专注于神经网络推断。这使得量化选择、CISC指令集、矩阵处理器和最小设计都成为可能。与CPU和GPU相比,单用途的TPU就是一个单线程芯片,不需要考虑缓存、分支预测、多道处理等问题。与CPU和GPU相比,TPU的控制单元更小,更容易设计,面积只占了整个冲模的2%,给片上存储器和运算单元留下了更大的空间。而且,TPU的大小只有其他芯片的一半。硅片越小,成本越低,良品率也越高。确定性是单用途带来的另一个优势。CPU和GPU需要考虑各种任务上的性能优化,因此会有越来越复杂的机制,带来的副作用就是这些处理器的行为非常难以预测。而用TPU,我们能轻易预测运行一个神经网络、得出预测,需要多长时间,这样,我们能让芯片以吞吐量接近峰值的状态运行,同时严格控制延迟。深度学习的广泛应用正推动计算模式的转变,谷歌预计未来几年中,TPU有可能成为快速、智能和价格实惠的重要芯片。 作者名片 编辑:明天 排版:晓岚 题图来源:deeplearningskysthelimit.blogspot.治疗白癜风的岐黄圣手北京治疗白癜风哪家最好
|