AG真人国际(中国)官方网站

服务热线热线:

02088888888

AG行业新闻

AG真人国际(中国)官方网站专家:算力需求尽头是能源算法优化、三维数据……

发布时间:2024-12-05点击次数:

  【导读】10月19日上午,由文汇讲堂和北大博雅讲坛联合承办,上海市算力网络协会、北京大学出版社、上海图书馆联合主办的展望下一代算力暨《对话时代》新书研讨讲座上海场在上图东馆成功举办,近10万人次观看直播。主讲嘉宾为上海超级计算中心主任李根国,对话嘉宾为上海超级计算中心高性能计算部部长王涛、商汤科技大装置事业群生态执行总监刘远辉,主持圆桌环节的上海市算力网络协会专家会员沈巍。

  上海市算力网络协会三位专家沈巍、刘远辉、王涛在李根国主讲后进一步展开探讨

  沈巍:上海市算力网络协会成立于2022年9月,是全国首个聚焦算力网络领域的专业协会,目前已有100多家成员单位。我们的愿景是拉通算力网络的供需两端,使得未来的算力能像电力、自来水一样,让每个用户都能非常方便的使用,将算力的绿色化、高效化、智能化赋能每一个行业。今天和理事长单位上海超算中心等一起和大家探讨下一代AI算力,也是协会的社会责任。

  先请两位专家分享和揭秘,日常工作和生活中使用的AI场景,背后是哪些基础设施在支撑其运行。

  刘远辉:关于算力需求的问题,本质上就是AI大模型在生活、科研等场景下如何被应用的问题。

  我的工作从IBM到华为,再到商汤科技公司,经历了计算机发展的不同时代。大型机时代经过30多年被小型机淘汰,小型机时代经过十几年进入云的时代,后又进入大模型出现称为的AI1.0时代,2022年openAI发布chatGP后,TITD(数据中心)发布《2022中国大模型发展白皮书》标志着进入大模型2.0时代。

  我从事了很多关于金融数字化的研究。当下,大模型已被广泛应用于信用评分、风险管理、高频交易和客户服务等多个方面。比如信用评分,大模型可以分析借款人的历史交易、社交媒体活动,评估信用风险,提高贷款审批的速度和准确性。比如风险管理,借助AI大模型技术分析时事新闻报道、财报和社交媒体,识别可能影响市场或特定资产的突发事件,使金融机构能够快速调整策略,以及应对潜在风险,但这个功能需要巨大的算力,需要GPU(图形处理器)、HOUR(HOUR函数)、TPO(市场轮廓图)计算小时时差。

  大语言模型在准确性和精准计算上还有很大空间,但金融领域的应用无论是信贷还是材料分析,都需要严谨。而且金融需要严监管,这是对AI的考验。但是初期也积极拥抱大模型,在边缘业务、推荐业务上有了一定的成果,近期之内会有大量的应用进入金融领域。

  由此看出,大模型的迭代时间在不断缩短,我们要有耐心,相信大模型在未来几年内就会取得更大的成果。

  同时,我观察到AI在新兴领域的应用。例如微短剧行业可以是大模型原生的一个方向,AI现在已经应用于许多微短剧中。据市场统计,2023年中国电影票房约560亿,同期微短剧的收入将近400亿,预计2027年微短剧的市场可能会达到1000亿,一两年之内就超过了电影票房市场。

  微短剧的商业模式与AI密切相关,其制作周期大约只需几周,甚至几天。微短剧使用的文本可以由AI代写。像当下比较热门的文生视频大模型,未来也可用来制作微短剧。

  王涛:我从事超算行业已有20多年。上海超算中心不是一个科研机构,而是一个应用和推广超级计算机的平台,它成立于2000年,是国内第一家面向公众开放的超算平台,主要工作是让大家用好超级计算机,改善公众的生活,促进科学发现。工作人员大多是应用学科方向。

  超级计算中心是提供算力的一个主要机构,我们目前有两套具有不同应用特点的系统,一套是用来做传统的模拟仿真类的计算,是传统意义上的通用型超级计算机,名字叫魔方三号,大约有将近36000个CPU核。另一套是用华为系统做的人工智能平台,大约提供了100P的16位浮点算力(FP16)的计算能力。

  人工智能在基础科学方面更好地体现了辅助工具的作用。举个例子,我们正在设计一款化学反应的催化剂,按照传统的研发流程,第一步是思考怎样的催化剂能与反应物结合,让它变得能量更低。做设计时可以利用计算机计算分子结构,推算出能否合成这样的分子。设计结果出来后再与反应物进行计算,测试它能否结合成一个稳定的结构并降低能量。从最初设计分子之时起,我们就要穷举各种可能性,每种都要计算一遍,可能要算1000次、10000次,计算机需要几个月时间。但这至少比做实验快多了,因为通过实验合成每一个分子需要较长时间,若要合成1000次、10000次,可能几年都完不成。

  人工智能的出现告诉我们,最初猜想的那几千个分子无须全部计算,只需要计算其中的10%。当然人工智能还有许多不确定性,它提供的是一个概率性的答案。它会把最初列举穷尽的几千种情况减少至几十个,此时再进行计算只需几天。计算完毕后再进行实验验证。

  无论是药物设计还是交通工具设计,整个人类的研发逻辑都是如此,先穷举无限的可能性,再逐步缩小。在这方面,人工智能工具可以极大加快研发过程。

  沈巍:进入算力中心看到的是一排排的机柜,机柜里密集地摆放着服务器,可以把服务器机架想象成数字世界的书架。上海图书馆的书籍约有5700万册,全部摆放到书架上大约需要10万个书架。如果将这些书全部数字化变成数据后,大约只需100个存储机柜就能存储。

  截止2023年底,上海数据中心的服务器机架约有20万个。截止2024年6月,国家工信部发布的数据显示,全国已有830万个数据中心的标准机架,这是中国现有算力设施的总体量,是一个非常庞大的基础设施。互联网的应用、人工智能的应用,以及未来的应用都基于这些基础设施的更新迭代和升级。

  数据中心的机架更像一个能源怪兽,以与家中双门电冰箱尺寸一样大小的机柜来比较。电冰箱一天约耗1-2度电;10年前数据中心的一个机柜一天约耗电100-200度;今天算力中心为 AI服务的算力机柜,一天耗电1500度;要去做一个大模型的运算,最起码要500到上千个机柜同时去运行。 GDP-4是用了三个月的时间训练。这样大家能较直观地理解能源怪兽的需求。

  AI正在被广泛应用于各行各业。如果明年再开一场论坛,可能就是三个AI坐在现场给大家分享它们的超能力了。事实上,网络上已出现许多数字人带货,它不仅可以面向国内受众,也能够接待国外受众。AI生成的数字人不仅可以运用英语、还可以熟练运用阿拉伯语、马拉西亚语等任何小众语言。

  刘远辉:说到算力挑战,绕不开AI三大核心要素的算法、数据和算力一起协同考虑。

  算法。大模型现在已进入新一代的算法,之前谈到的AI的准确性、对算力的需求等,其实底层就是Transformer模型,是一种基于自注意力机制(Self=Attention,Mechanism)的深度学习架构。

  下一代架构是什么?以认识香蕉为例,父母告诉我们这是香蕉,我们就知道了。从技术层面来说,样本数是十几张甚至几张,而大模型就需要几千张甚至几万张进行训练,有时还会出现错误,这是算法的问题。大脑自带的生物电需要多少算力才能达到一个计算机的水平?核心是什么?可能就是大脑本身的算法问题。

  数据。超算和智算最大的区别是什么?就是人工智能强烈依赖一个全要素数据。什么是全要素数据?实际上AI算法过程中也不知道哪些数据起了作用,得把所有的要素列出来才能达成效果,这也是现在在攻坚的AI黑盒难题。

  2009年6月,被称为AI教母的李飞飞发布世界上最大的图像标记数据集ImageNet。现在她做的是空间智能,把数据做成了一个三维的数据,并且落地使用。这个方向就是人工智能机器人。问题是机器人如何理解场景?举例来说,如果使用家用机器人,你的家就是一个场景,里面由各种数据组成。如何让机器人使用洗衣机洗衣、扫地拖地,构建场景的底层逻辑就是数据。这其中的数据量有多大,目前还无法想象。

  算力。大模型对算力的需要有多大?商汤科技的计算中心,用电量从2022年底的不足2000p到现在大约15000p,并且还在增长。每年用电超过1亿度。2023年,中国内地用电量百强城市排名中,遵义排在第100位,用电量大约230多亿度。也就是说,一个计算中心可能占1%,甚至抵得上一个小城市的用电量了。

  最终要落到能源需求。上海有科研机构在从事核电研究,就是小太阳核聚变的沉淀。亚马逊、Google等公司都在投资核电,以后的算力就会朝能源方向发展。二是生物芯片、量子芯片,这是下一代发展方向。例如,人类的大脑在这么少一点电的情况下,如何能计算出这么大的量?这方面极具潜力。

  AG真人国际

  前两年提出的脑机接口,对我们的生活具有一个划时代的意义。关于脑机接口攻坚的两个场景,一是盲人,二是假肢。此外,还有下载技术。其实大家还随身携带一个算力即手机。随着大模型的进步,新一代手机已经能实现很多功能,因此也有人在思考,如何把手机的算力都分布式集中起来。可见,大家都在探索AI的各个方面。

  关于算法。仿真类场景其实也是人工智能的一个方向。深度学习是实现人工智能的一种途径。还有一种是脑科学方案,通过计算机算法的方式来模拟人脑的运作方式。如果我们能用计算机或算法成功模拟人脑逻辑推理能力,那就是算法上的极大改进,这未必是深度学习算法,可能是其他的算法。

  所谓的数据,就如刚才认识香蕉的案列,我们给机器什么样的数据,他就学到了什么样的能力。最近的一个例子,有人问AI,3.11与3.9哪个大,很多大模型都说3.11大。因为软件版本迭代时,3.11的版本就是比3.9版本大。人工智能是程序员写的,程序员第一反应就是3.11的版本显然比3.9版本大,所以人工智能也这样认为。可见,人工智能没有意识到这是一个数学比较问题。这有点类似原生家庭里父母对子女的影响,训练一个人工智能的过程就是培养孩子的过程,我们提供怎样的数据,人工智能就给出怎样的反馈。

  关于算力。受中美关系的影响,我国的算力与国外的算力相比,落后较多,尤其体现在芯片的设计制造。我们要加大自主发展。随着模型越做越大,数据量会越来越多,需要的算力也越大,同时带来功耗的需求,这就变成一个能源安全问题了。

  沈巍:学界大咖普遍承认,算力的尽头是能源。英伟达的CEO黄仁勋(Jensen Huang)谈算力时提到,未来所有算力所需的能源,需要烧掉14个地球。事实上,我们算力的需求以及我们的发展速度基本上是40%左右,可能每一两年就要翻一番。因为我们现在的芯片工艺,实际上算力的需求翻一番,也意味着电力资源也要翻一番,两者的增速基本上等同。

  我们国家的能源增长率基本与GDP增长率一致,假设每年的GDP增长5%至6%,实际上能源的增长率也是5%至6%,那就出现了一个巨大的剪刀差。在2020年9月22日的第75届联合国大会上,我国宣告:中国要在2030年前碳达峰,2060年实现碳中和。这就意味着我们在能源消耗总量上不能再继续爬升。所以,能源是整个信息通信产业共同面对的一个挑战。

  国家也从战略层面提出了东数西算的解决方案。事实上,过去的数据中心、算力中心,包括现在最先进的数据中心和算力中心也都建在北上广深这些区域,而电力、能源全都依靠西电东输,依赖长江三峡的电来维持城市的用电需求。如果今后还有大体量的算力增长,那经济信息和安全性等将受很大挑战。与此同时,内蒙古、贵州、庆阳等东数西算的西部节点,一方面能够自给自足,另一方面还能西电东输。因此,选择西电东输后在本地使用,还是直接把算力设施搬到西部在当地消纳,就要算一笔账了。2021年开始启动的全国算力一体化实施方案推进低时延、大带宽、高可靠的新兴网络技术在 东数西算 工程中应用,打通国家枢纽节点与非国家枢纽节点间的网络主干道,提升算力网络的传输性能和响应速度,其意义在于实现全国算力资源的高效配置和协同发展,为数字经济的蓬勃发展提供坚实支撑。

  算力服务本身也有不同的场景,因为双碳战略,前两年也投资建设了大量的光伏或其他绿色能源基地,但用电负荷又没有与之完全匹配,所以有时发的电被白白舍弃,令人扼腕。国家的算力布局与能源布局会结合得日益紧密。

  比如上海还在建虚拟电厂。当处于夏季用电高峰时,通过一些企业,尤其是重点用人单位削峰填谷,在该时段发一点电,自己尽量使用自己的电来减少对电网的消耗。因为数据中心里恰好有大量的蓄电池和柴油发电机,平时是作为后备电源考虑的。如果我们响应虚拟电厂削峰填谷的需求,用后备电源保障用电,就可以降低对电网的消耗。

  此外,数据中心的发热量特别高,单机柜功耗50千瓦时需要12级台风的风速才能冷却。目前都选择了液冷技术,但又会带来另一个延伸的应用。服务器发的热通过风耗散到大气,相当于浪费掉了。单个服务期看起来不多,但全国830万台机柜,全球成千上万台机柜加起来就是一个很大的量。我们一直在考虑如何把服务器的热收集起来,给需要热的地方循环利用。

  有些哲学家已经开始思考,AI是否可以定义为一个新的意识或一个新的生物,未来它是否会变成这个样子?人类作为一种生物,未来与AI这种新生物该如何共存?

  有关算力需求和未来算力的主讲已被制作成两个短视频广泛传播刘远辉:目前我们对AI的定位是什么?铸造新式生产力。人工智能就是打造新质生产力的工具。计算机在IT时代也是工具,现在急缺的是什么?是融合人才。以开发新药为例,一般需要两个人来做,一个人负责AI,另一人负责制药,两个人说的语言不同,许多事情推动起来非常慢。这就需要一个研发药物且懂AI的人。所以,各行各业应该积极拥抱AI。

  在AI领域,其实许多人都在做工具,下一代是探索如何把工具利用得更好、更进步。从AI空间的维度来说,AI不仅产生了意识,还可能从我们的思想中建造 AI新的方向。

  王涛:应该把人工智能看作一个工具。人工智能工具特别多,未来必然会导致会用者和不会用者的生产效率差。用任务导向来看,效率高的人自然就会得到更多的自由。所以,我们将来就要学会如何使用人工智能工具。上海在这方面比较领先,一些小学生就在信息技术课上探索人工智能工具的使用。人工智能工具的使用一定是未来提高竞争力的重要方法。

  文:刘远辉 王涛 沈巍 图:现场主办方提供 其余朱梅全整理于网络 编辑:李念 责任编辑:李念

上一篇:AG真人国际(中国)官方网站南京发布18个人工智能应用场景欢

返回列表

下一篇:AG真人国际(中国)官方网站朱庆华 宋珊珊|风险视角下生成式