这个被微软高看的中国 AI 研究院,是何方神圣?
在大多数人都未曾注意到的时候,中国的人工智能技术,正悄悄走到了世界前列。
上周,微软总裁在接受采访时,cue 到了一家中国机构:
我们认为有三家公司处于绝对的前沿,一是与微软合作的 Open AI,二是谷歌,三是北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)。
谷歌自然不难理解,但说到智源研究院,大部分圈外人可能都要懵一会。
这是哪家机构,怎么之前好像没听说过?
事实上,这家机构确实很年轻——2018 年创建,诞生至今也不过五年。
但它做的事情可不小。
2021 年,智源推出了中国首个 + 世界最大超大规模预训练模型【悟道 2.0】,参数量达到了惊人的 1.75 万亿,这是 GPT-3.5 的十倍,也超越了谷歌的超大模型 Switch Transformers(1.6 万亿)。
在国际公认的 9 项的机器学习任务 “跑分” 项目上,【悟道 2.0】都取得了优异成绩,超过了 GPT-3、Google ALIGN 等领域内同类技术。
此外,悟道 2.0 本身的训练过程,也获得了中国超级计算机项目的帮助。事实上,它也是中国团队首次在 100% 国产的超级计算机上训练出来的深度神经网络模型。
而国外媒体也对其表示了密切关注。
除了大模型,智源研究院还推出了 “天演” 生命智能模型、“九鼎” 智算平台、“FlagOpen 飞智大模型”,推动我国人工智能行业从基础设施到跨学科应用的层层进步。
2022 年 5 月,智源天演团队发布天宝 1.0,即生物精度最高的仿真秀丽线虫,能够高精度模拟秀丽线虫全部 302 个神经元及连接关系,迈出天演人工智能生命模拟工程的第一步。
同日,智源推出的大型云计算服务平台“九鼎智算平台”,围绕通用大模型、AI for Science 等方向,为大模型训练提供算力、数据、算法三方面的创新支持。
今年 3 月推出的 “飞智” 大模型技术开源体系,则是智源与多家产学研单位共同构建的大模型开源开放软件体系,包含算法、模型、工具、评测等多个部分,能够显著降低大模型开发的难度。
尽管成立时间短,但智源已在业内声名赫赫:一年一度的智源大会,已成为业内的每年的重要活动之一。
这些都暗示着,在大多数人都未曾注意到的时候,中国的人工智能技术,正悄悄走到了世界前列。
起源
智源研究院的起源,是一场 “群英荟萃”(不是萝卜开会)。
2018 年年初,北京市出台《北京市支持建设世界一流新型研发机构实施办法》,进行科技体制的飞跃式改革。
同年,北京为建设怀柔科学城,聘请了清华大学药学院教授鲁白、原国家自然科学基金委员会主任杨卫院士、美国国家科学院院士杨培东、原微软亚太研发集团首席技术官张宏江博士等四位专家担任战略专家。
在那年的一场研讨会上,专家们围绕 “如何推动北京人工智能创新工作发展” 提出了六项建议:
- 建设 “北京智源” 等人工智能软硬件计算平台
- 建立 “产学研用” 联合创新的人工智能基础研究模式
- 积极推动政府数据和企业数据开放共享
- 开放人工智能应用场景和加大基础保障
- 加大人才培养、引进和完善保障措施
- 加大国际交流力度
于是,2018 年 12 月,在科技部和北京市委市政府的指导和支持下,北京智源人工智能研究院正式成立。
资料显示,智源人工智能研究院依托了北京大学、清华大学、中国科学院、百度、小米、字节跳动、美团点评、旷视科技等北京人工智能领域优势单位共建,实行理事会领导下的院长负责制,张宏江担任理事长,北京大学信息科学技术学院教授黄铁军担任智源研究院院长。
智源研究院的员工汇集了来企业、学术等不同背景的专家,集合了一支包括清华、人大、北大等知名学府不同专业方向的团队,也有各合作企业的员工进驻。
对于人才,智源通常给予四类定位:首席科学家、研究项目经理、研究员,和青年科学家。在每一个研究不同技术方向的子团队当中,都有不同资深程度、专业和技能方向、供职背景的成员,员工构成非常多元化。
2019 年,智源推出了 “智源学者计划”。截至 2021 年,已遴选智源学者近百人,其中 38 岁以下的青年科学家就有 40 位。
主要涉及的研究方向包括人工智能的数理基础、人工智能的认知神经基础、机器学习、自然语言处理、智能信息检索与挖掘、智能系统架构与芯片等。
可以说,智源研究院汇聚了中国 AI 圈内的顶尖人才,“集中力量办大事”,誓要将北京在 2028 年建设为国际领先的人工智能创新中心。
自由探索 + 目标导向
智源人工智能研究院的定位是 “新型研发机构”,但在这一领域上,如何规范、高效地运作,国内始终未有成熟且成功的样板参考。
通过摸索,智源提出了一套 “智源模式”:
即建立自由探索与目标导向相结合的科研管理机制,以小同行视角遴选支持智源学者自由探索,以 “集中力量办大事” 的科研组织模式推动 “悟道” 大模型等重大科研任务的实施。
所谓 “自由探索”,指智源研究院能够赋予科学家最大的技术路线决定权和经费使用权,给予科学家尽可能大的研究自由度。
而 “目标导向”,就是对于学界共识的方向,智源学者们的研究能够聚焦在一个统一的愿景上,并自然错开研究方向,频繁相互交流反馈,形成来自组织的合力。
在这一体制的滋养下,智源研究院实现的科研成果斐然。
根据 2021 年智源研究院三周年时公布的数据,智源研究院发表或支持发表国际 AI 顶会顶刊论文 1470 余篇,其中,被 AAAI、CVPR、ACL、ICLR、NIPS、SIGIR、TPAMI 等国际顶级会议期刊收录论文约 1060 篇,占比逾七成,形成多个国际首创、首发重大成果。
科学研究的探索之路往往曲折而漫长,作为学者的后盾,研究机构需要给予自由度,以鼓励创新和促进进步,但同时也需要进行一定的引导,避免 “迷失方向”。
正如智源研究院理事长张宏江在为图灵奖获得者 Yann LeCun 的自传《科学之路》作序时所写:
历史上多数突破性研究成果的出现都是偶然事件,而研究机构所有努力都是为了提升这类偶然事件发生的概率。
智源要做的就是希望通过构筑协作社区,打造用于未来研究的计算和数据平台,更重要地是,集结最优秀的同行,专注未来可能产生原始创新与长期影响的领域(包括过往投入不足、重视不够的领域)等一系列机制和努力,让创新系统更高效地运行,通过我们的努力能让中国出现突破性成果的概率增加。