大模型风潮席卷,中国科学技术信息研究所等机构发布的《中国人工智能大模型地图研究报告》显示,截至今年5月,国内已公开披露的大模型数量达到79个。大模型密集涌现,企业面临“选择困难”,集成优质大模型的聚合平台或将催化大模型在各行各业进一步落地。
6月28日,在火山引擎主办、英伟达合作举办的“V-Tech体验创新科技峰会”上,火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service)。
目前,“火山方舟”首批集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等7家AI科技公司及科研院所的大模型,并已启动邀测。“我们会把优选的大模型放上平台,供客户挑选使用。”在火山引擎总裁谭待看来,“方舟”如同一个大模型的“优选店”,基于“方舟”,企业可同步试用多个大模型,选用更适合自身业务需要的模型组合。
打造一个大模型的集成服务平台,“方舟”目前有哪些优势功能?安全互信计算是其首批推出的重点功能之一。火山引擎智能算法负责人吴迪介绍,“方舟”已上线了基于安全沙箱的大模型安全互信计算方案,利用计算隔离、存储隔离、网络隔离、流量审计等方式,实现了模型的机密性、完整性和可用性保证,适用于对训练和推理延时要求较低的客户。
多个大模型涌现的当下,帮助企业精调大模型以更低成本运用,或者根据不同业务场景选择不同的大模型组合能够帮助大模型加速落地百业千行。“一个经过良好精调的中小规格模型,在特定工作上的表现可能不亚于通用的、巨大的基座模型,而推理成本可以降低到原来的十分之一。”吴迪称。正如他所说,资料显示,微软以医学文章数据精调了生物领域的BioGPT-Large模型,仅有15亿参数,其在 PubMedQA 基准测试中的准确率却优于有着上千亿乃至数千亿参数的大型通用语言模型。
“方舟”则可以提供丰富的模型精调和评测支持。吴迪介绍,企业可以用统一的工作流对接多家大模型,对于复杂需求可设置高级参数、验证集、测试集等功能,再通过自动化和人工评估直观对比模型精调效果,在不同业务场景里还可灵活切换不同的模型,实现最具性价比的模型组合。这些自定义指标和评估数据的积累,将成为企业在大模型时代宝贵的数据资产。
据透露,抖音集团内部已有十多个业务团队试用“方舟”,在代码纠错等研发提效场景,文本分类、总结摘要等知识管理场景,以及数据标注、归因分析等方面探索,利用大模型能力促进降本增效。
此外,“方舟”的首批邀测企业,还包括金融、汽车、消费等众多行业的客户。北京银行CIO龚伟华表示,大模型与客户营销、办公协同、数据智能的结合,在金融应用场景有巨大潜力。北京银行将与“火山方舟”合作,在算力优化、模型精调等方面展开研究,共同推动金融风控、营销等模型应用落地。
谈及未来大模型市场展望,谭待判断,企业使用大模型,未来可能会呈现“1+N”的模式:“1”是通过自研或深度合作,形成1个主力模型;由于成本和场景复杂多元等原因,在这个主力模型之外,还会有N个模型同时应用。
“每一次技术的大变革,都会带来体验创新的新机会。”谭待坦言,“方舟”还在起步阶段,工具链和下游应用插件需要持续完善。当被问及字节跳动自研的模型是否会接入“火山方舟”,谭待表示,“火山方舟”是个开放的平台,字节其他团队在未来如果有好的模型,当然也可以加入平台。此外,平台还将接入更多大模型。