今天,在上海举办的2024全球开发者先锋大会上,一家颇为低调的通用大模型创业公司正式揭开神秘面纱。
大会开幕式上,Step Star创始人兼CEO蒋大新博士发布了Step系列通用大模型,包括Step-1000亿参数化语言模型、Step-1000亿参数化多模态模型和Step-2万亿参数化MoE语言模型预览。
▍科技股多头聚集实现AGI。
Step Star成立于2023年4月,聚集了众多人工智能领域的顶尖人才。其创始人兼CEO为前微软全球副总裁、微软亚洲互联网工程院首席科学家蒋大新博士。核心创始团队包括系统负责人朱一博博士和数据负责人焦斌星博士。
蒋大新是世界知名的自然语言处理专家,在机器学习、数据挖掘、自然语言处理和生物信息学等领域拥有丰富的研究和工程经验。朱一博在单个万卡以上集群的系统建设和管理方面有很多实践经验。焦斌星此前是微软必应引擎核心搜索团队的负责人,负责利用数据挖掘和NLP算法优化索引和搜索质量。
据悉,自成立以来,Step Star在算力、数据、算法和系统四大要素上全面布局,并在大规模模型技术的道路上坚定投入Scaling Law。公司创始团队认为,攀登标度律是一项必须坚持的极其艰巨的任务,因此步星团队云集。该公司有信心开始竞争,在通用人工智能领域赶上OpenAI。
▍▍▍▍▍▍▍▍▍▍▍▍▍▍▍▍▍▍▍▍▍▍▍▍▍▍▍▍
尽管Step Star团队成立仅一年,但他们对AGI的技术路线有着自己独特而深入的理解。
首先,我坚信缩放律是方向,参数决定了模型智能水平的上限。因此,在Step-1000亿参数化语言模型训练成功后,Step-2万亿参数化语言模型的训练随即启动。
二是认识到多模态理解和生成的统一是AGI的必由之路。拥有1000亿参数的Step-1V多模态大模型在多模态理解方面领先业界。一方面验证了Step-1语言大模型的能力,另一方面为多模式生成奠定了良好的基础。
测量是测试大型模型能力的最佳方式。在中国权威大型模型评估平台“OpenCompass”的多模态模型评估列表中,由Step Star开发的Step-1V多模态模型排名第一,其性能与GPT-4V相当。Step-1V具有突出的多模态理解能力,能够准确描述和理解图像中的文字、数据和图表等信息,并根据图像信息实现内容创作、逻辑推理和数据分析等多项任务。此外,Step-1V还可以实现视频理解。
千亿参数模型只是Step Star团队在攀登通用人工智能之路上迈出的第一步。Step Star还发布了Step-2万亿参数化语言模型的预览版,提供API接口供部分合作伙伴试用。
Step-2万亿参数化语言模型采用MoE架构,专注于深度智能的探索。据了解,参数数量从千亿级到万亿级增加了一个数量级,这对算力、系统、数据和算法提出了极高的要求,行业内只有少数几家公司能够做到。训练万亿参数模型体现了步星的核心技术能力,也展现了公司探索通用人工智能的决心。
▍自有+合作探索c端应用
目前,模型能力决定了AI应用水平的上限,也将创造新的应用机会。Step Star通过自有产品和合作产品在这方面进行了积极探索。该团队开发并推出了两款面向C端用户的大型模型产品——效率工具“文悦”和AI开放世界平台“泡泡鸭”。已经完全开放使用。
此外,Step Star还与金融、网络文学、知识服务等领域的合作伙伴达成深度合作,共同探索面向C端用户的创新应用。
在金融领域,Step Star与上海报业界面金融协会达成深度合作,双方推动大模型在AIGC金融信息、智能投研、智能投资等领域的应用。在网络文学领域,步星与中文在线达成独家深度战略合作,共同探索大模式在灵感、内容创作等网络文学创作领域的应用。在知识服务领域,步星与中国知网、中文在线达成战略合作,围绕海量知识服务场景,研究推进大模型应用。
“智能一步,人人十倍可能”是步步高的企业口号。目前,大模型技术的研发和应用仍处于快速迭代和探索中。聚焦这一前沿技术,聚集顶尖人才和丰富的战略资源无疑是大模型创业公司的核心竞争力。
在这样的大环境下,Step Star从幕后走到台前,正式亮相并发布了一系列重要车型和产品,释放了公司管理层的技术理念和追求:实现通用人工智能可能并不遥远。
(文章来源:财联社)