作者:郭颂财经
大模型浪潮的席卷速度超过了历史上任何一次技术革命。
年初,OpenAI发布了,马斯克和周都毫不犹豫的夸赞,风靡全球。就在大家还在惊叹“未来已来”的时候,Anthropic宣布正式发布Claude-3,并在AI逻辑基准测试中超越ChatGPT-4。与此同时,谷歌和马斯克同时跳入开源大战,分别推出了Gemma和Grok。
全球大模特的竞争热潮从小圈子向外蔓延,像涟漪一样波及全球。一个大模特的无限竞争开始了。全球科技巨头正携带着大量雄厚的资金和简历漂亮的技术人才将战场烧得更热。
但冷静来看,全球公认的大模型领导者,大多是年轻的AI公司:OpenAI,估值高达290亿美元,成立于2015年;被称为OpenAI & quot最强竞争对手“Anthropic,大型模型公司,成立于2021年;"欧洲新秀“Mistra成立仅一年。三家闪耀AI明星公司的员工加起来可能不到1000人,只有一个科技巨头一个部门的人数。
为什么这场对大模特皇冠的追逐不在豪门的范围内?
01荣耀为什么属于AI企业?
首先打破一个认知误区:大模式不是单纯依靠资源的军备竞赛。
在ChatGPT [/k0/]诞生后,一个广为流传的说法是,OpenAI成功的关键在于依赖微软Azure cloud上的几万张A100卡,而这需要花费数亿美元。更有甚者,认为大模式的胜率取决于资源的丰富程度。
然而今年3月,美国创业公司Databricks突然公布了其开源大语言模型DBRX,号称全球最强的开源大模型,参数规模达到1320亿,性能甚至比Meta的Llama2、Mistral AI的Mixtral、Musk的xAI公司刚刚开放的Grok-1还要好。
更何况他们只花了两个月,1000万美元。虽然他们的表现完全超过了GPT-3.5,但训练时间和费用只是GPT-3.5的一小部分。
其实资源对于任何领域的竞争都是非常重要的,但在大模特领域并不是万能的或者唯一的因素。与科技巨头相比,AI公司有一个独特的优势,那就是技术探索的灵活性。
谷歌曾经是人工智能深度学习领域当之无愧的王者。2016年击败人类围棋冠军李世石的阿尔法围棋来自谷歌Deepmind,在自然语言模型领域,谷歌遥遥领先。
然而ChatGPT诞生于2022年。其实是技术路线的差异拉开了立场的差距。Google追求的自然语言模型应该是一系列参数相对较小、适用场景相对较窄的垂直模型,而OpenAI认为应该是具有普适性的海量参数和海量数据训练的超大型模型。
OpenAI当时的梦想似乎是不可能的。但即使在与谷歌的竞争中落后很长时间,OpenAI也没有放弃GPT作为唯一的路线。奥特曼的一句话给出了答案——“创业公司做什么都很难,不如抓住大机会。"(创业无论做什么都很辛苦,不妨去追求一个大机会。)
相对于AI公司的灵活性,科技巨头在押注技术路线上很难孤注一掷,这也在一定程度上造成了动作的迟缓。这也是注定的,AI的最新方向极有可能被AI公司探索。
海外AI明星公司鳞次栉比,明星璀璨。那么问题来了,中国的AI明星公司都在哪里?
02 & quot;中国的大模型“五虎”浮出水面――变得明显
一份SuperCLUE评测榜单揭秘中国五虎。
剔除BAT,榜单显示了国内最强的AI公司,分别是百川智能、智普AI、月之暗面、MiniMax、从云科技。
百川智能由搜狗公司前CEO王小川于2023年4月创立。成立短短几个月,百川智能已成为科技独角兽之一,成立至今已连续发布11款基础大模型。
智普AI成立于2019年,今年年初完成新一轮融资。创始人张鹏,毕业于清华大学计算机科学与技术系。几年来,公司先后发布了GLM系列大模型、ChatGLM、CodeGeeX code大模型等。,并已成为中国最早、经验最丰富的企业之一。
MiniMax成立于2021年,背后的舵手严俊杰毕业于中科院自动化所。在担任商汤科技副总裁期间,负责构建深度学习和底层算法的工具链,以及通用智能的技术开发。联合创始人杨斌是严俊杰在中国科学院的校友。
月球的阴暗面也有威胁。2023年,月球黑暗面完成两轮总计近20亿元的融资,估值超过25亿美元。“月球的黑暗面”由三位清华校友于2023年3月成立,由90后校长杨领导。
至此,再加上云技术,中国AI大模型呼之欲出。
从云科技曾经是“AI四小龙”中国第一a股,也是唯一一个全国产背景的国产AI三驾马车。在业内,从云科技与商汤科技、旷视科技、易图科技并称“AI四小龙”,但说到气场和热度,最年轻的云从科技,却是最“顶流”的存在。
& quot;AI国家队球员“、& quot中国科学院孵化企业”;中国人工智能第一梯队企业”。首家承担国家发改委人工智能基础平台和应用平台、科技部开放平台等重大项目建设任务的人工智能企业,并参与制定国家和行业标准”等称号,让从云科技自2015年诞生以来,始终处于行业的聚光灯下。
如今,从云科技正在大模型时代阔步前进。
03时代青睐的尖子生
去年5月,国内人工智能第一梯队从云科技正式发布了AI领域的一款战略产品——智能体“易多模态大模型”。
从云科技学院产品总监孙进在接受媒体采访时表示:从容大模型在内部已经经历了多轮迭代。在1.5版本中,平衡上下文长度、模型性能和推理成本是迭代的重点。简易大模型版本2.0
已经完成,3.0版本侧重于多模态能力——跳过文本,直接处理不同的模态数据。
不仅仅是对话体验。还可以编程、写作、解题等等。云从不回“放轻松"”与ChatGPT相比,在回答同样的真题过程中,悠哉大模型的回答速度更快,但推理能力和语义理解能力已经超越GPT 3.5,略低于GPT4.0
根据SuperClue、C-Eval等第三方机构的综合测评,大型模型综合性能排名全球前五。同时,大比例模型具有多模态能力,在视野和跨模态方面10次刷新世界纪录。
据从云科技介绍,公司已布局数十个行业模型,开发了DataGPT、智能客服、AI鼠标等一批泛AI智能应用,成为从云科技布局AI-agent的重要抓手。
与此同时,从云科技和华为盛腾共同提出了应对智能计算基础设施挑战的解决方案,并开启了“家用计算能力+智能计算”的新布局。目前,双方已联合推出大型模型应用基地——易大型模型训练推送一体机,并携手天津港集团、首现科技、金世元、国网山东、中国电信等合作伙伴,成功帮助港口、医药、制造、电力、银行等行业客户落地生产AI应用场景。
云从科技开始连续踏上两波AI,与其深厚的科研背景密不可分。
周西,从云科技创始人,曾是中国科学院“百人计划”专家,被引荐回国,曾任中科院重庆绿色智能技术研究所信息所副所长。他用了半年时间,在全国范围内组建了20多名专业人员的团队,并入选中科院A级战略先导科技项目中唯一的人脸识别团队。
在未来,这个团队已经成为计算机视觉领域的国家队,其技术成果已经在多个省份使用。在alpha go大战李世石让AI一夜爆红之前,它就悄悄把这项技术带到了普通人的生活中。
直到2015年4月,33岁的周西放弃了令人羡慕的“铁饭碗”,选择内部创业,率先成立从云科技,专攻人脸识别领域。
& quot;我很惊讶,因为很少看到科学家愿意放弃现在的岗位,投身于这个领域的创业。"海通证券人士在接受媒体采访时表示,“海通作为从云的第一个项目,在应用实现上有很多困难。当时周西把整个研发带到上海一个星期,系统上线以来一直没有问题。"
从2015年开始,人脸识别作为计算机视觉领域最容易落地的赛道逐渐成型。7年后,从云交出了自己的答卷:作为唯一一家国内全资AI企业,成功登陆科技创新板,被称为“AI国家队”。
翻看从云科技的招股书可以看到,从云科技的创始团队大部分来自中科院和中科大。公司拥有近600名研究人员,其中R&D人员占50%以上。核心团队10次荣获国内外人工智能领域桂冠。
如今,全球大模特大赛风起云涌,新的科技浪潮席卷各行各业。中国人工智能领域在焦虑和追赶中再次走到了十字路口。
如何书写这一新篇章,既是云科技的新课题,也是中国所有AI企业的迫切使命。