●在国内大机型开始“价格战”的同时,硅谷的API价格战首先在OpenAI和Google之间打响。是什么在控制API“价格战”?盲目“滚”价还有前途吗?
●本周英威达创历史新高,收盘1064.69美元,市值飙升3447亿美元,达到26231亿美元,超过亚马逊和特斯拉之和。英伟达为什么能屡创新高?黄仁勋的管理有什么特别之处?
●本周以太坊现货ETF刚刚获批,虚拟货币市场迎来一波抛售,比特币上演“大跳水”;伊朗发布首份直升机事故调查报告:未发现弹痕或类似情况。更多内容,尽在“国际金融一周”。
[4].35 vs ,硅谷巨头的代币价格战!
不仅“滚”价,还拼推理速度。
从5月份开始,国产大机型开始了“价格战”。从每百万代币仅1元到仅8美分和50美分...国内厂商如字节跳动、阿里、百度、智普爱、科大讯飞等。不停接力,有的厂商甚至直接打出“免费”的口号,震惊了整个科技圈。
其实硅谷也在发生类似的情况。国家商报记者注意到,硅谷的大型号价格也呈下降趋势。
API的价格战最早是在“老对手”OpenAI和Google之间打响的,但是范围比较小。其中OpenAI的GPT-4o调用API的价格是GPT-4-turbo的一半,为5美元/百万令牌,Google Gemini 1.5 Flash的价格降为0.35美元/百万令牌。
到底是什么在推动API“价格战”?除了降价,有媒体指出,加快模型推理速度(即每秒生成的Token数量)也是硅谷大模型市场的主要竞争点。但是“量”的价格和“量”的速度真的能赢得未来吗?
硅谷“拼”的是什么?
5月中旬,豆宝以0.0008元/千代币的价格,直接将国产大机型的市场价格带入“李时代”。随即,各大型号厂商开始在价格上角力。百度甚至直接祭出了“文新大模式两大主力模式完全免费”的大招,直接将“价格战”推向了新的高度。科大讯飞、腾讯等。也“坐不住”,要么降低他们的价格,要么免费提供。
短短几天,国内大型型号企业的混战已经从“低价”走向了“免费”。在硅谷,类似的情况其实也在发生。
国家商报记者注意到,事实上,降低API价格,提振AI推理速度,已经逐渐成为硅谷各大模型提供商的竞争焦点。
API价格战首先在“老对手”OpenAI和Google之间展开。当地时间5月13日,OpenAI发布了一款全新型号的GPT-4o,支持免费试用,据说未来还会提供给用户免费试用。此外,调用GPT-4o API的价格比GPT-4-turbo降低一半,为5美元/百万令牌。
在第二天的谷歌全球开发者大会上,谷歌宣布最著名的双子座模型系列之一Gemini 1.5 Flash的API价格为0.35美元/百万令牌,远低于GPT-4o的价格。
比GPT-4o性价比更高的是Anthropic和Mistral AI模型的API价格,这两个模型是硅谷热门的AI创业公司。
除了“拼”模型调用价格,有媒体指出,硅谷AI芯片公司正试图通过加快模型推理速度,即每秒生成的Token数量来吸引客户。比如美国芯片厂商Groq,就把提高每秒生成的令牌数作为主要的市场竞争点。
据国外科技媒体Medium报道,Groq最新的AI芯片在Meta的开源模型LLaMA 3上,每秒生成了惊人的800个token,据说这“标志着AI推理的效率和能力发生了巨大的变化”。截至目前,英伟达在AI芯片市场占据主导地位。根据这份报告的分析,Groq的最新成果可能会对英伟达的主导地位构成严峻挑战。
根据Groq的数据,很多开源的机型据说在Groq芯片上运行速度更快。比如Mixtral8×7B版本输出500 Token每秒钟;Llama 2 70B版本每秒输出300个令牌。
国家商报记者发现,硅谷流行的大型号用英伟达芯片处理的推理速度比这个低很多。例如,GPT-4 Turbo每秒生成约48个令牌,GPT-4每秒生成约10个令牌;谷歌的Gemini 1.5 Pro大概是每秒54.2 token。
API“价格战”背后:
车型性能差距在缩小。
为什么硅谷也面临大型号的API“价格战”问题?这主要和车型性能有关。
上个月,纽约大学知名教授加里·马库斯(Gary Marcus)发表了一篇名为《证据显示LLM正在达到收益递减点》的文章,反驳了沃顿商学院教授伊森·莫利克(Ethan Mollick)的一个观点,他声称,目前对大规模语言模型改进速度的最佳估计显示,每5-14个月能力就会翻倍。
Gary Marcus认为,根据一些指标,在2020年到2023年之间,大规模模型的产能确实按照上述规律翻了一番,但在过去的13个月里,这种情况并没有发生。“相反,我已经看到许多迹象表明,我们已经进入了一个回报递减的时期。”他这样写道。
基于MMLU(大型型号通用基准指数)可以看出,GPT-2、GPT3、GPT-4的提升突飞猛进,而GPT-4对今年4月发布的GPT-4 Turbo的提升并不明显。
其次,自GPT-4发布以来,硅谷各大机型的能力正在趋同。LiquidAI的机器学习科学家Maxime Labonne在X平台上表示,性能最好的闭源模型(GPT-4级别)和开源模型之间的性能差距越来越小。
与此同时,随着企业对定制大型号的需求越来越大,硅谷的科技公司正在推出一系列小型号。例如,微软在4月份推出了一款名为Phi-3 Mini的轻量级机型。信息分析称,像Phi这样的小模型泛滥,可能会削弱OpenAI的主导地位。
根据资料显示,微软产品团队已经将内置的GPT-4替换为开源型号,以执行Bing等产品中更多的基本任务。一些最初为OpenAI大模型支付高价的公司最近转向了更便宜的竞争对手,包括开源模型。
随着GPT-4之后型号能力的趋同,以及更多开源型号和小型号的出现,在竞争加剧的情况下,降低高价大型号的价格似乎是必然的。
“量”的价格和“量”的速度都不是终点。
但是,如果只是“滚”价,会有未来吗?
众所周知,计算能力的成本是开发大型模型不可绕过的难点之一。根据斯坦福大学海研究所今年发布的AI报告,训练巨型模型的成本呈指数级增长。Google Gemini Ultra的训练费用预计为1.91亿美元,GPT-4的训练费用预计为7800万美元。
据报道,Anthropic的CEO此前曾表示,目前正在训练的模型的成本接近10亿美元,到2025年和2026年将飙升至50亿美元或100亿美元。
科技巨头在硅谷大模型领域站稳了脚跟,前沿基础模型市场呈现出强劲的市场集中趋势。分析认为,如果价格战持续下去,公司利润将受到挤压,财力雄厚的科技巨头仍有基础,但初创企业可能面临风险。
对于大型模型公司来说,提高模型性能是赢得竞争的终极手段。正如加里·马库斯所说,如果收益递减的趋势持续下去,低级错误得不到纠正,大模型可能永远也到不了黄金时间。
另一方面,对于芯片厂商来说,每秒钟“体积”产生的令牌数量仍然只是一个噱头,缩短产生第一个令牌的时间将成为下一个新的竞争点。
虽然Medium analysis认为每秒生成的令牌数的增加相当于推理能力的增加,但硅谷的AI公司SambaNova在5月初发表的博文中表示,在涉及一些复杂繁重的长文本任务时,每秒生成的令牌数并不是最重要的指标,也不能完全反映大型模型的推理性能。相对来说,第一个令牌生成的时间更重要。
这篇文章直言不讳地指出,追求高数量的每秒Token可能是一种“炒作”。虽然它可以实现令人印象深刻的解码速度,但它有一些主要缺点,如芯片利用率低,第一个令牌生成缓慢,以及难以处理长文本输入。
市值超过2.6万亿美元。
英伟达“飓风”的背后是黄仁勋“疯狂”的管理:没有1V1会议,没有报告,没有层级。
美国东部时间5月24日周四,英伟达发布了2025财年第一财季(截至2024年4月28日)财报,公司业绩和前景大幅超出预期。受该消息提振,股价创下历史新高,周五收于1064.69美元,市值26231亿美元,超过亚马逊和特斯拉的总和,一周内市值飙升3774亿美元。
报告期内,英伟达营收同比增长262%至260亿美元,远超245亿美元的市场预期,创历史新高;净利润同比增长620%,至148.8亿美元;调整后每股收益为6.12美元,同比增长461%。同时,该公司预计第二季度营收将达到280亿美元,市场预期为268亿美元。
在股价的推动下,英伟达CEO黄仁勋的身家升至936亿美元,在福布斯全球富豪榜中排名第17位。
值得一提的是,这是英伟达连续第三个季度营收同比增长超过200%。黄仁勋在随后的财报电话会议上表示:“下一次工业革命已经开始...除了云服务提供商,生成式人工智能还扩展到了消费互联网公司、企业、主权人工智能、汽车和医疗保健领域的客户,创造了几个价值数十亿美元的垂直市场。我们正处于下一波增长的起点。”
英伟达为什么打破分析师预期,营收创新高?60多岁的黄仁勋在管理方面有什么优势。
在英伟达内部,黄仁勋直接管理着60名下属。《纽约时报》资深记者安德鲁·索尔金(Andrew Sorkin)曾在2023年的DealBook峰会上质疑黄仁勋。这种安排的意义是什么?索尔金说,大多数人认为一个会议室里有6-10个智库成员,特斯拉CEO马斯克的直接下属有28人,而苹果CEO库克的员工只有17人。
在黄仁勋看来,扁平化的组织结构可以给员工更多的自主权,他认为高管接受的管理越少越好。这种管理模式的特点是没有计划,没有报告,甚至没有明确的层级。
据美国商业杂志(American business magazine Inc .)报道,许多CEO认为“CEO的信息应该是有价值的、机密的,只能与另外两三个人分享,而这些信息是如此的无价和机密,只能与少数人分享”。黄仁勋表示非常不同意。他说,“我不相信这样的文化,这样的环境,也就是你掌握的信息。
相反,他认为管理的作用应该是授权员工尽力而为。“你应该创造条件,让他们能够从事终身工作。这是我的使命。”他是这么说的。
虽然他现在直接管理60个高级管理团队,但他仍然避免一对一的会议,而是用小组讨论来代替。这样做的好处是确保所有人都在同一条线上。
而且在英伟达开会不受职位或级别限制。从副总裁到初级员工,每个人都可以访问公司的所有信息,并有权参加任何会议。“如果我们制定了战略方向,为什么只限于几个人?告诉所有员工,我们可以集思广益。我们只是一有想法就发给大家,然后等大家反馈给我们,我们会根据这些反馈来改进。”他说。
在他看来,与公司全体员工分享战略方向,就是利用整个公司的智慧和专业知识,制定更完善、更有思想的战略。
另外,黄仁勋不喜欢制定计划,也不喜欢让员工写报告。他认为,当他收到这类报道时,它们往往脱离了基本事实。为了了解公司的最新情况,黄仁勋鼓励所有员工以“目前他们心目中最重要的五件事”为主题给他写电子邮件。每天早上,黄仁勋都会阅读大约100封这样的邮件。
黄仁勋领导下的英伟达的组织架构有三个核心目标,即吸引业内最优秀的人才,组建最有能力、最高效的团队进行运营,并在这个过程中,确保信息在整个公司内快速有效的流动。
这种管理虽然独特,甚至疯狂,但保留了只有初创企业才有的灵活性,避免了大企业常见的官僚主义和僵化。正是这种管理模式,将英伟达的市值推高至2.6万亿美元,成为全球第三大公司,仅次于苹果和微软。
SEC为以太坊现货ETF上市扫清“关键障碍”。
比特币上演“大跳水”
当地时间5月23日周四,美国证券交易委员会(SEC)批准了一项规则变更,这将为批准全球最大的加密货币之一以太坊(Ethereum)的现货ETF铺平道路。
然而,当以太坊的现货ETF获批后,虚拟货币市场迎来了一波抛售。北京时间5月24日下午,比特币在盘中突然上演“大跳水”,以太坊、Coin-An币、dogecoin等币种也纷纷下跌。北京时间5月24日15: 00起,比特币接连跌破7万美元、6.9万美元、6.8万美元三大重要关口。据《中国证券报》报道,这意味着在24日凌晨以太坊现货ETF获批后买入比特币的投资者损失惨重,买入一个比特币的损失高达21731元人民币。
业内人士称,比特币24日暴跌,主要是因为以太坊现货ETF获批的好消息传出后,大部分投资者的乐观情绪消退,倾向于获利了结。
伊朗发布首份直升机事故调查报告:未发现弹痕或类似情况。
伊朗国家电视台5月20日展示的坠毁直升机残骸图片。
图片来源:新华社记者沙达提摄
当地时间5月23日,伊朗武装部队总参谋部发布了首份已故总统莱希及其随行人员直升机事故调查报告。
据报道,一支从德黑兰派遣的专业技术小组于当地时间20日上午9点抵达直升机坠毁现场,收集信息。
报告显示,直升机按计划航线飞行,没有离开指定航线。在直升机出事前大约一分半钟,事故直升机的飞行员与飞行组的另外两架直升机进行了沟通。在坠毁直升机的其余部分没有发现弹痕或类似情况。
每秒执行超过40万亿次运算!
微软推出了一款全新的内置GPT-4o的AI PC,称之为“阵列”苹果。
5月21日,微软推出了“比以往更快更智能”的Windows 11 AI PC,内置OpenAI的GPT-4o模型,其硬件AI计算能力据称每秒可执行超过40万亿次运算。
微软副总裁兼消费品首席营销官优素福·迈赫迪(Yusuf Mehdi)将Windows 11 AI PC与苹果高端Mac电脑进行了对比,称其“比采用M3处理器的MacBook Air快58%,并且所有(PC)都配备了可以持续一整天的电池。”
面对微软的“挑衅”,苹果已经承诺在6月的全球开发者大会上公布新的AI产品。Wedbush董事总经理、资深股票分析师丹尼尔·艾夫斯(Daniel Ives)在给《每日经济新闻》的电子邮件中表示,苹果的重点是在iOS 18中加入ChatGPT支持的AI功能,最终将嵌入到今年9月发布的iPhone 16中。
游戏站宣布发行完成。
盘后上涨22%。
当地时间5月24日周五美股收盘后,美国“疯狂散户”代表游戏站宣布,公司上周披露的新股发行计划已经完成,扣除佣金和发行费用前的毛收入近9.334亿美元。股价盘后上涨22%,随后涨幅收窄。
此前,由于“咆哮的小猫”账号被追回引发的猜测,游戏站的股价在5月中旬的短短两天内从17美元涨到最高64美元。面对股价变化,公司随即宣布以“按市价发行”的方式发行最多4500万股。
礼来公司150年历史上最大的投资
. 53亿美元加上“减肥药”
当地时间5月24日周五,礼来宣布将斥资53亿美元扩建其在印第安纳州的工厂,以提高减肥和糖尿病治疗药物的关键活性成分替泽帕肽的产量,这是该公司近150年历史上最大的一笔投资。
市场分析师预测,到2030年,减肥药的市场规模可能高达800亿美元。在这个快速增长的行业中,诺和诺德和礼来正在积极争夺市场份额,并试图成为行业领导者。尽管两家公司都投入巨资扩大生产规模,但市场需求的增长速度仍然超过了它们的生产能力,两家公司都面临着供应短缺的问题。
(文章来源:国家商报)