2024-04-07 23:16:03
来 源
中存储
人工智能
谷歌为开发人员提供了免费访问其LLM的新旧API的机会。免费访问是为了吸引开发者采用其人工智能产品。

中存储消息,上周,谷歌做出了一些低调的改变,包括任命了一位新的人工智能开发领导者,这表明该公司正在将其人工智能业务推向一个新的方向。

谷歌还对其Gemini API的使用进行了定价,并切断了对其API的大部分免费访问。信息很明确:寻找人工智能免费赠品的开发者的聚会已经结束,谷歌希望从Gemini等人工智能工具中赚钱。

谷歌为开发人员提供了免费访问其LLM的新旧API的机会。免费访问是为了吸引开发者采用其人工智能产品。

谷歌对人工智能运营进行重大变革,希望利用Gemini赚钱

Gemini主要通过公司的聊天机器人界面为客户所知。然而,许多开发人员正在使用Gemini创建自定义聊天机器人。API从Gemini中收集问题并检索答案,然后在自定义界面中传递给用户。

具体而言,谷歌正在关闭通过其人工智能工作室访问其PaLM(旧的Gemini LLM之前)API。它还通过限制免费使用的新付费计划,将API不受限制地访问更先进的Gemini Pro。基本上,所有API道路都在Gemini 1.0 Pro结束,谷歌正在围绕Gemini 1.0Pro整合其开发活动。

其他举措暗示谷歌的人工智能计划将发生重大变化。

本周,谷歌聘请Logan Kilpatrick领导人工智能工作室和Gemini API运营。Kilpatrick来自OpenAI,他于2022年12月加入该公司,领导开发者宣传。根据他在LinkedIn上的个人资料,在OpenAI,他“帮助将开发平台扩展到数百万开发者”。

Kilpatrick现在将为谷歌及其Gemini人工智能平台做同样的事情。

谷歌在聊天机器人方面落后于OpenAI,在吸引开发者使用其人工智能平台方面也在迎头赶上。

许多公司都选择了OpenAI API,因为它是第一个上市的。OpenAI现在向客户收取其API和访问其大型语言模型的费用。

例如,OpenAI的API可作为搭载英特尔酷睿Ultra芯片的Windows PC的一部分使用,API将用户连接到OpenAI以获得问题答案。安全公司正在将ChatGPT集成到他们的软件产品中。像Glean这样的公司正在将OpenAI集成到他们的企业搜索产品中。

谷歌正在通过其云服务和AI Studio服务吸引开发者。目前,开发者可以在谷歌的网站上获得免费的API密钥,该网站通过聊天机器人界面访问谷歌的LLM。到目前为止,开发者和用户都可以免费访问谷歌的LLM,但这种情况也正在结束。

本周,谷歌遭受了双重打击,有效地关闭了通过人工智能工作室对其API的免费访问。

在本周早些时候发给开发者的一封电子邮件中,谷歌表示将于8月15日关闭开发者通过AI Studio访问其PaLM API(Gemini之前的模型)的权限。开发人员可以免费访问PaLM API,该API用于构建自定义聊天机器人。

谷歌在3月29日发给开发者的一封电子邮件中表示:“在2024年8月15日之前,你将能够使用谷歌人工智能PaLM API提示、调整和运行推理。”。

PaLM API通知(来源谷歌)

谷歌表示:“我们鼓励使用稳定的Gemini 1.0 Pro测试提示、调整、推理和其他功能,以避免中断。您可以使用与PaLM API相同的API密钥,通过谷歌人工智能SDK访问Gemini模型。”。

谷歌本周还宣布,将限制API访问其谷歌Gemini模型,以将免费用户转变为付费客户。免费访问Gemini允许许多公司免费提供基于LLM的聊天机器人,但谷歌的变化可能意味着许多聊天机器人将关闭。

谷歌周一在发给开发者的一封电子邮件中表示:“Gemini API将推出按需付费定价。”。

谷歌在电子邮件中表示:“如果你在一个已禁用计费的项目中使用Gemini API,你仍然可以免费使用Geminis API,而不享受我们付费计划中的优惠。”。

Gemini成本通知(来源谷歌)

免费计划包括每分钟两个请求,每分钟32000个令牌,每天最多50个请求。然而,一个缺点是谷歌将使用聊天机器人响应来改进其产品,据称其中包括LLM。

付费计划包括每分钟5次请求、每分钟1000万代币和每天2000次请求。输入100万个代币的预览价格为7美元,输出100万个令牌的预览价格则为21美元。谷歌不会使用付费模式中的提示/响应来改进其产品。

有一个例外:PaLM和Gemini将继续向已经在谷歌云中为Vertex AI付费的客户开放。预算较低的常规开发人员通常使用AI Studio,因为他们负担不起Vertex。

谷歌的API使用公司数据中心托管的硬件向客户提供答案。Gemini使用TPU跑步,TPU可以进行训练和推理。

谷歌承诺投入数十亿美元建造新的数据中心,最近一次是在英国投入10亿美元建造数据中心。

在数据中心花费数千亿美元来运行人工智能是一场赌博,因为这些公司没有经过验证的人工智能收入模型。随着LLM使用的增长,通过API等产品获得的少量收入流可能会增加硬件和数据中心的建设成本。

其他人工智能公司正在花费数十亿美元建立新的数据中心,并希望从人工智能中获得收入来支付账单。

彭博社最近报道称,亚马逊在15年内花费1500亿美元建立新的数据中心。

据The Information报道,OpenAI和微软计划斥资1000亿美元开发一款名为Stargate的超级计算机。

对于不愿付费的客户,谷歌发布了Gemma大型语言模型,客户可以围绕这些模型构建自己的人工智能应用程序。其他开源模型,如Mixtral,也越来越受欢迎。Meta首席执行官马克·扎克伯格(Mark Zuckerberg)大肆宣传即将推出的名为Llama 3的LLM,作为降低采用人工智能成本的基金会。

随着人工智能成本的增长,客户倾向于开源LLM。这些型号可以下载并在经过调整以运行应用程序的自定义硬件上运行,但大多数都买不起硬件,在大多数情况下,硬件是英伟达的GPU。人工智能硬件也不容易现成。

声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。