服务热线:400-123-4567

电子行业动态点评:从谷歌I/开云(kaiyun)(中国)官方网站O大会看AI大模型产业前沿

时间:2023-05-12 19:52:51 文章作者:小编 点击:

  谷歌I/O 大会看点:AI 大模型&轻量化、AI 赋能应用、算力基础设施当地时间5 月10 日,谷歌举行I/O 大会,宣布了AI 大模型、AI 赋能应用、算力基础设施等一系列新进展:1)发布PaLM 2 语言模型,具有更好的多语言和推理能力,并宣布旗下DeepMind 正在研发多模态基础模型Gemini;2)宣布一系列基于PaLM 2 的应用功能更新,包括AIGC 办公工具包DuetAI,支持多模态理解和生成、并与其他应用协同的聊天机器人Bard、以及企业级AI 平台Vertex AI;3)推出新一代超算A3 Virtual Machines。本次I/O 大会上模型轻量化值得关注,PaLM 2 系列模型中体积最小的Gecko 可在手机上运行。我们认为模型压缩技术是实现 AI 大模型在边/端部署的核心技术,将加速 AI 技术与智能终端融合,国内 SoC 设计公司有望深度受益。

  大模型:PaLM 2 多语言能力、推理能力、代码能力提升明显谷歌发布了PaLM 2 语言大模型,基于Pathways 架构,使用TPU v4 和JAX框架训练。PaLM 2 的提升在于:1)多语言能力。训练数据超过100 种语言,能理解、翻译和生成更准确和多样化的文本(含双关语、习语等);2)逻辑能力。在一系列推理、数学任务测试中,PaLM 2 显著优于PaLM,并与GPT-4 相当;3)代码能力。PaLM 2 在 20 种编程语言上进行训练,包括Python 和JavaScript 等流行语言以及Prolog、Verilog 和Fortran 等其他语言。此外,谷歌在PaLM 2 的基础上还训练了用于编程和调试的专业模型Codey,安全知识模型Sec-PaLM 以及医学知识模型Med-PaLM 2。

  模型轻量化:Gecko 可在手机上运行, AI 技术与智能终端加速融合PaLM2 主要包含4 种规格(Gecko、Otter、Bison 和Unicorn),其中体积最小的Gecko 可以在手机上运行,每秒可处理20 个Token,大约相当于16或17 个单词。而在谷歌发布上述支持移动端部署的AI 大模型之前,高通、华为也相继实现了AI 模型在终端的轻量化部署,分别搭载在高通第二代骁龙8 移动平台手机以及华为新一代P60 系列手机上。我们认为模型压缩技术是实现AI 大模型在边/端部署的核心技术,将加速AI 技术与智能终端融合,国内SoC 设计公司有望深度受益。

  大模型应用:PaLM 2 赋能Workspace、Bard、Vertex AI 等功能升级PaLM 2 已应用在超过25 种功能和产品中,包括办公套件Workspace、聊天机器人Bard 等等。其中,Workspace 推出AIGC 工具包Duet AI。Duet AI包括Google Docs 和Gmail 中的智能写作工具、Google Slides 中的文本生成图像、演讲备注以及Google Meet 的会议摘要生成等功能。I/O 大会展示了Bard 支持的文字、代码、图像生成与理解能力,并重点强调了Bard 与谷歌应用,以及外部其他应用的协同能力。ToB 应用方面,Vertex AI 集合了谷歌研发的基础模型,用户可按需调用模型并对模型的参数权重进行微调;此外,Vertex AI 还能够根据内部数据建立企业版本的搜索引擎。

  算力基础设施方面,谷歌云推出了新一代超算——A3 Virtual Machines,采用第4 代英特尔至强可扩展处理器、2TB DDR5-4800 内存以及8 张英伟达H100,专门用于训练和服务AI 大模型。A3 是首个使用谷歌定制设计的200Gbps IPU 的GPU 实例,GPU 间的数据传输绕过CPU 主机,通过与其他虚拟机网络和数据流量分离的接口传输,网络带宽相比A2 增加10 倍,具有低延迟和高带宽稳定性。

  风险提示:AI 及技术落地不及预期;本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。开云集团(中国)官方网站


标签:行业动态

【产品推荐】

网站地图