半岛全站(中国)官方网站IOS/安卓通用版/手机APP

广州半岛电子元件有限公司欢迎您!

半岛体育全站腾讯云大模型新升级:保持节奏一切为了「落地」

作者:小编    发布时间:2023-09-14 18:44:23    浏览量:

  落地与否成检验大模型能力的唯一标准。外界之前普遍认为腾讯在大模型上的动作慢了,但实际上腾讯一直踩在自己的节奏里。

  自研大语言模型混元的新进展,另一方面宣布MaaS 平台全面接入 20 多个主流开源模型。这意味着,腾讯云正基于业界的需求和动向,及时做出了自己的反应。

  腾讯云继续升级大模型训练、精调工具链,覆盖大模型开发全生命周期,进一步帮助企业降低大模型应用落地门槛。

  10 款智能应用和解决方案,展示了这些产品在用户体验提升和效率升级上的价值。

  src=当下,业界有观点认为大模型在行业化落地缺乏亮眼的应用半岛体育全站,价值有待进一步彰显。

  从产业需求和当下的应用实践出发,着眼于解决行业内在大模型训练或应用场景中遇到的现实问题。

  金融、零售、文旅、政务等各个领域已初步应用,应用场景涵盖了对话类客服、营销内容生成、跨模态检索、风控等企业核心的生产经营环节。

  src=汤道生最近接受采访时提到 , 很多人知道大模型是个风口,很想抓住这个千载难逢的机会,但实际上用大模型来解决什么问题,以多大成本来获得什么价值、多少价值,其实还没想得很清楚。

  src=平台能力上,升级后的 TI 平台工具链性能更强,腾讯云 HCC 高性能计算节点、星脉高性能计算网络等覆盖大模型开发半岛体育全站、应用全生命周期,客户只需加入自己独有的场景数据,即可短时间内精调出专属的模型方案。

  半岛全站平台

  ,底层模型能力升级,解决了用户对不同场景里大模型的需求和灵活配置的问题。而平台能力升级,则进一步降低用户使用大模型的门槛。

  腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声在接受采访时提到,做应用层才能带来直观的反馈。比如在文旅行业场景里,要注入的数据和要理解的东西就不太一样,大模型要具备的能力也不太一样,有些需要有推理能力,有些需要有通用能力。做了应用层后,打穿从客户反馈到模型提升的链路,能针对性解决模型效能的一些问题。

  觉得大模型什么都能做的阶段,已经收敛到大模型能够给自身业务带来什么价值上了。

  还远没有到开箱即用的程度,会遇到不少困难,比如训练行业模型时高质量的数据来源问题,以及如何在提示词工程环节给出高质量反馈等。

  src=吴运声用一个教育行业的案例展示了大模型训练背后的复杂程度。这位客户希望通过企业的既有录音文件来判断用户是否具备某种属性,从而方便企业定向运营。它涉及拆解需求、选择基底模型、试模型、开始训练、中间评测、训练结束、模型部署和反馈回传等多个环节,其中任何一个节点出问题,都大大影响模型出来的效果。

  腾讯云 TI 平台提供了整个模型训练的完整工具链,来保障训练任务高效、稳定和顺利进行,并能评测和部署调用。

  src=比如,针对训练时间和成本高的问题,腾讯云升级后的太极 Angel 大模型加速框架,可通过异步调度优化、显存优化、计算优化等方式,相比行业常用方案,性能提升 30% 以上。这些能力来自于过去腾讯在深度学习领域多年积累。

  半岛全站平台

  高速网络和向量数据库也为大模型训练提供重要的底层支撑能力。腾讯云此前打造的星脉网络是业内网络传输速度最高的网络之一。今年 7 月,腾讯云发布了 AI 原生向量数据库 Tencent Cloud VectorDB,也是国内首个从接入层、计算层、到存储层提供全生命周期 AI 化的向量数据库,最高支持 10 亿级向量检索规模,延迟控制在毫秒级。吴永坚认为,这些都是相比其他厂商,腾讯云所具备的差异化关键技术能力。

  模型的评测也是目前业界关注到的大模型应用的短板点。一位能源行业人工智能业务的高管提到,行业模型训练时他们发愁从哪里找高质量的问题,来判断大模型的性能。 提示工程做不好,可能会非常影响模型的效果。 另外,业界人士也发现,大模型训练和落地的链条很长,仅评测单点效果,很难评测整体表现。

  相比于百度、阿里等厂商先发通用大模型,腾讯云选择了先从行业大模型路径切入。

  这与植根于其基因中的产业视角有关。技术并不是单一的割裂存在,而是在技术研发阶段就会与产业应用平衡。例如,腾讯云的技术团队在做识别技术研究时发现,栈道识别、山火识别的需求很分散。同时山火这类场景里的数据掌握不够,很难识别出来半岛体育全站。后来腾讯研究了万物识别的思路,构建一个更大的知识图谱,通过发现物体之间的关系来组成事件。这种抽象方式一方面有很好的学术价值,同时也是从之前的解决场景里问题的视角出发,在解决实际问题积累的经验与研究进步之间形成了良性循环。

  产业落地实效是腾讯云评判大模型价值的唯一指标。吴运声提到,大模型技术要能最终产生价值,才是他们最关注的要素。基于这一标准,他们最先从行业大模型起步,把技术聚焦到行业。随着行业大模型应用经验的积累,垂直场景里深入了解用户的使用方式和需求,还能帮助厂商沉淀出更丰富的解决方案,增加新的产品方向。

  以常规的文本摘要任务为例,十亿级和百亿级模型在这些任务上有不错表现。而一些带强推理属性比如鸡兔同笼为代表的任务,则需要更大的模型。在这一背景下,单一模型已经无法满足客户场景的需求。

  src=再次,从打造标杆案例到规模化复制。随着大模型底层能力日渐完善,目前大模型厂商们面向企业的服务模式也变成了两类:一类是自己的研发能力比较足,通过精调来训练自己的行业大模型;一类是调用 API,成本相对更低,能快速使用。

  腾讯云在行业场景上的偏好和选择也已经明了。数前线获悉,腾讯云目前会综合考量市场空间、腾讯云自身的产品技术积累,同时与已有产品的配合程度等多种因素来选择行业模型的布局领域。最终,他们希望打造的行业大模型,一方面能形成一定的准入门槛,另一方面能真正解决客户的痛点问题。吴运声介绍,具有端到端能力的产品,未来会是腾讯云重点发力的方向。

推荐新闻

关注半岛全站

网站地图