找回密码
 加入怎通
查看: 361|回复: 0

大模型开发路径主要有哪些?

[复制链接]
heshao 发表于 2024-08-29 16:27:34 | 显示全部楼层 |阅读模式
  近年来,大模型在全球资本市场和技术市场掀起狂澜,已经成为人工智能发展的重要方向之一。它被广泛应用于图像识别、语音识别、自然语言处理等领域。那么,大模型开发路径主要有哪些?下面就让小编来为大家简单介绍下:5 @* m7 z/ }0 B' F" X4 R
. t# F6 e3 M& m& a  A
  目前大模型的开发主要有两种路径,一种是从头构建完整大模型;另一种是在开源的通用大模型之上调优。前者所需数据、算力、时间投入较大,但大模型的性能更为突出。后者模型的参数和能力受限于开源模型,但成本较低,可以快速形成所需的大模型。
2 W. _& m: F6 `  Y
* A0 v3 I+ E/ L+ K  完整大模型开发流程:" e6 {5 e% D. g
5 p4 o4 x$ I: H  C
  首先是训练构建基座模型。基座模型已经初步具备良好的知识框架和认知能力,但需要复杂指令的准确引导才可以生成正确内容,因而一般不能直接用于作为日常交互。
9 _% {" A% m% q8 `
! g% N- p7 m& C6 V; p! v  其次是策略精调。目的是让模型具备适用性,能与人类正常交流,即让基座模型理解用户想问什么,以及自己答的对不对。这个环节主要通过高质量的人工标注<指令,答案>优化模型。$ m1 o9 h5 D. A/ O* ^
! y( F  F4 a6 l( @  v
  第三步是训练一个独立于基座模型的判别模型,用来判断模型生成结果的质量,为下一步的强化学习做准备。4 P8 m7 }6 R/ g6 ?% ~: \. I

/ R" }* |$ D$ b# G* w2 J+ s( _9 V  R  最后一步是利用奖励机制优化基座模型,完成模型的领域泛化能力。本阶段无需人工标注数据,而是利用强化学习技术,根据上一阶段判别模型的打分结果来更新内容生成模型参数,从而提升内容生成模型的回答质量。
: [( O7 @: T; Z8 E/ h6 y# X; e7 a) q* U0 H
  关于大模型开发问题,小编就先为大家介绍到这里。值得注意的是,大模型定制开发的过程始于需求分析,开发团队需要与客户或项目相关方进行充分沟通。小编这里为大家推荐分形科技公司,具体服务内容,大家可通过公司官网咨询了解。2 l. p$ w5 G+ q7 V4 Y4 m6 r7 p

. B  ^$ r. j' k5 U: U1 X: x, Y
回复

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-6-13 22:33 , Processed in 0.024923 second(s), 22 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表