找回密码
 加入怎通
查看: 357|回复: 0

大模型开发路径主要有哪些?

[复制链接]
heshao 发表于 2024-08-29 16:27:34 | 显示全部楼层 |阅读模式
  近年来,大模型在全球资本市场和技术市场掀起狂澜,已经成为人工智能发展的重要方向之一。它被广泛应用于图像识别、语音识别、自然语言处理等领域。那么,大模型开发路径主要有哪些?下面就让小编来为大家简单介绍下:
9 v" k% r6 I6 b) M; n+ W' [4 Z! ~# [
  目前大模型的开发主要有两种路径,一种是从头构建完整大模型;另一种是在开源的通用大模型之上调优。前者所需数据、算力、时间投入较大,但大模型的性能更为突出。后者模型的参数和能力受限于开源模型,但成本较低,可以快速形成所需的大模型。
' @0 z( A  ]6 w% G0 v- G5 V0 G: ~& C9 k
  完整大模型开发流程:4 H, E+ p! D$ [
- `5 O9 Y: Z: A; \4 ]9 J" G* z
  首先是训练构建基座模型。基座模型已经初步具备良好的知识框架和认知能力,但需要复杂指令的准确引导才可以生成正确内容,因而一般不能直接用于作为日常交互。
5 [1 R! @" r4 G- c: L  J: O# `: n1 p7 g6 p4 C- f" G! V
  其次是策略精调。目的是让模型具备适用性,能与人类正常交流,即让基座模型理解用户想问什么,以及自己答的对不对。这个环节主要通过高质量的人工标注<指令,答案>优化模型。4 r+ T  i. |' J9 i

& u% g. g& d4 Z  第三步是训练一个独立于基座模型的判别模型,用来判断模型生成结果的质量,为下一步的强化学习做准备。) S, ~' ?, ~" z* I

' A+ F, Z" t6 I  最后一步是利用奖励机制优化基座模型,完成模型的领域泛化能力。本阶段无需人工标注数据,而是利用强化学习技术,根据上一阶段判别模型的打分结果来更新内容生成模型参数,从而提升内容生成模型的回答质量。
$ F0 m$ k0 Y$ x& @8 y8 z: }& c5 ^$ B* e! c- f
  关于大模型开发问题,小编就先为大家介绍到这里。值得注意的是,大模型定制开发的过程始于需求分析,开发团队需要与客户或项目相关方进行充分沟通。小编这里为大家推荐分形科技公司,具体服务内容,大家可通过公司官网咨询了解。7 a; l+ i7 Z3 G& Z8 t- C" W

( u" s9 n  q7 i8 p: h$ B8 [
回复

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-22 09:30 , Processed in 0.445277 second(s), 22 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表