找回密码
 加入怎通
查看: 235|回复: 2

生成式AI继续狂飙,正以“天”为单位迭代|甲子光年_生成式方法

[复制链接]
我来看看 发表于 2023-03-28 13:38:43 | 显示全部楼层 |阅读模式
( \! P9 [. J% Z# p8 d: h

原标题:生成式AI继续狂飙,正以“天”为单位迭代|甲子光年

1 p d0 S3 S) j$ z

ChatGPT蝴蝶震动翅膀,世界开始为之颤动整理|刘杨楠 简春燕编辑|赵健ChatGPT带来的AI浪潮正在蔓延至更广的地方上周,GPT-4、Microsoft 365 Copilot、Midjourney V5、Google PaLM API、文心一言接连出场;本周,英伟达、Adobe紧跟其后,OpenAI更是在本周五推出插件功能,点亮“AI的AppStore时刻”。

8 ?$ x3 \7 S8 v1 k; x0 d8 y

此外,李开复、阿里VP贾扬清、前字节跳动视觉技术负责人王长虎多为商业大咖入场AI大模型创业;阿里M6大模型前带头人杨红霞被曝加入字节AI Lab,参与语言生成大模型的研发;还有一系列整合AI的新产品雨后春笋般涌现。

0 ~6 B5 h0 {: G% a

相信所有关注AI的人都有一种感受:每天都不知道明天和OpenAI的新产品到底哪一个会先来「甲子光年」整理了一份AI周报,整理了过去一周生成式AI领域的新鲜事以下为详细内容:3月20日,周一OpenAI 发布重磅研究,80%打工人或被颠覆!。

2 o. ^# w- g6 Z0 h

OpenAI与宾夕法尼亚大学共同探索大型语言模型如何影响美国劳动力市场,研究估计,对于19%的岗位,至少50%的工作内容会被影响;对于80%的岗位,也至少有10%的工作内容被波及。

$ h+ Z8 A# V6 C/ l" {6 b' Z

OpenAI引入了“暴露”的概念,衡量标准为,使用ChatGPT或相关工具,在保证质量的情况下,能否减少完成工作的时间E0:没有暴露E1:直接暴露,仅使用大型语言模型(比如 GPT-4 聊天界面),可以将时间至少减少 50%。

1 ]+ f- A& U& D* u; n% x

E2:间接暴露,单独使用大型语言模型无法达到效果,但在它的基础上开发的额外软件(比如图像生成),可以将时间至少减少 50%有着极高暴露风险的职业更容易受到震荡,如作家、数学家、新闻从业者、会计与审计、金融量化分析师等。

! v# `6 v, X/ h7 ]* x

十年前有传统观点认为,人工智能将首先影响体力劳动,然后是认知劳动,最后可能会影响到那些需要创造力的工作但如今看来,一切都是相反的顺序OpenAI研究论文链接:https://arxiv.org/pdf/2303.10130v1.pdf

`, R" M4 S2 I9 Z7 B, D/ `

3月21日,周二Adobe推出名为Adobe Firefly的 "创造性生成AI模型系列"Adobe推出自己的AI图像生成器,宣布了一个名为Adobe Firefly的 "创造性生成AI模型系列",并发布了利用这些模型的前两个工具——一个类似DALL-E或Midjourney,用户输入提示后,工具便能创建一个图像;另一个可生成风格化的文本,类似人工智能驱动的WordArt。

& C c1 |; H" ~- Y7 o% t1 {& n/ M

对Adobe来说,此次发布意义重大过去一年,面对AIGC的冲击,作为创意应用领域头部企业的Adobe一直在观望如今,Adobe终于有所动作“我们不害怕变化,我们正在拥抱这种变化,”Adobe公司生成型人工智能和Sensei的副总裁Alexandru Costin说, 。

9 r" S: A! {) b

“我们可以产生高质量的内容,而不是随意品牌和他人的IP”Firefly的前两个工具将从3月21日起提供公开测试版非Creative Cloud用户也可以申请使用,但Adobe将限制进入测试版的人数访问地址:

0 P# d$ u, b/ X2 w. H

https://www.adobe.com/sensei/generative-ai/firefly.html从十年前的深度学习,到如今的AI大模型,英伟达一直在“赢” 在年度活动GTC(GPU Technology Conoference)

+ O# T. s" j9 i3 d0 z/ N

上, 英伟达发布了四款AI推理芯片,包括针对生成式AI图像处理、大模型处理的芯片;三个大模型云服务,分别适用于文本、图像和生物研究;超级计算机,以及针对场景优化的应用100个、更新功能的工业元宇宙Omniverse。

G: b: H* g8 ], s$ l, e

在演讲中,黄仁勋又把“AI的iPhone时刻”这句话重复了三遍在ChatGPT以及生成式AI的热潮下,英伟达的股价今年以来涨幅超过80%,市值接近6500亿美元,一举超过特斯拉英伟达也把AI当做一次二次腾飞的机遇。

9 | I4 D/ I- Z% [

2023年初各大科技公司财报发布,英伟达提及AI 75次,超过谷歌、微软、Meta本周为期四天的GTC活动包含了650多场会议,由众多研究者、开发者和行业领袖参与,其中仅生成式AI的主题会议就超过70场。

3 K6 L2 _5 ~8 x. m1 V% B$ V7 S$ ?

黄仁勋表示:“AI正迎来有史以来最辉煌的时刻这将是我们迄今为止最重要的一次GTC”阿里VP贾扬清被曝离职创业大模型阿里VP贾扬清被曝将离职,创立一家新的AI公司,和他一起创业的还有曾参与ONNX、PyTorch和Caffe2项目的“老战友”。

; x: }. Y( V# f+ E

贾扬清是AI架构领域最厉害的华人之一,他创建了知名深度学习框架Caffe,还是TensorFlow、Pytorch的核心成员和共同领导者在阿里时,他曾率队升级了以ODPS和PAI为代表的大数据和人工智能平台产品,支撑了整个集团大数据存储、计算、分析和机器学习的需求;支持发布了魔搭。

1 L2 N ]& ?) w: W$ {9 h

(ModelScope)开源模型社区此次,贾扬清团队将打造一个统一、多云和可观察的人工智能平台——不仅是AI基础设施提供商,也关注包括大模型在内的AI应用3月22日,周三谷歌发布Bard公测,硬刚ChatGPT。

* u0 R4 W( G( s6 @+ g

谷歌宣布正式开放旗下ChatGPT竞争对手Bard的公测,首先将面向美国和英国地区启动这两个国家的用户都可以在bard.google.com上进行排队等候,随着测试的推进Bard也会逐步在其他地区上线总体来看,Bard与New Bing的使用模式和功能基本一致。

8 _. t. W7 s' N" V7 s- x" Y W4 U0 ~

目前Bard并不具备New Bing能够给AI生成答案提供信息来源,以及基于生成答案自动提供拓展问题的功能当用户提出一个问题之后,Bard能生成3个不同版本的答案,用户可以根据自己的内容喜好进行选择此外,在New Bing上线后曾出现的混乱和批评的前车之鉴下,此次谷歌十分谨慎,在Bard界面上时刻提醒用户:“Bard可能生成不准确或者略带攻击性的信息,但并不代表谷歌官方观点。

! L) h9 G$ W5 V3 T+ d% v

”对于ChatGPT的威胁,谷歌CEO桑达尔·皮查伊(Sundar Pichai)表示,谷歌过去一些最成功的产品也并不是第一个推向市场的在AI的竞争上,谷歌将依然如此微软宣布,Bing Chat现已整合Bing Image Creator功能。

: |; Y9 ~3 p8 y8 x/ P

微软宣布Bing Chat现已整合Bing Image Creator功能,允许用户通过文本生成图片,基于OpenAI旗下的深度学习模型DALL-E实现。

9 K( C o" j7 K5 e# P

此外,微软表示已经整合了OpenAI的安全措施,并添加了额外的保护功能,以此限制图片生成功能被滥用GitHub推出全新版本Copilot X,接入GPT-4,解放程序员双手微软旗下代码托管平台GitHub发布了编程辅助工具Copilot的全新版本Copilot X,新版本接入GPT-4,并新增了聊天和语音功能,开发人员用自然语言询问如何完成特定的编码功能。

( @/ T9 v0 ?+ j+ ~

Copilot X更新的一系列功能包括有:GitHub Copilot Chat,可实现与AI对话完成编码;Copilot for Pull Requests,由AI协助程序员拉取请求;Copilot for Docs,智能文档编写工具;Copilot for CLI,命令工具;Copilot Voice,语音扩展功能,说话就完成程序编写。

2 t& s' a& b! @) X( F* e s+ B3 y

此次更新意味着GitHub Copilot编程模型重磅级升级,GPT-4正将程序员从基础性编码工作中解放出来,很大程度上提高了生产力Runway发布Gen-2,三秒钟生成大片Runway成立于2018年,是一家AI视频编辑软件提供商。

3 q; h- g% ^% I$ m$ x

Runway在文本到图像领域就曾经大放异彩,开发了大名鼎鼎的Stable Diffusion今年2月,Runway提出了首个AI编辑模型Gen-1,可以在原视频基础上进行编辑但部分用户Gen-1的内测都还没拿到,Gen-2就已经来了。

2 Z% ~; N+ Y; h

Gen-2进一步升级,可以用任意的图像、视频、文本,生成各种风格的创意大片Runnway官网地址:https://research.runwayml.com/gen1Zapier推出自然语言操作无代码自动化平台Zapier推出了一个通用的、人工智能驱动的API,称为自然语言动作

' H! L) t: j% {, m" P4 V) w

(NLA),以将Zapier动作集成到任何应用程序中NLA针对基于自然语言的产品进行了优化,例如聊天机器人或使用LLM构建的产品,但任何开发人员都可以使用非营利组织Mozilla新成立人工智能初创公司Mozilla.ai,旨在构建开源且“值得信赖”的AI。

4 U n+ d. j2 `

Firefox浏览器背后的非营利组织Mozilla新成立人工智能初创公司Mozilla.aiMozilla执行总裁兼Mozilla.ai负责人Mark Surman称,这家新成立的公司名为Mozilla.ai,其使命不仅仅是构建任何 AI——它的使命是构建开源且“值得信赖”的AI。

' v/ M, c) D( v! ~& |" U

“在可信赖的人工智能领域工作了将近五年,我一直感到既兴奋又焦虑,”Surman表示,“过去一两个月快速发布的大型科技 AI 公告没有什么不同真正令人兴奋的新技术正在出现——新工具立即激发了艺术家、创始人……各种各样的人去做新事物。

5 \" G" I; E, n7 p1 H/ z4 `% Q3 Q

当你意识到几乎没有人在看护栏时,焦虑就来了”Mozilla.ai由Mozilla的母公司Mozilla基金会的3000万美元种子投资资助,是Mozilla基金会的全资子公司——很像 Mozilla Corporation

" T/ a3 a, G, E) Q& i

(负责开发 Firefox 的组织)和 Mozilla Ventures(Mozilla基金会的VC基金)其董事总经理是Moez Draief,他曾任华为诺亚方舟人工智能实验室首席科学家、凯捷咨询公司全球首席科学家。

- b- Q4 k" Q2 O- q% F

值得注意的是,Mozilla.ai不是非营利组织“最大的问题是,有多少新的、规模较小的值得信赖的 AI 初创公司能够保持独立?” Draief表示,“很明显,亚马逊、谷歌和微软等巨头的云平台正急于整合人工智能领域,所有的钱都是从这里赚来的,小公司很难不被卷入这种整合。

5 @5 G7 J- K3 q0 T

”阿里M6大模型前带头人杨红霞加盟字节跳动,参与语言生成大模型研发3月22日,阿里M6大模型前带头人杨红霞被曝加入字节AI Lab(人工智能实验室),参与语言生成大模型的研发,直接向字节跳动副总裁杨震原汇报。

1 m5 o. b7 j' n2 E

目前,字节跳动尚未出面证实该消息杨红霞曾是阿里达摩院超大规模多模态预训练模型M6的技术负责人,毕业于南开大学、杜克大学统计科学系,师从著名统计学家David Dunson;在人工智能领域国际会议、顶级期刊有近百篇顶级论文;曾带领M6大模型从百亿级进化到千亿、再到万亿的参数量,并且主导认知智能技术的发展和场景落地。

- t1 d8 E/ p# `' h

2022年9月初,杨红霞因个人家庭原因从阿里巴巴达摩院离职由于达摩院AI大模型还未找到实际落地场景,加上大厂降本增效需求迫切,大模型无法得到更多支持,这也间接导致包括杨红霞在内的多位顶级人才离职,如智能研究领域负责人金榕、城市大脑实验室负责人华先胜。

~- H( W) G; {5 C6 K. X/ Q b

腾讯高管:AI大模型是增长的加速器,会进一步投资3月22日, 腾讯发布2022年财报在晚间的电话会议上,针对市场热议的人工智能和ChatGPT相关话题,腾讯高管表示,生成式AI可以用来提升腾讯旗下旗舰产品的用户体验。

& y1 ~" s; ~$ I; {: j

未来可能每一个用户都会有人工智能助理,如果效果好,有可能将生成式AI纳入微信和QQ腾讯高管进一步表示,对于腾讯而言,AI和大模型是一个增长的加速器,会帮助改善现有业务,加速商业化,腾讯会在资源上进一步投资,来建立腾讯自己的大模型,同时会确保打好打牢模型建设的基础。

& n9 J) P- s( q3 r6 o

3月23日,周四微软协作平台Micro Loop上线,剑指Notion AI3月23日,微软协作平台Loop官方账号宣布Microsoft Loop正式开启公测,并同步开放公众预览版下载无需Waiting list,用户现在就可以登录Microsoft Loop并直接体验。

0 U; B6 t2 Z8 M

尽管Loop对标Notion AI,但在用户体验上,Loop远不如NotionAILoop网址:https://loop.microsoft.com/百度回应网友对文心一言文生图功能的反馈文心一言推出后,因文生图功能不够准确,许多网友开始调侃“文心一言”,甚至开始用文心一言生成的图片做起了”看图猜词的游戏。

; ] |8 {) m# }5 f E; j

更有甚者,有人开始质疑百度文心一言并非自研,只是套在国外模型上的一个空壳产品。为此,百度再3月23日在官方微博正式回应质疑:

! ?5 P! \7 X5 P8 `5 G! V

当天,有消息称李彦宏接受采访时表示, 中国基本不会再出现一个像OpenAI的公司了 李彦宏称,OpenAI 之所以诞生是因为美国大厂都不看好这个方向(所以没人竞争),但现在中国大厂都看好AI大模型,所以都在做这个方向。

/ d' B; {5 s. `+ E% }0 z w

他表示,创业公司重新做一个ChatGPT没有多大意义,基于大语言模型开发应用机会很大,所以没有必要再重新发明一遍轮子此外,李彦宏还回应了文心一言发布会为何用录屏的问题,他表示,他是希望能现场演示的,因为人机对话产品具有极强交互属性,但后来有两个因素让他改变了主意:“一是生成式AI每次给出的答案不一定一样,会带来不确定性。

. k) ]6 R' u+ ?% i; `1 w( P

二是真正说服我的理由,是全球所有类似发布会,没有一个是现场演示的,都是录好的如果大家都可以,那我们也OK”3月24日,周五OpenAI推出插件功能,ChatGPT“有了联网能力”如果说ChatGPT是AI的“iPhone”,那么OpenAI推出的插件功能,就是“iPhone的App store”。

) }. O# n4 k# n" I& o$ b/ T) M

在目前已实现的“初步功能”来看,ChatGPT已经可以具备了三项能力:● 访问最新信息,比如体育比分、股票价格、最新消息; ● 检索知识库信息,比如公司文件、个人笔记、运行计算; ● 代表用户执行操作,比如订机票、订餐。

6 h# X! W O$ P

目前,插件系统还处于alpha测试期,首批参与插件创建的厂商包括 Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram 和 Zapier。

) o7 y! ]2 [. B% K: Z4 D6 V: ^

其他使用插件的开发者可以申请进入候补名单OpenAI表示,在了解更多情况后将逐步开放访问范围OpenAI 还自己托管了两款插件,其一为网络浏览器,其二是代码解释器OpenAI 开源了一款知识库检索插件的代码,任何开发者都可以借此托管用于增强 ChatGPT 的信息。

$ l* r0 f) n4 w

OpenAI 将插件比喻成语言模型的“眼睛和耳朵”,能帮助模型访问因为较新、较私人或较具体而不宜包含在训练数据内的信息为了响应用户的明确要求,插件还能帮助语言模型切实执行安全、受控的操作,从而提高整个系统的实用性。

! ~, r1 T, d, T3 f

一位资深程序员感叹道, ChatGPT的插件接口可能是一生中见过最疯狂、最令人印象深刻的刚刚回归OpenAI不久的特斯拉前AI主管Andrej Karpathy则表示,GPT类模型是一种运行在文本上的新型计算机架构,它不仅可以与我们人类交谈,也可以与现有的软件基础设施“交谈”,API是第一步,插件是第二步。

: G2 `7 B. J/ A8 d0 Y0 h+ f) S' f) Z

加入ChatGPT插件候补名单:https://openai.com/waitlist/plugins前字节跳动视觉技术负责人王长虎加入AI创业大潮投中网获悉,前字节跳动视觉技术负责人王长虎近期将于龙湖集团离职,并即将组建新的创业团队。

$ i# j# _, J6 Y2 Z% C

王长虎的创业方向将聚焦于 生成式AI的视觉多模态算法平台,并基于过去近20年顶级的学术研究及技术应用能力,赋能视觉相关的各大垂直应用场景 此前,字节跳动的官方介绍也显示,王长虎于2017年加入字节跳动人工智能实验室担任总监一职,主要研究方向包括计算机视觉、视频理解、多媒体检索和机器学习等。

% i0 s2 a- o# o* X

王长虎完整参与了抖音和TikTok等视频类产品从0到1的建设和发展,并搭建了数百人的视觉技术和产品团队,建设了视觉技术和业务中台,带领团队将相关技术广泛应用到字节跳动全线产品中,为集团各产品提供AI技术支撑和业务解决方案,包括今日头条、抖音、TikTok等,覆盖了视觉相关产品内容生产与消费的全流程。

) m; s0 ]/ R/ s# f3 X) G5 x

END.受微信改版影响,没有标星的朋友可能会错过「甲子光年」的推送或是看不到封面,欢迎各位新老朋友给「甲子光年」点个星标⭐️,以便及时收到我们的每篇新推文。返回搜狐,查看更多责任编辑:

& J" Y6 I: ^4 D5 N( { ( \0 }% z7 h7 P4 ^- A. d + D% Q1 l# p) A" F , P* Q; Q8 H5 U5 Z/ c" F0 o! f2 ?" O ! b: _& _- c9 O2 ~. A/ q
回复

使用道具 举报

LIDI 发表于 2026-01-16 23:17:00 | 显示全部楼层
刚好遇到类似问题,看完这个帖子心里有底了
回复 支持 反对

使用道具 举报

茫然 发表于 2026-06-03 03:40:15 | 显示全部楼层
这个思路很新颖,打开了新世界的大门,谢谢分享
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-6-14 23:43 , Processed in 0.027359 second(s), 23 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表