人工智能行业研究:AI+下半场,以大模型为入口向终端应用扩散
(报告出品方/作者:招商证券,张夏)
一、“互联网+”热潮回顾
4G 牌照发放叠加微信 5.0 推出,政策产品齐发力,“互联网+”时代正式开启。2013 年 12 月 4 日,工业和信息化部 正式向中国移动、中国电信和中国联通三大运营商发放 4G 牌照,标志着我国正式进入 4G 通信时代。2015 年 8 月, 微信 5.0 版本发布,“微信支付”功能的推出对“互联网+”的行情具有推波助澜的作用。网速的大幅提升叠加“微 信支付”的推动,互联网应用场景快速普及至娱乐、电子商务、餐饮出行、教育等相关领域,形成了传统行业和互联 网结合的“互联网+”模式:1)娱乐领域,大量游戏厂商进入移动端市场,游戏移动端用户规模增长迅速,手游市场 步入高速发展轨道;2)电子商务领域,生鲜 O2O 模式通过结合线上和线下渠道打通了线上线下交易屏障,余额宝移 动端理财和花呗借贷的出现对银行传统业务构成了冲击;3)餐饮出行领域,滴滴出行的上线改变了传统扬招叫车的 模式;4)教育领域,作业帮、好未来等提供在线教育和学习服务,推动了教育信息化和智能化。
产业革命与政策加码下,2013-2015 年“互联网+”板块迎来了史诗级行情。互联网板块指数从 2013 年初的 930.96 一 路飙升至 2015 年 6 月 12 日盘中的历史高点 5357.76,最大涨幅达 475%。个股涨幅更是惊人,整个“互联网+”板块 出现多只十倍股,其中“互联网+金融”的龙头东方财富、同花顺涨幅高达 49 倍、36 倍。在此轮行情背后,是十年难遇 的创业板大牛市,创业板指从 2013 年年初 705.34 一直到 2015 年中创出 4037.96 历史高点,涨幅达 473%。从走势 上看,“互联网+”板块与创业板走势高度一致。
从具体区间看,“互联网+”此轮大行情可以分为三个阶段:
1、第一阶段:“互联网+”板块领涨全市(2013.1-2013.9)
2013 年年初,“互联网+”板块便开始快速上涨,传媒板块领涨。从整个“互联网+”板块看,该阶段内指数从 922 上涨 至 1822,高于同期创业板涨幅。从细分板块看,该阶段下游应用端率先发力,传媒板块涨幅达 144%,相对于万得全 A 指数有超过 150%的超额收益。从个股看,互联网+游戏龙头中青宝、互联网+金融龙头东方财富、互联网+传媒龙 头华谊兄弟和华策影视,均在半年时间之内实现股价翻倍。 该阶段传媒板块上涨主要得益于政策、资本运作与业绩三重共振。政策端,2013 年 3 月国务院出台的《国务院机构 改革和职能转变方案》,组建国家出版广播电视总局,打破过往多头管理、职权不明的情况,为传媒领域的监管松绑。 2013 年 8 月,国务院下发《关于促进信息消费扩大内需的若干意见》,提出实施“宽带中国”战略,加快网络、通 信基础设施建设和升级;同时提出要大力发展数字出版、互动新媒体、移动多媒体等新兴文化产业,促进数字文化内 容消费。到 2015 年,信息消费规模要超过 3.2 万亿元,其中基于互联网的新型信息消费规模达 2.4 万亿元,年均增 长 30%以上。资本运作端,华谊兄弟收购浙江常升、永乐影视,提升自身电视剧业务实力,华测影视更是以 16.52 亿 元收购克顿传媒,奠定自身在电视剧领域的龙头地位。业绩端,2013 年全国电影总票房达 220 亿元,保持 30%的高 增长率,龙头公司华谊兄弟净利润增幅更是达到 175%。
2、第二阶段:走势分化,开始出现软切硬行情(2013.11-2014.9)
该阶段宽基指数震荡上行,上证指数上涨 10.38%、万得全 A 上涨 24.50%、创业板指数上涨 24.71%。从风格看,该 阶段仍然是小盘成长风格显著占优,相对大盘与价值风格有较高超额收益。成长板块代表 TMT 内出现分化,前一阶 段涨幅最高的传媒板块跑输大盘,通信、计算机与电子涨幅较高,出现了从下游软件应用向上游硬件设备切换的行情。
此阶段内硬件设备的上涨主要由于需求拉动带来的业绩高增。2012-2014 年间全球消费电子快速发展,智能手机与平 板电脑的出货量两年内接近翻倍,由此带动相应的半导体及 TMT 设备需求大幅增长。同样,国内智能手机也在该阶 段内迅猛发展,2013-2014 两年出货量 GAGR 超 100%。消费端的旺盛需求开始向上游传导,2013-2014 年 A 股计 算机、电子板块归母净利润同比高增,相应的,股价也迎来戴维斯双击。
3、第三阶段:牛市末尾的拔估值行情(2015.1-2015.6)
自 2015 年年初起,市场进入了疯狂的牛尾行情,所有指数普涨,赚钱效应十分显著。分板块看,该阶段依旧是“互 联网+”板块领涨,带动整个 TMT 板块实现较高涨幅,显著高于一众宽基指数。从风格看,该阶段是小盘成长股的天 下,弹性更高、成长性更强的个股相对大盘价值股有明显的超额收益。此外,从暴力上涨的新股也能窥见牛尾行情的 疯狂,该阶段新股上市后大多连续封板涨停,其中暴风科技更是在上市后连续录得 24 涨停板,区间涨幅接近 3000%。
估值贡献了“互联网+”第三阶段的大部分涨幅。与一般盈利、估值双驱动的“双击型”牛市不同,基本面的变化在 2015 年的大牛市中并不明显,从 TMT 所属的四个一级行业看,经历了 2013-2014 年业绩的快速增长后,2015 年 TMT 板块业绩增速显著放缓,下半年更是出现同比下降。而在有利的产业政策与宽松的货币政策加持下,大量杠杆资 金入市,向上拔高市盈率,走出一波轰轰烈烈的大牛市。
二、大模型的诞生与 AI+的崛起
1、ChatGPT 引爆大模型概念
ChatGPT 的诞生经历了 GPT 四个版本的迭代,基于 GPT-3.5 微调得到,其发布后得到市场广泛关注,成为史上用 户数增长最快的消费者应用。2018 年,生成式预训练模型 GPT-1 诞生,引入有监督的微调训练;2019 年,GPT-2 在 GPT-1 的架构基础和预训练方法上,以更大的参数量和多任务训练,进行 zero-shot 学习;2020 年,GPT-3 用 fewshot 替代 zero-shot,将训练参数增加至 1750 亿;2022 年 GPT-3.5 增加代码训练和指示微调,具备了更强的复杂推 理能力、更好的人类指令响应和代码生成能力。2022 年 11 月,OpenAI 基于 GPT-3.5 采用近端策略优化算法进行微 调,突出强调为对话而生,推出了 ChatGPT。ChatGPT 具备连续对话能力,对话内容质量高,语言理解和逻辑推理 能力强,一经推出,便引发市场较大关注,从 2022 年 11 月底上线至 2023 年 1 月,ChatGPT 注册用户便超过了 1 亿,2023 年 1 月的月活跃用户数达到 1 亿,成为史上用户数增长最快的消费者应用。
OpenAI 在 ChatGPT 成为爆款后又推出多模态大模型 GPT-4。3 月 14 日,OpenAI 公布多模态预训练大模型 GPT4,其在诸多方面进行了升级:1)输入端上限:GPT-4 文字输入限制提升至 2.5 万字,为 ChatGPT 的 8 倍左右;2) 多模态输入能力:能够接受文本、图像等形式的输入;3)高级推理能力:在各种专业和学术领域的基准测试中表现 出“人类水平”,多数成绩优于 GPT-3.5。
其他科技巨头亦纷纷下场,大模型如“雨后春笋”般涌现。国外超大规模预训练模型目前已进入“军备竞赛”阶段。 面对微软和 OpenAI 目前在大模型领域的领先优势,曾一度自视 AI 领头羊的谷歌发起了全面反击,5 月 17 日,谷歌 在其 I/O 开发者大会上发布最新通用大语言模型 PaLM 2,并率先开启了 AI 边缘部署。国内大模型发展迅速,大模型 自主可控趋势势不可挡。 2023 年 3 月 14 日,商汤科技发布多模态多任务通用大模型“书生 2.5”;3 月 16 日,百度 正式发布新一代大语言模型、生成式 AI 产品文心一言;约半月后,360 集团创始人周鸿祎在“2023 数字安全发展与 高峰论坛”上发布关于大语言模型的中国版 ChatGPT 产品。4 月 7 日,阿里云宣布自研大模型“通义千问”,次日, 华为发布华为盘古大模型。4 月 17 日,昆仑万维正式发布千亿级大语言模型“天工”;5 月 6 日,科大讯飞发布讯飞 星火认知大模型,并发布教育、办公、汽车、数字员工四大行业应用成果。
2、大模型是人工智能以及万物互联网的核心入口
在“互联网”时代和“移动互联网”时代,入口是获取信息、解决问题的第一接触点。入口主要包含内容、应用软件、 操作系统、硬件四个维度,四个维度在用户距离和用户控制力上依次递增,其中操作系统作为基础软件,上承应用, 下接硬件,面向用户,对生态要求极高;在生态加持下,操作系统技术变迁较慢,容易形成寡头竞争甚至寡头垄断的 市场格局,进而成功卡位底层入口。因此,操作系统的每一次迭代和更新都可能意味着“入口”的重新定义和争夺, 也孕育着新时代的开启:Windows 系统的出现降低了 PC 的使用门槛,催发了互联网繁荣;而 App Store 提供的双向 选择平台,为应用接入移动手机提供契机,拉开了移动互联网序幕;Android 开源属性为移动端应用市场的繁荣“增 光添色”。因此可以发现每一次“新入口”的提供和接入不仅带来了系统和应用的繁荣,还具有定义时代的重要意义。
Windows 系统降低 PC 使用门槛,全球互联网使用人数年复合增长率达到 117.9%。Windows 系统诞生前,基 于命令行的 PC 系统界面并不用户友好,软硬件兼容性问题降低了 PC 使用便捷性。Windows 系统诞生后,图形 用户界面设计降低了用户上手难度,硬软件兼容性问题的改善利于用户多元需求的满足。同时,伴随 Windows 系统成熟,如 Windows 95 支持个人 Web 服务器功能,Windows 98 紧密结合国际网络和全球资讯网,极大程度 上便利了用户进入“互联网”世界,为互联网时代的繁荣奠定了基石。根据世界银行和 IWS 数据显示,1995-2000年间,美国和日本互联网人数从 9.24%/1.59%大幅增长至 43.08%/30.00%,全球互联网使用人数年复合增长率 达到 117.9%。
iPhone 的出现及其 iOS 独特生态拉开了移动互联网时代序幕,苹果手机取代运营商成为导流入口。iPhone 不 再是从“运营商”角度设计的单一“通讯设备”,而是集工作、休闲、娱乐、通信等功能为一体的“复合设备”。 苹果改变了“通过运营商选择购买合约的手机设备”,消费者开始因为选择苹果手机而选择运营商,取代运营商 成为导流入口。APP Store 在只收取 30%渠道费用的基础上为工程师和用户提供自由双向选择的平台,带来了移 动端 App 的繁荣。因此,核心终端 iPhone 的出现奠定了手机终端在移动互联网的入口地位,iOS 赋予的多元而 自由的 App 选择成功将 iPhone 拉入互联网,两者结合成就了移动互联网的开启。
不同于苹果从“封闭走向开放”,Android 开源特性成就其“天然入口”属性。谷歌成立“开放手提设备联盟”, 将众多三星、联想、HTC、LG、中国移动等手机厂商、软件厂商和通信公司拉入其中,并允许联盟成员免费拥有 对安卓系统的使用权以及定制权。百度、阿里等巨头以及部分新兴创业公司都在 Android 上动刀形成了 ROM 甚 至新系统。部分手机厂商深度定制自家智能手机适配系统,其带有许多通用 APP,因此形成了“天然入口”。开 源特性降低了智能机成本,开发者的加入使得定制系统、软件应用百花齐放,其“开放兼容”的特性不仅促进了 安卓独特的生态“护城河”形成,还成就了移动互联网时代的“五光十色”。
通用大模型和插件协同为智能终端提供接入,有望开启“AI+”时代。目前的大模型,如 OpenAI 的 GPT-4、阿里的 “通义大模型”、华为的“盘古大模型”和腾讯的“HunYuan 大模型”,为协调各类硬件、软件、数据等提供了强大基 础平台。ChatGPT 为代表的 GPT 系列如同互联网时代的 Windows 操作系统,成功定义用户 AI 使用习惯。Plugins 面世,多插件相互协同为打造私人定制的人工智能管家奠定基础。Plugins 基于 Browsing(联网插件)、Code Interpreter(代码编程器)以及 Retrieval(知识检索插件)实现第三方插件在通用平台上相互协调。目前,OpenAI 已宣布向所 有 ChatGPT Plus 用户开放 web browsing 和 Plugin 功能,付费用户可以通过 ChatGPT 访问互联网并使用 70 多 个第三方插件,可以使用的 70 多个插件功能涵盖了创建网页、视频编辑、数据分析等。而本次官宣意味着 ChatGPT 联网和插件功能将进入 Beta 测试阶段。正如移动互联网时代的 iOS App Store,Plugins 率先定义“AI+”时代的应用 生产及接入方式,另外,根据 iOS 和 Android 系统衍生出 App 百花齐放的演绎之路,Plugins 的诞生亦有望带来“AI+” 应用的繁荣。整体而言,大模型的定位从简单的技术赋能转向平台生态入口卡位,同时 ChatGPT Plugins 的出现将加 速“AI+”时代生态的明晰和应用层的繁荣,两者协同将为现代人类的生活带来全维度的颠覆性变化。展望未来,我 们相信,当越来越多的现实载体通过插件接入通用大模型,现代人类的生活可能发生颠覆性变化,万物互联的“AI+” 时代或不再遥远。
3、2023 年年初以来 AI 行情回顾
2023 年初以来“AI+”概念相关板块涨幅均超 50%,当仁不让成为主线。具体来看,此次上涨可细分为四个阶段。
1) 第一阶段:ChatGPT 概念领涨(2023.1.1-2023.2.14)
爆款应用推出,ChatGPT 领涨全市。2022 年底现象级应用 ChatGPT 横空出世,上线仅五天注册人数已超过一百万, 两个月后便实现过亿月活,均为历史之最。微软在 1 月 23 日宣布对 ChatGPT 母公司 OpenAl 进行数十亿美元的投资 以加速其在人工智能领域的技术突破,微软计划迅速推进 ChatGPT 商业化,将其整合进旗下 Bing 搜索引擎、Office 全家桶等全线产品中。此外,“美版今日头条”BuzzFeed 宣布将与 OpenAI 合作,拟使用 ChatGPT 帮助内容创作;亚 马逊、谷歌等大公司也踊跃布局。相应的,该阶段 ChatGPT 指数领涨市场,创下超 50%涨幅。
2) 第二阶段:指数震荡调整,板块内部分化(2023.2.13-2023.3.14)
板块缺少催化,内部涨跌互现。该阶段“AI+”板块表现平淡,主要有内外两重因素。从板块内部看,“AI+”及人工智能行 业并未有爆款产品推出,又恰逢业绩真空期上涨缺乏基本面支撑。从外部市场看,该阶段恰逢“中特估”概念盛行,2 月 27 日国务院国企改革领导小组召开国企改革三年行动经验成果交流会议,提出国有企业对标世界一流,聚焦全员劳 动生产率、净资产收益率、经营现金流。该阶段国企提估值成为市场主线,明显跑赢一众宽基指数以及“AI+”相关指数。 此外,该时期正值两会前夕,市场对于农业、自主可控等有望受益板块提前布局。
3) 第三阶段:上游算力与下游应用两翼齐飞(2023.3.14-2023.4.11)
重磅应用落地助推股价,上游算力与下游应用两翼齐飞。该阶段内发生了多个重要事件:3 月 15 日 Open AI 发布新 大模型 GPT-4,3 月 16 日微软宣布旗下 Office 接入 GPT 大语言模型,3 月 27 日文心一言正式上线。受上述多重利 好催化,“AI+”相关板块迅速上涨,其中以上游算力及板块与下游应用板块涨势最为迅猛,其中盈利能力最为确定的光 模块板块一个月内涨幅更是突破 100%。
从算力侧看,强大的算力是训练大语言模型的基础。AI 芯片是算力的硬件基石,主要指针对人工智能算法做了特殊加 速设计的芯片。按照技术架构,AI 芯片可分为 GPU、FPGA、ASIC 及类脑芯片,随着人工智能下游需求的爆发,AI 芯片迎来快速发展,据亿欧智库预测,2025 年我国 AI 芯片市场规模将达 1780 亿元,较 2022 年增长近 100%。光模 块(CPO)将成为大算力应用场景下的重要路线。CPO 技术可以将光模块和芯片封装在同一个封装体中,极大地减 小了连接长度和距离,从而减少了计算损耗,提升了集成度并降低计算整体功耗,在大算力时代有显著优势。
从应用侧看,人工智能相关技术与产品已在多行业有所应用。AI+医疗领域,国内外科技巨头已有所布局。微软发布 医疗行业首款结合 GPT-4 模型应用、英伟达与三井物产株式会社就 Tokyo-1 项目展开合作、百图生科发布可提供多 种蛋白质生成能力的 AIGP 平台。AI+游戏领域,游戏与人工智能结合是必然趋势,一方面,科技的进步带动了游戏 行业的快速发展,另一方面,游戏行业对于科技迭代的推动作用也十分显著。目前 AIGC 已在游戏领域崭露头角,助 力游戏开发,显著降本增效。AI+影视领域,runway 发布新一代文字生成视频模型 Gen-2,全新工具赋能视频生成。 海外龙头公司商业模式已落地,从 To C 向 To B 逐渐转型。
4) 第四阶段:传媒板块一枝独秀(2023.4.11 至今)
4 月 11 日至今,AI+硬件端熄火,市场风格向软件应用方向切换。 大模型利好出尽,硬件端缺乏业绩支撑。自 3 月 16 日百度发布“文心一言”开始,国产大模型进入集中发布期,一 次次大模型的推出将相关公司股价推向高点。而自 4 月 11 日起,除科大讯飞“星火”大模型再无新的大模型发布公 告(昆仑万维“天工”大模型发布会已于 4 月 10 日公告),故本已处于较高位置的 AI+板块缺乏继续上涨催化剂。 另一方面,AI+硬件公司并没有在业绩端兑现市场的高期望,2022 年 AI+板块业绩增速不及预期,尤其是 AI+板块龙 头公司海天瑞声、科大讯飞、三六零 2023 年一季度均录得亏损,使得市场对硬件端的投资热情有所减退。 减费增效叠加低估值,传媒板块领涨。随着 Runway 公司 Gen-2 模型的推出,大模型向软件端的扩散趋势已十分显 著,在游戏开发端,AI 模型可以协助开发者制作动画,显著减少开发时间与成本;在影视制作端,AIGC 能在保证质 量的前提下快速生成海量内容,满足消费者海量需求;在发行出版端,AI 大模型可以将制作者从校对、排版等机械繁 琐的工作中解放出来,将更多的精力放在内容制作端。这波传媒板块的上涨有着估值修复的特点,估值较低的板块涨 幅靠前,平均市盈率不足 10 倍的出版行业更是涨超 50%。
三、AI+产业趋势及下一阶段关注重点
1、已经演绎过的 AI+行情
年初至今人工智能许多领域已经获得充分关注,数据要素、AI 算力、AI+游戏、AI+影视等有较大幅度的上涨。
1) AI 算力
AI 芯片是算力的硬件基石。AI 芯片也被称为计算卡或 AI 加速器,主要指针对人工智能算法做了特殊加速设计的芯片。 按照技术架构,AI 芯片可分为 GPU、FPGA、ASIC 及类脑芯片;按照其在网络中的位置,AI 芯片可分为云端 AI 芯 片、边缘及终端 AI 芯片;按照其在实践中的目标,AI 芯片可分为训练芯片和推理芯片。随着人工智能下游需求的爆 发,AI 芯片迎来快速发展,据亿欧智库预测,2025 年我国 AI 芯片市场规模将达 1780 亿元,较 2022 年增长近 100%。
光模块(CPO)将成为大算力应用场景下的重要路线。CPO 即共封装光学,是将光引擎和交换芯片共同封装在一起 的光电共封装。在传统的光通信系统中,光模块与芯片之间需要通过复杂的连接方式,而 CPO 技术可以将光模块和 芯片封装在同一个封装体中,极大地减小了连接长度和距离,从而减少了计算损耗,提升了集成度并降低计算整体功 耗,在大算力时代有显著优势。据 LightCounting 预测,光模块市场 21 年达到 110 亿美元后,光模块的市场规模在 未来 5 年将以 CAGR14%保持增长,到 2026 年预计达到 176 亿美元。从下游场景看,光模块可应用于无线回传、电 信传输与数据中心,其中数据中心是最大细分市场。
2) 数据要素
数据是大模型高质量回答的基础。在各家大模型训练算法类似的背景下,高质量的数据便成为兵家必争之地。结构化 数据是人工智能算法开发迭代的重要基础,人工智能基础数据服务市场受人工智能核心产业发展带动仍将保持高速增 长,据德勤预测,2027 年市场规模有望达到 130-160 亿元。从发展趋势看,标注复杂化、自动化、全栈式服务需求 以及愈加严格的数据合规需求是 AI 基础数据服务市场的四大趋势。
3) AI+游戏
AI 赋能游戏,有望打破游戏产业“成本、效率和质量”的不可能三角。大型游戏开发需要大量人力、物力和财力的投 入,对美工、实时性和交互性具有较高要求。通常,为保证玩家的良好体验,大量人员投入和漫长开发周期不可避免, 相应地,开发成本和效率便难以保障,如《荒野大镖客:救赎 2》制作成本达到 56 亿人民币,开发周期长达 8.5 年。 而 AI 的诞生可优化剧情、音频、图像、动画制作及底层代码编写等流程,其自然语言生成的能力可增强 NPC 互动真 实感,其制造的虚拟玩家可承担陪玩任务丰富玩家体验。《模拟飞行 2020》便使用 AI 生成还原了大量建筑。超图软 件 5 月 16 日在互动平台上表示,利用 AI 与游戏引擎结合的技术,几何级降低了实景三维数据的生产时间和成本。可 见,AI 在游戏行业的应用不仅有利于游戏行业降本增效,还推动了游戏向更精美、更个性化的方向发展。
游戏与人工智能结合是必然趋势。一方面,科技的进步带动了游戏行业的快速发展。根据中国音像与数字出版协会, 游戏的科技能力与价值与日俱增,自 20 世纪 50 年代开始,经历了“科技启动游戏诞生”、“游戏科技反哺科技创 新”、“快速融入实体经济发展”三个重要阶段。另一方面,游戏行业对于科技迭代的推动作用也十分显著。近期, 人民网与新华社分别发表文章,肯定游戏行业对科技进步的贡献,并提倡挖掘电子游戏产业价值,推动科技发展。此 外,中国音数协游戏工委、中国游戏产业研究院等发布《游戏科技能力与科技价值研究报告》称,面向游戏与电子通 信、硬件制造等领域的行业调研显示,81%的受访者认为游戏促进了 AI 技术的发展;面向大众的用户调研发现,91.4% 的受调研者认为游戏领域的一些科技创新对实体领域有一定的推动作用。
海外已开始探索 AI+游戏落地方案。目前海外游戏聊天社区 Discord 推出了基于 ChatGPT 的聊天机器人 Clyde,它 允许被用户召唤到对话中,可以实时多轮回答用户的问题,还可以向频道发送 Gif 动图,推荐音乐及更多其他内容。 此外,Discord 还将基于 OpenAI 的技术推出另外两项功能,包括内容过滤器系统 AutoMod AI,以及助用户捕捉错过 对话的内容服务 Conversation Summaries。5 月 16 日,亚马逊旗下 Amazon Games 和恩布雷瑟集团双方达成合作, 同意开发并发行一款基于《指环王》世界观的全新大型多人在线(MMO)游戏。 国内诸多厂商已开始使用大模型于游戏开发。《原神》的创作方米哈游正准备加入国内知名大模型创企 MiniMax 进行 新一轮融资;腾讯的 AI Lab 已经将 AIGC 技术应用于王者荣耀等旗舰游戏;众多游戏公司都在招聘网站挂出寻找 AIGC 工程师及美术设计师的公告。网易宣布《逆水寒》手游将实装国内首个“游戏 GPT”,结合网易伏羲 AI 技术,游戏 内 NPC 可以做到无设定自由交互,更贴近真实的开放世界。富春股份接受调研时,表示目前已搭建本地化 AI 应用工 具,且在积极探索、尝试 AI 互动和游戏结合的玩法,增强用户体验感。部分游戏厂商开始寻求工程技术和 AI 协同的 突破。5 月 15 日 SPARK 2023 腾讯游戏发布会上,马晓轶透露,腾讯游戏正在推进跟英伟达等全球多家顶级厂商的 深度合作,尝试将游戏引擎和工具链打造成一个可以跨团队、跨公司协作的“联机游戏”,让更多人,甚至人和程序、 人和 PCG 技术、人和 AI,都能一起在虚拟空间中协作,打造出下一代实时协作技术方案。
4) AI+影视
全新工具赋能视频生成,海外龙头公司商业模式已落地。2021 年,Runway 提出划时代的 diffusion 模型,取代 GAN 成为主流图片生成模型。2023 年 3 月 20 日,runway 发布新一代文字生成视频模型 Gen-2,将 AIGC 正式带入视频 生成领域。相比上一代视频编辑产品 Gen-1,Gen-2 最大的不同在于能根据用户的语言或图片描述,自动生成高质量 视频。具体来看,Gen-2 功能包括根据文字生成视频、根据图片生成视频、改变视频风格、渲染、蒙版与定制化。 Runaway 采用订阅制,收费模式为个人专业版 12 美元/月,可生成 44 秒视频或 125 张图像;团队版 28 美元/月,可 生成 160 秒视频或 450 张图像。我们认为,AI+视频主要解决视频制作团队降本增效的问题,相关应用能显著减少团 队在拍摄、剪辑与宣发等环节成本,故未来 B 端市场空间将更加广阔。
从玩具到工具,AI+影视在海外已有实用案例。随着观众审美水平的不断提高,一支好的作品需要制片方在前、中、 后期投入大量的资源与精力进行制作与打磨,而 AIGC 的引入可以从各环节优化流程,实现影视作品文化价值与经济 价值的最大化。在前期工作中,AIGC 可以通过对海量剧本进行分析,按照预设风格生成剧本初稿,为剧本创作提供 思路。例如纽约大学利用人工智能编写的电影剧本《Sunspring》,拍摄后入围伦敦科幻电影 48 小时挑战 10 强。在电 影制作中,AIGC 可以扩展角色和场景创作。例如电影《指环王》使用 Massive“虚拟环境群体模拟系统”制作数十万个 数字人群演,在节省经费的同时达到预期的拍摄效果。
国内龙头腾讯亦推出产品,多家公司积极布局。目前“腾讯智影”提供了 AI 绘画、数字人、智能配音三大功能,主 要目的是解决 PGC 的工业化规模产出和 UGC 的创意转化难的问题,以 AIGC 的方式提升创作者的生产效率。“腾讯 智影”主要面向短视频创作者,其特色功能为正版版权素材和数字人播报。用户可以通过上传照片和文本,生成一段 由照片人像讲述的视频。搭配使用智能 AI 配音功能,使用者还能选择不同的音色。AI 绘画具备图生图、文本生图能 力,搭配使用智能 AI 配音功能即可迅速生成可及时发布的短视频内容。此外,商汤、百度、昆仑万维等上市公司亦 基于自身大模型推出 AI+影视相关应用,例如商汤“如影”平台将提供视频创作、图片生成、数字人直播等功能。
2、AI+下一阶段关注重点——以大模型为入口向终端应用扩散
Open AI 开源插件,大模型作为触达人工智能的关键入口。5 月 13 日,OpenAI 宣布将在下周向所有 ChatGPT Plus 用户开放 web browsing 和 Plugin 功能,将使得付费用户可以通过 ChatGPT 访问互联网并使用 70 多个第三方插件; 在此之前 OpenAI 联合创始人 Greg Brockman 在“2023TED”大会现场分享了多个 ChatGPT Plus 的新功能和插件, 展示了跨平台系统的自动化、事实核查、复杂数据可视化等功能。ChatGPT 插件是专门设计用于扩展 ChatGPT 功能 的互联网连接工具,相当于给 ChatGPT 配备了一套工具箱,将更大范围地扩展其理解力、集成性和实用性。插件系 统 plugin 的开放有助于 ChatGPT 扩展到各个领域,AI+应用落地百花齐放。截至当前,各海外头部公司已经基于GPT 发布 Microsoft 365 Copilot、New Bing、Dynamic 365 Copilot、BloombergGPT、Teladoc Health、Expedia 等 应用软件,ChatGPT 技术已经进入产业印证期,实现了办公、教育、搜索引擎、金融、医疗、酒店差旅等各类场景的 应用。而伴随 C 端优质场景落地,B 端垂类数据积累优势凸显,AI+应用将百花齐放。 大模型自主可控具有极强意义。ChatGPT 问世后不久,便引起了各国政府对于大语言模型的监管与安全问题的担忧。 3 月 31 日,意大利率先宣布禁用 ChatGPT。4 月 3 日前后,德国、英国、韩国等监管部门纷纷采取措施加强对 ChatGPT 监管。4 月 11 日,我国也出台了第一份对生成式 AI 进行监管的文件,国家互联网信息办公室正式发布《生成式人工 智能服务管理办法(征求意见稿)》。同日,美国商务部就 ChatGPT 等 AI 工具监管措施公开征求意见。中美两国对 于大模型监管的高度重视凸显了大模型自主可控对于个人隐私、行业数据乃至国家安全的重要意义,我们认为,即使 Open AI 将 GPT 开源,大部分国内厂商仍会优先选择国产大模型进行接入。
国产大模型将开启新一轮“AI+”应用浪潮。自 3 月 16 日百度发布文心一言以来,国内厂商纷纷推出大语言模型,并在影视、电商、汽车相关应用上实现大语言模型的落地。站在当前时点,上游的平台已经基本搭建完毕,我们认为, 下一阶段大模型将作为触达人工智能的关键,AI+行情将以大模型为入口向 AI+消费电子、AI+机器人等硬件领域与众 多 AI+应用领域演绎,从 AI+应用发展历程看,细分领域的 AI+应用往往先兴起与国外,但不久之后国内厂商便后来 居上,故研究时需要注重细分行业的海外映射。除此之外,云计算是 AI+时代解决算力问题的重要方案。
1) 云计算
大模型时代算力仍为稀缺资源。大模型构建过程中的训练、微调、推理等步骤均需要进行大量计算,对于算力的需求 呈指数级提升,据英伟达数据,以 Transformer 模型为基础架构的大模型算力需求每 2 年提升 275 倍。大模型优异的 生成能力来源于数以亿计的模型参数,当参数突破千亿级后,模型便可能产生所谓的“涌现”能力。根据最新论文对 “涌现”效应的研究,当模型训练量小于 10^22 时,模型在几个自然语言处理任务上准确率都在 0 附近,当模型训练 量超过 10^22 后,模型准确率有了很大的提升,该效应被称为“涌现”。据招商计算机团队测算,GPT-3 大模型训练 算力总需求为 315ZettaFLOPS,若使用 1 万张英伟达 V100 芯片训练,仍需要 14.59 天完成。 自建算力集群过于昂贵,云计算将成为中小厂商入局关键。截止目前,英伟达生产的 A100 和 H100 是最适合做训练 的 AI 芯片,但其昂贵的价格却让小厂商望而却步。据招商计算机团队测算,自建一个类 GPT-3 大模型算力基础设施 成本超过 2.5 亿美元,仅有几家头部厂商能够承受如此高额的资本开支。毫无疑问,相较于自建服务器,租用头部玩 家的服务器训练自身模型,成为了中小厂商的破局之路。
头部企业开放云计算平台,化身卖铲者。微软 2018 年起便推出了智能云服务平台 AzureAI Platform,用户可通过简 单的 API 调用访问高质量的视觉、语音、语言和决策 AI 模型,并使用 AI 超级计算基础设施创建自己的人工智能模 型。谷歌云推出了新一代超算——A3 Virtual Machines,采用第 4 代英特尔至强可扩展处理器、2TB DDR5-4800 内 存以及 8 张英伟达 H100。A3 超算专门用于训练和服务 AI 大模型,可提供 26exaFlops 的 AI 算力。亚马逊也在 2023 年一季报中提到通过亚马逊云投放更多资源到人工智能领域,将迭代 ALEXA 原有的大模型,并推出新产品 Bedrock 去协助用户建立生成式人工智能。
2) AI+消费电子
AI 赋能之下,消费电子有望重现 Airpods 发布后的持续上涨行情。消费电子的大行情常需要爆款产品的驱动,2016 年 9 月苹果发布第一代 TWS 耳机 Airpods,当年全球 TWS 耳机出货量仅 918 万部,苹果 iPhone7 取消 3.5mm 插孔 后,TWS 耳机市场迅猛发展,2019 年 AirPods pro 的发布叠加 AirPods 早期用户换机需求,仅 2019 年上半年 TWS 耳机百年实现 4450 万出货量。伴随着 2017-2021 年全球 TWS 耳机出货量大幅增长的是消费电子牛市,作为苹果代 工厂,立讯精密和歌尔股份股价均跑出了新高,立讯精密自 2011 年押宝 TWS 耳机市场,正式切入苹果 Airpods 组 装业务,至 2019 年立讯精密已经占据 Airpods 七成市场份额;另外,2018 年歌尔股份拿下苹果 AirPods 30%代工 份额,成为 AirPods 全球第二大代工厂。2017-2019 年立讯精密和歌尔股份股价亦顺势起飞,歌尔股份股价最大涨幅 超过 6 倍。2023 年需重点关注 AI 赋能下,MR 头显、智能眼镜、智能手表、智能音箱等消费电子的创新。
MR 头显
苹果最快将在 6 月全球开发者大会(WWDC)上发布旗下首款 MR 头显装置。5 月 15 日,距离 6 月苹果全球开发者 大会(WWDC)已经不足一月,苹果 MR 设备迎来了第一个业内评价,VR 头显公司 Oculus 创始人 Palmer Luckey 在推特上发表 “苹果头显很棒”,盛赞苹果 MR 新品。由 于 GIS 负责与最终成品出货距离最近的镜头贴合业务,因此业界从 GIS 生产线动员时程研判苹果的 MR 新品最快会 在今年 6 月的年度开发者大会(WWDC)发布;目前,GIS 成都工厂已专门开辟该头显的镜头贴合生产线,正全力赶 工,预计第二季至第三季陆续开始量产出货。之前早在 3 月 27 日,苹果公司已在总部苹果园的史蒂夫·乔布斯剧院 内向公司的 100 名顶级高管演示了传闻已久的 MR 头显。 苹果 MR 新品有望成为继 iPhone、Mac、iWatch 之后全新现象级终端。苹果在 VR/AR 领域深耕多年,自 2010 年 来陆续收购或投资多家面部识别(Polar Rose/Emotient)、动作捕捉(PrimeSense/Ikinema)、眼动跟踪(SensoMotoric) 等相关企业。MR 项目自 2016 年启动来已打磨七年之久,有望成为继 iPhone、Mac、iWatch 之后全新现象级终端。 据已有的消息,这款头显将会是苹果有史以来设计最复杂的产品:内部拥有超高分辨率的 8K 显示屏和先进的眼球追 踪技术;搭载 15 个摄像头和传感器来精准的对眼球进行识别和追踪;搭载两枚 5nm 工艺芯片:一个图像信号处理器 ISP(代号为 Bora)和一个 SoC(代号为 Staten)。
背靠苹果生态和技术优势,MR 发布有望成为“MacItosh 时刻”,引爆消费电子新浪潮。苹果收购的 VR 创业公司 Vrvana 创始人 Bertrand Nepve 在接受加拿大电视台采访时表示,苹果首款 MR 的推出将是一个“Macintosh 时 刻”。苹果 MR 或将搭载全新操作系统“xrOS”,开发专属 App 应用程序,交互主界面与 iOS 较为相似,系统内置 照片、邮件、Safari、日历、健康等常见应用。而背靠苹果生态系统,苹果 MR 系统与应用有望融入苹果现有多移动 终端平台,使用者有望体验更具交互性的软件生态平台。“超短焦光学折叠光路”(Pancake)方案的采用、Micro OLED 的搭配、数位表冠对 AR/VR 模式快速切换的实现等相关技术的应用亦将加速产业链公司创新进程,引爆消费 电子新浪潮。与此同时,苹果在内容生态上的构建,有望 MR 为代表的头显设备在教育、医疗、金融等 To B 端和游 戏、文旅、影视等 To C 端不断落地,拉动游戏人、游戏等消费领域和商业生态领域的爆发。
智能手表
3 月 22 日,苹果将其于 3 月初批准的适用于 Apple Watch 的 ChatGPT 应用程序 watchGPT 正式更名为“Petey”,并 推出加入 GPT-4 支持的 Petey 1.2 版本,用户无需键入即可快速获得问题答案或生成相关信息;而安卓系智能手表方 面,第三方应用程序 WearGPT 已经上线谷歌 Play 商店;3 月 2 日,华米宣布其新款 Amazfit Falcon 运动智能手表 将上线 ChatGPT 表盘。
智能眼镜
4 月 6 日,META 推出具有查找和分割图像中任何对象的 SAM 大模型,可用于在 VR 和 AR 场景中根据用户的目光交 互显示对象的相关信息,为 AI 大模型在计算机视觉方面赋能 AR 等智能终端设备打通底层技术基础;4 月 11 日,美 国智能眼镜开发商和零售商 Innovative Eyewear 官宣推出了一款名为“Lucyd”的手机应用,该应用可以为智能眼镜 用户提供 ChatGPT 的语音服务。据公司新闻稿表述,Lucyd 这款 app 可以与许多其他可听设备一起使用,包括苹果 无线耳机 AirPods,用户可以语音唤醒 Lucyd,不需要键入文字和解锁手机屏幕。当然,用户也可以通过公司智能眼 镜产品内置的麦克风向 ChatGPT 提出问题,并通过眼镜的立体声扬声器听到聊天机器人给出的回答内容;4 月初, 斯坦福大学的的一组学生研究人员开发了“rizzGPT”,这款被戏称为“作弊神器”的 AR 眼镜可以通过 OpenAI 最新的 语言模型 GPT-4 生成聊天内容,然后输入 AR 单片眼镜,让用户可以像看提词器一样实时阅读这些内容。
智能音箱
4 月 4 日,脱口秀演员鸟鸟在微博展示了自己的数字分身——“鸟鸟分鸟”,并与其进行了多次互动,多轮对话,该分 身为搭载于阿里旗下智能语音终端产品天猫精灵上的类 ChatGPT 语音助手,能够模仿人类的音色、语气以及文本风 格,形成“个性化”大模型,其定制化特征契合语音交互场景。“未见其人,先闻其声”,此时阿里大模型尚未正式发布, “鸟鸟分鸟”作为大模型内测版引发市场关注。根据财联社新闻,4 月 11 日阿里云峰会上,业内人士称天猫精灵将率先 接入测试阿里 AI 大模型“通义千问”。
3) AI+机器人
海外科技巨头布局人形机器人,Optimus 和 Nvidia VIMA 掀起“人形机器人”浪潮。5 月 16 日,特斯拉 2023 股东 大会展示了 Optimus 人形机器人最新进展,包括捡起物品、环境发现和记忆,基于 AI 模仿人类动作,能完成分类物 品的复杂任务。从视频中能够看到,特斯拉机器人取得全方位进展,运动控制能力持续进化,AI 能力大幅提升。5 月 17 日,NVIDIA 创始人黄仁勋在 ITF 2023 年半导体大会上向观众介绍了多模态人工智能技术 NVIDIA VIMA,VIMA 能根据视觉、文本提示执行任务。谷歌 PaLM-E 作为多模态具身视觉语言模型,不仅能够理解图像,还能理解、生成 语言,执行各种机器人指令而无需重新训练;微软持续探索将 ChatGPT 扩展到机器人领域,从而运用语言直观控制 机械臂、无人机等,而早在 3 月 28 日,OpenAI 领投挪威机器人制造商 1X Technologies A2 轮投资,以创造具有实际应用价值的机器人。
人形机器人有望持续印证“AI 软切硬”逻辑,有望成为 AI+硬件终极应用。NVIDIA 创始人黄仁勋认为,下一波人工 智能浪潮是“具身人工智能”,即能够理解、推理并与物理世界互动的智能系统。不同于传统机器人仅具有“物理” 执行力,大模型可通过将图像、文字、具身数据联合训练,引入多模态输入,进而提升大模型和环境的交互能力和学 习能力,为机器人注入了“灵魂”。GPT-4 赋予机器人高质量的连续对话能力,Meta 发布 SAM 模式有望助力机器视 觉迎来 GPT 时刻,使其做到“能听、能看、能说”。 人形机器人需求潜力大,预计 21-30 年全球市场规模 CAGR 能达到 71%。人形机器人应用需求大,在智能制造、智 能服务、人机协作等方面都将有广阔的应用场景。特斯拉股东大会上,马斯克称特斯拉的长期价值将主要来自人形机 器人,并预测人形机器人需求将达 100 亿台,远超汽车,如果机器人与人的比例为 2:1,需求将达到 200 亿台。据麦 肯锡报告,到 2030 年,全球约有 4 亿个工作岗位将被自动化机器人取代,按 20%渗透率和 15-20 万人形机器人单价 来测算,全球人形机器人市场空间可达到 12—16 万亿元。中性预测下,2030 年全球人形机器人市场规模 855 亿元, 2021-2030 年市场规模 CAGR 可达到 71%。根据中国电子学会数据,国内机器人 2024 年有望达 251 亿美元市场规 模,2020-2024 年 CAGR 约 22%。
人工智能和机器人相关政策密集出台,国内人形机器人发展提速。2023 年 1 月,工信部等十七部门发布《“机器人 +”应用行动实施方案》,该政策明晰了“十四五”期间机器人行业的发展目标。5 月 19 日,科技部部长王志刚在 2023 第七届世界智能大会开幕式暨创新发展高峰会上表示,将加大人工智能基础理论和前沿技术研发布局,打造一批人工 智能区域高地和技术平台。地方政府出台具体行动方案,落实顶层设计。4 月下旬以来,北京市印发《北京市机器人 产业创新发展行动方案(2023-2025 年)(征求意见稿)》明确指出成立人形机器人产业开放联盟,到 2025 年,建成人形机器人通用行为控制大模型服务开发平台、共性技术服务平台、后陆续引发《北京市促进通用人工智能创新发 展的若干措施(2023-2025 年)(征求意见稿)》和《北京市加快建设具有全球影响力的人工智能创新策源地实施方 案(2023—2025 年)》,以推动人工智能发展取得变革性、颠覆性突破。
国内厂商开始进入 AI+机器人赛道。中科创达基于 Android 和 ROS 系统,定制优化而成的机器人专用操作系统,对 系统底层、中间件进行了大量的裁剪和优化,集成了机器人环境感知、行动所需的软件包、算法、传感器引擎,以及 相应的开发接口。在产品方面,中科创达融合智能音箱与机器人,对其加以 Rubik 大模型的不断训练,已经实现了能 够自由对话的智能销售机器人,可以自主回答客户关于企业及产品的各种问题。4 月 27 日,阿里巴巴董事会主席兼 CEO 张勇透露,阿里云工程师正在实验将千问大模型接入工业机器人,在钉钉对话框输入一句人类语言,即可远程 指挥机器人工作,并发布了演示视频。
人形机器人发展需“硬件”“软件”两手抓,未来人形机器人的发展将很大程度上取决于精密减速器和机器视觉两方 面的技术性突破。精密减速器作为人形机器人的核心零件,对其执行和运动的稳定性和完整度具有重要影响;而机器 视觉是人形机器人“看见世界”的重要突破口。目前这一预判在 2023Q1 的资本市场得到初步印证。根据高工机器人 研究所数据显示,2023 年第一季度,中国工业机器人领域融资案例 16 例,涉及资金近 9.5 亿元人民币;按融资案例 分布来看,2023 年一季度融资案例数量最多的是机器视觉领域(38%),其次是零部件领域(31%);融资金额最大 的领域分别是机器视觉(35.5%)。
4) AI+教育
AI 赋能教育降本增效成果显著。教育者越多,教育对象人数越少,教育效果越好,但教育边际成本越高,这意味着在 传统教育领域,教育效果和成本之间需要权衡。但在 AI 的发展下,“测试-学习-联系-测试-答疑”这一常见的教学流 程可以形成“千人千面”的教育系统,精细化“因材施教”和“个性化”教育能够得到实现,同时亦能兼顾边际成本 最小化和教育效果最优化。 海外教育应用平台已引入 AI 辅助教学。国外教育平台 Quizlet 率先采用 ChatGPT,推出“Q-Chat”家教软件,其可 通过有趣的聊天体验,根据学习材料提出可选问题,帮助学生学习语言且形成良好学习习惯。教育平台多邻国上的 Roleplay 机器人已经能与法语、西班牙学习者聊天,纠正学习者错误并提出建议以提高其词汇量。同时公司对大语言 模型进行二次开发,使其以教师身份出现,而教师会随着学习者的进步变得高级,颇有“教学相长”意味。美国可汗 实验学校的 Khanmigo 基于 GPT-4 等模型开发了个性化学习工具,如“辅导我”模式和针对不同科目的测验板块。
新东方、好未来等大型教育集团和科技集团均推出 AI+教育。新东方以智能答题器等硬件入手,结合智能设备可登录 的 APP 等,通过学生答题和迭代测试情况,得到学生学习曲线、遗忘曲线、知识点归因等分析,推出综合个性化学 习方案。好未来教育于 2 月初上线 AI 讲解机器人,且未来将利用 ChatGPT 相关技术对学习机等产品进行迭代。5 月 5 日,网易有道发布了基于“子曰”大模型开发的 AI 口语老师剧透视频,不同于以往只会进行死板剧本式对话的 AI 口语老师,该 AI 口语老师为用户提供了开放式的聊天场景,更符合真实的口语练习环境,并能够在结束对话后快速 生成结果报告。同日,学而思传出正自研数学大模型 MathGPT,且与年内推出基于该大模型的产品级应用。5 月 6 日,科大讯飞发布讯飞星火认知大模型,并展示了“大模型+AI”的功能,其中包含批改语文或英语作文,模拟口语老 师实景对话等。
5) AI+办公
海外率先布局 AI+办公,GPT 接入 Office“全家桶”。3 月 16 日微软推出 Microsoft 365 Copilot,其将大语言模型与 Microsoft Graph 中的数据及 Microsoft 365 中的应用相结合,只需输入简单的语句命令,便能轻松实现众多功能,让 使用者从繁琐的工作中解放。在 Word 中,Copilot 可以创建初稿、向现有文档添加内容、汇总文本以及重写部分或整 个文档以使其更简洁,甚至只需一句简单的命令,Copilot 就能自动改变行文风格;在 Excel 中,Copilot 可根据所输 入自然语言的需求插入公式、进行相关性分析并且创建可视化效果;在 PPT 中,使用者可以输入自然语言要求 Copilot 将冗长的文本自动生成 PPT 并调整布局;在 Outlook 中,Copilot 可以自动将邮件分类、提取关键信息、起草邮件。
国内多家企业陆续发布应用,AI 赋能办公领域。4 月 11 日,钉钉接入阿里通义千问大模型,用户输入一个“/”就能 调动 10 余种高能 AI 能力,包括自动生成群聊摘要、辅助内容创作、总结会议纪要、草图变小程序等,为 2300 万企 业提供智能转型抓手;同日,字节跳动旗下办公软件飞书发布视频,预告了其专属智能助手“My AI”。4 月 17 日,百 度官微宣布文心一言大模型在百度内部全面应用在智能工作平台“如流”上,助员工在日常工作中的思路构建、协作 沟通、方案策划、代码编写等方面提升效率;同日,金山办公正式推出具备大语言模型能力的生成式 AI 应用“WPS AI”,包括文本生成、多轮对话、润色改写等功能,计划嵌入金山办公全线产品。
6) AI+汽车
通用汽车率先布局,打响 AI+汽车第一枪。3 月 14 日,通用汽车在汽车圈率先宣布引入 ChatGPT,将基于 Azure 云 服务和 OpenAI 的技术来开发一款新的虚拟汽车助手。通用汽车副总裁 Scott Miller 称,ChatGPT 可以帮助车主获取 车辆使用的相关信息,或从日历中整合日程安排提醒车主待办事项。例如,聊天机器人可以在仪表板上出现诊断灯时 建议驾驶员采取什么行动。另外,ChatGPT 还可能用于汽车功能以外的语音控制。比如从“打开我的车库门”到“计 划一条去医生办公室的路”,再到“为我预留一个充电点”,诸如此类语音控制都可以实现。 国内厂商积极响应,大模型接入推动汽车智能化。百度将其大模型文心一言与智能座舱结合,生成更聪明的车载语音 助手“小度”。3 月 18 日,长安汽车旗下轿车序列的“新面孔”长安逸达正式上市,这是国内首款搭载文心一言的量 产车型,目前,还有更多的车企已开启文心一言的邀请测试。商汤基于“日日新 sensenova”大模型推出“SenseAuto 绝影”智能汽车平台,其拥有语言大模型以及数字人等多种生成式 AI 能力,可以为车舱提供更智能和人性化的人车 交互体验。目前已有超过 40 家行业客户和超过 60 款定点车型,定点车数量解决 2500 万辆。科大讯飞推出星火认知 大模型,与原有智慧汽车业务相结合。在 5 月 6 日的星火认知大模型发布会上,科大讯飞宣布星火大模型将与智慧座 舱结合,实现车内跨业务、跨场景人车自由交流,该模型更自由、拟人化、更懂汽车、更开放。
7) AI+商业
率先拥抱 ChatGPT,海外龙头 Shopify 实现个性化推荐等多项业务。Shopify 是全球领先的电商服务平台,3 月 1 日,OpenAI 刚开放 API,Shopify 便率先接入,将 ChatGPT 集成至自身网站服务。当用户搜索产品时,ChatGPT 会 化身购物助理扫描数百万种产品,根据客户要求做出个性化的推荐,帮助客户简化应用内购物流程。此外,ChatGPT 还能提供智能客服、分析用户评价数据、撰写推广文案与优化商品描述等多项服务。作为全球领先的 SaaS 服务商, Shopify 这一开先河的举动有望引领行业趋势,吸引更多企业接入 ChatGPT API。
国内厂商另辟蹊径,数字人化身电商主播。小冰公司为花西子创制数字人“佳人”,打造 7X24 小时不间断数字人直 播间,可随时搭建,随时待波、随时插播,满足花西子品牌自播需要。腾讯推出云智能数智人,采用语音交互、虚拟 形象模型生成等多项 AI 技术,实现唇形语音同步和表情动作拟人等效果。虚拟技术提供商世优科技目前已将 ChatGPT 技术接入数字人产品当中;智能内容生成平台来画也在 3 月底正式接入 ChatGPT,短短几十秒就能生成一篇高质量 视频文案,并推出数字 IP+直播模式。
8) AI+搜索
较传统搜索,AI+搜索在理解力、搜索准确度和个性化三方面具有优势。AI 大模型在海量数据训练下,具有强语义理解能力,可更好理解搜索目标和潜在问题,而传统搜索引擎只可进行“关键词”匹配和“近义词”联想来呈现搜索结 果;AI+搜索能够很好去除传统搜索引擎大量同质化和片面化的低信息熵内容,更好过滤信息噪音,在搜索准确度上 更胜一筹;AI+搜索具有强学习能力,在使用过程中优化输出结果以更好贴合用户习惯,更具个性化。
微软和谷歌搜索巨头布局“AI+搜索”,亚马逊考虑启动类 ChatGPT 电商搜索。微软内置 AI 聊天功能的 New Bing 基于 GPT-3.5 改良的 Prometheus AI 模型;对于搜索结果的呈现,New Bing 能够对搜索结果进行提取、优化整合和 分析,且标明信息来源,生产力工具作用凸显。根据微软副总裁 Yusuf Mehdi 称,New Bing 在推出一月后日活跃用 户已突破 1 亿,而移动端 Bing 在 AI 机器人加入后日活跃用户增长了 6 倍。New Bing 出世后,谷歌亦演示了其基于 自研大语言模型 LaMDA 的对话机器人 Bard,但由于测试图中包含事实性错误,发布情况不及预期。在 2023 年谷歌 I/O 大会上谷歌母公司 Alphabet 首席执行官皮查伊表示“正在重新塑造包括搜索在内的所有核心产品”,将生成式 AI 整合到搜索引擎和其他产品中,例如可以生成草稿信息的 Gmail,以及可以对图像进行重大修改的 Google Photos。 此新的搜索服务被命名为“搜索生成体验”。同时谷歌正为其图像搜索增加两个新功能,以减少虚假信息的传播。电 商巨头亚马逊正在通过“交互式对话体验”重构亚马逊搜索,这项工具需要回答用户的提问、比较产品,并提供个性 化建议。从亚马逊的招聘文件中,亦印证了亚马逊正在开展一项新的“AI 优先”项目,通过使用超大规模的下一代深 度学习技术来重新构建搜索的方式。
国内搜索引擎巨头亦开始争先布局 AI+搜索引擎。三六零集团已发布 360AI,与自身搜素引擎生态结合,具备知识性 科普文本生成能力,其创始人周鸿祎在 4 月 21 日的内部信中强调对人工智能资源投入的重要性;昆仑万维于 4 月 26 日宣布旗下的 Opera 浏览器和人工智能研究室 Open AI 团队达成合作,在浏览器内正式接入 ChatGPT,并于 5 月 6 日发布全新浏览器产品 Opera One,该产品为全新适配 AI 的浏览器版本。在垂直搜索领域,知乎平台于 4 月 13 日 联合大模型企业面壁智能推出了“知海图 AI”中文大模型。
9) AI+医疗
海外科技巨头加快布局 AI+医疗,微软发布医疗行业首款结合 GPT-4 模型应用。3 月 20 日,微软旗下语音识别子公司 Nuance Communications 发布一款 AI 临床笔记软件,该软件名为 Dragon Ambient eXperience (DAX) express, 主要面向医护人员,该软件由 GPT-4 驱动,可几秒钟内自动生成临床笔记草稿,是医疗行业第一款结合 GPT-4 模型 的应用。3 月 22 日,英伟达官网显示,全球 100 多家医疗保健企业正在与 NVIDIA 就 Clara 模型合作,推动人工智 能加速解决方案。Clara 模型可以用于药物设计,通过不同 AI 生成分子,来完成蛋白质生成、分子生成与对接等任务, 甚至可以预测蛋白质和分子的三维相互作用,从而优化药物在体内的作用方式。在 3 月 21 日举行的英伟达春季 GTC 大会上,英伟达宣布将与三井物产株式会社(Mitsui)就 Tokyo-1 项目展开合作,旨在通过高分辨率分子动力学模拟 和用于药物发现的生成式人工智能(AIGC)模型等技术,来提高日本制药实力。日本的制药公司和初创公司预计都可 以参加 Tokyo-1 项目,三井物产子公司 Xeureka 将负责运营 Tokyo-1,并在今年晚些时候正式上线这一项目。
国内 AI+医疗紧随其后,百图生科 AIGP 平台发布,提供多种蛋白质生成能力。3 月 23 日,百图生科在官方微信公众 号发布文章显示,百图生科在北京发布生命科学大模型驱动的 AIGP——AI Generated Protein 平台。百图生科 (BioMap)是首家超大规模 AI 模型驱动的生命科学研发平台,成立两年多以来,百图生科一直致力于打造生命科学 领域的 AI 大模型,构建了千亿参数的跨模态大模型“xTrimo”,该大模型从跨物种、跨模态的生命信息中学习蛋白质如 何构成和实现功能、如何相互作用、如何组合和调控细胞功能的关键规律,从而破解生命的自然语言——蛋白质。基 于大模型,AI 在一系列任务算法上取得了明显的进展,除了更好地完成结构预测等基础任务外,也开始可以根据不同 的问题输入,以生成的方式,设计创新的蛋白质,来回答各种生命科学问题。目前,百图生科 AIGP 平台设置了 3 类 功能模块,分别是 Function to Protein Design(F2P,根据结构、功能、可开发性等功能指标设计/优化蛋白质)、Protein to Protein Design(P2P,给定抗原等目标蛋白,设计与之以特定方式结合的抗体等蛋白)、以及 Cell to Protein Design (C2P,给定细胞,发现调控细胞功能的靶点蛋白并设计相应调控蛋白)。
在政策方面,我国相继出台了 AI 医疗相关文件,对 AI 技术在医疗领域的应用提出指导方向。3 月 23 日,中共中央 办公厅、国务院办公厅印发了《关于进一步完善医疗卫生服务体系的意见》,并发出通知,要求各地区各部门结合实 际认真贯彻落实。意见提出,发展“互联网+医疗健康”,建设面向医疗领域的工业互联网平台,加快推进互联网、区块 链、物联网、人工智能、云计算、大数据等在医疗卫生领域中的应用,加强健康医疗大数据共享交换与保障体系建设。 建立跨部门、跨机构公共卫生数据共享调度机制和智慧化预警多点触发机制。推进医疗联合体内信息系统统一运营和 互联互通,加强数字化管理。加快健康医疗数据安全体系建设,强化数据安全监测和预警,提高医疗卫生机构数据安 全防护能力,加强对重要信息的保护。
四、结论
“AI+”将开启新一代产业革命。新技术的诞生和导入是产业革命的驱动力量,当下人工智能有望开启新一轮产业革 命,技术端,AI 由决策式向生成式进化;生产要素端,数据要素得到重视,相应基础制度初步完善。目前 AI+正在积 蓄力量,有望再度大幅提高生产效率。历史上的技术革命对资本市场的拉动作用不可轻视,AI+新业务、新模式和新 产品的出现将为 AI+发展提供持续动能。因此,我们看好 AI 技术带来的颠覆式产业革命,AI+中长期向好大逻辑不变。
本轮“AI+”行情尚处于初期。2013-2015 年,TMT 板块走出了波澜壮阔的大牛市,“互联网+”是那轮牛市中最耀眼 的主题。该轮牛市的背后是通信技术的进步带来的移动互联网的快速发展,形成不可阻挡的“互联网+”热潮,带动 产业链相关公司顺周期上涨。2013 年由“互联网+”推动的 TMT 大牛市主要呈现三个阶段,受益于政策与业绩的支撑 传媒板块率先领涨,随后呈现“软切硬”的特征,上游通信、电子及半导体公司得益于下游旺盛的需求,量价齐升、 获得超额受益。本轮 AI+行情有望复制 2013 年“互联网+”行情,当前 AI+尚处于新技术导入期前半段,在新业务、新 模式、新产品生产方面尚未完全发力,基于此,我们认为“AI+”行情依然处于初期。
大模型是人工智能的核心入口。回顾历次“入口革命”,Windows 系统降低 PC 使用门槛,催发互联网繁荣;iPhone 的出现及其 iOS 独特生态成为了移动互联网时代的导流入口,拉开了移动互联网时代的序幕,可见“新入口”的提供 和接入不仅能带来系统和应用的繁荣,同样具有划时代的重要意义。而正如通用大模型之于 Windows 移动系统, ChatGPT Plugin 之于 iOS App Store,二者协同有望成为人工智能以及万物互联网的核心入口,将为更多现实载体接 入大模型提供契机。当越来越多的现实载体通过插件接入通用大模型,现代人类的生活可能发生颠覆性变化,万物互 联的“AI+”时代或不再遥远。
国产大模型将开启新一轮“AI+”应用浪潮。海外 Open AI 开源插件系统 plugin,付费用户可以通过 ChatGPT 访问互 联网并使用 70 多个第三方插件,AI+应用落地百花齐放。下一阶段大模型将作为触达人工智能的关键,人工智能行情 将向 AI+消费电子、AI+机器人等硬件领域与众多 AI+应用领域演绎,从 AI+应用发展历程看,细分领域的 AI+应用往 往先兴起与国外,但不久之后国内厂商便后来居上,故研究时需要注重细分行业的海外映射。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
精选报告来源:【未来智库】。