资料来源:中国互联网协会。
2023年5月19日,在第七届世界智能大会“世界智能科技创新合作峰会”期间,在中国互联网协会、中国软件行业协会指导下,由天津人工智能学会、支钉科技、支钉智库联合编制的《2023年全球生成式AI产业图集》和《2023年全球生成式AI产业研究报告》面向政府部门、行业从业者、教育工作者和社会发布。
图片来源:由** AI工具生成。
作为人工智能的前沿领域,生成性AI已经成为全球最热门的科技话题。2022年,OpenAI发布了ChatGPT,生成式AI实现了模型应用的重要突破。短短两个月就突破1亿月活跃用户,成为史上增长最快的消费应用。全球众多科技公司在生成式AI领域加大了对R&D的投入,不断推出技术、产品和应用的重要成果,持续推动人工智能的创新和商业化,这也将带动产业链相关企业的快速发展。
在此背景下,在中国互联网协会、中国软件行业协会指导下,天津人工智能学会、支钉科技、支钉智库联合发布了《2023年全球生成式AI产业研究报告》,从全球视角梳理了生成式AI的产业概况、基础设施、算法模型、场景应用、机遇与挑战,全面展示了生成式AI的产业发展,供政府部门、行业从业者等参考。
01生成式人工智能产业概述
1.1生成性人工智能概念和内容生成阶段
生成式AI (Generative AI)是继专业生成内容(PGC)和用户生成内容(UGC)之后,利用人工智能技术自动生成内容的一种新的生产模式。
基于海量训练数据和大规模预训练模型,生成式AI自动生成和创建文本、音频、图像、视频和跨模态信息。自2022年OpenAI发布ChatGPT以来,全球掀起了一股生成式AI的热潮,许多科技公司推出了生成式AI模型、产品以及相关的基础设施和服务。
1.2生成性人工智能产业发展的驱动力
近年来,全球数据规模持续增长。IDC预测,到2025年全球数据规模将达到175ZB,为人工智能模型训练提供海量数据资源;高性能AI芯片的引入,为大规模预训练模型提供了重要的计算支持;随着技术的不断发展,Transformer、BERT、LaMDA、ChatGPT等模型实现了快速迭代优化。在数据、计算能力和模型的共同推动下,全球生成式AI产业快速发展,相关场景应用不断丰富。
02生成式人工智能基础设施
2.1 AI高性能芯片为生成式AI训练提供计算支持。
人工智能的发展已经从深度学习时代进入大规模模型时代,大规模预训练模型的参数呈指数级增长,需要高性能计算能力的支持。
目前大规模预训练模型的训练计算能力是过去的10到100倍。目前,NVIDIA Tensor Core GPU芯片广泛应用于主流生成式AI模型的训练中。例如,微软已经花费数亿美元购买了数万颗NVIDIA A100芯片,帮助Open AI构建ChatGPT。
2.2 AI计算集群为生成式AI训练提供大规模计算资源。
AI计算集群可以提供大规模的计算能力,不断提高计算能力资源的利用率,提高数据存储和处理能力,加速AI大模型训练和推理的效率。
目前,典型的AI计算集群,如英伟达DGX SuperPOD、百度智能云高性能计算集群EHC、腾讯新一代高性能计算集群HCC等,继续为生成式AI训练场景提供强大的计算资源,进一步降低模型训练的门槛和成本,推动生成式AI模型的落地进程。
2.3 AI云服务为生成式AI模型的开发提供平台支持。
人工智能预训练模型的发展对云服务的需求很大。AI云服务可以提供人工智能开发模块,通过多样化的服务模式降低开发者的开发成本和产品开发周期,为模型开发提供AI赋能。
一个典型的案例就是亚马逊SageMaker,可以提供图像/影像分析、语音处理、自然语言理解等相关服务。用户可以在不知道参数和算法的情况下实现函数的应用。
百度的EasyDL零门槛AI开发平台提供了图像分类、物体检测、文本分类、声音分类、视频分类等功能,实现了一站式自动训练,降低了AI定制化开发的门槛。
生成式人工智能算法模型
3.1全球生成式人工智能模型的发展历程
3.2语言类生成的主流模式:OpenAI GPT-1到GPT-4。
2018年以来,OpenAI发布了GPT-1、GPT-2、GPT-3、ChatGPT、GPT-4等一系列生成式预训练模型。GPT-1模型基于变压器架构,仅保留了架构中的解码器部分。
GPT-2模型取消了GPT-1中的监督微调阶段;
GPT-3模型抛弃了GPT-2的零射击,而使用少射击来给出特定任务的少量样本。ChatGPT通过采用RLHF(人类反馈强化学习)技术,增强了调整模型输出的能力。
2023年发布的GPT-4模型具有更强大的多模态能力,支持图文多模态输入并生成响应文本,能够实现视觉元素的分类、分析和隐式语义提取,表现出卓越的响应能力。
3.3语言类生成主流模式:Google Transformer到PaLM-E
2017年,谷歌发布了标志性的变形金刚模型。这个模型的解码模块成为了GPT模型的核心元素。通过引入注意机制,可以实现更大规模的并行计算,显著减少模型的训练时间,实现大规模AI模型的应用。BERT模型和LaMDA模型在信息提取能力和安全性方面都有所提高。
最新的PaLM-E模型具有很强的泛化和迁移能力。它可以处理多模态数据(语言、视觉、触觉等。)在完成视觉语言和通用语言任务的同时,实现引导机器人完成相应任务的功能。
3.4图像类生成的主流模型:扩散模型
扩散模型的研究可以追溯到2015年,2020年提出了去噪扩散概率模型(DDPM),展示了扩散模型的强大能力,促进了扩散模型的发展。该模型主要包括两个过程:正向过程和反向过程,其中正向过程又称为扩散过程。扩散模型通过在图像中加入高斯噪声来破坏训练数据进行学习,找出反转噪声过程的方法,利用学习到的去噪方法从随机输入合成一幅新的图像。
扩散模型的优点是生成的图像质量更高,并且不需要对抗性训练。在数据较少的情况下,模型的图像生成效果明显提高。
PART.04生成式人工智能场景应用4.1世界生成式人工智能典型应用概述
4.2生成式AI场景应用——文本生成
文本生成主要应用在内容延续、文本风格传递、摘要/标题生成和全文生成四个领域,相关的个性化文本生成和实时文本交互具有广阔的前景。
总的来说,基于NLP技术的文本生成是生成式AI的早期应用。世界知名科技公司相继推出文本生成工具,如微软、Xmind等,其他相关产品在文案、数据分析、演示、思维导图等方面都有相关应用案例。
4.3生成式人工智能场景图像生成的应用
图像生成的技术场景分为图像属性编辑、局部图像生成和变化、端到端图像生成。其中,前两个落地场景是图像编辑工具,端到端的图像生成对应两个落地场景:创意图像生成和功能图像生成。
目前,图像编辑工具已经得到广泛应用,相关产品也非常丰富。创意形象多以NFT的形式呈现,功能形象主要是营销海报/界面、LOGO、模型图、用户头像等。
4.4生成式AI场景应用——音频生成
音频生成在日常生活中很常见,其应用领域可以进一步分为语音合成和音乐创作。语音合成包括TTS和语音克隆。
TTS领域技术成熟度较高,但情感表达仍有欠缺;声音克隆对电影、动漫等行业意义重大,值得关注;音乐创作可以进一步细分为作词、作曲、编曲、录音、混音等方向,创作过程主要依靠变形金刚模型。
4.5生成式AI场景应用——视频生成
视频生成有望成为未来跨模态生成领域中的中高潜力场景。视频生成主要对应三个领域:视频属性编辑、视频自动编辑和视频部分生成。
视频属性编辑已经广泛应用于视频创作领域,大大提高了视频编辑的效率;视频自动剪辑主要处于技术试用阶段;视频部分生成的原理本质上类似于图像生成,强调的是将视频切割成帧,然后对每一帧的图像进行处理。目前的技术在于提高修改的准确性和实时修改。
4.6生成式人工智能场景的应用——数字人
数字人是指存在于非物质世界(如图片、视频、直播、VR)的多种人类特征的整合。数字人代表了从文本/音频等低密度模式向图像/视频/实时交互等更高密度模式的转变。未来,视频甚至是超宇宙都将是数字人的重要应用场景。
在生成式AI领域,数字生活可以分为数字人视频生成和数字人实时交互。数字人视频生成是目前应用最广泛的领域之一,数字人实时交互多用于可视化智能客服,更强调实时交互功能。
05生成性人工智能的机遇和挑战
5.1生成式AI时代,行政工作可替代性强,“问客户”有望成为一个新的职业。
生成性AI对就业的影响挑战与机遇并存。一方面,生成式AI会促进工作岗位的智能化升级,部分工作岗位会被取代。高盛分析称,生成式AI的智能自动化能力大大提高了工作效率,降低了运营成本。美国和欧洲的传统岗位会受到AI自动化不同程度的影响,生成型AI可以替代四分之一的工作岗位。
另一方面,生成式AI也将创造新的工作岗位:“提示工程师”允许人们使用自然语言作为提示,通过与AI的交互来获取信息或创作作品。此外,围绕人工智能的相关领域将创造大量新的就业岗位。
5.2生产AI作品的版权主要在软件所有者和用户之间分配。
生成式AI的本质是机器学习的应用,在模型学习阶段必然会使用大量数据集进行训练,但对于训练后产品的版权归属仍存在争议。
既然法律主体可以享有权利,那么生成性AI作品的著作权只能由对作品创作有贡献的人享有。相关人员包括软件开发者、所有者和使用者(主体身份可能重合)。一般认为,生成式AI软件开发者已从软件著作权中获得补偿,生成式AI作品的著作权主要在软件所有者和用户之间分配。
本网站声明:网站内容来源于网络。如有侵权,请联系我们,我们会及时处理。
温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信(j7hr0a@163.com),我们会及时处理和回复。
原文地址"ai 产业,2019年中国ai产业生态图谱":http://www.guoyinggangguan.com/qkl/143765.html。

微信扫描二维码关注官方微信
▲长按图片识别二维码