AIGC趋势观察与合
规应对研究报告(第
2023 年 11 月 8 日
AIGC趋势观察与合
规应对研究报告(第
2023 年 11 月 8 日
1
目 录
序言............................................................................ 2
第一章 AIGC 发展趋势观察 ........................................................ 4
一、AI 与 AIGC 简介 .......................................................... 4
二、AIGC 发展与前景 ......................................................... 7
第二章 AIGC 监管态势 ........................................................... 27
一、中国 AIGC 监管态势...................................................... 27
二、美国 AIGC 监管态势...................................................... 28
三、欧盟 AIGC 监管态势...................................................... 29
第三章 AIGC 法律风险分析 ....................................................... 29
一、版权确权风险与侵权风险................................................. 29
二、侵犯肖像及个人隐私数据风险............................................. 36
三、内容违法和伪造欺诈风险................................................. 40
四、AIGC 广告违规风险 ...................................................... 42
五、刑事风险............................................................... 46
第四章 AIGC 合规应对策略 ....................................................... 48
策略一:加强数据安全治理................................................... 49
策略二:加强算法治理....................................................... 51
策略三:加强内容治理....................................................... 52
附:法律法规及监管政策......................................................... 52
一、国内法律法规及政策..................................................... 52
二、海外法律法规及政策..................................................... 54
2
序言
随着科技的进步,人工智能已与市场经济密不可分。其中,人工智能生成内
容(Artificial Intelligence Generated Content,简称 AIGC)在丰富我们的
生活、提高我们工作效率的同时也正在颠覆式地改变着我们的经济。
在版权领域,在 AIGC 带来创作内容增长的同时,也面临更难以避免的侵权
风险及筛选、监管成本;在竞争领域,AIGC 为企业及专业人士插上了翅膀、更好
地在市场中竞争,但也为混淆、虚假宣传、侵犯商业秘密、商业诋毁等不正当竞
争提供了工具。在反垄断领域,AIGC 赛道越来越精彩,但因为数据、算力及技术
的差距,各企业间的差距开始体现,反垄断风险不断激增。同时,AIGC 在进一步
挖掘数据价值的同时,也给数据安全、个人信息及隐私保护带来了巨大的挑战。
可以说,新的赛道已开启,机遇与挑战并行。
在这号角刚刚正式吹响之时,我们愿与有志者们一同探索 AIGC 的未来,通
过专业的力量,为研发、运营、使用、交易及监管提供持续的法律支持。以合规
创造价值,助力产业高质量发展。
3
声明
本报告由泰和泰|数字经济法律研究院主笔,联合南都大数据研究院共同整
理、发布,仅供交流学习之用。转载或利用其他方式使用本文件的,应注明“来
源:泰和泰|数字经济法律研究院”。
同时,本报告内各文件均从官方途径或公开途径获得,本报告内各文件或援
引内容的著作权归各作者及译者所有!转载、摘编或利用其他方式使用报告内文
字或者观点的,应取得著作权人许可并注明来源。违反上述声明者,应承担相应
法律责任。
有关本报告的任何问题或交流,欢迎与我们联系。
联系方式:
中国 深圳市 福田区 新闻路 1 号中电信息大厦 3、4、11 层
3/F,4/F,11/F, Zhongdian Information Building, No.1 Xinwen Road
Futian District, Shenzhen, People’s Republic of China
电话 | TEL: 86-755-82562030 传真 | FAX: 86-755-82562030
联系人 | C.P.: 周才淇律师、易怀炯律师
手机 | MOB: 177 2261 8837、135 3782 4231
电子邮箱 | E-mail: caiqi.zhou@tahota.com、huaijiong.yi@tahota.com
4
第一章 AIGC 发展趋势观察
一、AI 与 AIGC 简介
(一)历史沿革
AI 即人工智能(Artificial Intelligence),
是通过计算机来模拟人类大脑思维方式的一门科学,
被称为 20 世纪 70 年代以来世界三大尖端技术之一。
随着近年来 AI 技术的迅速发展,AI 技术在我们生
活的世界已经被广泛应用,如人脸识别、个性化医
疗、智能辅导系统、AI 评分系统、自动驾驶汽车、
无人售货商店等,可以说 AI 在我们的生活中已具有
相当的影响力,并且从一定程度上改变了我们的生
活和工作方式。2022 年底,ChatGPT 更是凭借其强
大的“学习”能力以及“语言”能力风靡全球,成为
有史以来成长最快的应用程序,几乎在所有互联网
能够播撒到的地方它都倍受青睐,这也使得 AIGC 引
起了社会对于人工智能持续的关注和热议。
AIGC 即人工智能生成内容 ( Artificial
Intelligence Generated Content),属于 AI 应用
的重要领域,其核心是基于人工智能算法对大数据
进行学习,通过提炼、分析、模拟人类行为和创造力
进行预测或生成新内容。目前,对 AIGC 这一概念的
界定尚未统一。国内产学研各界通常是从创作主体
的差异,对 AIGC 进行理解及定义,即 AIGC 是“继
专业生成内容(Professional Generated Content,
1
中国信息通信研究院:《人工智能生成内容(AIGC)白皮
书》。
PGC)和用户生成内容(User Generated Content,
UGC)之后,利用人工智能技术自动生成内容的新型
生产方式”,将 AIGC 定义为“通过人工智能算法对
数据或媒体进行生产、操控和修改的统称”1
。
AIGC 内容生成主要涉及数据收集、数据分析处
理、模拟训练、内容生成以及完善。从它的技术特征
来看,AIGC 所谓的“创造力”是源于海量数据,海
量数据作为样本给了 AIGC 丰富的、源源不断的素材,
正是这种素材的累积和“学习”让 AIGC 得以进一步
创作新的作品。
虽然,AIGC 直到 2022 年底才迅速走红,但这项
技术的发展却由来已久。AIGC 的发展离不开 AI 技
术的支持,AIGC 随着 AI 技术的逐渐深入而演进。结
合人工智能技术的更迭,AIGC 的发展大致可以分为
三个阶段,第一阶段是指 20 世纪 50 年代至 90 年
代,可称为“早期萌芽阶段”,第二阶段是指 20 世
纪 90 年代至 21 世纪 10 年代,可称为“沉淀积累阶
段”,第三阶段是指 21 世纪 10 年代至今,可称为
“快速发展阶段”。在三个不同的阶段,AIGC 均呈现
出不同的特点、发展水平和意义。
在早期萌芽阶段,由于当时的科技水平有限,
AIGC 仅限于实验室内的小范围实验。1957 年,莱杰
伦·希勒(Lejaren Hiller)和伦纳德·艾萨克森
(Leonard Isaacson)通过蒙特卡罗算法将计算机
程序中的控制变量换成音符完成了历史上第一支由
5
计算机创作的音乐作品——弦乐四重奏《依利亚克
组曲(IlliacSuite)》。1962 年,R.M. Worthy 领导
开发了最早的诗歌写作软件 Auto-beatnik,该软件
只需输入语法结构和词汇,便可生成诗歌。1966 年,
约瑟夫·魏岑鲍姆(Joseph Weizenbaum)和肯尼
斯·科尔比(Kenneth Colby)共同开发了世界第一
款人机对话系统“伊莉莎(Eliza)”,其通过关键字
扫描和重组实现人机交互任务。80 年代中期,IBM 基
于隐形马尔科夫链模型(Hidden Markov Model,HMM)
创造了语音控制打字机“坦戈拉(Tangora)”,能够
处理约 20000 个单词。早期探索阶段的 AI 技术尚未
成熟,内容的生成主要依赖于预设的固定规则和模
板,AIGC 的交互对话也通常比较机械化,缺乏创造
性和多样性,也多无实用意义,因此在 20 世纪 90
年代左右,由于高昂的系统成本及无法带来可观的
商业变现,各国纷纷减少了在人工智能领域的投入。
但无论如何,早期萌芽阶段的 AIGC 仍然是一次跨越
性的尝试,实现了从无到有的蜕变,也为后期 AIGC
和机器深度学习奠定坚实的基础。
经过上一阶段的尝试,同时得益于计算机技术
的高速发展和数据统计学习方法在信息处理领域的
应用,在沉淀积累阶段,AIGC 开始摆脱固定的模板
和预设规则的限制,逐步从实验性转向实用性。此
时,互联网的兴起产生的大量数据有助于 AI 模型的
训练,让传统的一对多传播模式转变成多对多的互
2
胡正荣 樊子塽:《历史、变革与赋能:AIGC 与全媒体传播
体系的构建》,《科技与出版》2023 年第 8 期。
动模式,可生成更多个性化的内容 2
。1997 年,IBM
研发的国际象棋程序深蓝(Deep Blue)采用了决策
树搜索算法的机器学习模型,进行大量的学习训练,
实现决策内容的定制化,最终打败了世界象棋冠军
卡斯帕罗夫(Kasparov),成为 AIGC 发展历史上重
要的节点。同时,AIGC 通过大量双语语料库学习,
可以训练出更加自然流畅的文本,例如在 2012 年,
微软就曾展示过一个全自动同声传译系统,基于深
层神经网络(Deep Neural Network,DNN)可以自
动将英文演讲者的内容通过语音识别、语言翻译、
语音合成等技术生成中文语音。但沉淀积累阶段的
AIGC 依然存在算法瓶颈,创造性较差,应用不广,
实用性仍有待提高等问题。在 2007 年,纽约大学人
工智能研究员罗斯·古德温装配的人工智能系统通
过对公路旅行中的一切所见所闻进行记录和感知,
撰写出世界第一部完全由人工智能创作的小说——
《1 The Road》。虽然这本小说存在许多明显的写作
问题、其可读性尚有优化空间,但不可否认的是其
象征意义远大于实际意义。
快速发展阶段是 AIGC 发展的最新阶段,自 2014
年起,随着以生成式对抗网络 ( Generative
Adversarial Network,GAN)为代表的深度学习算
法的发展,AIGC 开始朝多模块、跨模块内容生成转
变,生成式人工智能迎来了新时代,生成内容百花
齐放,涵盖图片、视频、音乐、绘画等多方位,效果
6
之逼真,内容质量之高。例如,2017 年,微软人工
智能少女“小冰”推出了世界首部 100%由人工智能
创作的诗集《阳光失了玻璃窗》。2018 年,英伟达公
司(Nvidia Corporation)发布的 StyleGAN 模型可
以自动生成图片,目前已升级到第四代模型
StyleGAN-XL,其生成的高分辨率图片,普通人眼难
以分辨真假。2019 年,DeepMind 发布了 DVD-GAN 模
型用以生成连续视频。2021 年,OpenAI 推出了 DALLE 并于一年后推出了升级版本 DALL-E-2,主要应用
于文本与图像的交互生成内容,用户只需输入简短
的描述性文字,DALL-E-2 即可创作出相应极高质量
的卡通、写实、抽象等风格的绘画作品。2022 年 11
月,OpenAI 推出全新的对话式通用人工智能工具—
—ChatGPT,它可通过深度学习理解人类的语言和思
维方式,并能与人类进行高质量的对话,提供个性
化服务,极大提高了人机交互的效率和体验。
(二)应用价值
AIGC 可以处理文本、图像、语音、视频、代码
等,在人类生活中具有广泛的应用空间,引领人工
智能的发展从 1.0 时代进入 2.0 时代。AI+搜索、AI
写作、AI 对话、AI 翻译等 AIGC 的产品在给人类生
活增加便利的同时,也实现了技术与产业的结合,
为社会创造了巨大经济价值,为数字经济发展注入
3 陈永伟:《超越 ChatGPT:生成式 AI 的机遇、风险与挑
战》,《山东大学学报(哲学社会科学版)》,2023 年第 3
期。
新的能量。AIGC 在各个行业领域的应用价值主要表
现如下:
1.金融领域,发挥数据优势。利用金融领域的
专业数据,将 AIGC 形成的大数据收集和分析成果运
用到金融信息和服务产品中去。
2.电商、自媒体等互联网领域,定制个性化服
务,颠覆内容生成。在自媒体、游戏、电商、广告等
依托互联网快速发展的行业中,AIGC 能够迅速渗透
进入相关领域,颠覆传统的内容产出模式,为客户
定制个性化的服务,既满足客户需求,也适应相关
行业快节奏发展的趋势,发挥最大的创造力和价值,
降本增效、抢占先机。
3.工业领域,建立精准模型,完成模拟测试。例
如工业设计、药物研发、合成数据等领域。
4.日常工作、生活,完成(协助完成)便捷交
互,简化工作。以通过一种近似人际交流的方式来
让计算机完成像检索信息、翻译、整理资料这样的
简单任务 3
。此外,在一些专业性强的行业领域内,
尽管现阶段 AIGC 发挥的空间虽比较有限,但也可以
作为其中某些环节强有力的辅助工作,从而发挥其
在文字、数字、信息处理方面的巨大优势。比如,
AIGC 可以替代人们完成很多繁琐的文案工作、检索
工作、翻译工作,提高工作的效率,从而释放出更多
时间及精力去解决其他工作。
7
二、AIGC 发展与前景
(一)行业现状
1.AIGC 产业链
由艾瑞咨询制作的《中国 AIGC 产业图谱全景图》
4
可见,我国的 AIGC 产业可大致分为应用层、大模
型层、工具层和基础层。
基础层作为产业链上游,其为中游的大模型层、
工具层及下游的应用层提供了算力、数据和算法基
础。而模型层和工具层是 AIGC 所较为独特、体现产
业特性的产业端,这一层级既包括了通用基础大模
型,也包括了基于通用基础大模型分化和具象化后
的行业垂直型基础大模型(如金融、医疗、电商)和
业务垂直型基础大模型(如企业服务、智能问答)。
任何技术都需要最终落回用户手中,AIGC 也不例外。
AIGC 应用层目前已经呈现“百花齐放”的状态,既
有偏向于“to C 端”的内容消费赛道、创作工具赛
道,也有偏向于“to B 端”的企业服务赛道。
从《中国 AIGC 产业图谱全景图》可见,不同类
型的参与者都存在——既有不少为大众所熟悉的
“互联网大厂”,也有在 AIGC 行业深耕的“新面孔”。
本就位于头部的互联网厂商在新技术出现时,
总是更有资源和机会接触到,他们也会第一时间研
究和发展相关技术,以免在迭代速度如此之快的互
联网时代丧失自身艰难取得的领先地位。同时,还
可以发现的是,这些头部互联网厂商由于先发优势,
4 艾瑞咨询:《2023 年中国 AIGC 产业全景报告》,第 12
页。
其不仅仅在一个产业链环节发力,而更多的是在全
产业链布局。例如阿里云,其在基础层(算力基础-
智能云服务;算法基础-AI 开发平台)、大模型层(通
用基础大模型、AI 开源社区、行业或业务垂直基础
大模型)、工具层(模型平台/模型服务)、应用层(创
作工具赛道、金融、零售、政务、店里、医疗)全领
域均有涉猎。
当然,除了熟悉的面孔之外,也出现了不少的
“新面孔”。如西湖心辰、硅基智能等。这些初创企
业主要聚焦在 AIGC 产业端的特定领域,以其特定的
比较优势力争在激烈的竞争中获得一席之地。
尽管 AIGC 产业已经涌入了互联网大厂、初创公
司、各类研究机构等各类型,但目前仍处于竞争窗
口期,各类竞争者的态势仍不明朗,其区别相对有
限,仍有待核心技术的突破和资源的最终整合。
图 2.5 中国 AIGC 产业图谱全景图 5
2.AIGC 行业技术现状:各模态处于初步可应用
状态,商业化落地持续推进
5 数据来源:IT 桔子、艾瑞咨询研究院
8
AIGC 从内容形态进行划分,可以分为文本、音
频、图像、视频、代码、多模态等。根据红杉资本预
测,AIGC 将首先在文本和代码领域落地应用,随后
逐渐拓展至图像和视频领域。
(1)AIGC 文本生成技术现状
文本生成可细分为对话、提炼总结、创作等多
种能力,以 GPT-36
、GPT-4 等为代表的大语言模型将
AI 文本生成能力拉升至接近人类平均水平。目前,
文本生成技术已经可以实现多种任务,如新闻摘要、
对话生成、诗歌创作等。此外,随着深度学习技术的
发展,文本生成技术的性能也在不断提升。
但当前在语言理解能力、稳定性、可控性和安
全性上还存在非常明显的应用瓶颈,且具体技术路
径及对应的训练效果也尚无定论。不过,随着 GPT3、GPT-4 的关注度不断提升,相应的文本生成模态
也得到了更多资本的投资和关注,其未来的发展前
景较好。2023 年下半年,微软公司逐渐在一部分国
家或地区的 Windows 11 的最新版本中提供了基于
GPT-4 的 Copilot 软件。
(2)AIGC 图像生成技术现状
图像生成可分为 2D、3D 及视频生成三个分支。
在 GAN、diffusion、NeRF 等模型框架基础上,图像
生成技术正在以超乎想象的速度迭代升级,部分散
点应用已取得良好效果。
6
GPT-3 是由 OpenAI 公司开发的,是一种预训练的语言模
型。它的训练过程采用了无监督学习方法,利用大量的互
联网数据进行预处理,使其能够理解和处理大量的自然语
言数据。
目前,图像生成技术已经可以实现多种任务,
如图像修复、图像增强、图像合成等。但在生成精准
可控性及算力成本等方面仍需优化。
(3)AIGC 音频合成技术现状
音频生成技术是 AIGC 技术的新兴领域,近年来
也取得了显著的进步。其经历了拼接合成、参数合
成和端到端合成三代技术演进,已实现规模化应用。
目前,音频生成技术已经相对成熟,可以实现多种
任务,如语音合成、语音识别、音乐生成等。当前,
技术升级方向在于通过提升语音的韵律感和情绪表
达等达到完全拟人的效果,以及实现语音实时合成。
甚至可以基于大数据的采集,低成本完成语音创意
和灵感探索。
(4)AIGC 多模态技术发展现状
多模态技术是文本、图像、语音等模态之间的
转换与融合,目前 AIGC 可以已经通过采集多模态
数据初步实现多重任务的完成,完成有效表达,
如多模态摘要、多模态对话、多模态图像生成等。
但其技术难度大,导致其当前成熟度水平较低,
仅在文字与图片转化、文字与语音转化等领域有
基本达到商用水平的表现。
(5)小结
一般而言,在评判相应技术是否达到一定成熟
度,会以生成内容质量、技术稳定性、技术安全性、
9
技术可解释性、个性化生成与定向微调效果、应用
成本等方面进行衡量。目前 AIGC 各模态在生成内容
质量上初见效果,但是在其他技术成熟度评价维度
尚有进步的空间。
3.AIGC 行业投融资现状:应用层、多模态更受
资本青睐
根据艾瑞咨询的数据显示,2021 至 2023 年 7 月
期间 AIGC 赛道共发生 280 笔投融资 7
,各投资人对
AIGC 赛道未来发展持较为乐观的态度,AIGC 行业展
现了在投融资端的高热度和强成长性。
截至 2023 年 3 月,AIGC 赛道目前在国外已出
现了 7 家独角兽,如 OpenAI(估值 290 亿美元)、
Hugging Face(20 亿美元)、Lightricks(18 亿美
元)。在我国,小冰公司和超参数已明确成为独角兽
公司,其中小冰公司估值为 20 亿美元、超参数估值
为 10 亿美元。尽管如此,与国外融资环境相比,目
前国内 AIGC 的融资频次及体量仍有一定差距。
多家国内投资机构已高度明确要将 AIGC 作为
主投赛道,个别头部机构已经明确了相应的主题孵
化项目,预计融资规模将在 2024 年出现首次阶段性
的指数级增加,投资标的也将向 AIGC 全产业扩散。
(1)AIGC 模态维度上的投融资现状:以多模态
为主导,语音、视频、文本并驾齐驱
在获得投资的应用项目中,多模态获投项目占
据了“半壁江山”,而音频、视频、文本相差不大,
在另外一半投融资市场中各自“平分秋色”。从投融
7
艾瑞咨询:《2023 年中国 AIGC 产业全景报告》。
资现状来看,更多投资人看好多模态的发展,而这
也恰恰回应了多模态作为更高端、技术壁垒更高的
模态类型所需的资金需求和各投资机构对抢占这一
技术“高地”的热切期盼。
图 2.1 2021—2023 年 AIGC 各模态融资项目占比柱状图 8
(2)AIGC 融资阶段维度上的投融资现状:AIGC
投融资处于初步阶段,方兴未艾
从融资阶段来看,绝大部分项目尚处于种子轮、
天使轮或者 A 轮,这表明国内 AIGC 仍处于初步阶
段,围绕 AIGC 的初创项目正在慢慢起步。另外,还
有高达 15%左右的股权融资及战略投资,表明投资
人持续看好 AIGC 的未来发展,乐于做 AIGC 行业发
展的陪伴者。
8 数据来源:IT 桔子、艾瑞咨询研究院
0.6%
58.8%
24.9% 24.9% 22.6%
0.0%
20.0%
40.0%
60.0%
80.0%
代码 多模态 音频 视频 文本
10
图 2.2 AIGC 投融资项目阶段占比饼状图 9
(3)AIGC 产业链维度上的投融资现状:应用层
AIGC 更受投资者青睐
从 AIGC 产业链来看,大部分投资者更愿意将资
金投入到应用层 AIGC 中,应用层创业项目较多、应
用层 AIGC 更容易变现等因素可能是导致这一现状
的原因。
但是,我们也注意到,随着 ChatGPT 等模型层
项目推出,模型层创业项目在 2023 年出现激增态势。
未来,随着 AIGC 产业的不断发展,模型和算力资源
需求可能会不断攀升,不排除模型层和算力层创业
项目会急剧增加,为应用层提供更多的模型和算力
支持。
9 数据来源:IT 桔子、艾瑞咨询研究院
10 数据来源:量子位智库
11 开源证券:《计算机行业深度报告——AIGC 行业广阔,行
图 2.3 AIGC 各层级投融资现状柱状图 10
4.AIGC 技术应用现状:应用广泛、未来可期
AIGC 的应用价值主要体现在以下四个方面:第
一,降本增效。通过 AI 技术的应用,使用者可以高
效、低成本地获取所需的信息,生成文字、图像、视
频等内容。第二,提升内容质量。个人所获取的信息
是有限的,但是 AI 模型可以大数据的给养,经过大
量的训练,生成更高质量的内容。第三,增加内容的
多样性。AIGC 已经呈现由单一模态向多模态的发展,
在多模态技术的应用下,其可以通过文字、音频、视
频等多维技术的配套使用,丰富生产内容的多样性。
第四,生成个性化内容。与传统的专业生成内容
(Professional Generated Content,PGC)和用户
生成内容(User Generated Content,UGC)相比,
AIGC ( Artificial Intelligence Generated
Content)可以根据用户的个性化特点以及其个人需
求生成具有用户个人特色的内容 11
。
业应用大有可为》。
60%
25%
10%
5%
0%
10%
20%
30%
40%
50%
60%
70%
应用层 算力层 模型层 工具层
11
目前 AIGC 技术在影视领域、娱乐领域、传媒领
域、电商领域均有应用,显示广阔的应用场域。如
AIGC+传媒,AIGC 作为当前新型的内容生成方式,在
时效、内容质量、形式等方面均给传媒内容的生产
赋能不少,如写稿机器人、视频字幕生成、人工智能
合成主播等。再如 AIGC+电商,AIGC 加速商品 3D 模
型的数字化、虚拟化,虚拟主播甚至虚拟卖场的构
建,实现消费者沉浸式、交互式的购物体验。
未来,传统行业的数字化程度会越来越高,随
着 AIGC 技术的不断完善,可以预见在不远的将来,
有越来越多行业会应用 AIGC 技术,也会有更多的企
业借助 AIGC 实现内容生产效率的提高,为用户提供
更多丰富多元、动态交互的内容。
(二)商业案例
1.模型层商业案例
AI 大模型是“人工智能预训练大模型”的简称。
AI 大模型包括了两层含义,一层是“预训练”,另一
层是“大模型”,两者相结合产生了一种新的人工智
能模式。AI 大模型通过对大量数据的学习和训练,
能够理解人类语言和语义,并从中提取出有用的信
息。这些模型通过机器学习和深度学习的技术来学
习和理解庞大的数据量。AI 大模型的发展推动了人
工智能领域的快速发展,并在各个领域中展现出惊
12《文心大模型》百度百科词条,https://bAIke.bAIdu.c
om/item/%E6%96%87%E5%BF%83%E5%A4%A7%E6%A8%A1%E5%9E%
8B/61806144?fr=ge_ala,2023 年 10 月 23 日
人的应用潜力。在过去的几年里,AI 大模型取得了
巨大的进展。其中最著名的就是由 OpenAI 开发的
GPT 系列模型。AI 大模型根据不同的应用场景,可
以分为大语言模型、图像生成模型、代码生成训练
模型等等。
(2)国内外大模型案例
a.文心大模型
文心一言旗下有大语言模型文心一言、图片生
成模型文心一格等多种产品。2022 年 11 月 30 日,
由深度学习技术与应用国家工程研究中心主办、百
度飞桨承办的 WAVE SUMMIT+2022 深度学习开发者
峰会举行。百度集团副总裁、深度学习技术及应用
国家工程研究中心副主任吴甜发布文心大模型的最
新升级,包括新增 11 个大模型,大模型总量增至 36
个,构建起业界规模最大的产业大模型体系,并通
过大模型工具与平台的升级和文心一格、文心百中
等基于大模型技术的产品应用,进一步降低大模型
产业化门槛,让更多企业和开发者步入 AI 应用的新
阶段。2023 年 6 月,百度文心大模型 3.5 版本已内
测可用。10 月 17 日,文心大模型 4.0 正式发布 12
。
b.“悟道”大模型
智源“悟道”人工智能,连创“中国首个+世界
最大”纪录 13
。2021 年 6 月,北京智源研究院(BAAI)
推出了悟道 1.0 的后续版本悟道 2.0,作为中国第
一个超大规模智能模型系统,旨在在人类层面的思
13 智研研究院官方网站首页,https://www.baAI.ac.cn/p
ortal/article/index/cid/49/id/518.html,2023 年 10 月
23 日
12
维上超越 OpenAI 的 GPT-3 和谷歌的 LaMDA14
。2023
年 6 月,悟道 3.0 进入全面开源全新阶段。
c.OpenAI
OpenAI 旗下有自然语言处理模型 GPT-4、图像
生成模型 DALL-E2 及代码生成训练模型 Codex 等产
品。GPT(Generative Pre-trained Transformer)
模型系列是其最具代表性的成果之一。这些模型是
基于 Transformer 的深度神经网络,它们能够自动
学习自然语言处理中的语法规则,并能够根据上下
文生成连贯的文本。DALL-E 模型是一种基于 GAN 的
生成模型,可以将自然语言描述转化为图像,并生
成符合描述的图像。这一技术开创了人工智能的新
局面,同时也引起了广泛的关注和讨论。DALL-E 可
以生成包括动物、物品、食物和人物等多种类型的
图像,这对于数字内容创作者、虚拟现实和增强现
实应用程序等领域具有很大的潜在应用价值。Codex
是 OpenAI 开发的一种基于 GPT 模型的编程助手,其
通过自然语言描述生成代码,从而极大地提高了编
写代码的效率。Codex 可以在多种编程语言和开发
环境中进行操作,并可以学习和自适应用户的编程
风格。这一技术在软件开发、自动化测试和数据分
析等领域有着广泛的应用。
d.Google
Google 推出了下一代大语言模型 PaLM 2 及 AI
14 《1.75 万亿,世界第一!智源发布「悟道 2.0」中国首
个万亿模型参数》,新智元,https://bAIjiahao.bAIdu.c
om/s?id=1701382247158540992&wfr=spider&for=pc,2021
年 6 月 2 日
文字到图像生成模型 Imagen(Pathways Language
Model)是一种大型语言模型,类似于 OpenAI 创建
的 GPT 系列或 Meta 的 LLaMA 系列模型。谷歌于 2022
年 4 月首次宣布推出 PaLM,超过了 5400 亿个训练
参数。与其他 LLM(Large Language Model)一样,
PaLM 是一个灵活的系统,可以执行各种文本生成和
编辑任务。Imagen 是一款文本-图像的扩散(CLIP)
模型,由 Google Research 和 Google BrAIn 团队研
发,打出的标语是“前所未有的写实感×深层次的
语言理解”,即可以根据给定的提示词,生成高度契
合文本含义及具有照片般真实感的图像。
2.应用层商业案例
在具体的实际应用层面,主要可分为两大类:
AI 工具类及 AI 工具延伸出的工具。AI 工具可根据
具体的功能分为写作工具、图像工具、视频工具、办
公工具等等,而 AI 工具延伸出的工具则是为了更好
地实现或检测“AI 工具”的应用所产生的工具,主
要可以分为 AI 内容检测及 AI 提示指令两类。下面,
将针对各具体应用展开介绍。
1)AI 工具类
(1)AI 写作工具
a、秘塔写作猫
秘塔写作猫是秘塔科技旗下研发的 AI 写作垂
类产品,目前秘塔科技已于 2021 年完成 Pre-A 轮融
13
资 15。秘塔写作猫是一款集 AI 写作、多人协作、文
本校对、改写润色、自动配图等功能为一体的 AI
Native 内容创作平台。目前,秘塔科技已经拥有数
百万用户,成立北京和成都两大研发中心,在 AIGC、
文档辅助创作、智能合同等方向上开展研发与产品
落地。
秘塔写作主要通过纠错/改写 API 接口服务收
费。
b.彩云小梦
彩云小梦是由彩云科技(彩云天气和彩云小译
背后的团队)推出的智能写作 AI 助手,用户只需提
供一个开头,AI 就会帮用户创作故事。用户可以自
由定义故事的背景和世界设定,并扮演其中的角色,
与其他角色聊天。另外,该产品的用户可以使用其
AI 续写功能,让用户续写用户喜欢的小说和故事,
提供不同版本的续写风格。目前彩云小梦提供了网
页版和移动端的 APP,用户可以选择对应的终端访
问。
彩云小梦提供会员增值服务,为会员提供免广
告、不限量字数等服务 16。此外,彩云小梦亦存在部
分广告收入。
公开信息关于彩云投资的具体融资情况不明,
已知消息为早在六七年前,九合创投便为彩云科技
的投资人 17
。
15 《基于自研大模型,「秘塔科技」推出中文版 ChatGPT
「对话写作猫」|早期项目》,36 氪,https://36kr.co
m,2023 年 3 月 7 日。
16 彩云小梦官方网站,https://if.cAIyunAI.com/,2023
年 10 月 22 日访问。
c.Jasper
Jasper(原 Jarvis)是国外最受欢迎的 AI 写作
软件工具之一,因其丰富的模板和强大的智能写作
功能而广受欢迎。用户可以使用 Jasper 创建博客、
文章、书、剧本、帖子和任何其他内容。只需选择一
个话题,填写关键词和细节,Jasper 将为用户自动
写作内容。同时,Jasper 支持 30+的语言和方言进
行 AI 写作,包括中文、英语(美式)、英语(英式)、
保加利亚语、捷克语、丹麦语等。
目前,Jasper 提供三个付费计划,Creators、
Teams、Business。
2022 年 10 月,Jasper 从 Insight Partners、
Coatue 、 Bessemer Venture Partners 以 及 Y
Combinator 等机构那里筹集到 1.31 亿美元,估值
大约 15 亿美元,预计去年 ARR 超过 7500 万美元,
相比于 2021 年同比增长 76%。
(2)AI 图像工具
a、文心一格
文心一格是由百度推出的依托其文心大模型和
飞桨技术的文本生成图片的 AI 艺术和创意辅助平
台,于 2022 年 8 月正式发布。作为国内第一梯队的
AI 图片生成的工具和平台,文心一格可以进行国风、
油画、水彩、水粉、动漫、写实等十余种不同风格高
清画作的生成。
17 《直击 WAIC2023|九合创投创始人王啸:大模型时代到
来 AI 应用存在巨量创业机会》,科创板日报,https://bA
Ijiahao.bAIdu.com/s?id=1770733805237605066&wfr=spid
er&for=pc,2023 年 7 月 7 日。
14
文心一格面向的用户人群非常广泛,既能启发
画师、设计师、艺术家等专业视觉内容创作者的灵
感,辅助其进行艺术创作,还能为媒体、作者等文字
内容创作者提供高质量、高效率的配图。
目前文心一格采用的是免费加增值模式,新用
户注册登录后可以获得 50 的电量用以生成图像,签
到、分享和公开自己的画作可以获得额外免费的电
量。用户也可以采用付费充值电量。
2023 年第一季度,百度营收 311 亿元,同比增
长 10%;归属百度的净利润(非美国通用会计准则)
为 57 亿元,同比大涨 48%,营收和利润双双超市场
预期。其中,与文心一言关系最为密切的百度智能
云,一季度实现盈利,收入同比增长 8%至 42 亿元
18。2023 年第二季度百度的财务数据持续增长,营收
340.56 亿元,同比增长 15%。
b.Midjourney
Midjourney 由一群对人工智能和创造力充满热
情的研究人员和工程师于 2022 年创立,他们受到
OpenAI 的 DALL-E 和 Stable Diffusion 模型的突破
的启发——从自然语言输入创建高质量图像。他们
基于最先进的技术开发了自己的专有模型,例如
Transformer、生成式对抗网络(GAN)和自注意力机
制。他们还收集并整理了来自不同领域和流派的文
本图像对的大规模数据集,经过数月的努力和测试,
18 《2023 年第一季度业绩公告》
19 《上线一年,600 万用户、1 亿美元收入,只有 11 人的 M
idjourney 是如何成功的》腾讯网,https://new.qq.com/
rain/a/20230508A0A4IX00&wd=&eqid=95e5c00a0000d37000
000005645af9de,2023 年 5 月 8 日。
终于在 2022 年底推出了 Midjourney 作为在线平台,
任何人都可以访问他们的 AI 免费生成图像。
Midjourney 采用付费订阅模式。提供按年收费、
按月收费模式及基本、标准、专业三种服务标准。
Midjourney 截至目前在 Discord 社区已经吸引
了超过 1600 万名成员,获得了 1 亿美元左右的收益
(主要来源于用户订阅)19
。
c.stable diffusion
Stable Diffusion 是于 2022 年发布的一个基
于深度学习的 AI 文本到图像生成模型,该模型主要
用于生成以文本描述为条件的详细图像和插画,由
初创公司 StabilityAI 与一些学术研究人员和非营
利组织合作开发的。
该应用为开源模式,目前的盈利模式尚不明确。
截至 2022 年 9 月,随着多方投资机构透露出对
Stability AI 的兴趣,其估值也从 1 亿美元、5 亿
美元、最终飙升到了 10 亿美元 20
。
d.Leonardo.ai
Leonardo.ai 是基于 Stable Diffusion 的算法
构造的,同时深度集成了 Stable Diffusion 的各种
插件,比如 ControlNET 的 openpose 姿势参考、局
部重绘、prompt 提示等。
Leonardo.ai 的服务器访问量持续上升,显示出
惊人的增长趋势,目前已经吸引了数百万用户。
20 《最牛 AI 艺术家 Stable Diffusion 有多值钱?种子轮
融资即晋升独角兽》新智元,https://baijiahao.baidu.
com/s?id=1747190955571732856&wfr=spider&for=pc,202
2 年 10 月 20 日
15
(3)AI 视频工具
a.Runaway
Runway 最开始是一个供创作人员以直观的方式
使用机器学习工具的平台,而不需要任何编码经验,
用于视频、音频和文本等媒体。Runway 的 Al Magic
Tools 目前提供了超过了 30+的 AI 工具,在 Runway
上,用户可以创建并发布预先训练好的机器学习模
型,用于生成逼真的图像或视频等应用。用户还可
以训练自己的模型,并直接从 GitHub 导入新的模型。
而在 3 月 23 日,Runway 发布了 Gen-2 模型,允许
用户从文本、图像和视频片段中生成视频内容。
Runway 采取付费订阅模式。根据 Insider 的独
家报道:2023 年 5 月初,视频编辑生成式 AI 创业
公司 Runway 已经完成了至少 1 亿美金的 D 轮融资,
使其估值从 C 轮时候的 5 亿美金跃升到了 15 亿美
金 21
。
b.Capsule
Capsule 是一个面向企业团队的人工智能视频
编辑器(个人和小团队可免费使用),旨在通过将简
单直观的操作界面与自动执行编辑任务的 AI 相结
合,帮助内容和营销团队以高效的速度和轻松地创
建视频。通过人工智能,Capsule 创新性地引入了新
的视频剪辑制作界面——消除了时间线、图层或关
键帧动画。
Capsule 提供 Business 版本和 Enterprise 版
21 《Runway 再融资 1 个亿,150 天里估值翻了三倍》,硅发
布,https://mp.weixin.qq.com/s/IYAJj2HTTzqo-ahf-z6
8yw,2023 年 5 月 10 日。
本。目前,尚无公开明确的有关 capsule 的融资信
息。
c.快剪辑
快剪辑是 360 旗下推出的支持在线视频剪辑的
软件,拥有强大的云端剪辑能力,其智能工具箱提
供了多种 AI 工具,帮助创作者更加高效快捷地剪辑
视频,满足不同行业用户的使用需求。适用于电商
营销、内容营销、短视频创作等场景,为有视频剪辑
需求的中小机构或个人提供从端到端的一站式视频
创作服务。
快剪辑提供不同权益的免费版和会员版本,以
满足不同用户的剪辑需求。
目前,尚无公开明确的有关快剪辑的融资、营
收或盈利信息。
(4)AI 办公工具
a.ChatPPT
必优科技推出的国内首个中文 AI 生成 PPT 的
办公产品。ChatPPT 是必优科技旗下面向 PPT 使用
者提供的 AI 生成 PPT 软件,产品基于 ChatGPT 与韦
尼克模型,面向 PPT 用户提供可通过自然语言指令
与 Chat 模式进行 PPT 文档创作的 AI 创作服务。
目前该应用提供免费模式及高功能收费模式。
根据企查查显示,珠海必优科技有限公司显示
融资状态为“天使轮”,具体融资信息未披露 22
。
b.通义听悟
22 《珠海必优科技有限公司》,企查查,https://www.qc
c.com/firm/0db6cc77cf87248ed7bbbf38b3a7dcac.html,2
023 年 10 月 24 日
16
通义听悟是阿里巴巴推出的智能 AI 会议转录
和总结工具,支持实时双语翻译字幕,一键高亮要
点,智能提炼总结,高效记录、整理和共享音视频内
容。多种字幕形态随心切换,自动区分发言人,总结
关键词、议程、摘要、待办事项和问题。支持一键导
出和公开分享。
目前,该应用可在一定限度内(10 小时)免费
使用,后续可通过签到、邀请新用户等模式增加使
用权限。
截至 2023 年 8 月 12 日,通义听悟各平台累计
用户数已超 55 万。尚无公开明确的有关通义听悟的
融资、营收或盈利信息。
c.Gamma
Gamma 是一个在线网页版创建演示文稿的工具,
用户可以最少的格式化和设计工作来创建和展示内
容。在人工智能的支持下,Gamma 允许用户仅通过输
入文本和想法提示,点击按钮便可以生成设计美观
和具有吸引力的幻灯片。
在 Gamma 的帮助下,创建演示文稿制作幻灯片
变得更快、更简单,而且比使用传统软件更有效率。
Gamma 旨在通过视觉和互动内容将想法变为现实,
从而吸引任何设备上的受众,支持嵌入各种多媒体
格式,包括 GIF、视频、网站和图表,使观众更容易
理解复杂的想法。除此之外,用户还可以借助该 AI
生成 PPT 工具的快速反馈、评论、发布和分析工具
等功能实现协作和反馈。
目前,Gamma 提供增值订阅模式,尚无公开明确
的有关 Gamma 的融资、营收或盈利信息。
(5)AI 设计工具
a.鹿班
鹿班是由阿里巴巴智能设计实验室自主研发的
一款设计产品,基于图像智能生成技术,鹿班可以
改变传统的设计模式,使其在短时间内完成大量
banner 图、海报图和会场图的设计,提高工作效率。
用户只需任意输入想达成的风格、尺寸,鹿班就能
代替人工完成素材分析、抠图、配色等耗时耗力的
设计项目,实时生成多套符合要求的设计解决方案。
鹿班针对新用户提供 7 天免费试用的服务,同
时针对不同的使用期限及免单券数额提供增值服务。
目前,尚无公开明确的有关鹿班的融资、营收
或盈利信息。
b.AIDesign
AIDesign 是腾讯设计云推出的 AI 在线免费设
计 Logo 的产品功能,该款 AI Logo 生成器旨在帮助
个人用户和企业用户快速生成具有辨识度和独特性
的 Logo。只需输入品牌名称,便能在 10 秒内生成精
美的 Logo。
目前,该应用为免费模式,尚无公开明确的有
关 AIDesign 的融资、营收或盈利信息。
c.Magic Design
Magic Design(Beta)是热门的在线设计工具
Canva 推出的一个免费的人工智能设计工具,Magic
Design 是一个由人工智能驱动的设计生成工具,将
文本和图像变成个性化的精美设计。它可以让用户
从其海量的精美模板中智能将用户的设计理念可视
化。只需上传用户自己的媒体文件或从一个空白的
区域开始,输入用户的设计想法,Magic Design 便
17
会魔法般地定制好用户的设计并呈现在用户面前。
用户可以输入任何媒体,并将其转化为符合用户所
需内容和背景的定制模板。通过从 8 个自动生成的
模板中选择,用户可以进一步编辑和调整尺寸,毫
不费力地将用户的想法可视化和细化。Magic
Design 建立在 Canva 数以百万计的模板、图像、字
体和其他图形元素的基础上,并使用人工智能来制
作设计,帮助用户的想法变成现实。
Canva 提供了免费版、个人高级版、团队高级版
三种付费订阅模式。
Canva 作为世界上最大的在线设计平台,这家
澳大利亚软件公司估值超过 400 亿美元。Canvas 每
月平台用户 1.35 亿,每分钟诞生 1.2 万个新的设
计;该平台年营收 15 亿美元,连续六年盈利,没有
任何负债;过去 12 个月,新增用户 4500 万 23。
(6)AI 对话聊天
a.ChatGPT
ChatGPT 是由 OpenAl 公司推出的火爆全球的聊
天对话机器人,该 AI 聊天对话工具建立在 OpenAI
开发的 GPT-4 语言模型上,它可以执行各种自然语
言处理(NLP)任务,如总结、分类、提问和回答,
以及类似人类反应的错误纠正。ChatGPT 是一项革
命性的技术,通过将人们的工作效率提高到一个新
的水平,使人们的生活更加轻松。
23 《价值 400 亿美元!女创始人打造超级独角兽 Canva》,
创业邦,https://baijiahao.baidu.com/s?id=177926257
9536317991&wfr=spider&for=pc,2023 年 10 月 9 日
24 胡润百富官网,https://www.hurun.net/。
自 2023 年 2 月推出付费版 ChatGPT 以来,
OpenAI 的收入主要来自 AI 聊天机器人的订阅费用,
营收实现了显著增长。用户可以通过支付每月 20 美
元的价格,获得更加稳定、快速的服务,享受更加高
级的功能和特性。除用户订阅外,OpenAI 亦提供付
费的 API 供第三方调用 OpenAI 的模型。
2019 年,OpenAI 从微软筹集了 10 亿美元的第
二轮资金,开始使用 Azure 超级计算机来构建这些
大型语言模型。2023 年,微软承诺向 OpenAl 投资
100 亿美元,使其总股份达到 49%。2023 年 4 月 18
日,OpenAI 企业以 1380 亿人民币的企业估值入选
《2023·胡润全球独角兽榜》,排名 17 名 24。截至
2023 年 10 月 20 日,OpenAI 估值高达 860 亿美元
25。
b.微软必应(Bing)
微软必应(Bing)是一款由微软公司推出的搜
索引擎应用,能够为用户提供快速、准确的搜索体
验。NewBing(新必应)采用 Open AI 的 GPT-4 大语
言模型技术驱动,为用户提供对话生成式的全新 AI
搜索体验。与旧版必应相比,新版必应更加智能化
和人性化,采用了先进的自然语言处理和机器学习
技术,能够更好地理解用户的搜索意图和需求,并
返回更加方便、准确、相关的结果。
目前,Bing 为免费试用软件。美国当地时间
2023 年 2 月 7 日,在微软推出 NewBing 后,当天微
25 《估值 860 亿美元!OpenAI 抛员工股票,仅次 SpaceX,
成顶级独角兽》新智元,https://baijiahao.baidu.com/
s?id=1780256870142897233&wfr=spider&for=pc,2023 年
10 月 20 日。
18
软股价收涨逾 4%,一夜市值飙涨超 800 亿美元(约
合 5450 亿元人民币),为 5 个月新高。
c.文心一言
文心一言(英文名:ERNIE Bot)是百度研发的
知识增强大语言模型,能够与人对话互动,回答问
题,协助创作,高效便捷地帮助人们获取信息、知识
和灵感。文心一言基于飞桨深度学习平台和文心知
识增强大模型,持续从海量数据和大规模知识中融
合学习,具备知识增强、检索增强和对话增强的技
术特色。
2023 年 11 月 1 日,百度上线文心一言专业版,
单月购买定价为 59.9 元/月,连续包月优惠价 49.9
元/月。据介绍,文心一言会员版基于文心大模型
4.0。
百度文心一言发布时,百度股价产生了反复跌
涨的情况。2023 年 3 月 16 日下午,在发布会进行
的同时,百度港股股价一度下跌 10%至 120.1 港元。
截至在 3 月 17 日收盘,百度股价下跌 6.36%报收
125.1 港元。3 月 17 日美股开盘,百度股价出现上
涨,最终报收于 138.16 美元/股,上涨 3.8%。3 月
18 日,百度股价回升,百度股价上涨近 14%,至 142
港元 26
。
d.通义千问
通义千问,是阿里云推出的一个超大规模的语
言模型,功能包括多轮对话、文案创作、逻辑推理、
多模态理解、多语言支持。能够跟人类进行多轮的
26 《反转了!百度大涨 14%,文心一言回应股价波动》第一
财经,https://baijiahao.baidu.com/s?id=17606626398
70074706&wfr=spider&for=pc,2023 年 3 月 18 日。
交互,也融入了多模态的知识理解,且有文案创作
能力,能够续写小说,编写邮件等。2023 年 4 月 7
日,阿里在 AI 大模型领域的研究成果终于亮相,阿
里云宣布自研大模型“通义千问”开始邀请用户测
试体验,这也是继百度的文心一言之后国内又一家
巨头启动 AI 大模型邀测。
目前,通义千问为免费使用模式。目前业内有
说法认为,阿里云是唯一一家可以全球范围内和亚
马逊 AWS、微软 Azure 对标的云计算公司。若按照当
前亚马逊云、微软 8-10 倍的市销率来计算,阿里云
772 亿元营收对应的市值在 6000 亿至 8000 亿元之
间。时任阿里集团董事长张勇在阿里云内部的全员
信中也指出,未来 12 个月阿里云将从阿里集团完全
分拆并完成上市,并引入外部战略投资者 27。
(7)AI 编程工具
a.GitHub Copilot
GitHub Copilot 是微软与 OpenAI 共同开发的
一款 AI 编程工具。GitHub Copilot 的工作方式是
通过分析大量开源代码和常见的编码模式来学习和
理解编程语言的规则和惯例。当你在编写代码时,
Copilot 会根据上下文和你已经输入的代码,自动
生成相关的代码片段、函数或类的定义、变量命名
等。
目前有月度付费及年度付费两种模式。
据《华尔街日报》10 月 9 日报道称,微软首批
27 《张勇掌舵,阿里云估值几何?》搜狐新闻,https://
news.sohu.com/a/686823594_643517,2023 年 6 月 18 日。
19
生成式 AI 产品中的 GitHub Copilot 正在亏损,对
于目前在 AI 大模型商业应用维度走在最前沿的微
软而言,它在推出的帮助程序员创建、修复和翻译
代码服务的 GitHub Copilot 且拥有 150 万用户的基
础上,向使用者收取每月 10 美元抑或者是每年 100
美元的费用之际,还亏损了不少。该服务平均每个
用户每月损失 20 美元,有些用户每月高达 80 美元
28
。
b.Comate
Comate 是百度推出的 AI 编程工具,基于文心
大模型,结合百度积累多年的编程现场大数据和外
部优秀开源数据,为开发人员生成更符合实际研发
场景的优质代码,现已向企业开放试用申请。2023
年 10 月 24 日,该应用全面开放。
目前,针对个人用户可申请免费试用;针对企
业客户则单独询价。尚无公开明确的有关 Comate 的
融资、营收或盈利信息。
c.iFlyCode
iFlyCode 是科大讯飞最新推出的智能编程助手,
基于讯飞星火认知大模型,可以帮助开发人员编程
更轻松,创意更自由。该 AI 编程工具拥有代码生成、
代码补齐、代码纠错、代码解释、生成单元测试等功
能。
目前,该编程助手主要针对企业用户开放,可
申请免费使用,具体价格需另询价。
由于在 AI 大模型上进行了较高的研发投入,科
28 《搞大模型巨亏,微软都还没挣到钱!Copilot 每月收 1
0 刀,倒赔 20 刀》百家号,https://baijiahao.baidu.co
大讯飞在 2023 年第一季度出现了亏损。随着 AI 大
模型的相关应用在各行业落地,必然将研发成本转
化为营收和利润,对讯飞的财务状况将带来正面影
响。
(8)AI 音频工具
a.网易天音
网易天音是网易云音乐推出的一站式 AI 音乐
创作工具,无需乐理知识,一键上手。音乐爱好者或
者歌手只需输入灵感,AI 便可以辅助完成词、曲、
编、唱,生成 AI 初稿后,支持词曲协同调整等。
目前,网易天音在进行公测,持续更新,用户可
免费试用。但尚无公开明确的有关网易天音的融资、
营收或盈利信息。
b.Riffusion
Riffusion 是一个免费开源的具有稳定扩散的
实时音乐和音频生成库,用户只需输入音乐描述,
AI 便可以生成对应风格的音乐。该开源项目由 Seth
Forsgren 和 Hayk Martiros 推出,Riffusion 白的
背后原理是基于 Stable Diffusion(文本生成图像
模型)微调频谱图,频谱图是音频的视觉表示,显示
不同频率随时间的振幅,而后再将高保真度的频谱
图图像转换为音频。
该项目为开源项目,免收取用户订阅费。目前,
尚无公开明确的有关 Riffusion 的融资、营收或盈
利信息。
m/s?id=1779343453891807017&wfr=spider&for=pc,2023
年 10 月 10 日。
20
(9)AI 语言翻译
a.DeepL 翻译器
DeepL 翻译器是一款集合了深度学习、神经网
络算法、大数据等先进技术的新一代 AI 翻译工
具。能够高效、准确、流畅翻译,除了学术论文,
文言文和方言的翻译。
DeepL 提供用户付费及 API 使用权服务。
2023 年 4 月 18 日,DeepL 以 69 亿元人民币的
企业估值入选《2023·胡润全球独角兽榜》,排名第
1039 名。29
b.阿里翻译
阿里翻译是由阿里巴巴提供的多语种在线实时
AI 翻译网站,由阿里巴巴达摩院机器智能技术实验
室提供技术支持,提供多个领域、覆盖 200+语言的
智能机器翻译服务。阿里翻译还支持文档翻译、图
片翻译、视频翻译、语音翻译等多模态翻译能力。覆
盖场景包括跨境电商场景、翻译教育场景、企业办
公场景等。
阿里翻译提供 API 接口服务,具体价格根据需
求情况咨询。目前,尚无公开明确的有关阿里翻译
的融资、营收或盈利信息。
c.必应翻译
必应翻译是微软作为其必应搜索引擎的一部分
而提供的 AI 翻译服务,支持 70 多种不同语言的免
费翻译,包括常见的英语、西班牙语、法语、德语、
汉语、日语、俄语等通用语言之间的翻译。
29 胡润百富官网,https://www.hurun.net/。
目前,必应翻译为用户免费使用软件,尚无公
开明确的有关必应翻译的融资、营收或盈利信息。
2)AI 工具延伸工具
(1)AI 提示指令
AI 提示指令工具可以简单理解为“让 AI 调教
AI”的工具。
a.promptperfect
PromptPerfect 是 Jina AI 旗下一款专业好用
的提示词优化工具,可帮助用户一站式设计、开发、
优化和部署提示词,支持优化 GPT-4、ChatGPT、文
心一言、 Claude 、 Llama 、Midjourney 、 Stable
Diffussion 等各大主流文本和图像模型的提示词。
目前,该产品支持的模型包括:(1)文本模型:
支持 ChatGPT、GPT-4、StableLM 7b、Claude、Claude
2、文心一言、Llama 2(70b、13b、7b)、Cohere
Command、JinaChat、GPT-3;(2)图像模型:DALLE 2、Stable Diffusion、Midjourney、Stable
Diffusion XL 、 Kandinsky2.2 、 DreamShaper 、
AbsoluteReality、万象熔炉、Anything、Deliberate、
Lexica。
PromptPerfect 提供积分购买服务,根据不同的
积分数量分为三档计费。
Jina AI 定义为一家“神经搜索公司”,并采取
了开源的方式。2020 年夏天,JinaAI 完成了种子轮
和 Pre-A 轮的融资 30。目前,JinaAI 最受欢迎的产
30 《JINA AI 肖涵:带领来自十个国家的大牛做开源是种怎
样的体验?》36 氪,https://36kr.com/p/1158857644328
325,2021 年 3 月 29 日。
21
品为 PromptPerfect。
b.词魂
词魂为“精品提示词库”,每日更新 1000+高质
量提示词,用户可以在这里找到各类提示词和咒语,
帮助用户更好地使用 AI 工具,快速得到想要的效果,
提升工作效率。如果用户是一位优秀的提示词创作
者,则可以在这里销售自己的提示词。目前,该应用
提供的是已生成作品对应提示词的查看服务,即“提
示词集合”,无法直接优化用户输入的提示词。
词魂根据每日可查看提示词的个数提供不同的
付费服务。目前,尚无公开明确的有关词魂的融资、
营收或盈利信息。
c.Clickprompt
ClickPrompt 是一款专为 Prompt 编写者设计的
工具,它支持多种基于 Prompt 的 AI 应用,例如
Stable Diffusion、ChatGPT和GitHub Copilot等。
使用 ClickPrompt,您可以轻松地查看、分享和一键
运行这些模型,同时提供在线的 Prompt 生成器,使
用户能够根据自己的需求轻松创建符合要求的
Prompt,并与其他人分享。
ClickPrompt 为开源项目,目前,尚无公开明确
的有关 ClickPrompt 的融资、营收或盈利信息。
(2)AI 内容检测
a.GPTZero
GPTZero 是一种 AI 检测工具,旨在识别 AI 生
31 《GPTZero 检测工具,识别 AI 内容》百家号,https://
baijiahao.baidu.com/s?id=1772813879792990964&wfr=sp
ider&for=pc,2023 年 7 月 30 日
成的文本,专门针对教育工作者和其他用户。主要
特点和优势包括:(1)抄袭分数:提供一个整体分
数,表明文档中 AI 生成的内容的数量;(2)突出显
示的句子:识别单个 AI 生成的句子以便于检测;(3)
批量上传:支持一次上传多个文件,非常适合检查
整个教室的工作;(4)API 集成:无缝集成到具有可
定制端点的组织系统中。
GPTZero 通过提供 API 接口或订阅服务收费,
具体需注册认证后询价。
GPTZero 上线后,立即获得了巨大成功,首周就
吸引了 3 万用户注册。尤其是教育工作者发现这项
工具对检测学生作文和其他写作作业方面的作弊极
具价值,因为 TurnItIn 等其他抄袭检测网站还无法
捕捉到 AI 生成的文本 31。截至 2023 年 6 月,GPTZero
已经拥有了超 120 万的用户。据海外媒体报道,
GPTZero 已经获得了 350 万美元的融资 32,投资者包
括 Uncork Capital、Neo、Lattice 首席执行官 Jack
Altman33以及 Stability AI 的首席执行官 Emad
Mostaque。
b.StudyCorgi ChatGPT Detector
StudyCorgi 推出的帮助学生检测 ChatGPT 的工
具。
目前,StudyCorgi 检测文本是否为 AI 生成的
功能是免费的,但提供“网站专家可根据用户要求
提供定制论文,每页文档收费 11.05 美元”的服务。
32 《判断文本是否由人工智能编写的应用 GPTZero 融资 350
万美元,瞄准教育和新闻两大应用场景》搜狐新闻,2023
年 6 月 2 日。
33 Jack Altman 是 OpenAI 公司的 Sam Altman 的兄弟。
22
目前,尚无公开明确的有关 StudyCorgi
ChatGPT Detector 的融资、营收或盈利信息。
3.应用层商业案例小结
(1)通过订阅模式实现盈利
目前,几乎所有 AI 公司均依靠订阅模式实现盈
利,订阅价格为每月 10 美元至 70 美元不等。截至
2023 年 6 月,流量排名前 50 的生成式 AI 公司订阅
费用平均为 21 美元/月,年收益为 252 美元。
(2)网页为主,移动端为辅
面向用户的 AI 产品大多仅能通过网页使用,只
有少数产品如 ChatGPT、character ai、photoroom、
彩云小梦拥有移动端应用程序。不过,移动端应用
程序为产品贡献的流量较少,不足产品整体流量的
10%。
(3)各产品差异巨大,ChatGPT 一骑绝尘
根据硅谷知名风投机构 a16z 统计,ChatGPT 为
全球数据网络流量排名第一的生成式 AI 产品 34。截
至 2023 年 6 月,ChatGPT 每月访问量为 16 亿次,
每月用户数为 2 亿。而排名位居第二的 CharacterAI
的访问规模仅为 ChatGPT 的 21%。
(三)产业前景
1.我国 AIGC 产业市场经济规模的预测:阶段式
快速增长
34《How Are Consumers Using GenerativeAI》,andreesse
n horowitz,https://a16z.com/how-are-consumers-using
-generative-ai/,2023 年 10 月 30 日
根据量子位智库测算,我国 2023 年 AIGC 市场
规模预计可达到 170 亿元人民币 35。与《新一代人
工智能发展规划》三步走的阶段划分相似,AIGC 市
场规模的发展也可大致分为三个阶段。
第一阶段是 2023 年—2025 年,该阶段可称之
为“培育摸索期”。该阶段是我国 AIGC 产业市场规
模初步增长的第一阶段,增长率维持在 25%左右,
2025 年市场规模预计达到 260 亿元人民币。在这一
阶段,各类 AIGC 技术正在孕育和初步发展,尚未达
到稳定进入实际生产环节的水平,各类业态的协同
效应也较差,未形成规模经济。各类资本正在小规
模投资,处于摸索阶段。
第二阶段是 2026—2027 年,该阶段可称之为
“应用蓬勃期”。由于行业生态逐渐完善,各类技术
进入稳定期,特别是底层大规模模型开始对外开放,
应用层会开始井喷式发展。而应用层的快速发展又
会反过来带动模型层、算力层和工具层的发展。此
时,AIGC 产业的不断发展也会吸引更多的投资人进
入该市场。在这样的相互协同发展、快速增长的态
势下,预计 2027 年我国 AIGC 市场规模将会超过 600
亿元人民币,年复合增长率将超过 70%。
第三阶段是 2028—2030 年,该阶段可称之为
“整体加速期”。预计 2028 年开始,AIGC 产业将延
展出完整的产业链,在商业化运用场景的广度和深
度上都会有不同程度的增长,传统行业数据化和数
35 量子位智库出品:《中国 AIGC 产业全景报告》。
23
据行业产业化成为必然趋势。中国 AIGC 产业生态日
渐稳固,相应重点领域、关键场景的技术价值得到
进一步兑现,AIGC 深入变革各个行业。预计我国
AIGC 市场规模将在 2023 年突破万亿元体量。
图 2.4 我国 AIGC 市场规模及增长速度预测图 36
2.各层级具体发展前景
上文已叙,根据预测,我国 2023 年 AIGC 市场
规模预计可达到 170 亿元人民币,且可预测产业市
场保持高位增长。但由于技术壁垒和可迁移性程度
不同,未来五年的发展可能呈现不同的发展态势。
(1)AIGC 基础层发展前景
基础层可以划分为算力基础、数据基础、算法
基础等细分板块。算力基础和算法基础属于较为通
用的模块资源,其可基本沿用在先的供给方,相应
的投资确定性较强。
AIGC 的智能化程度有赖于大量的预训练,而这
将对大计算量的高性能计算机和海量数据资源产生
36 数据来源:量子位智库
37 王吉伟:《AIGC 持续火爆大模型争相推出,庞大市场造就
算力供应模式演变》,访问地址:https://baijiahao.baid
u.com/s?id=1766559870653576661&wfr=spider&for=pc
极大的需求。因此,对数据计算中心的网络带宽、能
源消耗与维护能力、互联协同功能、软硬件配套发
展等多方面、全维度工作能力提出更高的要求。根
据中国信息通信研究院数据,在算力市场增速与规
模方面,目前全球计算设备算力总规模达到
615EFlops(Flops 为算力单位,即每秒浮点运算次
数),增速达到 44%,预计 2030 年全球算力规模达到
56ZFlops,平均年增速达到 65%。各大 AIGC 公司的
参数规模也体现了其对算力的巨大需求:由 OpenAI
在 2020 年发布的 GPT-3,参数规模为 1750 亿个;
由 OpenAI 在 2022 年发布的 ChatGPT,参数规模为
10 万亿个;由阿里云在 2022 年发布的通义千问,参
数规模为 10 万亿个。可以合理猜测的是,随着 LLM
(Large Language Model)的不断发展,大算力基
础设施和庞大数据库的需求会不断增加。一个很好
的例子是:为支持 ChatGPT 对于强大算力的需求,
微软于 2019 年投资 10 亿美元建造了一台大型顶尖
超级计算机,配备了数万个 NVIDIA Ampere 架构 GPU,
还在 60 多个数据中心总共部署了几十万个 NVIDIA
GPU 进行辅助。一个 AI 应用 ChatGPT,尚且就需要
这么大的算力支持。更遑论 OpenAI 还有 Dall-E 等
多个大模型,可见从事 AIGC 产业公司对算力的需求
有多大 37。除此以外,云服务产品也因为其空间与时
间限制少、设施占地小等优点受到各类资本的青睐,
24
未来可能会有更多的算力资源搭载于云服务产品,
以 MaaS 的模式为各个产业提供数据服务。
关于数据资源的使用与分析,需要特别关注数
据的有效性、合法性和实时性,才可以保障后续所
得结果可用的预期效果。在我国的合规要求下,需
要格外关注数据资源利用的合法性(包括数据来源、
使用、再利用等是否合法)和检测审核的有效性(避
免出现相应算力用于危害国家安全、诈骗等违法犯
罪等安全隐患),这也给相应的合规、确权等数据法
律服务提出了更多、更高的要求。
随着 AIGC 时代大模型参数的计算量量级提升,
算力层出现供不应求的情况属于大概率事件。未来,
算力基础设施建设和数据库搭建将呈现广阔空间,
大模型运行将对 AIGC 基础层的提供与审核提出更
高的要求。
(2)AIGC 模型层发展前景
模型层可分为底层通用大模型和中间层模型。
底层通用大模型部分是相对容易形成技术壁垒的板
块,也成了资本最关注,各类企业建设和提升迫切
性最强的领域。通用大模型层的战略意义不仅仅在
AIGC 领域,其外部性也会拓展到人工智能全领域,
成了各类型企业争先恐后的“战略高地”。就其难度
而言,因其需要投入大量的人才、时间、资金等要素
禀赋,还需要大量的数据资源为其提供源源不断的
“资源养分”,其技术壁垒较高。
在以OpenAI的GPT、Dall-E为代表的LLM(Large
Language Model)出尽风头后,出于应战,更出于
商业生态所需,其他厂商陆续推出各自的大模型。
在谷歌率先推出 Bard 并与 NVIDIA 联合开发了参数
量高达 5300 亿的 Megatron-Turing 后,Meta 发布
了 BlenderBot3、亚马逊推出了自有的大型语言模型
泰坦(Titan),OpenAI 前元老创立的 Anthropic 发
布了 Claude,Stability AI 拥有 Stable Diffusion
并于近期推出了开源大语言模型 StableLM。以国外
的 Stable Diffusion 为例,Stable Diffusion 作
为文本生成图像模型,由于交互简单、生成速度快,
极大地降低了使用门槛。因此 Stable Diffusion 成
了当前热门的 AIGC 绘画生成应用。在开源的两个月
内,已有超 20 万开发者下载 Stable Diffusion。
2022 年 10 月 18 日,Stability AI 公司获得 1.01
亿美元投资,估值达 10 亿美元,公司宣布将继续研
发拥有生成图片、语言、音频、视频和 3D 的 AIGC 生
成模型。
而在国内,自 2023 年 3 月 16 日百度基于文心
大模型的“文心一言”发布后,国内就开启了“百模
大战”模式。华为的盘古、360 的智脑、商汤的日日
新、阿里的通义、京东的言犀、腾讯的混元、中科院
的紫东太初、科大讯飞的 1+N 认知、浪潮的源 1.0、
昆仑万维的天工 3.5、云从科技的行业精灵、知乎的
“知海图 AI”、第四范式的“式说 3.0”、科大讯飞
的“星火认知”等大模型都已发布。
模型层作为目前 AIGC 最具特征性、凝聚最多智
力成果的领域,其发展程度有赖于资本、人才、技术
效果及成本控制、数据层配合、战略合作及投资等
多要素的参与。随着各家 AIGC 公司入局,模型层将
得到长足发展,其也将更贴合应用层的需求,为更
25
多用户带来更佳的体验。
(3)AIGC 应用层发展前景
AIGC 是一次新的技术革命,特斯拉和 SpaceX 的
创始人马斯克认为,AIGC 是人工智能发展的重要趋
势之一,有可能改变我们的工作方式和生活方式。
他曾经说过:“未来的工作将会是与 AI 一起工作,
而不是被 AI 取代。”他还表示,AIGC 有可能成为未
来的一项重要技术。随着 AIGC 的不断发展,越来越
多 AIGC 应用被生产,丰富了用户的生活选择,提高
了用户获取信息的效率。
在 to B 端,许多 AIGC 公司已经在传媒广告、
娱乐、零售、金融、政务、电力、医疗等业务上进行
布局,致力于为垂直产业链下提供高效率、高质量、
高频次的企业服务。随着越来越多的企业拥抱人工
智能,打造产业数字化,AIGC 将会成为更多企业端
客户的稳定需求。目前,B 端 AIGC 应用尚处于合作
探索期,AIGC 公司与企业用户正在探索未来产业的
可能模式,共同推进 AIGC 为产业发展赋能。
在 to C 端,AIGC 将通过进一步下放内容创作
权,激发用户的创作激情,加速创作内容的裂变和
传播速度。通过内容社区等方式,用户可以自行相
互讨论具体应用的使用场景、使用方式、效果调整
等内容,形成内部自发粘性。但国内用户的较低付
费意愿和购买力,如何形成完善的集群效应,是 to
C 端的难点所在。
无论是 to B 还是 to C 端,用户的不断实践与
38 麦肯锡:《生成式人工智能的经济潜力:下一波生产力浪
潮》。
使用可以为模型层不断提供数据来源、修正产出内
容,进而增进模型的自优化,反回来进一步提升 AIGC
提供内容的质量,用户与模型的互动进入良好的正
向循环。
3.AIGC 变革行业前瞻
不少企业在全球新冠肺炎疫情常态化下已形成
开发数字内容的惯性,各行各业对数字内容的需求
呈现快速增长态势。而 AIGC 以其多样性、便捷性等
特征,助力各行业提高生产内容的效率,提供更多
元化的交互场景。麦肯锡指出,如果将分析的 63 种
生成式 AI 应用于各行各业,将为全球经济每年带来
2.6 万亿至 4.4 万亿美元的增长(英国 2021 年的 GDP
总额为 3.1 万亿美元)。这一预测还未将所有的生成
式 AI 应用计算在内,若将尚未研究的应用计算在内,
生成式 AI 所产生的经济影响可能会翻倍。报告数据
显示,从整个经济来看,生成式 AI 可提升 850 个职
业的 2100 个具体工作的生产效率,每年生产成本降
低可以高达 6.1 万亿到 7.9 万亿美元 38。AIGC 对以
下几个行业的变革尤为突出。
(1)AIGC+传媒
自传媒诞生以来,就以要式化、强时效作为行
业特征,而 AIGC 恰恰符合了传媒行业的需求。AIGC
作为当前新型的内容生产方式,极大提高了传媒活
动的生产效率。AIGC 与传媒的交融可以体现为写稿
机器人、AI 转写、AI 翻译、AI 字幕生成等,相关应
用的产生辐射了传媒行业的全链条、多环节,深刻
26
改变了媒体的生成内容模式,为传媒行业助力赋能。
在采编环节,AIGC 可以实现自动化智能写作,
极大满足了新闻产业的时效性要求。例如,中国地
震台网的写稿机器人就可以在震后数秒后自动产出
与当前地震相关的数百字及十多张图片,涵盖速报
参数、震中位置、周边信息、历史地震等二十余项内
容 39。除了文字和图片端的亮点外,AIGC 亦在视频
端有不俗的表现。例如,在 2020 年全国两会期间,
《人民日报》利用“智能云剪辑师”工具快速生成视
频,并能够实现自动匹配字幕、人物实时追踪、画面
抖动修复、横屏速转竖屏等技术操作,以适应多平
台分发要求 40。
在传播环节,AIGC 主要以 AI 合成主播为主要
展现形式,为大众带来更丰富的传播内容。目前新
华社、中央广播电视总台、人民日报社等国家级媒
体及湖南卫视等省市媒体都开始积极布局应用 AI
合成主播,先后推出“新小微”“小 C”等虚拟新闻
主持人,并推动其从新闻播报向晚会主持、记者报
道、天气预报等更广泛的场景应用,为全国两会等
重大活动传播深度赋能。在应用形态上,也从过去
的机械口型到面部自然表情、手势、肢体等素材延
伸。例如腾讯 3D 手语数智人“聆语”,实现了唇动、
面部表情、肢体动作、手指动作等内容的生成,并配
套可视化动作编辑平台,支持对手语动作进行精修。
39 中国地震台网微信公众号:《地震信息服务的背后——地
震信息播报机器人系统》,访问地址:https://mp.weixi
n.qq.com/s/k-vmiI1ggEphW4njIivS9Q。
(2)AIGC+电商
随着数字经济的发展,消费升级的驱动及消费
者对购物体验的更高要求,沉浸式、交互式购物方
式成为未来电商的发展趋势。
商品端上,3D 模型商品可以为消费者提供更多
的维度和方式来呈现商品,从而提供接近实物的购
物体验。例如,阿里巴巴在 2021 年 4 月上线了 3D
版的天猫家装城,帮助商家快速构建 3D 购物空间,
让消费者可以自己动手做家装搭配,从而为消费者
提供沉浸式的“云逛街”体验。数据显示,3D 购物
的转化率平均值为 70%,较行业平均水平提升了 9 倍,
同时,正常引导成交客单价也提升了超过 200%,并
且商品退换货率明显降低。此外,3D 模型商品还可
以帮助消费者更好地理解和判断商品的质量和细节,
从而提高消费者的购物满意度和体验感。
销售端上,基于动作、话术、形象而打造的虚拟
主播可以为消费者提供 24 小时不间断的商品介绍
及在线咨询服务等内容,降低商家的销售成本。如
欧莱雅、飞利浦、完美日记等品牌的虚拟主播一般
会在凌晨 0 点上线,并进行近 9 个小时的直播,与
真人主播形成了 24 小时无缝对接的直播服务。且,
头部主播的“塌房”事件频发一定程度上也增加了
销售端风险,而 AI 主播则可以避免人设崩塌,商家
不必花大量成本用于主播的背景调查和可能的公关
40 人民日报:《人民日报“智能云剪辑师”上岗,亮相两
会!》,访问地址:https://baijiahao.baidu.com/s?id=1
667297559335942531&wfr=spider&for=pc。
27
事件。
(3)AIGC+金融
在金融企业拓客、留客的过程中,该项活动通
常有以下三个特点:其一,活动频率高。其举办活动
频繁、多变,但各活动之间变量相近,总体相差不
大。其二,风控要求高。金融机构对于资损风险、数
据安全的要求很高,需要将风险降到最低才能保证
资金的安全。其三,客诉要求高。尽量避免客诉,如
发生客诉后也需要加急、尽快处理,做到让用户满
意。但现实却是许多金融机构很难做到以上几点,
既难以洞察客户的行为偏好和真实需求,也无法实
时陪伴、辅助决策,致使营销活动和成本投入不少,
但客户的活跃度与粘性始终难以提升。而这也是
AIGC 可以发挥长处的领域所在。
在金融领域,AIGC 可以实现大数据分析,进行
更全面的尽职调查,识别主体信用风险,为金融机
构在信用评分、风险管理、投资决策、交易执行和客
户服务方面实现降本增效。(1)信用评分:AIGC 可
以用于生成客户信用报告,从而帮助金融机构更准
确地评估客户的信用风险。(2)风险管理:AIGC 可
以用于生成市场预测和风险评估报告,从而帮助金
融机构更好地管理风险。(3)投资决策:AIGC 可以
用于生成投资建议和研究报告,从而帮助投资者作
出更好的投资决策。(4)交易执行:AIGC 可以用于
生成交易指令和报告,从而帮助交易员更有效地执
行交易。(5)客户服务:AIGC 可以用于生成客户服
41 中国银行官方网站:https://www.boc.cn/ebanking/bo
cmbs/mbs1/201804/t20180423_12061379.html
务报告和建议,从而帮助金融机构更好地服务客户。
例如,2018 年 4 月 19 日,中国银行正式推出智能
投资顾问产品——“中银慧投”,依托人工智能和大
数据技术,面向广大用户提供代销类资产管理产品
销售业务基础上的资产配置建议服务,包括“优选
FOF”“资产诊断”“智能定投”三个模块 41
。
第二章 AIGC 监管态势
一、中国 AIGC 监管态势
我国对 AIGC 的监管采用“包容审慎”的原则,
放宽事前准入限制,加强事中事后监管。对于发展
前景暂时不明的业态和领域,国家鼓励大胆创新,
并在一段时间内予以观察。这种包容审慎的监管理
念极大推动了我国互联网产业的发展。
从国际层面上讲,我国的监管态度介于美国和
欧洲之间:既从政策层面上鼓励人工智能的发展,
又对人工智能,尤其是深度合成技术的开发和使用
持相对谨慎的监管态度。
《生成式人工智能服务管理暂行办法》(以下简
称《暂行办法》)是我国针对 AIGC 的首次监管举措,
具有里程碑式的意义。通过对《暂行办法》立法意图
的剖析,能深入浅出地理解我国目前对 AIGC 监管的
基本态势。
《暂行办法》映射出国家坚持创新、发展与安
28
全、法治两手都要抓,两手都要硬的态度,以包容审
慎和分类分级监管为导向,对 AIGC 服务实行监管。
在此框架内,AIGC 的创新发展受到重视。随着 AIGC
技术迅猛发展,其应用场景愈发广泛多样,《暂行办
法》鼓励不同领域通力合作,从技术创新、数据资源
建设、应用转化到风险控制等各方面共同促进创新。
考虑到我国在 AIGC 相关算法、芯片等技术研发方面
起步相对较晚,《暂行办法》提倡在基础技术领域进
行自主创新,并呼吁推动平等互利的国际交流与合
作,加强与他国之间的合作,共同推进 AIGC 技术的
进步。在资源利用方面,《暂行办法》强调资源共享
的重要性,积极推动 AIGC 基础设施和公共训练数据
资源平台的构建,也鼓励协同共享算力资源,以提
高算力资源的利用效率。这些举措共同构建了 AIGC
领域内的鼓励创新、支持合作、资源共享的环境。
从法规架构看,我国监管机构倾向于建立一套
“1+N”式法律框架,以基础性和原则性规定组成为
主,以特定问题和技术领域的专项规则和指南为辅,
确保对 AIGC 技术的全面监管。不容忽视的是,已列
入 2023 年国务院立法工作计划的《人工智能法》草
案将起到至关重要的作用。一旦该法通过全国人大
常委会审议,将为 AIGC 领域的技术开发、应用和产
业发展提供坚实的法律基础,涵盖诸如算法、数据、
安全、个人信息保护、知识产权等重要领域。对于
《暂行办法》而言,其地位旨在作为“1+N”法规框
架中的一环,重点关注解决当前我国及国际上 AIGC
技术所面临的热点难题。《暂行办法》将在初期扮演
指导性角色,为相关监管规定提供补充和细化思路。
在地方层面也在积极进行相应的探索,上海市
先后出台了《上海市数据条例》《上海市促进人工智
能产业发展条例》,深圳市出台了《深圳经济特区人
工智能产业促进条例》等,体现了各地对 AIGC 的鼓
励与重视,这有助于 AIGC 行业健康、稳定发展。
二、美国 AIGC 监管态势
美国的人工智能监管政策相对宽松,其目的在
于维持美国在人工智能领域的领先优势。美国政府
自 2016 年起就开始关注人工智能的风险和监管问
题。奥巴马政府在报告《为人工智能的未来做好准
备》中提出“如果对人工智能的监管反应可能会增
加合规成本,或减缓有益创新的开发或采用,政策
制定者应考虑如何调整这些反应,以降低成本和创
新障碍,而不会对安全或市场公平产生不利影响”。
而后 2019 年 2 月发布的《关于维持美国在人工智能
领域领导地位的行政命令》中指出要在维护公民自
由、隐私和美国价值观的前提下促进美国人工智能。
在 2020 年 1 月,白宫发布规范人工智能发展及应用
的监管原则,一份名为《人工智能应用规范指南》的
文件,主张限制主管机关过度干预,并表示希望欧
洲当局同样能够避免采取激进措施。
2022 年 10 月,美国总统拜登公布了《人工智能
权利法案蓝图》,概述了美国在人工智能时代应满足
的五项原则,包括安全有效的系统,算法歧视保护,
数据隐私,通知和解释,以及人工替代、考虑和后
备。虽然该法案不具备强制性,但却从科技、经济以
及军事等方面为美国人工智能发展提供指引。除此
29
之外,两党立法者小组于 2023 年 6 月 20 日提出了
一项名为《建立人工智能委员会以及其他目的》的
法案,旨在成立一个专注于人工智能监管的委员会。
2023 年 10 月 30 日,拜登政府颁布《关于安全、可
靠、可信地开发和使用人工智能的行政命令》,旨在
促进安全、负责任地管理人工智能的开发和使用。
在 AIGC 技术出现突破的情况下,尽管几位立法
者敦促加强监管,美国政府对人工智能规则仍不予
干涉。
由此可见,美国政府对人工智能的态度倾向于
尽量减少对 AI 创新的监管影响从而鼓励发展和创
新。
三、欧盟 AIGC 监管态势
欧盟秉承其一贯的谨慎态度,在数据保护和隐
私上较为保守,在人工智能的发展和应用方面更加
关注其可能带来的风险。欧盟希望确保人工智能以
人为本、合乎道德、可持续发展,尊重基本权利和价
值观,并且据此尝试将人工智能的应用纳入监管。
欧盟对于 AIGC 的发展主要有四个要求,第一,
应确保投放到欧盟市场和使用的人工智能系统是安
全的,并尊重关于基本权利和欧盟价值观的现有法
律。第二,应确保法律的确定性,以促进人工智能的
投资和创新。第三,加强对适用于人工智能系统的
基本权利和安全要求的现有法律的管理和有效执行。
第四,促进合法、安全和可信的人工智能应用的单
一市场的发展,防止市场分裂。此四个要求,贯穿于
欧盟立法及监管的全过程。
欧盟个别国家甚至禁用 AIGC 产品。2023 年 3
月,意大利数据保护机构称对 ChatGPT 禁止,经其
调查后表示,该模型存在隐私问题。意大利不仅会
阻止 OpenAI 的聊天机器人,还会调查它是否符合通
用数据保护条例。此外,爱尔兰数据保护委员会也
表示,正在与意大利监管机构跟进,以了解他们采
取行动的依据,来保护本国用户的信息安全。德国、
法国等国家也可能对 ChatGPT 进行停用,并且德国
相关组织表示已经与意大利相关组织进行了联系,
并讨论了调查结果。
欧洲议会两个委员会 5 月 11 日通过《人工智能
法案》提案的谈判授权草案,向立法严格监管人工
智能技术的应用迈出关键一步。欧洲议会当天发表
声明,议会内部市场委员会和公民自由委员会以压
倒多数通过欧盟委员会于 2021 年 4 月提出的《人工
智能法案》提案的谈判授权草案。新文本将严格禁
止“对人类安全造成不可接受风险的人工智能系统”,
包括有目的地操纵技术、利用人性弱点或根据行为、
社会地位和个人特征等进行评价的系统等。
具体的监管政策和法律法规附于本报告附录,
仅供参考。
第三章 AIGC 法律风险分析
一、版权确权风险与侵权风险
在 AIGC 的输入端,在使用数据训练 AI 算法或
模型时,通常需要海量训练数据,这些数据可能通
30
过自行收集、从第三方采购和通过自动化工具采
集。其中,自行收集,是指 AI 企业通过网站、
App、小程序、SDK 等方式从数据主体处直接收
集;从第三方采购,是指从数据供应商处直接采
购;通过自动化工具采集,是指通过网络爬虫等技
术抓取网络上现有的数据。前两种数据获取方式,
其来源相对确定,但通过自动化工具采集方式获取
数据来源的方式,因为数据量庞大且来源广泛,容
易对其他主体的民事权益构成侵害,比如侵害其他
主体的著作权、侵害其他主体的商业权益和竞争秩
序,从而对其他主体构成著作权侵权和不正当竞争
的风险。
在 AIGC 的输出端,在 AIGC 生成过程中,因为
生成内容把基本要素进行了重新编排,融入了算法
设计者的劳动价值,其可能因为具有独创性而获得
著作权,从而获取版权法律的保护。但是,也可能
因为生成作品不具有独创性而无法获得版权法律的
保护。相反,AIGC 生成内容还可能因为与已有作
品构成实质性相似而对其构成版权侵权。
以下摘选相关案例予以具体分享、分析。
(一)数据来源侵权风险
1.全球首例“Stable Diffusion”AIGC 模型权
侵权案 42
42 See Stable Diffusion litigation,https://stabledi
ffusionlitigation.com/(最后访问时间:2023 年 10 月 2
2 日)。
2023 年 1 月 13 日,三位艺术家代表 Sarah
Andersen,Kelly McKernan 和 Karla Ortiz 提起集
体诉讼,控告使用 Stable Diffusion 的三家公司
Stability AI、Deviant Art 和 Midjourney 未经允
许也未给予任何补偿使用上百位画家的作品作为训
练数据,原告认为该三家公司的应用将构成版权侵
权(直接侵权及间接侵权)、公开权侵权,以及不正
当竞争。
原告认为被用于训练的图像会以压缩副本的形
式储存并纳入人工智能系统,并且根据相关算法生
成的属于训练数据的衍生作品,其完全来自数据和
潜在图像的组合,并称“Stable Diffusion”其是
一种“21 世纪的拼贴工具”,这些数据为相关公司
带来了丰厚的利润,但却没有获得数十亿训练数据
版权所有者的许可,也没采取任何报酬支付或补偿
措施。据此,原告向美国加利福尼亚州北区地方法
院提起诉讼,
该案的审理现在仍在进行中。
2.Anthropic 被环球音乐起诉 43
Anthropic 成立于 2021 年,由 Daniela Amodei
和 Dario Amodei 兄妹创立,他们都曾在 OpenAI 工
作。Anthropic 已分别获得谷歌 3 亿美元、亚马逊
40 亿美元的投资。目前该公司在 Claude1.3 的基础
上,已经发布了最新的版本 Claude2。
2023 年 10 月 18 日,环球音乐集团(Universal
43 来源:知产力微信公众号,文章链接 https://mp.weixi
n.qq.com/s/vs5tjrUY7Tc7TAuFsTSsyQ(最后访问时间:20
23 年 10 月 31 日)。
31
Music Group)和其他出版商起诉美国人工智能公司
Anthropic,指控该公司滥用“无数”受版权保护的
歌词来训练其聊天机器人 Claude。环球音乐集团要
求 Anthropic 对其损失作出 7500 万美元的赔偿。
根据原告的诉状,Claude 人工智能模型能以貌
似人类的方式响应用户的提示,这是因为被告复制
并向底层模型输入了大量文本。
具体来说,被告通过以下步骤训练其 Claude 人
工智能模型如何生成文本:首先,被告用爬虫从互
联网上复制了包含原告享有版权的歌词在内的大量
文本,这些构成了输入或“语料库\",Claude 人工智
能模型就是在这些输入或“语料库”的基础上进行
训练的。其次,被告会“清理”复制的文本,删除它
认为技术上和商业上与其商业模式不一致的材料,
无论是技术性的还是商业性的。比如删除冒犯性语
言,但多数情况下,这种“清理”过程似乎完全忽视
了复制文本所体现的版权侵权行为。被告将以前复
制的大量文本复制到计算机中,并通过多种方式处
理这些数据,以训练 Claude 人工智能模型,包括“标
记”“微调”“强化学习”,所有这些都可能需要对
收集到的文本进行额外的复制。一旦输入和训练过
程完成,被告的 Claude 人工智能模型就会生成在结
构和风格上与训练语料库中的文本一致的输出结果。
被告在很大程度上隐瞒了其用于训练人工智能
模型的文本的具体来源。被告只表示 Claude 模型的
训练依据包括从互联网上公开获取的信息、从第三
方获得许可的数据集,Claude2 号接受训练所依据
的文本将持续到 2023 年初,其中 90%为英语。而数
据集(如\"Common Crawl\"数据集)中包含大量流行歌
词内容。被告拒绝透露其用于培训 Claude 的材料的
原因是意识到自己在未经版权所有者授权的情况下
复制了受版权保护的材料。人工智能训练完成后,
被告并未删除侵权的训练素材,被告的人工智能模
型传播了大量与出版商受版权保护的歌词相同或近
乎相同的副本,进一步侵犯了出版商的权利。诉状
列举的例子,用户要求 Claude 对凯蒂佩里的《咆哮》、
滚石乐队的《You Can't Always Get What You Want》
输出歌词,然后得到了和原版几乎相同的歌词。
被告的 Claude 人工智能模型还能为新歌曲生
成歌词,有时会包含现有版权歌曲的歌词。当 Claude
被要求按照某位艺术家或词曲作者的风格创作其他
类型的版权作品(如诗歌、短篇小说)时,人工智能
模型也会经常有直接抄袭原告享有版权的歌词。
Claude 甚至可能会将一部受版权保护的作品的部分
内容与其他受版权保护的作品的部分内容放在一起,
有时甚至有悖于歌曲作者的初衷。
Claude 还能为歌词生成和弦谱,原告认为也构
成侵权。当 Claude 被要求为某首歌曲提供和弦行进
时,其往往会生成包含出版商受版权保护的歌词以
及和弦的输出结果。诉状举了约翰尼-卡什(Johnny
Cash)的《Daddy Sang Bass》的例子。尽管被告公
然利用出版商的歌词和内容用于开发和训练人工智
能模型,但被告禁止他人将被告拥有版权的内容用
于同样的目的,其服务条款明确禁止使用被告内容
“开发或训练任何人工智能或机器学习算法或模
型”。
32
(二)生成内容确权风险
1.腾讯诉上海盈某科技侵害著作权及不正当竞
争纠纷案
【案情简介】
2018 年 8 月 20 日,原告在腾讯证券网首次发
表标题为《午评:沪指小幅上涨 0.11%报 2671.93 点
通信运营、石油开采等板块领涨》的文章,文章末尾
注明:本文由腾讯机器人 Dreamwriter 自动撰写。
涉案文章是一篇股市财经综述类文章,连标题在内
共计 979 字,由九个自然段组成,第一自然段对 2018
年 8 月 20 日上午的沪指、深成指、创业板指数及上
证 50 指数的涨跌情况进行了介绍;第二、三、四、
五自然段分别对盘面、概念股、个股、换手率、资金
流向方面的相关情况进行了介绍;第六、七、八、九
自然段对人民币对美元中间价、银行业同业拆放利
率、融资融券信息、沪深港通南北资金流向的相关
情况进行了介绍。而被告经营的“网贷之家”网站上
全文转载了上述文章,其标题和内容完全一致,文
章末尾同样标注:本文由腾讯机器人 Dreamwriter
自动撰写。原告据此认为被告侵犯了原告对该文章
享有的著作权,向法院提起诉讼。
【案件结果】
本案的争议焦点在于,涉案文章是否构成文字
作品。
首先,涉案文章由原告主创团队人员运用
Dreamwriter 软件生成,其外在表现符合文字作品的
形式要求,其表现的内容体现出对当日上午相关股
市信息、数据的选择、分析、判断,文章结构合理、
表达逻辑清晰,具有一定的独创性。其次,原告组织
包含编辑团队、产品团队和技术开发团队在内的主
创团队运行 Dreamwriter 软件生成包含涉案文章在
内的财经新闻类文章。涉案文章的生成过程主要经
历数据服务、触发和写作、智能校验和智能分发四
个环节。在上述环节中,数据类型的输入与数据格
式的处理、触发条件的设定、文章框架模板的选择
和语料的设定、智能校验算法模型的训练等均由主
创团队相关人员选择与安排。涉案文章的创作过程
与普通文字作品创作过程的不同之处在于创作者收
集素材、决定表达的主题、写作的风格以及具体的
语句形式的行为也即原告主创团队为涉案文章生成
作出的相关选择与安排和涉案文章的实际撰写之间
存在一定时间上的间隔。涉案文章这种缺乏同步性
的特点是由技术路径或原告所使用的工具本身所具
备的特性所决定的。原告主创团队相关人员的上述
选择与安排符合著作权法关于创作的要求,应当将
其纳入涉案文章的创作过程。本案中原告主创团队
在数据输入、触发条件设定、模板和语料风格的取
舍上的安排与选择属于与涉案文章的特定表现形式
之间具有直接联系的智力活动。从整个生成过程来
看,如果仅将 Dreamwriter 软件自动生成涉案文章
的这两分钟时间视为创作过程,确实没有人的参与,
仅仅是计算机软件运行既定的规则、算法和模板的
结果,但 Dreamwriter 软件的自动运行并非无缘无
故或具有自我意识,其自动运行的方式体现了原告
的选择,也是由 Dreamwriter 软件这一技术本身的
特性所决定。如果仅将 Dreamwriter 软件自动运行
33
的过程视为创作过程,这在某种意义上是将计算机
软件视为创作的主体,这与客观情况不符,也有失
公允。因此,从涉案文章的生成过程来分析,该文章
的表现形式是由原告主创团队相关人员个性化的安
排与选择所决定的,其表现形式并非唯一,具有一
定的独创性。综上,从涉案文章的外在表现形式与
生成过程来分析,该文章的特定表现形式及其源于
创作者个性化的选择与安排,并由 Dreamwriter 软
件在技术上“生成”的创作过程均满足著作权法对
文字作品的保护条件,涉案文章属于我国著作权法
所保护的文字作品。
被告未经许可,在其经营的网贷之家网站上向
公众提供了被诉侵权文章内容,供公众在选定的时
间、选定的地点获得,侵害了原告享有的信息网络
传播权,应承担相应的民事责任。
2.《通向天堂之近路》绘画登记案 44
【案情简介】
2018 年 11 月 3 日,美国人泰勒提交了作者为
“创造力机器”的作品版权登记申请,以寻求将这
一计算机生成的作品登记为“‘创作者机器’所有
者的雇佣作品”。美国版权局于 2019 年 8 月 12 日
44 【Re:Second Request for Reconsideration f
or Refusal to Register A Recent Entrance to
Paradise (Correspondence ID 1-3ZPC6C3; SR
# 1-7100387071)】
拒绝了登记申请,认为其缺乏版权注册所需要的人
类作者身份。
泰勒随后请求版权局重新考虑该作品登记申请,
认为该局人类作者的要求违反宪法规定,且缺少法
规和判例法的支持。版权局根据该请求重新对作品
进行审查后,再次得出结论认为,泰勒没有提供证
据证明人类作者对该作品进行了充分的创造性投入
或干预,该作品缺乏注册所需要的人类作者身份。
因此版权局拒绝了其第一次复议请求。
而后泰勒再次请求重新审议该登记申请,仍主
张版权局的人类作者要求违反宪法且缺乏判例法的
支持。该观点主要以公共政策为核心,认为版权局
应当对机器生成的作品进行版权登记,因为这将促
进版权法的基本目标。当前没有任何具有约束力的
权威机构禁止授予计算机生成作品的版权,因此版
权法应当允许非人类实体成为雇佣作品规则下的作
者。
【案件结果】
关于泰勒的第一点主张,作者的要求为人类是
否违反宪法,是否没有判例法的支持。美国版权局
版权复审委员认为:作为一种一般规则,版权法只
保护建立在人类思想创造活动所产生的智力劳动成
果。在先前的司法实践中,法院均将作者称为“完
34
成科学或文学作品的人”“造成图片产生原因的人”
并阐明人类思想与创造性表达之间的联系是版权保
护的先决条件,法院也多次驳回了将版权保护拓展
到非人类创作的尝试,如美国第九巡回法院认为一
本包含“由非人类存在‘撰写’的书籍只有在人类
对其启示进行选择和安排”的情况下才能获得版权
保护。同样,猴子也不能为它用相机拍摄的照片注
册版权,因为版权法中关于作者的诸多术语都意味
着人类,必然不包括动物。可见,法院一致认为非人
类表达不符合版权保护的条件。版权局因此需要遵
循法院的先例,即认为人的作者身份是版权保护的
基本要素。并且,其他材料也反映非人类无法成为
作者:“关于新技术条件下享有版权作品使用的委
员会”曾认定“原创作品”的现有司法解释要求作
者为人类,这足以使计算机创作的作品得到保护,
因此不需要对版权法进行修订,任何作品是否有资
格受到版权保护,并不取决于创作时所使用的设备,
而是取决于在作品产生时是否至少存在最低限度的
人类创造性努力;版权局所使用的实践手册长期以
来也一直规定注册时必须有作者本人,并阐明了非
人类表达的多种情况下的应用,虽然其中并没有明
确涉及人工智能,但可以判断版权局的政策和实践
将人类作者作为版权保护的先决条件;美国专利商
标最近的一份报告指出,在没有自然人参与的情况
45 (1)参见扬子晚报:《北京互联网法院开审国内首例“A
I 文生图”侵权案,AI 生成图片是否受法律保护成讨论焦
点》,https://baijiahao.baidu.com/s?id=1775556873945
974291&wfr=spider&for=pc(最后访问时间:2023 年 10 月
22 日);(2)参见新榜:《17 万网友围观!中国首例“AI 文
下由人工智能算法或程序生成的作品是否有资格成
为作品这一问题已经向公众征求意见,该报告的回
复摘要中指出,绝大多数评论者认为,现行法律不
允许非人类成为作者,并且这种规定应当延续。因
此,版权法只保护基于人类心智的创作能力而产生
的智力劳动成果。美国版权局将不会登记在缺乏人
类作者创造性投入的情况下,由机器或者纯粹机械
过程而生成的内容,因为作品必须由人所创作。
关于泰勒的另一点主张,认为人工智能可以是
作者,因为“雇佣作品”规则允许非人类的法人,
如公司成为作者。美国版权局复审委员认为,该作
品并非版权法定义的雇佣作品,并且“雇佣作品”
规则只涉及作品所有人的身份,而不涉及作品是否
受版权保护,由于法律要求作品必须由人类作者完
成,因此泰勒的主张不成立。
据此,美国版权局复审委员会维持了先前的决
定,认为版权法只保护“建立在以人类思想创造活
动为基础的智力劳动成果”,拒绝对人工智能生成
的绘画《通向天堂之近路》进行作品登记。
(三)生成内容侵权风险
1.国内首例“AI 文生图”侵权案 45
2023 年 8 月 24 日,北京互联网法院依法公开
生图”著作权案庭审直播,AIGC 构成作品吗?》,https://
zhuanlan.zhihu.com/p/653787493(最后访问时间:2023
年 10 月 22 日);(3)参见朱开鑫:《AI 生成与版权保护》,
https://mp.weixin.qq.com/s/JMFm_Opb4jWXzqbChmVsbA
(最后访问时间:2023 年 10 月 22 日)
35
开庭审理了一起“AI 文生图”著作权案。本案原告
李某利用 AI 绘图模型 Stable Diffusion,通过输
入提示词的方式,生成了一张人物图片,于今年 2 月
底发布在其小红书账号。被告刘某是一位诗词博主,
今年 3 月在其百家号上发布文章时使用了该人物图
片作为配图,且截去了图片来源水印。李某随后以
侵害作品署名权和信息网络传播权为由将刘某起诉
到北京互联网法院,要求被告赔偿其经济损失 5000
元,并赔礼道歉。
在庭审过程中,法庭要求原告当庭展示涉案 AI
图像的生成过程,并就独创性有无加以说明。原告
李某因此介绍了该人物图片的生成过程:首先,需
要通过网上的 AI 绘画整合包,在本地电脑运行
Stable Diffusion,并从根据需求选择一个最符合
目标图像风格的模型,其下载了在开源社区 Hugging
Face 发布的模型 AsiaFacemix;其次,根据自己的
需求,编辑、输入对目标图像加以描述限定的、较为
复杂的“正向提示词”和“反向提示词”;再次,对
迭代步数、采访方法、图像尺寸等模型参数加以分
别设置,最终生成了一张黄昏光线下的美女特写摄
影图片,并以“春风送来了温柔”为名发布在小红书
上。
关于自身对 AI 图像的创作贡献,原告李某认为,
AI 模型只是一种创作工具,不能自主生成任何内容。
涉案图片的整个创造活动是由使用者完成,原告在
涉案 AI 图像生成过程中对于模型类型、正反提示词、
绘画参数等的选择设置体现出了个性化创作贡献,
自己在 AI 文生图的操作和输入均可体现出独创性
智力劳动,涉案图片具有独创性。涉案 AI 图像达到
了美术作品应有的创作高度,一般公众均会认可其
艺术价值,不能因为 AI 绘图模型相较于此前其他创
作工具更先进,便否认自然人在创作过程的主导作
用,全自动照相机拍出的照片都可以构成摄影作品,
而原告的上述创作贡献明显高于按动相机快门和选
择拍摄时间这类操作。据此,李某主张涉案 AI 生成
图片属于美术作品,如果不构成美术作品,也属于
著作权法上“符合作品特征的其他智力成果”。而被
告刘某未经许可将该图片作为配图,且删除了图片
上的署名水印,原告李某认为被告刘某的行为侵害
了其对图片所享有的著作权。结合学习相关 AI 软件
的成本、创作所付出的智力劳动,以及最终涉案作
品受到用户喜爱的程度,原告李某请求被告刘某赔
偿经济损失 5000 元,并赔礼道歉以消除影响。
对于原告的主张,被告刘某辩称,其所发布主
要文章内容为原创诗文而非涉案图片,没有商业用
途,不具有侵权故意;涉案图片是其通过网络检索
获取的,具体来源已无法提供,使用时也不确定李
某是否对涉案图片享有权利。并且 AI 绘画是人类画
家的结晶,不是原告的作品。涉案图片创作门槛低,
没有独创性,因此不构成作品,目前公开分享的提
示词和 AI 绘画非常多,在电商平台上交易的价格低
至几块钱,不值得赔偿 5000 元。
本案并未当庭宣判,目前仍在进一步审理中。
36
二、侵犯肖像及个人隐私数据风险
AIGC 在使用数据的过程中,可能会使用包括
图形、视频、音频等数据,在该类数据中可能会涉
及自然人的形象、声音、个人信息等内容,应关注
其侵害人格权的风险。在国内外的绝大多数国家的
法律法规中,均规定了自然人享有肖像权、名誉
权、荣誉权、隐私权等权利。同样,在欧盟《通用
数据保护条例》、美国《加州消费者隐私法案》以
及中国《个人信息保护》等主要国家和地区均规
定,自然人的个人隐私信息受法律保护。而 IAGC
在使用前述音视频和图片数据过程中,可能因未获
得授权或者超出授权使用而对自然人的前述人格权
造成侵害。
在侵犯肖像权方面,鉴于 AI 数据可能涉及照
片、图片、录像、影视剧等内容,只要数据中涉及
的肖像、声音能再现自然人的特征,或者一般社会
公众能够将影视剧中的表演形象与表演者本人真实
的相貌特征联系在一起,相关的影视形象、自然人
形象均构成自然人肖像权控制的范围。根据我国
《民法典》和国外主要法律规定,未经肖像权人同
意,制作、使用、公开肖像权人的肖像,即构成对
权利人肖像权的侵犯。
在侵犯个人隐私数据方面,AIGC 的技术实现上
依托大量的训练数据,其中不乏存在大量的网络数
据及用户输入的数据。这种特性使得 AIGC 企业在运
营过程中存在侵犯个人隐私数据的风险。具体表现
为:
第一,在获取个人隐私数据方面,AIGC 企业可
能存在以下情形:未设置隐私政策,隐私政策未清
晰、明确、充分告知用户收集和使用数据的情况,超
过必要范围收集和使用个人信息,或者收集用户人
脸识别数据、地理位置数据等敏感数据未依法取得
用户单独同意等,这些违反欧盟《通用数据保护条
例(GDPR)》、美国《加州消费者隐私法案》、中国《个
人信息保护》以及其他国家或地区的隐私立法的情
形,将使得企业收集和使用个人隐私信息存在违法
违规风险,进而导致较高额度的处罚或引发集体诉
讼。
第二,在用户使用 AIGC 过程中,需要用户输入
数据以生成其需要的内容,在用户输入的数据中可
能存在其敏感个人数据或者隐私,这部分数据甚至
存在跨境传输所带来的安全风险,也会引起各个国
家和地区对数据跨境传输高度关注,AIGC 企业也存
在超出范围收集、跨境传输这部分数据进而被监管
处罚的风险。
第三,对 AIGC 企业而言,海量的数据是不可或
缺的,这其中就包括海量的个人隐私数据,比如
OpenAI 短短两个月活跃用户超过两亿,这也就意味
短短两个月收集了两亿人的个人信息。这海量的个
人隐私数据,其存储、加工和流转等环节都对 AIGC
的注意义务提出了更高的要求,企业存在因黑客攻
击、内部泄露等原因导致信息泄露。提供 AIGC 服务
的企业若出现大量泄露个人信息的情况,将会面临
有关部门严厉的处罚。
以下摘选相关案例予以具体分享、分析。
37
(一)换脸侵犯肖像
1.AI 换脸侵犯人格权案 46
【案情简介】
2022 年 12 月,杭州互联网法院审理了一起涉
及“AI 换脸”侵害他人肖像权的案件。原告楼某某
是一名古风汉服模特,经常在社交平台发布古风汉
服照片和视频。楼某某发现被告公司运营的“AI 换
脸”App 中使用的是其拍摄的古风造型视频模板。该
App 使用了深度合成算法,用户可通过上传个人照
片,将视频模板中的人脸替换成用户上传的人脸,
除五官发生实质性变化之外,其余内容都与原视频
保持一致。软件生成换脸后的古风造型视频,用户
可以将其保存并分享到其他平台。
【案件结果】
法院经审理认为,被告公司未经楼某某同意使
用其肖像,利用深度合成技术制作了伪造视频,构
成对楼某某肖像权的侵害,最终判决被告向楼某某
赔礼道歉并赔偿损失人民币 5000 元。
2、国内软件擅自使用自然人形象创设虚拟人
物构成侵权 47
【案情简介】
被告上海某科技公司是某款手机记账软件的开
46 (1)参见中国新闻网:《“AI 换脸”软件涉侵犯肖像权 A
PP 开发者被判赔偿,》https://baijiahao.baidu.com/s?id
=1751740252016685467&wfr=spider&for=pc(最后访问时
间:2023 年 10 月 22 日);(2)参见梁山县人民政府:《擅
自使用别人视频充当“AI 换脸”盈利模板,肖像权如何守
护?》,http://jninglsfy.sdcourt.gov.cn/jninglsfy/38
发运营者,用户在该软件中可自行创设“AI 陪伴
者”,设置陪伴者的名称、头像,设置与该陪伴者的
人物关系(如男女朋友、兄妹、母子等),并借助聊
天语料实现与虚拟人物的交流互动。原告何某系公
众人物,在该款软件中被大量用户设置为陪伴人物
并设置了人物关系。某公司通过聚类算法,将陪伴
者“何某”按身份分类,并以协同推荐算法向其他
用户推介该虚拟人物。用户在设置“何某”为陪伴
人物时,上传了大量原告的肖像图片用以设置人物
头像。为了使虚拟角色更加拟人化,被告还提供了
“调教”算法机制,即用户上传各类符合该虚拟角
色人设的文字、肖像图片、动态表情等互动语料,部
分用户参与审核后,被告使用人工智能筛选、分类,
形成人物专属语料。用户和该软件为“何某”制作
了专属语料,根据话题类别、人设特点等,用于“何
某”与用户的对话中,为用户营造一种与原告真实
互动的体验。原告何某认为上海某科技公司的行为
侵害了其姓名权、肖像权以及一般人格权,因此诉
至法院请求判令被告公开向其赔礼道歉,并赔偿经
济损失及精神损害。
被告某公司则认为,原告何某主张的角色设置、
肖像图片上传、语料“调教”等行为均由用户作出,
其仅为网络技术服务提供者,且已在用户协议中已
5278/385284/9954653/index.html(最后访问时间:2023
年 10 月 22 日)
47 来源:人民法院报微信公众号,文章链接 https://mp.we
ixin.qq.com/s/T_Mjh3VXs2jn9pvxG4CcOA,访问时间 2023
年 10 月 30 日。
38
经明确了用户不得作出侵害他人权益的行为,在何
某发出通知后已将含有何某姓名、肖像的“AI 陪伴
者”删除,故其不应承担侵权责任。
【案件结果】
网络技术服务提供者在算法设计和规则设定中
嵌套其主观价值和主观目的,不适用“技术中立”
原则技术的深入应用使得网络服务提供者开始深入
参与到了内容的创作提供中。表面看仅提供技术服
务的网络服务提供者,如果在产品的规则设计和算
法应用中嵌套了其主观价值和主观目的,直接决定
产品服务核心功能实现,那么其提供的技术服务就
不是简单的“通道”服务,网络服务提供者也就不
再是中立的技术服务提供者,而应作为网络内容服
务提供者承担侵权责任。此外,软件开发者相比于
普通用户,获得他人许可其商业化使用他人人格利
益的可能性更大,因此如果仅仅从技术服务的角度
评价软件开发者的行为,并不利于人格权益保护和
网络空间治理。自然人的人格权及于其虚拟形象,
其保护规则可以同时援引一般人格权和具体人格权
的保护规则自然人“虚拟形象”所包含的姓名、肖
像、人格特点等人格要素是自然人的人格权客体,
因此,未经许可擅自创设、使用自然人虚拟形象的,
构成对自然人人格权的侵害。自然人的人格权包括
了具体人格权和一般人格权。具体人格权,如肖像
权、姓名权等,其权利客体和权能内容是具体而确
定的。而一般人格权则不同,与具体人格权相对,一
般人格权是一种框架性权利,权利客体是除具体人
格权外,自然人享有的基于人身自由、人格尊严产
生的其他人格权益。由于当下互联网产业模式不断
创新,虚拟现实等新技术不断发展,越来越多的自
然人人格要素被虚拟化使用,因此,只有将具体人
格权保护和一般人格权保护相结合,才能使得个人
人格权益获得周延的保护。具体适用时,一般人格
权主要是对具体人格权保护的补充,当被侵害的人
格权益无法完全被具体人格权所涵盖时,权利人就
可以主张同时适用一般人格权的保护规则对其加以
救济。 法院判决被告向原告赔礼道歉,并赔偿经
济损失、合理支出以及精神损害抚慰金共计 203000
元。
(二)AI 侵犯个人隐私数据
1.Clearview AI 被意大利数据保护局处罚案
【案件简介】
Clearview AI 是一家成立于 2016 年的人脸识
别初创公司,其产品主打人脸识别与检索——用户
只需上传一张照片,即可获得照片人物在 Facebook、
Twitter 等社交网站上的资料。一直以来,其面部识
别技术应用所涉及的隐私问题受到广泛关注。
2021 年意大利个人数据保护机构就收到了两个
积极保护隐私和个人基本权利组织提出的针对
Clearview AI 的四项投诉和两项警报。在媒体报道
了 Clearview AI 公司面部识别产品的有关问题后,
意大利数据保护机构启动了对 Clearview AI 公司
调查程序。
根据意大利个人数据保护局的调查,其认定
Clearview AI 存在数起违规行为:
39
1.Clearview AI 公司涉嫌非法处理个人数据,
包括生物识别和地理定位数据;
2.Clearview AI 公司的收集和处理行为违反了
GDPR 的透明原则、目的限制原则和存储限制原则;
3.Clearview AI 公司未能提供 GDPR 第 13-14
条所规定的信息,未能在适当的时限内提供根据第
15 条对请求采取行动的信息,也未在欧盟指定一名
代表。
【案件结果】
意大利个人数据保护局对 Clearview AI 作出
以下处罚决定:
1.对 Clearview AI 公司处以 2000 万欧元的罚
款;
2.禁止 Clearview AI 公司通过网络爬取技术
进一步收集有关意大利境内人员的图像和相关元数
据,并禁止进一步处理公司通过其面部识别系统收
集意大利境内人员的关注点处理标准和生物特征数
据;
3.责令 Clearview AI 公司删除其面部识别系
统处理的有关意大利境内人员的数据,包括生物识
别数据,且需要根据 GDPR 第 12 条第(3)款的要求,
及时答复数据主体根据 GDPR 第 15 至 22 条规定提
出行使权利的请求;
4.责令 Clearview AI 公司在欧盟境内指定一
名代表。
2.Clearview AI 被英国信息委员会处罚案
【案情简介】
2022 年 5 月 23 日,英国信息委员会(The
Information Commission,简称 ICO)对 Clearview
AI 处以 750 万英镑的罚款,原因是其违反了当地隐
私法。Clearview AI 从 Facebook 等社交媒体和网
络搜索上收集人们的图像,并创建了一个全球数据
库。此外,ICO 还发布了一份执行通知,命令
Clearview 停止获取、使用在互联网上公开的英国
居民个人数据,并从系统中删除英国居民的信息。
根据调查,Clearview AI 客户可以将一个人的
图像上传到公司的应用程序中,根据数据库进行检
查。然后,该应用程序会提供一个与客户提供的照
片相似的图像列表,并提供一个指向图像来源网站
的链接。
【案件结果】
ICO 称,Clearview AI 在多个方面违反了英国
数据保护法,包括:未能以公平透明的方式使用英
国居民的信息;没有收集该信息的合法理由;以及
未能建立一个流程来阻止数据被无限期地保留。另
外,当人们联系 Clearview 询问他们的个人数据是
否在数据库中时,Clearview AI 要求他们提供包括
照片在内的其他信息。ICO 表示,这可能会让那些希
望反对自己出现在数据库中的人望而却步。
2022 年 7 月,ICO 宣布,Clearview AI 以多种
方式违反了英国数据保护法。其不仅在未经用户同
意的情况下非法收集和使用公民照片,未规定图像
数据的存储期限,还建立了超 200 亿张照片的数据
库用于提供面部识别服务,向美国执法部门和国家
安全机关出售身份匹配服务等。 ICO 决定对
40
Clearview AI 处以 750 万英镑的罚款(折合人民币
约 6700 万元),要求删除其持有的英国公民图像数
据。
随后 Clearview AI 提起上诉,目前该案还在审
理中。
3.Everalbum 被美国联邦贸易委员会(FTC)处
罚案
【案情简介】
Everalbum 成立于 2013 年,主要产品是一款名
为“Ever”的相册软件。该软件允许用户将移动设
备、电脑上或社交媒体账户中的照片和视频上传到
云端存储,Everalbum 声称该软件可以帮助用户节
省手机空间。
2017 年 2 月,“Ever”应用中上线了一个名为
“Friends”的功能,其使用面部识别技术将用户的
照片按照内容自动分组,并允许用户自行标记照片
中的人名。2018 年 7 月至 2019 年 4 月期间,除非
用户确定选择激活“好友”功能,否则“Ever”不
会将面部识别技术应用于用户的内容。但在 2019 年
4 月之后,“好友”对所有其他用户自动激活,并且
无法关闭。
2019 年,NBC News 等媒体曝出:“Ever”利用
其收集的用户照片训练人脸识别算法,而且未在其
隐私条款中写明,严重侵犯了用户的隐私权。此外,
他们还将训练出的算法卖给了执法机关和军方。
【案件结果】
媒体的曝光引起了 FTC 的关注。FTC 认为,
Everalbum 在“Ever”应用程序中将面部识别应用
于用户的照片不仅限于提供“朋友”功能。在 2017
年 9 月至2019 年8 月期间,Everalbum 将从“Ever”
用户照片中提取的数百万张面部图像与 Everalbum
从公开数据集中获得的面部图像相结合,创建了四
个数据集,用于开发其面部识别技术。而 Everalbum
仅使用其中一个数据集产生的面部识别技术来提供
“Ever”应用程序的“朋友”功能,Everalbum 利用
“Ever”应用程序收集的信息开发面部识别技术出
售给其企业客户,虽然其中并未包含“Ever”用户
照片、视频或含有个人信息的图像。并且在 2019 年
10 月之前,Everalbum 还未删除任何已停用帐户的
照片或视频,而是无限期保留它们。
经过一段时间的审查, FTC 公布了对于
Everalbum 的最终处理结果。FTC 与 Everalbum 达成
和解协议。该和解协议要求 Everalbum 删除:Ever
应用程序停用帐户的照片和视频;所有未经 Ever 用
户明确同意使用的、可以用于面部识别目的的、反
映面部特征的数据;使用“Ever”用户的照片或视
频开发的任何面部识别模型或算法。
三、内容违法和伪造欺诈风险
依托于海量的训练数据,当前 AIGC 技术在特定
条件下可以生成高度趋近于真实的照片、视频,并
投入商业运用,如著名电影《流浪地球 2》中就采用
该类技术实现演员面部的年轻化、再现已逝演员的
41
面容、还原声带受损演员的声音等等 48
。但另一方
面,这种 AIGC 技术也可以被用于生成违法内容和伪
造欺诈,最为典型的场景是,他人可以通过 AIGC 技
术将特定自然人的声音或面部等生物数据与其他人
的生物数据进行合成,从而将该人伪装成特定自然
人,再通过冒用该特定自然人的身份进行伪造及欺
诈行为。
对于提供 AIGC 服务的企业而言,其所提供的服
务可能被他人用于生成违法有害信息、伪造及欺诈
用途,若放任不管,将使其服务沦为违法犯罪的工
具,有违科技向善的基本伦理规范和国内外主要国
家和地区的监管要求,存在陷入传播色情、血腥、暴
力等违法有害信息和伪造欺诈信息的风暴中,从而
面临被责令承担民事责任、行政责任甚至刑事责任
的风险。
以下摘选相关案例予以具体分享、分析。
(一)崔某造谣案 49
2023 年 7 月 26 日凌晨,茂名网安部门巡查发
现某视频平台传播一条标题为“一个 7 岁小孩因为
偷了同学一支铅笔被老师绑在电线杆上面 5 个小时”
的短视频,称事件发生于 2021 年广东茂名下辖某县
级市,小孩在警察到场前已无力站立。
48 参见影驰科技:《<流浪地球 2>的 AI 换脸与 AI 修复,强
大的 AI 正在逐步普及》,https://baijiahao.baidu.com/
s?id=1757064120914560528&wfr=spider&for=pc(最后访
问时间:2023 年 10 月 22 日)
49 参见茂名公安:《茂名查处首宗利用 AI 技术编造传播虚假
经核查,该视频内容为一网民为博取流量,通
过 AI 软件生成,选用素材源于网络上的关于“小孩
偷铅笔”内容的文章,并编造为茂名市下辖某县级
市发生的案件,纯属不实信息。相关视频被该网友
于多个网络社交短视频平台发布传播,造成恶劣影
响。茂名市公安局茂南分局依法对违法行为人崔某
作出行政拘留十日的处罚。
(二)朱某造谣案 50
2023 年 4 月 10 日,盐城市公安局网安支队接
到上级通报称,该市一网民发布“浙江温州一名女
大学生在晚归途中遭持刀袭击并强奸”的信息,盐
城网安支队立即会同属地警方展开调查。
经调查发现,该信息系盐城阜宁县网民朱某锋
通过 ChatGPT 人工智能软件杜撰并发布,为显真实,
朱某峰还在网上找到一张白衣女性的图片,附在文
章中一同发布。因编造发布此类谣言极易引发群众
恐慌,造成不良社会影响,从而构成违法犯罪。据朱
某锋所述,其发布上述谣言的目的在于博取眼球、
吸引流量,以获取平台给予的创作者奖金。该文章
系其根据提示词自动生成,朱某锋并没有对相关内
容的真实性进行核查。
最终,公安机关根据《中华人民共和国治安管
信息案件》,https://mp.weixin.qq.com/s/I-fqgI0eo0X7mn
jpVEjDsQ(最后访问时间:2023 年 10 月 22 日)
50 参见盐阜在线:《阜宁一男子利用人工智能技术造谣被处
罚!》,https://mp.weixin.qq.com/s/DxNPvgbHt4vpPR0g4to
pEw(最后访问时间:2023 年 10 月 22 日)
42
理处罚法》第二十五条之规定,对朱某峰行政罚款
人民币 200 元,并责令其清理不实信息,关停相关
自媒体账号。
(三)郭某造谣案 51
2023 年 8 月 17 日,桔子洲派出所湖大社区民
警杨德君发现,网传一则信息称“某大学女生校园
裸贷曝光,事件的背后竟然有一位男老师作为幕后
黑手,这令人震惊不已”。经调查发现,该文章拼接
痕迹非常明显,极有可能为网络谣言。桔子洲派出
所支部迅速锁定了嫌疑人郭某。
郭某到案后,对其造谣行为供认不讳,据郭某
交代,其为博人眼球、赚取流量,通过 AI(人工智
能)技术捏造多条虚假信息,人工拼接后发布至网
络平台。目前,郭某已被公安机关依法处以行政拘
留 3 日处罚,案件正在进一步办理当中。
51 参见岳麓公安:《通过 AI 捏造不实信息博眼球,行拘!—
—桔子洲派出所 9 小时破获一起造谣案》,https://mp.weix
in.qq.com/s/9-13qQ7f1KgZSWtN71y63Q(最后访问时间:20
23 年 10 月 22 日)
52 (1)参见青瞳视角:《实力不够 AI 来凑?韩国围棋天才少
女用 AI 作弊,被禁赛一年》,https://baijiahao.baidu.co
m/s?id=1686879254067356994&wfr=spider&for=pc(最后访
问时间:2023 年 10 月 22 日);(2)参见围棋宝典:《韩国棋
手非法利用 AI 遭禁赛》,https://mp.weixin.qq.com/s/TYF
(四)韩国棋手非法利用 AI 作弊案 52
2020 年 11 月 19 日,一位围棋爱好者在“ORO
国手战”赛后对对局进行了分析,发现韩国围棋最
年轻棋手,被誉为“天才围棋少女”的金恩持在 9
月 29 日晚上 11 时左右的线上比赛中所使用的,手
段和 AI 程序的推荐吻合率高达 92%,当时金恩持
在 24 强战中击败了国内排名第 7 的李九段,并且
执黑 129 手中盘战胜对手。该情况引发了轩然大
波,随着作弊一事被传开,韩国棋院的国家队教练
对金恩持进行了面谈,并且请了国内外的 AI 公司
对这盘棋进行了分析。在 11 月第一周进行的第一
次调查中,金恩持也对部分作弊内容予以承认。但
是为了进行更加准确的调查,韩国棋院开设了“真
相调查委员会”进行了追加调查,在 2 次调查结果
出炉之后,决定在 20 日对金恩持进行处罚。
四、AIGC 广告违规风险 53
自从 ChatGPT 3.0 于 2023 年年初火爆以来,
AIGC 市场迎来前所未有的重大机遇,各种通用大模
型和基于通用大模型开发的 AIGC 应用也纷纷涌现
fJBN5jmzr67PrJyNekQ(最后访问时间:2023 年 10 月 22 日)
53 处罚案例内容分别来自于:沪市监金处〔2023〕2820230
00041 号、沪市监闵处〔2022〕122021005499 号、京朝市
监处罚〔2023〕149 号、京顺市监处罚〔2022〕1572 号、
沪市监崇处〔2022〕302021001039 号、京工商海处字〔201
9〕第 474 号、沪监管嘉处字〔2018〕第 142018000703
号,参见 SaaS 1919:《AI、算法相关的广告宣传违规处罚
案例》,https://mp.weixin.qq.com/s/yG_63CF9qgHENwHn
ubtBVg(最后访问时间:2023 年 10 月 22 日)
43
出来,相应的宣传推广也在互联网媒体刮起旋风。
但相应地,AIGC 的宣传也存在因对产品虚假宣传、
使用极限词或禁用词、绝对词等原因违反广告法和
反不正当竞争相关法律法规的规定。
美国联邦贸易委员会(FTC)广告业务分部在其
官网发布文章,警告商家不得利用对出售的 AI 产
品和服务进行虚假宣传,也不得滥用“AI”及相关
的热门营销术语。同时,FTC 强调,在对 AI 产品进
行宣传时,应注意以下几点:是否夸大了 AI 产品的
功能?是否承诺 AI 产品比非 AI 产品做得更好?AI
技术的风险点是什么?被宣传的产品是否真的使用
了 AI54?
对于提供 AIGC 产品或服务的企业而言,应当关
注其广告、宣传用语是否有不真实、不准确或者其
他误导消费者的部分,否则可能会因违反《行政处
罚法》《反不正当竞争法》等法律法规而受到处罚。
以下摘选相关案例予以具体分享、分析。
(一)TLS 处罚案
2023 年 4 月,TLS 公司在官网“公司简介”页
面介绍其“是一家专业从事音频信号处理、语音交
互技术,掌握国内领先人工智能语音算法、芯片设
计的高新技术企业”。经查,上述广告的宣传内容
与事实不符;发布有 6 项国家专利的广告宣传内容
54https://link.zhihu.com/?target=https%3A//www.busin
essinsider.com/chatbot-ftc-chatgpt-hype-scam-fraudai-artificial-intelligence-2023-3
55 《广告法》第 12 条第 1 款:“广告中涉及专利产品或者专
利方法的,应当标明专利号和专利种类。”
时,没有注明专利号、专利种类。据此,TLS 公司被
认定发布虚假广告,被执法机关处以罚款并责令停
止发布。TLS 公司曾于 2022 年因在官网发布与事实
不符广告宣传内容,介绍其“是行业首家同时掌握
人工智能语音算法、芯片设计、语音数据处理及训
练引擎、软硬件产品应用方案开发全技术链企业”,
已经被执法机关处罚,要求其整改删除“首家”等
字样。
(二)LPJJ 处罚案
2021 年 6 月 4 日至 8 月 18 日期间,LPJJ 公司
在自有网站上发布了由第三方制作的广告宣传内
容,包含“是国内最早为国安、公安体系进行人脸
识别算法、大数据训练”“第一个在国际上构建了
人脸戴墨镜识别算法”“第一个把人脸识别技术应
用在到国家重大活动安保一线”“120+公司拥有各
项研发专利”“1500+场景图像算法模型产品”等
在内的多个广告,上述部分广告使用了国家机关的
名义,部分广告真实性无法证明或被证伪。执法机
关于 2023 年 2 月,以其违反《广告法》(2018 修
正)第 9 条第 1 款第 2 项 55、第 28 条第 2 款第 2
项、第 12 条第 1 款 56为由处以人民币 10 万元的罚
款。
处罚依据中,《广告法》第 9 条第 1 款第 2 项
56 《广告法》第 28 条第 2 款第 2 项规定:“广告有下列情
形之一的,为虚假广告:(二)商品的性能、功能、产地、
用途质量、规格、成分、......,以及与商品或者服务有关
的允诺等信息与实际情况不符,对购买行为有实质性影响
的”。
44
规定为:“广告不得有下列情形:……(二)使用或
者变相使用国家机关、国家机关工作人员的名义或
者形象”,第 12 条第 1 款:“广告中涉及专利产品
或者专利方法的,应当标明专利号和专利种类”。
(三)ML 公司处罚案
ML 公司自 2020 年 1 月 12 日起在其自建网站产
品中心页面发布了含有“人脸识别一体机采用最新
的深度学习算法”的内容,经执法机关调查发现,
当事人所采用的摄像机 XXXXXXXXA 卷积神经网络的
训练方法、人脸识别方法及装置是浙江大华技术股
份有限公司 2018 年公开运用的技术,CNXXXXXXXXA
一种车牌识别方法、装置及电子设备的技术是杭州
海康威视数字技术股份有限公司 2020 年公开运用
的技术。据此,执法部门认定该等广告实际为虚假
内容,涉案的算法不是最新的深度学习算法,并于
2022 年 8 月对 ML 公司违反《广告法》第 28 条第 2
款第 2 项 57和第 55 条第 1 款 58发布虚假广告的行为
处以罚款并责令停止发布。
(四)SDTL 公司处罚案
SDTL 公司官方网站有“最全面的三维全景声解
决方案”“最新智能降噪算法”等字样;在制作海
57 《广告法》第 55 条第 1 款规定:“违反本法规定,发布虚
假广告的,由市场监督管理部门责令停止发布广告,责令广
告主在相应范围内消除影响,处广告费用三倍以上五倍以下
的罚款,广告费用无法计算或者明显偏低的,处二十万元以
上一百万元以下的罚款;两年内有三次以上违法行为或者有
其他严重情节的,处广告费用五倍以上十倍以下的罚款,广
报、PPT 宣讲、微信公众号、淘宝网店中有“最新人
工智能识别系统”“最新人工智能声纹感知和分析
系统”等字样;另通过软文推送在百度新闻、百度
网页、360 新闻等进行上述宣传。因无法提供证据证
明其宣传的真实性,执法部门于 2022 年 7 月对 SDTL
公司处以人民币 1.7 万元的罚款。
(五)NH 公司处罚案
2021 年 6 月 16 日,NH 公司在其官方网站发布
“强势品牌国内最专业的 ICT 综合服务提供商之
一”“顶尖信誉多家世界 500 强首选服务商”“技
术领先荣获多项国家资质认证和荣誉,顶尖核心技
术:ISP 图像算法技术、音频视频解码技术、传输技
术、云存储技术、智能分析技术等自主知识产权:外
观专利、实用新型、软件著作权等 50 多项自主研发
产权”以及华为、惠普、华三、深信服科技、甲骨文
等多家知名公司为其合作伙伴的内容。
2021 年 8 月,执法人员对当事人使用含有禁止
情形的广告用语以及发布虚假广告的行为立案调查,
经查明:当事人主要从事计算机软件开发以及弱电
的施工安装业务,当事人为了推广业务通过自建网
站发布广告内容,使用含有“最专业”的禁止使用
的绝对化用语,同时发布其他不实广告内容。执法
告费用无法计算或者明显偏低的,处一百万元以上二百万元
以下的罚款,可以吊销营业执照,并由广告审查机关撤销广
告审查批准文件、一年内不受理其广告审查申请”。
45
单位认定 NH 公司在其自建网站中使用含有禁止情
形的广告用语的行为,违反广告法第 9 条第 3 项 59
的规定,构成了发布禁止情形广告的行为。而 NH 公
司在其自建网站中发布虚假广告的行为,违反了广
告法第 4 条第 1 款 60的规定,构成了发布第 28 条第
2 款第 2 项规定的发布虚假广告。最终于 2022 年 1
月对 NH 公司处以人民币 1 万元的罚款。
(六)2018 年,HY 公司因使用绝对化用语进行
宣传被处罚
2018 年,HY 公司因在公司官网发布“投放效率
与效能独居行业首位”“技术最强,国际顶级的数
据科学算法团队”“数据最准,发布中国首个数字
广告人群类目体系”“拥有人群分析模型的独家专
利”“跨屏流量最大、用户识别最专业、出价算法
最科学、覆盖用户最多、广告形式最丰富、访客找回
效果最优”等宣传内容。
经执法部门调查,上述用语均无相关依据,系
引人误解的商业宣传,最终认定 HY 公司的该等行为
违反了《反不正当竞争法》第 8 条第 1 款 61规定。
鉴于 HY 公司已主动修改网页,下线被举报网站,根
59 《广告法》第 9 条第 3 项规定:“广告不得有下列情
形:(三)使用“国家级”“最高级”“最佳”等用语”
60 《广告法》第 4 条第 1 款规定:“广告不得含有虚假或
者引人误解的内容,不得欺骗、误导消费者”
61 《反不正当竞争法》第 8 条第 1 款:“经营者不得对其
商品的性能、功能......等作虚假或者引人误解的商业宣
传,欺骗、误导消费者”
62 《行政处罚法》第二十七条第一款第(一)项“当事人
据《行政处罚法》《反不正当竞争法》的相关规定 62
确定处罚,最终执法部分对 HY 公司处以人民币 2 万
元的罚款。
(七)FJ 公司处罚案
2019 年,FJ 公司在其官方网站上推广语文分级
阅读时,使用“精准判断中文文本难度,大于 96%的
识别准确率”等文字表述内容。虽然 FJ 公司说明了
其公开模型算法测试中达到 96%正确率,并取得了
“中文文本辅助写作 AI 系统”“中文文本难度自
动分级 AI 系统”“纷极阅读”等软件著作权,但
“大于 96%的识别准确率”的说法仅有 FJ 公司自己
测试的数据,没有第三方数据及证明为支撑。执法
部分认为 FJ 公司的行为违反了《广告法》第 8 条第
1 款 63的规定,对其处以人民币 1.5 万元的罚款。
处罚依据中,《广告法》(2018 修正)第 8 条
第 1 款规定为:“广告主在广告中对商品的性能、
功能、产地、用途、质量、成分、价格、生产者、有
效期限、允诺等或者对服务的内容、提供者、形式、
质量、价格、允诺等有表示的,应当准确、清楚、明
白。”第 59 条第 1 款第 1 项规定为:“有下列行为
有下列情形之一的,应当依法从轻或者减轻行政处罚:
(一)主动消除或者减轻违法行为危害后果的”;
《反不正当竞争法》第二十条第一款“经营者违反本法第
八条规定对其商品作虚假或者引人误解的商业宣传,或
者......。
63 参见安徽政法:《警方辟谣:系 AI 生成不实图文》,https:
//mp.weixin.qq.com/s/hJiX3MOUDAhkyXXJmJpJqw(最后访
问时间:2023 年 10 月 22 日)
46
之一的,由市场监督管理部门责令停止发布广告,
对广告主处十万元以下的罚款:(一)广告内容违反
本法第八条规定的”。
五、刑事风险
高效且强有力的监管是中国区别于大部分国家
与地区监管特点之一。前述所列的民事法律风险,
在符合法定的情况下,还会伴随着行政风险,甚至
还可能会因为触犯《刑法》而存在刑事风险。作为功
能强大的工具,各类 AIGC 技术已经使得犯罪更加频
繁、更难预防。可以说,前述所列举的 AIGC 数据来
源侵权、生成内容侵权、内容欺诈等在满足特定条
件的情况下,均可能存在行政责任和/或刑事责任的
风险。
(一)伪造相关
1.ChatGPT 涉刑案
2023 年 4 月 25 日,平凉市公安局崆峒分局网
安大队发现一篇名为“今晨甘肃一火车撞上修路工
人致 9 人死亡”的文章,该文章访问量巨大。经查,
文章系犯罪嫌疑人通过 ChatGPT 将搜集到的新闻要
素修改编辑后,使用“海豹科技”软件上传至其购买
的百家号上非法获利。该行为已涉嫌寻衅滋事罪,
目前,崆峒公安分局对犯罪嫌疑人洪某弟采取刑事
64 参见河南商报:《用 AI 造谣“河南光膀男遭抱摔致死”,网
民徐某某被处罚》https://mp.weixin.qq.com/s/0d-U5nECm
qqbtz1Grwo42w(最后访问时间:2023 年 10 月 22 日)
强制措施,案件正在进一步侦办之中。该案也是自 1
月 10 日《互联网信息服务深度合成管理规定》颁布
实施后,警方侦办的首例利用先进 ChatGPT 技术制
造不实信息并广泛散播的案件。
2.李某造谣案 64
2023 年 10 月 14 日晚,苏州市公安局直属分局
就网传“一公交车起火致 2 死 5 伤”事件发布警情
通报,称有网民在网络平台发文称“10 月 9 日江苏
苏州一辆公交车起火造成 2 人死亡、5 人受伤”,引
发广大网民关注。经核实,该帖文系谣言。经审查,
发帖人李某出于获取网络流量收益的目的,使用 AI
工具和网上搜索的图片生成不实图文在某平台发布,
造成恶劣影响。目前,犯罪嫌疑人李某已被苏州市
公安局依法采取刑事强制措施。
3.徐某某造谣案 65
2023 年 9 月 10 日,河南省驻马店市互联网信
息办公室发现有网民在某平台发文称:“河南省确
山县一名光着上身的男子在街头遭到另一名男子强
行抱摔,被摔者已经不幸身亡”。河南省驻马店市
互联网信息办公室立即联合公安机关成立专案组赴
发布者所在地河北省遵化市进行调查。
经审查,网民徐某某为赚取流量,使用 AI 软件
自动生成《越闹越大!河南光膀男抱摔后续:知情人
47
称被摔者已死亡,悔不当初》信息,其中包含有“驻
马店确山光膀男遭抱摔致死”不实内容,该文生成
后,徐某某未进行核实直接发布,该信息为网络谣
言。
专案组依法对徐某某处 300 元罚款。徐某某对
自己虚构事实扰乱公共秩序的违法行为供认不讳,
并主动删除该谣言信息。
4.内蒙古利用 AI 实施电信诈骗案
2023 年 4 月,内蒙古包头市发生一起诈骗案,
案件受害人郭先生来自福建,是一家科技公司的法
人代表。他的好友通过微信视频联系他,声称希望
借用郭先生公司的账户走账参与竞标,需要保证金
430 万元。
基于对好友的信任和通过视频聊天“核实”身
份,郭先生在短短 10 分钟内两次转账将 430 万元汇
入对方的银行账户。事后,郭先生拨打好友电话才
发现自己被骗。骗子利用 AI 换脸和拟声技术伪装成
好友使郭先生放松戒备,并进行诈骗。
5.安徽“冒充熟人”诈骗案
2023 年 4 月 27 日,安徽安庆经开区发生一起
诈骗案,诈骗分子使用了一段 9 秒钟的智能 AI 换脸
视频佯装“好友”,向受害人何先生发起视频通话,
66 参见法制日报:《全国首例利用 AI 贩卖游戏“外挂”案告
破!涉案资金超 3000 万元》,https://mp.weixin.qq.com/
s/lN4mYSAw7dwD-_nk8GopJA(最后访问时间:2023 年 10 月
22 日)
电话接通后,何先生看到“好友”正在一间会议室
内,正当他准备进一步询问时,“好友”直接挂断
了电话,并表示在会议中不方便通话,之后有重要
事情交代,需要何先生添加 QQ 沟通。随后,“好友”
在 QQ 上告诉何先生,目前有一个项目招标需要周转
资金,希望何先生能够帮忙先行垫付。因已经通过
视频电话确认确为好友,何先生基于对“好友”的信
任的放松了警惕,立即让家人将 245 万元转至对方
指定的账号。直到事后拨打对方电话才得知自己被
骗。
(二)技术新型应用相关
1.利用 AI 贩卖游戏“外挂”案 66
2023 年 8 月中旬,江西省鹰潭市公安局余江分
局网安大队在网络巡查中发现一条涉嫌违法制售游
戏“外挂”的产业链线索。经侦查发行,相关犯罪
团伙以营利为目的,通过发展下级代理的方式在微
信、QQ 和游戏平台上销售制作的\"外挂\"程序和卡密,
并以层层加价的方式获取利润。
其中,主要犯罪嫌疑人王某于 2021 年开始接触
FPS 游戏,并为了提高自己的战绩购买了一款“外
挂”。在几次尝试后,王某决定将其作为一项副业,
并以代理的身份与“外挂”软件编制者张某建立联
系,并拓展了下线。随着一年的发展,王某认为销售
48
收益可观,于是成立了一家公司,将“外挂”的销售
当成了自己的事业,直至案发。
9 月 15 日,公安机关共抓获了 10 名犯罪嫌疑
人。在现场搜查中,警方查获了 10 台台式电脑、7
台笔记本电脑、11 部手机,以及卡密生成程序、“外
挂”源代码、“外挂”辅助硬件和一些半成品硬件。
涉案流水金额高达 3000 万元,这是全国首例成功打
击 AI 技术模式游戏“外挂”的案件,目前案件仍在
进一步办理中。
2.邓某等典型网络诈骗案
邓某等人通过“AI 智能机器人-智能语音客服
系统”拨打的诈骗电话事实诈骗,极大提高了诈骗
效率并降低诈骗成本。最终,经湖北省荆州市中级
人民法院及湖北省石首市人民法院审理,邓某等人
均被认定构成诈骗罪,判处有期徒刑,并处罚金。
未来借由包括但不限于 AIGC 技术实施的犯罪
行为会更加频繁,如何有效地规制相应违法行为,
降低违法行为监控及查处成本,将是主管部门及
AIGC 服务提供者不可回避的问题,值得重视。
3.胡某、赵某枫侵犯公民个人信息案
被告人胡某系某信息科技有限公司通信技术人
员,被告人赵某枫系某科技有限公司技术人员。二
被告人所在的公司均系线路服务商,为李某经营 AI
智能机器人提供线路服务。2019 年 8 月,李某了解
到二被告人的公司在提供服务过程中能获取大量自
然人姓名、电话号码等公民个人信息后,分别向二
被告人提出收购公民个人信息的意图,二被告人均
同意。之后,胡某以每条信息 0.5 元的价格向李某
出售大量公民个人信息,非法获利人民币 386815.1
元;赵某枫以每条信息 0.06 元的价格向李某出售大
量公民个人信息,非法获利人民币 153135.5 元。二
人的行为均构成侵犯公民个人信息。
AIGC 在提供便利的同时,也使得个人信息的汇
聚及收集更为便利,企业及企业人员可能利用职权,
侵害用户个人信息,严重者甚至构成犯罪。
第四章 AIGC 合规应对策略
人工智能技术迅速、超前发展带来的不仅仅是
机遇,也将在市场垄断、知识产权、数据和隐私安
全、技术伦理方面带来诸多挑战和风险。在市场垄
断方面,拥有前沿技术及影响力的公司必将乘势而
发,通过技术壁垒和数据积累迅速占领市场,甚至
可能迅速拥有市场支配地位,极有可能引发市场竞
争失灵、消费者选择权受限、创新能力下降等一系
列与垄断有关的法律问题。就知识产权而言,AIGC
与创新的界限逐渐模糊,AIGC 生成的作品是否具有
独创性?是否值得纳入版权法予以保护?如何避免
侵犯他人知识产权?诸如此类问题受到广泛关注。
在数据与隐私安全方面,则可能存在更大的风险。
具体而言,首先,AIGC 使用的海量数据来源广泛、
数量巨大、类型繁多,其数据来源的合法性和正当
性、数据的真实性和准确性均难以保障。其次,在该
等海量数据中,不可避免地存在通过爬虫等方式自
49
动化抓取、未经同意收集或者通过侵入计算机信息
系统等不当行为方式非法获取。再次,通过该等途
径获取的数据中可能存在关涉国家安全、他人商业
秘密、个人隐私、重要数据等敏感数据,这无疑会给
国家安全、社会公共利益和他人合法权益的维护带
来新的挑战。在技术伦理方面,AIGC 作为一种新兴
的技术手段,人工智能也成为科技创新的历史契机,
但 AI 技术本身又不断对传统伦理秩序产生挑战,诸
如“算法黑箱”“算法歧视”以及算法规则违反劳
动者权利保护等问题开始涌现,诸如此类问题也将
成为未来很长一段时间内需要关注和解决的问题。
目前,AIGC 发展之势迅猛,已经引起各国监管
部门的高度警惕。各国基于政治、经济、社会和法治
等各层面考量,对 AIGC 的法律监管也从无法监管,
转变到鼓励创新、包容审慎和逐步重视和加强。比
如,我国国家网信办联合国家发展改革委、教育部、
科技部、工业和信息化部、公安部、广电总局七部门
于 2023 年 7 月 13 日联合公布《生成式人工智能服
务管理暂行办法》,旨在促进 AIGC 健康发展并有效
防范可能面临的各类风险,这表明了中国监管部门
对 AIGC 前所未有的重视。
因此,对于 AIGC 服务提供者、技术提供者和使
用者而言,采取相应策略,对 AIGC 开发、运营及使
用过程中可能出现的风险加强监督和控制,成为该
类企业不得不面对的现实要求。
策略一:加强数据安全治理
(一)梳理数据安全与合规义务清单
如前所述,在使用 AIGC 服务过程中,需要海量
数据作为依托,而该过程中也涉及数据的获取、传
输、存储、对外提供、计算分析、模型训练、数据出
境等数据全生命周期处理活动,在欧盟、美国、中国
等主要国家和地区,均针对该等数据处理的安全和
合规进行了大量立法规范。因此,对 AIGC 企业而言,
其提供服务过程中需要遵循的诸如数据处理安全与
合规、版权保护、正当竞争、网络信息安全、反欺诈
等合规义务也散落于各个国家和地区的法律、法规、
规章、标准、监管政策等立法文件之中,相对较为繁
杂而零散,比如,就 AIGC 在国内数据处理活动所涉
的合规义务就覆盖数据安全、网络安全、个人信息
及隐私保护、反不正当竞争、消费者权益维护、未成
年人保护等领域,仅以《个人信息保护法》及《数据
安全法》为例,所涉的合规义务超过 23 类。因此梳
理数据安全和合规义务清单就显得尤为重要。
AIGC 企业应当根据服务提供者、技术提供者
和服务使用者的角色,对可能适用的法律、法规、
标准规范、监管要求等进行梳理,形成合规义务清
单,从而为后续履行合规义务设置科学的规划,按
照相关合规要求及时审查、评估和审计合规义务履
行情况,及时查漏补缺,并结合实际情况监管和督
促合规工作的落实。
(二)建立数据安全与合规管理体系
需要说明的是,梳理合规义务仅是应对策略落