分享自:

人工智能生成内容(AIGC)的技术特征与形态演进

期刊:图书情报知识DOI:10.13366/j.dik.2023.01.066

本文是作者李白杨、白云、詹希旎、李纲发表于《图书情报知识》期刊2023年第1期的一篇论文。文章标题为《人工智能生成内容(AIGC)的技术特征与形态演进》。本文并非一份单一的原始研究报告,而是一篇综合性的综述与展望文章。它从信息资源管理的学科视角出发,系统地梳理了AIGC的发展背景、技术特征、构成要素、发展阶段,并深入分析了其对信息资源管理领域带来的深刻影响与挑战。以下是对该论文主要观点的详细阐述:

首先,论文在引言部分明确了探讨AIGC的背景与意义。 随着2022年以来AI绘画等应用的爆火,以多模态内容生成为核心的AIGC(Artificial Intelligence Generated Content)已成为数智环境下网络信息资源发展的重要趋势。它源于生成式人工智能(Generative AI)技术的发展,并正在从早期的专业工具辅助向大众化、创意化、实时交互化方向演进。论文指出,AIGC的迅猛发展在为信息获取与生产生活带来便利和效率提升的同时,也因其大规模、多模态、跨场景的特性,给信息组织、版权确认和信息伦理等传统信息资源管理问题带来了新的挑战。因此,有必要从信息资源管理的专业视角,全面审视AIGC,以把握机遇、应对挑战。

论文的第一个核心观点是:AIGC的兴起与发展,深深植根于互联网形态的演化进程之中。 文章通过构建一个清晰的对比框架(如表1所示),从内容生产、人机交互、网络资源组织三个层面,系统分析了AIGC在互联网从Web1.0到Web3.0演进过程中的定位与角色。在Web1.0时代,内容以专业生产内容(PGC)为主,交互方式依赖键盘鼠标,资源组织是目录式和搜索引擎索引。Web2.0时代,用户生成内容(UGC)与PGC并存,平台中心化,交互方式增加了触控、语音等,资源呈现多源异构的大数据特征。而正在到来的Web3.0时代,则呈现出去中心化、虚实共生等特点。在此背景下,AIGC作为一种由技术驱动的自动化、智能化内容生产方式,将与PGC、UGC共同构成未来网络内容生态(PGC+UGC+AIGC)。它对应的人机交互将迈向视觉、触觉、脑电等多模态融合,其资源组织则面临多模态融合、认知计算等新课题。这一分析将AIGC置于宏观的技术与社会发展脉络中,揭示了其产生的必然性与未来的重要性。

论文的第二个核心观点是:AIGC具备独特的技术特征,其发展由算据、算法、算力三要素共同支撑,并呈现出清晰的阶段性演进路径。 在技术特征方面,论文概括了四点:1)数据巨量化:AIGC的“创造力”建立在海量标注和训练数据之上,如CLIP模型使用了4亿个图文配对数据。2)内容创造力:借助海量语料和风格迁移等技术,AI能在短时间内生成大规模、多风格的艺术或实用内容。3)跨模态融合:这是AIGC区别于传统内容的显著特征,以CLIP、百度“跨模态通用可控AIGC”为代表,实现了文本、图像、听觉等不同模态知识的相互理解和生成。4)认知交互力:AIGC正成为人与机器沟通的媒介,在感知和交互上展现出潜力,为智能机器人等应用提供内容支撑。 在技术要素方面,论文构建了一个以三要素为支柱的分析模型(如图1所示):算据(数据) 是AIGC的“燃料”,大规模高质量语料库是其创作基础。算法是核心驱动力,关键技术突破包括生成对抗网络(GAN)、多模态认知计算以及数字孪生/虚拟现实技术,它们分别解决了内容生成、多模态理解与融合、以及三维场景构建的问题。算力是应用保障,可分为支撑本地创作的硬件算力、保障实时服务的云计算、以及面向实时人机交互的边缘计算。 基于三要素的支撑,论文前瞻性地提出了AIGC发展的三阶段:1)基于实体孪生的阶段:此阶段主要是对物理世界进行数字化映射和仿真,如早期的游戏NPC生成、工业数字孪生,算据来源于实物,算法以建模为主。2)基于学习创作的阶段:这是当前的主流阶段,AI通过海量数据学习后进行创意生成,如AI绘画、虚拟数字人内容生成,对算据规模和算法模型要求高,依赖云算力。3)基于实时自主生成的阶段:这是面向未来的高阶阶段,AIGC将能实时感知环境并与人、物进行智能交互,典型场景是赋能人形机器人,需要“本地+云+边缘”混合算力支持,实现多模态的实时感知与内容生成。

论文的第三个核心观点,也是其核心贡献所在,是系统阐述了AIGC对信息资源管理研究与实践带来的四方面具体影响(如图2所示)。 第一,对信息组织的影响。 AIGC的虚实共生、实时生成、跨模态等特性对传统信息组织方法构成挑战。在信息描述层面,其创作主体多元(用户、平台、AI)、算法版本复杂、形态多变,需要新的跨模态描述框架。在语义关联层面,解析AIGC内部文本、图像、视频等多模态特征之间的语义关系并实现有效关联,是一个高难度任务。在标引索引层面,AIGC内容(如AI绘画)复杂的语义特征使得依赖关键词的传统标引方法效率与准确性下降。 第二,对数据资产管理的影响。 这主要涉及AIGC的权属与价值实现问题。知识产权归属是目前的法律灰色地带,涉及训练数据版权、生成平台责任、用户权利等多个主体,美国版权局已有因“缺乏人类作者身份”而拒绝AIGC作品版权注册的案例。在数据资产化路径上,论文指出AIGC与NFT(非同质化通证)存在交集但角色不同,AIGC是生产工具,NFT是资产载体。要实现AIGC资产化,需解决语料版权合法化、明确各方权属、并利用区块链技术记录生成与流通全过程。 第三,对用户研究的影响。 AIGC改变了用户与信息资源的交互范式,用户研究需从关注“人”转向关注“人-机(智)交互”。研究应强调以人为本和人智交互,借鉴人本人工智能的研究框架,关注人机在协同、竞争、冲突与共生中的互动。同时,AIGC的虚实融合特性拓展了用户研究的情境,研究者需要处理语音、视觉、触觉、脑电等多模态、快速转换的交互数据,研究设计面临新的挑战。 第四,对信息伦理的影响。 AIGC技术的“双刃剑”效应在此领域尤为突出。一方面,它加剧了深度伪造(Deepfakes)的负面作用,使虚假信息更逼真、更具欺骗性,可能被用于诈骗、诽谤等犯罪活动,即所谓“骗子的红利”。另一方面,AIGC可能被用于大规模、有组织的信息操纵,例如利用智能化的社交机器人(Social Bots)自动生成和散播特定言论,扰乱舆论场,这对网络信息治理和伦理规范提出了紧迫要求。

最后,论文在结语部分总结了AIGC作为数智时代典型创新的重要意义。 它革新了数字内容的生产范式,改变了人机交互模式,并为信息资源管理带来了从信息组织、数据资产到用户行为、信息伦理等一系列新课题。作者认为,尽管面临挑战,但正如信息资源管理学科成功应对了Web1.0和Web2.0时代的变化,它也有能力应对AIGc带来的变革。未来应深化AI赋能智慧图书馆、AIGC特征挖掘与语义关联、多模态人机交互行为等方向的研究,推动学科发展与技术革新同步。

本文的学术价值在于, 它率先从信息资源管理这一特定学科视角,对当时方兴未艾的AIGC现象进行了系统化、结构化的梳理与分析。论文不仅清晰地勾勒了AIGc的技术脉络和发展阶段,更重要的是前瞻性地、深入地剖析了其对信息管理核心环节(组织、资产、用户、伦理)产生的具体影响,为后续该领域的研究提供了一个扎实的理论框架和问题清单。文章融合了技术分析(特征、要素、阶段)与学科思考(影响、挑战),体现了交叉学科研究的特色,对图书情报、信息管理、数字人文等相关领域的学者和从业者理解与应对AIGC浪潮具有重要的参考意义。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com