人工智能生成内容（AIGC）的技术特征与形态演进

分享自：
人工智能生成内容（AIGC）的技术特征与形态演进

期刊:图书情报知识DOI:10.13366/j.dik.2023.01.066
本文是作者李白杨、白云、詹希旎、李纲发表于《图书情报知识》期刊2023年第1期的一篇论文。文章标题为《人工智能生成内容（AIGC）的技术特征与形态演进》。本文并非一份单一的原始研究报告，而是一篇综合性的综述与展望文章。它从信息资源管理的学科视角出发，系统地梳理了AIGC的发展背景、技术特征、构成要素、发展阶段，并深入分析了其对信息资源管理领域带来的深刻影响与挑战。以下是对该论文主要观点的详细阐述：
首先，论文在引言部分明确了探讨AIGC的背景与意义。 随着2022年以来AI绘画等应用的爆火，以多模态内容生成为核心的AIGC（Artificial Intelligence Generated Content）已成为数智环境下网络信息资源发展的重要趋势。它源于生成式人工智能（Generative AI）技术的发展，并正在从早期的专业工具辅助向大众化、创意化、实时交互化方向演进。论文指出，AIGC的迅猛发展在为信息获取与生产生活带来便利和效率提升的同时，也因其大规模、多模态、跨场景的特性，给信息组织、版权确认和信息伦理等传统信息资源管理问题带来了新的挑战。因此，有必要从信息资源管理的专业视角，全面审视AIGC，以把握机遇、应对挑战。
论文的第一个核心观点是：AIGC的兴起与发展，深深植根于互联网形态的演化进程之中。 文章通过构建一个清晰的对比框架（如表1所示），从内容生产、人机交互、网络资源组织三个层面，系统分析了AIGC在互联网从Web1.0到Web3.0演进过程中的定位与角色。在Web1.0时代，内容以专业生产内容（PGC）为主，交互方式依赖键盘鼠标，资源组织是目录式和搜索引擎索引。Web2.0时代，用户生成内容（UGC）与PGC并存，平台中心化，交互方式增加了触控、语音等，资源呈现多源异构的大数据特征。而正在到来的Web3.0时代，则呈现出去中心化、虚实共生等特点。在此背景下，AIGC作为一种由技术驱动的自动化、智能化内容生产方式，将与PGC、UGC共同构成未来网络内容生态（PGC+UGC+AIGC）。它对应的人机交互将迈向视觉、触觉、脑电等多模态融合，其资源组织则面临多模态融合、认知计算等新课题。这一分析将AIGC置于宏观的技术与社会发展脉络中，揭示了其产生的必然性与未来的重要性。
论文的第二个核心观点是：AIGC具备独特的技术特征，其发展由算据、算法、算力三要素共同支撑，并呈现出清晰的阶段性演进路径。 在技术特征方面，论文概括了四点：1）数据巨量化：AIGC的“创造力”建立在海量标注和训练数据之上，如CLIP模型使用了4亿个图文配对数据。2）内容创造力：借助海量语料和风格迁移等技术，AI能在短时间内生成大规模、多风格的艺术或实用内容。3）跨模态融合：这是AIGC区别于传统内容的显著特征，以CLIP、百度“跨模态通用可控AIGC”为代表，实现了文本、图像、听觉等不同模态知识的相互理解和生成。4）认知交互力：AIGC正成为人与机器沟通的媒介，在感知和交互上展现出潜力，为智能机器人等应用提供内容支撑。 在技术要素方面，论文构建了一个以三要素为支柱的分析模型（如图1所示）：算据（数据） 是AIGC的“燃料”，大规模高质量语料库是其创作基础。算法是核心驱动力，关键技术突破包括生成对抗网络（GAN）、多模态认知计算以及数字孪生/虚拟现实技术，它们分别解决了内容生成、多模态理解与融合、以及三维场景构建的问题。算力是应用保障，可分为支撑本地创作的硬件算力、保障实时服务的云计算、以及面向实时人机交互的边缘计算。 基于三要素的支撑，论文前瞻性地提出了AIGC发展的三阶段：1）基于实体孪生的阶段：此阶段主要是对物理世界进行数字化映射和仿真，如早期的游戏NPC生成、工业数字孪生，算据来源于实物，算法以建模为主。2）基于学习创作的阶段：这是当前的主流阶段，AI通过海量数据学习后进行创意生成，如AI绘画、虚拟数字人内容生成，对算据规模和算法模型要求高，依赖云算力。3）基于实时自主生成的阶段：这是面向未来的高阶阶段，AIGC将能实时感知环境并与人、物进行智能交互，典型场景是赋能人形机器人，需要“本地+云+边缘”混合算力支持，实现多模态的实时感知与内容生成。
论文的第三个核心观点，也是其核心贡献所在，是系统阐述了AIGC对信息资源管理研究与实践带来的四方面具体影响（如图2所示）。 第一，对信息组织的影响。 AIGC的虚实共生、实时生成、跨模态等特性对传统信息组织方法构成挑战。在信息描述层面，其创作主体多元（用户、平台、AI）、算法版本复杂、形态多变，需要新的跨模态描述框架。在语义关联层面，解析AIGC内部文本、图像、视频等多模态特征之间的语义关系并实现有效关联，是一个高难度任务。在标引索引层面，AIGC内容（如AI绘画）复杂的语义特征使得依赖关键词的传统标引方法效率与准确性下降。 第二，对数据资产管理的影响。 这主要涉及AIGC的权属与价值实现问题。知识产权归属是目前的法律灰色地带，涉及训练数据版权、生成平台责任、用户权利等多个主体，美国版权局已有因“缺乏人类作者身份”而拒绝AIGC作品版权注册的案例。在数据资产化路径上，论文指出AIGC与NFT（非同质化通证）存在交集但角色不同，AIGC是生产工具，NFT是资产载体。要实现AIGC资产化，需解决语料版权合法化、明确各方权属、并利用区块链技术记录生成与流通全过程。 第三，对用户研究的影响。 AIGC改变了用户与信息资源的交互范式，用户研究需从关注“人”转向关注“人-机（智）交互”。研究应强调以人为本和人智交互，借鉴人本人工智能的研究框架，关注人机在协同、竞争、冲突与共生中的互动。同时，AIGC的虚实融合特性拓展了用户研究的情境，研究者需要处理语音、视觉、触觉、脑电等多模态、快速转换的交互数据，研究设计面临新的挑战。 第四，对信息伦理的影响。 AIGC技术的“双刃剑”效应在此领域尤为突出。一方面，它加剧了深度伪造（Deepfakes）的负面作用，使虚假信息更逼真、更具欺骗性，可能被用于诈骗、诽谤等犯罪活动，即所谓“骗子的红利”。另一方面，AIGC可能被用于大规模、有组织的信息操纵，例如利用智能化的社交机器人（Social Bots）自动生成和散播特定言论，扰乱舆论场，这对网络信息治理和伦理规范提出了紧迫要求。
最后，论文在结语部分总结了AIGC作为数智时代典型创新的重要意义。 它革新了数字内容的生产范式，改变了人机交互模式，并为信息资源管理带来了从信息组织、数据资产到用户行为、信息伦理等一系列新课题。作者认为，尽管面临挑战，但正如信息资源管理学科成功应对了Web1.0和Web2.0时代的变化，它也有能力应对AIGc带来的变革。未来应深化AI赋能智慧图书馆、AIGC特征挖掘与语义关联、多模态人机交互行为等方向的研究，推动学科发展与技术革新同步。
本文的学术价值在于， 它率先从信息资源管理这一特定学科视角，对当时方兴未艾的AIGC现象进行了系统化、结构化的梳理与分析。论文不仅清晰地勾勒了AIGc的技术脉络和发展阶段，更重要的是前瞻性地、深入地剖析了其对信息管理核心环节（组织、资产、用户、伦理）产生的具体影响，为后续该领域的研究提供了一个扎实的理论框架和问题清单。文章融合了技术分析（特征、要素、阶段）与学科思考（影响、挑战），体现了交叉学科研究的特色，对图书情报、信息管理、数字人文等相关领域的学者和从业者理解与应对AIGC浪潮具有重要的参考意义。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问