本研究由来自中国电子科技大学的张杨婷、方嘉明、廖密妍、韩琳彤,来自美国俄亥俄北方大学的温超,以及来自加纳Akenten Appiah-Menka技能培训与创业发展应用科学与数学教育学院的Adddo Prince Clement共同完成。该研究成果于2025年发表在Journal of Business Research 期刊第192卷上。
学术背景
本研究属于营销学、人机交互与设计心理学的交叉领域,聚焦于人工智能(AI)大语言模型产品的用户界面设计如何影响消费者行为。近年来,生成式AI和大型语言模型(LLM)产品(如ChatGPT)迅速普及,消费者对这些产品的接受度和付费意愿(Willingness to Pay, WTP)成为企业成功的关键。付费意愿是衡量消费者感知价值、满意度并影响购买决策的核心指标。尽管已有研究探讨了消费者期望(如性能)和感知(如风险)对WTP的影响,但作为用户与AI交互中最直接、最直观的视觉元素之一的字体,其作用在很大程度上被忽视了。
字体不仅是信息载体,也是一种强大的设计工具,能够影响消费者的第一印象,传递专业、友好等不同特质。例如,机器感字体(machine-like typeface)通常与精准、效率、专业相关联,而手写感字体(handwritten-like typeface)则更能传递个性、温暖和友好。同时,用户向AI提出的问题类型也可以分为两类:寻求事实、知识或建议的非对话式问题(non-conversational question),以及旨在引发讨论、寻求社交互动的对话式问题(conversational question)。
本研究正是基于这一背景,旨在填补理论空白。研究者们提出核心问题:字体与问题类型的匹配是否会影响消费者对AI产品的付费意愿? 其背后的心理机制是什么?例如,当用户提出一个需要精确答案的专业问题时,机器感字体是否会因为增强了AI的“权威感”而提高付费意愿?反之,当用户进行轻松聊天时,手写感字体是否会因为提升了“友好感”而更受欢迎?本研究旨在通过一系列严谨的实验来验证这些匹配效应,并揭示其背后的中介机制和边界条件。
详细研究流程
本研究共包含六个实验,共涉及来自美国、加纳和中国三个不同文化背景国家的3634名参与者,确保了研究发现的普遍性和外部效度。整体研究流程设计精巧,层层递进,从验证主效应到探究中介机制,再到排除替代解释并验证边界条件。
流程一:核心效应的初步验证与跨文化检验(研究1) 研究1是整个研究的基石,旨在初步验证字体与问题类型匹配对WTP的影响(假设H1和H2),并在三个不同文化背景的国家(美国、加纳、中国)中进行检验,以增强结论的普适性。 - 研究对象与样本量:研究1分为三个子研究。研究1a在美国进行,招募了264名大学生,最终有效样本251人。研究1b在加纳进行,招募了479人,有效样本452人。研究1c在中国进行,招募了436人,有效样本428人。所有参与者均被随机分配到不同实验条件中。 - 实验设计:采用2(字体:机器感 vs. 手写感)x 2(问题类型:非对话式 vs. 对话式)的组间设计。研究者精心设计了实验材料:例如,非对话式问题示例为“珠穆朗玛峰有多高?”,对话式问题示例为“你对远程工作的未来有何看法?”。字体则选用了标准的、几何感强的无衬线字体(如Helvetica)代表机器感,以及模仿手写笔迹的不规则字体代表手写感。 - 实验流程:参与者首先阅读一段模拟的AI对话记录(包含问题与AI的回答),对话内容与字体根据实验条件进行组合。随后,参与者需要报告他们对这个AI产品的付费意愿(WTP),测量使用三个7分量表题项,例如“我愿意订阅这个AI产品”。此外,实验还测量了作为控制变量的AI熟悉度和字体偏好,并对问题类型和字体进行了操纵检验。 - 数据分析方法:采用协方差分析,在控制AI熟悉度、字体偏好、文本长度等因素后,检验字体与问题类型对WTP的交互作用,并对简单效应进行分析。 - 预实验:在研究1之前,进行了两项预实验。预实验1旨在筛选和验证有效的实验刺激材料(对话内容和字体),确保参与者能清晰区分两种问题类型和两种字体。预实验2则验证了研究者对AI产品六种主要使用目的(如文本写作、虚拟聊天)的分类是否符合非对话式/对话式的框架,结果支持了分类的有效性。
流程二:排除干扰因素,增强效应稳健性(研究2) 研究2旨在复制研究1的发现,同时排除潜在干扰因素,如实验主题的特殊性、对话内容的可比性以及界面中人类图像的影响。 - 研究对象与样本量:通过Credamo在线平台招募了400名参与者,最终有效样本386人。 - 实验设计:同样采用2x2的组间设计,但使用了与研究1完全不同的对话主题(例如,围绕“城市交通规划”展开),并且在界面中没有使用任何人物图像,以确保效应纯粹由字体和文本内容驱动。 - 实验流程与数据分析:与研究1a类似,参与者观看新主题的AI对话,报告WTP,并进行操纵检验。数据分析方法相同。
流程三:探究中介机制及排除替代解释(研究3) 在确立了核心匹配效应后,研究3转向探究“为什么”会发生这种效应。基于心智感知理论,研究假设感知权威性(perceived authority,对应能力维度)和感知友好性(perceived friendliness,对应温暖维度)是潜在的中介变量,并通过“对AI的欣赏”(appreciation of ai)最终影响WTP。同时,研究3还系统性地排除了一些可能的替代解释。 - 研究对象与样本量:通过Credamo平台招募了464名参与者,最终有效样本451人。 - 实验设计:2(字体)x 2(问题类型)的组间设计,使用与研究1相同的材料。 - 实验流程:除了测量WTP,本研究还测量了四个关键中介变量:感知权威性(例如,“AI的回答是基于事实、逻辑和参数的”)、感知友好性(例如,“AI是温暖的”)、对AI的欣赏(例如,“AI的回答是有趣的、有说服力的”)。此外,为了排除替代解释,还测量了可能影响WTP的其他因素,如字体的易读性、对话的趣味性、以及感知流畅性和独特性。 - 数据分析方法:首先进行ANCOVA验证主效应。然后,使用Hayes的PROCESS宏(Model 7和Model 6)进行有调节的中介效应分析和链式中介效应分析,检验在非对话式问题中,字体是否通过“感知权威性 -> 对AI的欣赏”的路径影响WTP;在对话式问题中,是否通过“感知友好性 -> 对AI的欣赏”的路径影响WTP。同时,检验易读性、趣味性等变量是否具有显著的中介作用。
流程四:通过“过程调节”方法进一步验证中介机制(研究4) 研究4采用了一种称为“过程调节”的严谨方法,通过直接操纵中介变量(感知权威性和友好性),观察核心匹配效应是否因此被削弱或消失,从而为中介机制提供因果证据。 - 研究4a:操纵感知权威性 - 研究对象与样本量:招募452人,有效样本438人。 - 实验设计:2(字体)x 2(问题类型)x 2(权威性:高 vs. 低)的组间设计。低权威性组在AI对话界面中增加了一个提示语:“AI可能会犯错。请核实重要信息。”以降低用户对AI权威性的预期。 - 流程与结果:测量WTP并进行操纵检验。预期结果:只有在高权威性(无提示语)条件下,字体与问题类型的交互效应才会显著;在低权威性(有提示语)条件下,该交互效应应消失或减弱。 - 研究4b:操纵感知友好性 - 研究对象与样本量:招募436人,有效样本418人。 - 实验设计:2(字体)x 2(问题类型)x 2(友好性:高 vs. 低)的组间设计。低友好性组的提示语为:“我无法提供情感交流;请尽我所能提问问题。” - 流程与结果:测量WTP并进行操纵检验。预期结果:只有在高友好性条件下,字体与问题类型的交互效应(尤其是对话式问题中手写体更优)才会显著;在低友好性条件下,该效应应消失。
流程五:排除“AI偏见”这一替代解释(研究5) 有研究表明,消费者可能对AI生成的内容存在偏见,尤其是在涉及创造性的领域。研究5旨在检验:使用手写感字体会否让用户觉得AI更拟人化,从而可能触发对“AI冒充人类”的负面反应,进而影响实验结果。 - 预实验:验证手写感字体(相较于机器感字体)确实能显著提升用户对AI的拟人化感知。 - 主实验研究对象与样本量:招募200人,针对非对话式和对话式问题分别进行实验,有效样本分别为98人和96人。 - 实验设计:所有材料均使用手写感字体。关键操纵是告知参与者对话回答的来源:“此回答由人类生成” vs. “此回答由AI生成”。 - 流程与结果:参与者阅读对话后,分别评估感知权威性(非对话式问题组)或感知友好性(对话式问题组)。通过比较两组评价的差异,检验“AI来源”标签是否会导致负面评价。若无显著差异,则说明在本研究的信息交流语境下,不存在针对AI生成内容的系统性贬低偏见。
流程六:探索边界条件——消费者AI知识水平的调节作用(研究6) 研究6探讨了核心匹配效应的适用范围,假设对AI技术了解较少的消费者更容易受到字体设计线索的影响。 - 研究对象与样本量:通过Credamo平台招募400人,最终有效样本398人。 - 实验设计:2(字体)x 2(问题类型)的组间设计。 - 实验流程:在测量WTP和控制变量之外,新增了对消费者AI知识的测量(例如,“我对AI了解很多”)。 - 数据分析方法:使用PROCESS宏(Model 3)进行有调节的调节效应分析,检验AI知识水平是否调节了字体与问题类型的交互效应。进一步使用“探照灯分析”来识别在AI知识水平的哪些取值区间内,字体对WTP的影响是显著的。
主要研究结果
核心匹配效应得到一致证实(支持H1和H2):在所有六个实验(研究1a, 1b, 1c, 2)中,结果模式高度一致。协方差分析均显示,字体与问题类型对WTP存在显著的交互作用,而两者的主效应不显著。具体而言:
中介机制得到验证(支持H3和H4):研究3的链式中介分析结果清晰地揭示了内在心理路径:
“过程调节”提供因果证据:研究4的结果为中介机制提供了强有力的支持。
“AI偏见”在信息交流语境中影响有限:研究5的结果表明,尽管手写感字体会增强AI的拟人化感知,但在本研究所用的问答和聊天语境下,当明确告知内容由AI生成时,用户对其权威性或友好性的评价并未系统性低于“人类生成”标签下的评价。这说明核心效应并非由消费者对拟人化AI的负面偏见所驱动,而是在于字体与用户期望的匹配。
消费者AI知识构成重要的边界条件:研究6发现,核心匹配效应受到消费者AI知识水平的调节。调节的调节效应显著,进一步的探照灯分析显示:
研究结论与意义
本研究得出明确结论:在AI产品交互中,字体与问题类型的视觉-功能匹配能有效提升消费者的付费意愿。其内在逻辑是:匹配的设计(非对话式问题用机器体,对话式问题用手写体)通过满足用户在不同情境下的心理期望(权威性或友好性),提升了对AI的欣赏,最终转化为更高的支付意愿。这一效应对于AI知识水平较低的消费者尤为明显。
理论价值: 1. 拓展了AI产品研究视角:首次系统地将视觉设计元素(字体)与用户任务类型(问题类型)的匹配效应引入AI产品付费意愿的研究中,弥补了该领域的空白。 2. 深化了对WTP驱动因素的理解:在已有研究关注交互功能的基础上,强调了静态视觉设计的关键作用,并引入了“一致性理论”来解释这种匹配效应如何通过满足用户期望来创造价值。 3. 丰富了心智感知理论的应用:将心智感知的两个基本维度(能力与温暖)具体化为“权威性”和“友好性”,并实证了它们在特定设计线索(字体)和任务语境(问题类型)下的差异化中介作用,提供了更精细的理论框架。
应用价值: 为AI产品(尤其是基于LLM的聊天助手、文本工具等)的设计师和营销者提供了直接、可操作的指导: 1. 动态界面设计:AI产品可以根据用户输入问题的类型(可通过自然语言处理技术初步判断),自动切换或推荐匹配的字体风格,以优化用户体验和转化率。 2. 市场细分与定位:针对AI新手或大众市场,精心设计的字体匹配策略能更有效地提升产品吸引力和付费意愿。对于专业用户或科技爱好者,则需要强调其他价值主张。 3. 成本效益优化:相较于开发复杂的交互功能,调整字体是一种低成本、高杠杆的设计干预手段,能显著影响用户感知和行为。
研究亮点