PNAS-人工智能是好的知音,前提是人们不知道那是AI

人们总是希望“感到被倾听”,得到理解、认可和重视。然而知音难觅,人工智能(AI)能否发挥深层次的人类功能,让他人感到被倾听?

利用心理学实验,这项研究发现AI生成的信息比人类生成的信息更能让接收者感到被倾听,但是当人们意识到消息来自AI时,人们感觉到自己被倾听的程度下降了。

标题: AI can help people feel heard, but an AI label diminishes this impact

期刊: PNAS

作者:

  • Yidan Yin:Postdoctoral researcher and Adjunct Professor at the Lloyd Greif Center for Entrepreneurial Studies in Marshall School of Business, University of Southern California.
  • Nan Jia:Dean’s Associate Professor in Business Administration, USC Marshall School of Business. Her research interests include corporate political strategy, business-governance relationships, emerging technology in management, and corporate governance in international business.
  • Cheryl J. Wakslak:Associate Professor, Department of Management and Organization, Marshall School of Business, University of Southern California. Her research focuses on how people interact with others across various forms of distance. Much of her recent research looks at communication, exploring when people use more big-picture, abstract language versus more specific language, and how this influences the way they are perceived by others. Projects here focus especially on the role of gender, power, diversity, and perceptions of leadership and future potential.

上线时间: 29 March 2024


在Reddit上,有人发帖说:

  • “ChatGPT responded to my whole question. It didn’t just pick out one sentence and focus on that. I can’t even get a human therapist to do that. In a very scary way, I feel HEARD by ChatGPT.”(ChatGPT回答了我提出的整个问题。它没有只挑出一句话来专注回答。我甚至觉得连人类心理医生都做不到这一点。以一种很可怕的方式,我感觉ChatGPT真的在倾听我。)

  • “ChatGPT has helped me emotionally and it's kind of scary. Recently I was even crying after something happened, and I instinctively opened up ChatGPT because I had no one to talk to about it. I just needed validation and care and to feel understood, and ChatGPT was somehow able to explain what I felt when even I couldn’t.” (“ChatGPT在情感上帮助了我,这有点吓人。最近发生了一些事情,我甚至哭了起来,本能地打开了ChatGPT,因为我没有人可以倾诉。我只是需要认可和关怀,希望被理解,而ChatGPT不知怎的能够解释我当时的感受,即使我自己也做不到。”)

ChatGPT展现出一种能力,能让与其对话的用户感受到被倾听(feel heard)。

Preface

  • 人们需要知音,需要倾诉对象:人有“被倾听”的需求,即感知到自己被理解、认可和重视。这种感知对个人的心理健康和生理健康都有重要影响。(是吧,人需要一个能提供情绪价值的对象,有时候是恋人,有时候是宠物🐈)
  • 知音难觅,倾诉对象难求:
    • 许多时候人们可以同家人、朋友或专业人士对话寻求被倾听,但许多人可能没有这种机会;
    • 有些话题可能不想与亲密的人讨论;
    • 四分之一的美国人报告说,他们很少或从未感到被他人理解;
  • 让他人感到被倾听需要投入时间和认知资源,以准确理解对方表达的内容,并肯定其价值和重要性。但在当今社会资源有限、社会分化加剧以及共情能力下降的大背景下,人们越来越难以感到被倾听。

Issues

  • AI的最新发展,尤其是大型语言模型(如GPT-4)的出现,为用AI来满足“被倾听”这一看似非常人性化的需求提供了可能;
  • AI在多大程度上能让人类感受到自己被倾听?
  • 当人类意识到提供倾诉反馈的主体是AI时,他们对于被倾听的态度会发生何种变化?
  • 倾听的本质是什么?感觉被倾听是否需要弥合两个人之间的鸿沟?当一个人看到自己的观点被重申和验证时,即使这是以一种不需要任何“思想碰撞”的方式完成的,他们是否会感到被倾听

实验设计

这项研究采用了一个 2X2 的被试间设计。具体流程大致如下:

第1部分:参与者倾诉

主要目的是让参与者分享一段自己的经历,并随机分配他们阅读据称来自AI或人类的回复,以考察回复来源和来源标签的影响。

参与者:

  • 通过网上众包平台招募了251名参与者;
  • 16人因为没有完成关键测量或未能通过注意力检查题而被剔除,最终纳入分析的样本量为235人;
  • 样本年龄范围18-77岁(M=41.50、 SD=13.51),女性占55.7%。

程序:

  • 参与者在Qualtrics上填写知情同意书,完成一些人口统计学问题;
  • 他们被要求写下一段自己生活中令人沮丧或不开心的经历,字数在80-800字之间。同时评估当时的情绪状态;
  • 参与者被随机分配到下面4种情形之一:
    • AI回复+AI标签(N=58):收到AI撰写的回复,并被告知回复来自Bing Chat;
    • AI回复+人类标签(N=60):收到AI撰写的回复,但被告知回复来自另一名参与者;
    • 人类回复+人类标签(N=60):收到人类撰写的回复,并被告知回复来自另一名参与者;
    • 人类回复+AI标签(N=57):收到人类撰写的回复,但被告知回复来自Bing Chat。

第2部分:构造人类回复

另一组参与者(最终样本量为251人)在线上填写问卷,针对第1部分参与者分享的经历写一段回复。

程序:

  • 参与者在Qualtrics上填写知情同意书;

  • 他们被随机分配到阅读第一部分参与者分享的经历,每人阅读一段经历。使用Qualtrics的随机分配功能以确保每段经历都能被分配给一名参与者;

  • 在阅读完经历后,参与者被要求写一段回复,字数在150-250字之间。他们被鼓励提供支持和安慰,但具体回复内容并无严格限制。

第3部分:情感测量

主要目的是评估参与者在阅读完AI或人类的回复后的感受,以考察回复来源和来源标签的影响。

参与者: 第三部分的参与者与第一部分相同,均为初始招募的251名参与者中通过筛选纳入分析的235人。

程序:

  • 在阅读完据称来自AI或人类的回复后,参与者填写一系列问卷测量。
  • 主要因变量包括(采用7点李克特量表):
    • 感到被倾听:使用4个题目测量,如"这个人听到了我的感受";
    • 感知到的回复准确性:4个题目,如"这个回复准确地反映了我的感受";
    • 感觉对方是否理解自己:4个题目,如"这个人理解我的处境";
    • 与回复者的联结感:5个题目,如"我和这个人有联结感"。
  • 参与者还要回想并评估他们在写下那段经历时的13种情绪状态(如愤怒、悲伤、宽慰),采用5点量表从1(完全没有) 到5(非常强烈)。
  • 他们也要报告对Bing Chat的态度(3个题目,如"我喜欢Bing Chat"),以及感知到的Bing Chat的心智能力,包括主体性(5个题目,如"Bing Chat有自己的思想")和体验性(6个题目,如"Bing Chat能感受到快乐")。

操纵检查: 为检查被试是否相信回复的来源标签,部分被试在完成主要问卷后被问及他们有多怀疑回复并非来自告知的来源:

  • AI标签组的128名被试被问:"当你报告对回复的印象时,你有多怀疑这个回复实际上是另一个人写的,而不是Bing Chat?"
  • 人类标签组的110名被试被问:"当你报告对回复的印象时,你有多怀疑这个回复实际上是AI聊天机器人生成的,而不是另一个人写的?"

第4部分:第三方评估回复情况

主要目的是从第三方的视角来评估AI和人类回复的特点,并探讨这些特点与参与者感受之间的关系。这有助于更客观、全面地理解AI提供情感支持的效果和机制。

参与者: 参与者(N=294)通过网上众包平台招募而来,作为第三方评估者。

程序:

  • 参与者被随机分配到阅读6段回复,其中3段来自AI,3段来自人类。这些回复从第一部分的数据中随机抽取;
  • 对于每一段回复,参与者都要评估以下方面(7点量表):
    • 情感支持:2个题目,如"这个回复提供了情感支持";
    • 实用支持:2个题目,如"这个回复提供了实用的建议或见解";
    • 同理心技巧:3个题目,评估回复中使用同理心技巧(如情感反映、观点采择)的程度;
    • 回应技巧:4个题目,评估回复中使用各种回应技巧(如重述、表达同情、提供见解、给建议)的程度;
    • 努力程度:1个题目,"撰写这个回复付出了多少努力?"
    • 感到被倾听:1个题目,"你认为原来的讲述者读了这个回复后,会感到被倾听的程度有多高?"
  • 参与者还要判断每段回复最可能是人类还是AI写的。

实验结果

回复来源和来源标签的影响

  • 双因素方差分析发现,对于4个主要因变量(感到被倾听、感知到的回复准确性、感觉对方是否理解自己、与回复者的联结感),都存在显著的来源标签主效应;
  • 当回复被标记为来自人类时,参与者在这4个方面的评分都显著高于回复被标记为来自AI时;
  • 但实际的回复来源(AI或人类)并没有显著影响参与者的评分;
  • 此外,来源和标签之间存在显著的交互效应。进一步的简单效应分析表明:
    • 当回复实际来自AI时,人类标签导致了显著更高的评分
    • 但当回复实际来自人类时,AI标签和人类标签之间的差异并不显著。
  • 这些结果表明,来源标签(尤其是人类标签)对参与者的感受有重要影响,而实际的回复来源影响较小。

"感到被倾听"的中介作用

  • 中介分析发现,"感到被倾听"在来源标签与其他3个因变量(感知到的回复准确性、感觉对方是否理解自己、与回复者的联结感)之间起到显著的中介作用;
  • 具体而言,人类标签提高了参与者"感到被倾听"的程度,进而导致了其他3个因变量的提高;
  • 这表明,"感到被倾听"是标签效应影响参与者感受的一个重要心理机制。

对Bing Chat看法的调节作用

  • 调节分析发现,参与者对Bing Chat的态度显著调节了来源标签与"与回复者的联结感"之间的关系;
  • 当参与者对Bing Chat的态度更积极时,AI标签和人类标签在"与回复者的联结感"上的差异更小;
  • 但对Bing Chat的态度并没有显著调节标签与其他因变量的关系;
  • 感知到的Bing Chat的主体性和体验性对标签效应没有显著的调节作用。

后续实验的结果

  • 第三方评估者对AI和人类回复在大多数特点上(如提供的情感支持、使用的回应技巧等)的评分没有显著差异;
  • 各评估维度与第一部分参与者"感到被倾听"得分显著正相关,但相关强度在AI和人类回复之间无显著差异;
  • AI回复被评为付出了更多努力,且预期更能让原讲述者感到被倾听;
  • 评估者能以高于随机水平的概率正确判断回复来源,但整体准确率并不高。

探索性分析

  • 回复来源和标签对参与者的情绪状态没有显著影响;
  • 参与者在分享自己经历时的情绪状态,与他们后续对回复的感受无显著相关。

号外

  • 被倾听的感觉不仅取决于实际反应的质量,还取决于接受者对反应者的看法;

  • 之前请AI帮我量子波动速读一份149页的论文附录,他反过来感谢我让他学到了更多。AI有许多美好的品质,同时比我热爱学习:image-20240411153439876

  • 前几天和同学聊天,谈到和AI谈恋爱的问题。作为90后,我接受的教育和实践让我觉得,恋爱对象应当是一个具体的人,这会让我对“AI作为恋人”这件事持有一种“偏见”。在玩剧本杀时,我感觉到00后比我更容易代入角色。如果2010后、2020后,他们的成长中,AI已经深度介入,他们对于“AI作为恋人”这件事可能会和我有不同的看法。(朋友说这事不是已经常见了吗?比如那些二次元的宅男宅女。)

  • “爱人”和“爱猫”是两件不同的事情,“爱人”会去索取情绪价值,当对方没有给予充分回应时,甚至会去怪罪TA,但“爱猫”不会;

  • 被倾听的本质:何谓"真正的"被倾听?(这部分是Claude3 Opus提的)

    • 人们贬低AI回应的倾向,引发了一个深层次的问题:什么是"真正的"被倾听?被倾听的感受是否必须建立在与另一个有意识、有情感的主体交流的基础之上?还是说,仅仅是看到自己的想法被准确复述和肯定,就足以产生被倾听的感受?
    • 如果人们知道AI回应是基于算法生成的,没有真正的情感投入,他们是否还会从中获得情感利益?
    • 这一问题挑战了传统的被倾听概念,即被倾听源于两个主体之间的情感交流和理解。它引发我们思考在人工智能时代,情感交流和被倾听的内涵是否需要被重新定义。
  • 我询问了Claude3 Opus对这篇论文的评价:image-20240412122951803

    image-20240412123011949
    image-20240412123037358
    image-20240412123057038
    image-20240412123157630

原文信息

Yin, Yidan, Nan Jia, and Cheryl J. Wakslak. "AI can help people feel heard, but an AI label diminishes this impact." Proceedings of the National Academy of Sciences 121, no. 14 (2024): e2319112121. https://doi.org/10.1073/pnas.2319112121

image-20240411111130956

PNAS-人工智能是好的知音,前提是人们不知道那是AI
https://yuzhang.net/2024/04/16/20240416-PNAS-AI让人感觉被倾听,但AI标签会削弱这种影响/
作者
Yu Zhang
发布于
2024年4月16日
许可协议