自然语言处理(NLP)模型和大语言模型(LLM)的快速发展使得新的特定用途对话代理的开发成为可能,这些对话代理旨在回答特定类型的查询。这些范围从提供学术支持的人工智能代理到提供一般财务、法律或医疗建议的平台。
合肥工业大学和合肥综合国家科学中心的研究人员最近致力于开发一个基于人工智能的平台,可以提供非专业但可能有用的心理支持。他们的论文于1月29日至2月2日在阿姆斯特丹举行的国际多媒体建模会议上发表,介绍了EmoAda,这是一种经过训练可进行情感对话的对话系统,可提供低成本的基本心理支持。
“我们的论文源于对抑郁和焦虑等心理疾病日益流行的担忧,特别是在COVID-19大流行之后,以及专业心理服务的可用性存在巨大差距,”该论文告诉TechXplore。
“这项工作建立在各种研究成果的基础上,例如李飞飞等人通过口语和面部表情测量抑郁严重程度的研究,孙晓等人关于用于人格评估的多模态注意力网络的研究,以及人工智能的开发基于情感支持系统,例如Google的LaMDA和OpenAI的ChatGPT。”
这项最近研究的主要目标是创建一个具有成本效益的心理支持系统,可以根据不同的输入感知用户的情绪,产生个性化和有洞察力的反应。该系统并不是为了替代专业帮助,而是为了减轻压力并帮助用户提高心理灵活性,这一功能与良好的心理健康相关。
“EmoAda是一种多模式情绪互动和心理适应系统,旨在为难以获得心理健康服务的个人提供心理支持,”孙解释道。“它的工作原理是从用户那里收集实时多模态数据(音频、视频和文本),提取情感特征,并使用多模态大语言模型来分析这些特征,以进行实时情感识别、心理分析和指导策略规划”。
多模态情感交互大语言模型的架构。研究人员以开源模型baichuan13B-chat为基础,通过MLP层将从视觉、文本和音频模型中提取的深度特征向量集成到baichuan13B-chat中。他们采用混合模态适应技术来实现多模态语义对齐,使法学硕士模型能够处理多模态信息。该团队还构建了多模态情绪微调数据集,包括开源PsyQA数据集和团队收集的心理访谈视频数据集。利用HuggingGPT[6],他们开发了多模态微调指令集,以增强模型的多模态交互能力。研究人员正在创建心理知识图谱,以提高模型响应心理知识的准确性并减少模型幻觉。通过结合这些不同的技术,MEILLM可以进行心理评估,使用心理量表进行心理访谈,并为用户生成心理评估报告。MEILLM还可以为用户创建全面的心理档案,包括情绪、心情、性格等,并根据用户的心理档案提供个性化的心理指导。MEILLM为用户提供更加自然、人性化的情感支持对话和个性化的心理适应报告。图片来源:Dong等人
EmoAda是Sun和他的同事创建的平台,可以通过分析各种类型的感官数据(包括用户的声音、面部视频片段和文本)来检测用户的情绪。根据这些分析,系统会生成个性化的情感支持对话,通过文本或数字化身进行传递。
根据用户的需求和他们提到的困难,平台可能会建议各种可能有益的活动。其中一些活动是通过EmoAda平台上提供的内容来促进的,例如引导冥想练习和用于放松或缓解压力的音乐。
“当对真实用户进行测试时,EmoAda已被证明可以提供自然且人性化的心理支持,”孙说。“在这些试验中,我们发现一些用户更喜欢与人工智能对话,因为它可以显着减少他们对隐私泄露和社会压力的焦虑。与人工智能对话可以创造一个安全、非评判性的环境,让用户可以在不产生任何影响的情况下表达自己的感受和担忧。担心被评判或误解。像EmoAda这样的人工智能系统还提供全天候支持,不受时间限制,这对于在任何特定时刻需要帮助的用户来说是一个显着的优势。”
在最初的测试中,研究人员发现EmoAda最受赞赏的方面之一是它的匿名性。事实上,用户经常提到,他们觉得分享私人信息很舒服,因为他们发现很难与其他人面对面讨论这些信息。
未来,这种基于人工智能的新系统可以作为基本支持服务,为那些无力承担专业心理护理或正在等待获得可用心理健康服务的人们提供服务。此外,EmoAda可以为其他研究小组提供灵感,为其他基于人工智能的心理健康相关数字平台的开发铺平道路。
“我们下一步的研究将集中于解决当前系统的局限性,包括优化多模态情感交互大语言模型以减少错误信息的产生,提高模型干扰性能,降低成本,并整合心理专家知识库以增强系统的可靠性和专业性,”孙添加。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!