中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

AI 3个月前 admin

65 0 0

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

原文标题：GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models

原文作者：Kunsheng Tang, Wenbo Zhou, Jie Zhang, Aishan Liu, Gelei Deng, Shuai Li, Peigui Qi, Weiming Zhang, Tianwei Zhang, and Nenghai Yu

发表会议：ACM CCS 2024

论文连接：https://zjzac.github.io/publications/pdf/CCS_24_bias.pdf

主题类型：大模型安全

笔记作者：唐坤生@USTC

主编：黄诚@安全学术圈

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

针对LLMs的性别偏见评估与去偏框架

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

采用我们所提出GenderCARE框架的去偏结果

5. 论文信息

论文连接：https://zjzac.github.io/publications/pdf/CCS_24_bias.pdf

相关论文已被ACM CCS 2024接受，作者为中国科学技术大学的唐坤生、周文柏、李帅、齐培贵、张卫明、俞能海，南洋理工大学的张杰、邓格雷、张天威，北京航空航天大学的刘艾杉。

安全学术圈招募队友-ing
有兴趣加入学术圈的请联系 secdr#qq.com

原文始发于微信公众号（安全学术圈）：中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

版权声明：admin 发表于 2024年5月8日上午9:40。
转载请注明：中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架 | CTF导航

相关文章

七天入门LLM大模型 | 第六天：大模型量化及低成本部署最佳实践

admin

6

Transformer技术在好大夫在线的落地探索

admin

623

[IEEE TPAMI 2024] 将CLIP模型转换为端到端文本识别器

admin

27

【技术分享】利用AI来攻击IA：一种针对智能手机语音助手功能的隐形间谍软件

admin

401

深度探索：LLaMa-3 网络安全能力全解析

admin

29

G.O.S.S.I.P 阅读推荐 2022-10-25 Trajectory

admin

440