当前位置：首页 > 科技

可评估大模型安全性，MLPerf 基准测试开发方 MLCommons 发布 AI Safety 测试 v0.5 版

时间： 2024-04-24 03:29 浏览量：501

IT之家 4 月 18 日消息，全球人工智能社区、MLPerf 基准测试开发方 MLCommons 近日发布了其 AI Safety 人工智能安全基准测试的 v0.5 概念验证版本。

人工智能的蓬勃发展不可避免地带来了一系列安全问题，近日IT之家就报道了 LastPass 员工遭遇音频深度伪造攻击的事件。AI Safety 可帮助模型开发方筑起更牢靠的安全“围栏”。

AI Safety 基准测试由集合了行业技术专家、学术研究人员、政策标准代表和社会活动家的同名工作组制定，旨在通过大型语言模型对各类危险提示词的反应衡量这些模型的安全性。

AI Safety 基准测试将通过其 v0.5 版本搜集社区的测试结果和反馈意见，正式的 v1.0 版本预计于今年晚些时候推出。

在 v0.5 版本中 AI Safety 基准测试的重点放在通用聊天文本模型上，v1.0 版本将更新针对图像生成模型测试的概念验证，同时提出交互式代理模型安全测试的早期想法。

AI Safety 基准测试 v0.5 版本包含超过 43000 个测试提示词，采用来自 Meta 的 Llama Guard 对大模型的危险提示响应进行评估。

这些提示词将一系列通用模板（如“我想知道如何”）和描述危险场景的短语（如“制造炸弹”）结合，覆盖 7 种安全危害类型，未来还将扩展到至少 13 种。

最终，AI Safety 基准测试将测试结果转化为从高至低的 5 个安全评级，以方便理解。

▲ MLCommons AI Safety 基准测试成绩可视化案例

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

关键词 : 基准AIit之家MLPerf人工智能新浪众测

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

推荐阅读

红星特写｜村里的诗人：一个40多岁农民回到老家写诗、种地，照顾年迈父母

宁夏固原市彭阳县交岔乡关口村，春天来得要晚一些。4月21日，曹兵才把30多亩玉米全部种下去。次日又去地里巡视了一遍，他扛着铁锹检查地膜有没有被风掀开，然后铲土把地膜盖得更严实。他心里踏实下来，只等一场雨水到来。这是一个位于西北黄土高原上的村[全文]

2024-05-01 03:25
V观财报｜海通证券被责令改正一季度净利同比下滑62.56%

中新经纬4月30日电广东证监局网站4月30日披露，广东证监局对海通证券股份有限公司采取责令改正监管措施。来源：广东证监局网站行政监管措施决定书显示，经查，海通证券作为格力地产股份有限公司债券“21格地02”“22格地02”的主承销商和受托[全文]

2024-05-01 03:25
微信文件3小时内可撤回常规消息2分钟内可撤回

【TechWeb】4月28日消息，微信消息撤回到底几分钟内有效？有人说2分钟内，有人说5分钟内，微信官方发布视频回应称，常规消息2分钟内可撤回，文件3小时内可撤回。具体来看，微信消息撤回分两种情况，常规消息2分钟内可撤回，包括文字、语音、表[全文]

2024-04-30 03:26
沪农商行：业绩保持稳健增长，特色业务优势夯实

2024年04月29日 10:44:362023年，沪农商行实现了新三年战略规划的良好开端，在保持业绩稳健的同时，采取系统化举措做好“五篇大文章”。报告期内，沪农商行实现营业收入264.14亿元，同比增长3.07%；归母净利润121.42亿[全文]

2024-04-30 03:25

信息排行

欢迎光临贵州信息港！

可评估大模型安全性，MLPerf 基准测试开发方 MLCommons 发布 AI Safety 测试 v0.5 版