当前位置:首页 > AI > 正文内容

实习生刚对字节大模型“投毒”,两人就联手获奖了

邻居的猫1个月前 (12-09)AI459

咱们好啊,我是董董灿。

前段时间闹得沸反盈天的字节大模型“投毒案”的主角——实习生田同学,在被字节申述背上了官司之后,居然拿下了 NeurIPS 2024 最佳论文奖。

而这篇获奖的论文,便是他在字节实习期间与团队协作宣布的。

听说这篇论文在同行评定中取得了极高的点评,是国内第二篇取得 NeurIPS 最佳论文的研讨,含金量十分高。

能够说是:田同学和字节,一边相互掐架,一边联手获奖,有点狗血。

咱们回忆下“投毒案”是怎么回事。

我查了一些材料,大概是两个月前,这位北大实习生田同学在字节实习期间,由于对团队感到不满,挑选了“投毒”。

他利用了 Huggingface 的一个函数缝隙,伪装了一个看似正常的文件,长途履行代码,篡改模型练习参数。

听说这种攻击方式能够让大模型在加载权重时篡改权重的值、改动练习参数等。

其时有人还剖析了他的“投毒”机制:大概是经过修正模型的优化器,篡改了参数的梯度方向,乃至随机让模型在练习过程中sleep(休眠),然后大大下降模型的练习速度。

模型在练习过程中梯度被修正了,这意味着什么我想许多同学都十分清楚——

反向传达传递过来的梯度被修正,模型想练习都练习不出来,白白浪费时间和 GPU 资源。

在这件事被发现后,田同学就被辞退了,随后字节一纸诉状将田同学告到了法院,除了补偿还要揭露赔礼道歉。

这便是这件投毒案的因由。

仅仅没想到的是,时隔不久,田同学和字节发的论文取得了 NeurIPS 2024 最佳论文奖,也算是活久见了。

论学术才能,田同学必定没问题,在学术方面十分的牛,可是那种“投毒”的行为,放眼全球都是迸裂的存在。

不得不慨叹,“天才”与“恶魔”,有时往往真的只在一念之间。

假如你想学习 AI ,欢迎来增加我的微信 (vx: ddcsggcs),会有许多好玩的AI技能共享,能够咨询、也能够围观朋友圈呀!欢迎检查我的专栏 >>1. 专栏:计算机视觉入门与调优 , 2. 专栏:Transformer 通关与大模型实战

扫描二维码推送至手机访问。

版权声明:本文由51Blog发布,如需转载请注明出处。

本文链接:https://www.51blog.vip/?id=348

分享给朋友:

“实习生刚对字节大模型“投毒”,两人就联手获奖了” 的相关文章

探究Native Plugins:敞开大模型的技术之门

探究Native Plugins:敞开大模型的技术之门

前语 上一章节咱们了解了一下Semantic Kernnel中Plugins插件的概念以及学习了的 Semantic Kernel 模板插件的创立,本章节咱们来学习 Native Plugins 原生函数插件运用。 经过函数界说插件 在之前的章节中咱们介绍过在在 Semantic Kernel 中运...

完成阿里云模型服务灵积  DashScope 的  Semantic Kernel Connector

完成阿里云模型服务灵积 DashScope 的 Semantic Kernel Connector

Semantic Kernel 内置的 IChatCompletionService 完结只支撑 OpenAI 与 Azure OpenAI,而我却计划结合 DashScope(阿里云模型服务灵积) 学习 Semantic Kernel。 所以决议自己着手完结一个支撑 DashScope 的...

机器学习文本分类, 文本分类概述

1. 数据收集:收集需要分类的文本数据。2. 数据预处理:对文本数据进行清洗、分词、去除停用词、词干提取或词形还原等处理,以便于后续的分析。3. 特征提取:从预处理后的文本中提取有用的特征,如词频、TFIDF(词频逆文档频率)等。5. 模型评估:使用测试数据集来评估模型的性能,常用的指标包括准确率、...

ai写小说,技术革新与文学创作的未来

ai写小说,技术革新与文学创作的未来

当然可以!我可以帮助你创作一篇小说。请告诉我你想要的主题、风格、人物设定、情节概要等,这样我可以更好地为你服务。AI写作小说:技术革新与文学创作的未来一、AI写作小说的兴起背景在互联网时代,信息爆炸使得人们对于文学作品的阅读需求日益多样化。与此同时,传统文学创作方式面临着创作速度慢、题材单一等问题。...

机器学习训练数据集,机器学习训练数据集的重要性

机器学习训练数据集,机器学习训练数据集的重要性

机器学习训练数据集的质量和数量对模型的性能有很大影响。高质量的数据集可以提供足够的信息,帮助模型学习到有用的模式。而大量的数据集可以提供更多的样本来训练模型,从而提高模型的泛化能力。在选择机器学习训练数据集时,需要考虑以下几个因素:1. 数据集的大小:数据集的大小应该足够大,以便模型能够学习到有用的...

机器学习摘要,未来科技发展的核心驱动力

机器学习摘要,未来科技发展的核心驱动力

机器学习:未来科技发展的核心驱动力随着信息技术的飞速发展,机器学习作为人工智能领域的一个重要分支,正逐渐成为推动社会进步和产业升级的核心驱动力。本文将简要介绍机器学习的基本概念、应用领域以及未来发展趋势。一、机器学习的基本概念机器学习(Machine Learning,ML)是一门研究如何让计算机从...