当前位置：首页 > AI > 正文内容

实习生刚对字节大模型“投毒”，两人就联手获奖了

邻居的猫1个月前 (12-09)AI459

咱们好啊，我是董董灿。

前段时间闹得沸反盈天的字节大模型“投毒案”的主角——实习生田同学，在被字节申述背上了官司之后，居然拿下了 NeurIPS 2024 最佳论文奖。

而这篇获奖的论文，便是他在字节实习期间与团队协作宣布的。

听说这篇论文在同行评定中取得了极高的点评，是国内第二篇取得 NeurIPS 最佳论文的研讨，含金量十分高。

能够说是：田同学和字节，一边相互掐架，一边联手获奖，有点狗血。

咱们回忆下“投毒案”是怎么回事。

我查了一些材料，大概是两个月前，这位北大实习生田同学在字节实习期间，由于对团队感到不满，挑选了“投毒”。

他利用了 Huggingface 的一个函数缝隙，伪装了一个看似正常的文件，长途履行代码，篡改模型练习参数。

听说这种攻击方式能够让大模型在加载权重时篡改权重的值、改动练习参数等。

其时有人还剖析了他的“投毒”机制：大概是经过修正模型的优化器，篡改了参数的梯度方向，乃至随机让模型在练习过程中sleep（休眠），然后大大下降模型的练习速度。

模型在练习过程中梯度被修正了，这意味着什么我想许多同学都十分清楚——

反向传达传递过来的梯度被修正，模型想练习都练习不出来，白白浪费时间和 GPU 资源。

在这件事被发现后，田同学就被辞退了，随后字节一纸诉状将田同学告到了法院，除了补偿还要揭露赔礼道歉。

这便是这件投毒案的因由。

仅仅没想到的是，时隔不久，田同学和字节发的论文取得了 NeurIPS 2024 最佳论文奖，也算是活久见了。

论学术才能，田同学必定没问题，在学术方面十分的牛，可是那种“投毒”的行为，放眼全球都是迸裂的存在。

不得不慨叹，“天才”与“恶魔”，有时往往真的只在一念之间。

假如你想学习 AI ，欢迎来增加我的微信 (vx: ddcsggcs），会有许多好玩的AI技能共享，能够咨询、也能够围观朋友圈呀！欢迎检查我的专栏 >>1. 专栏：计算机视觉入门与调优 , 2. 专栏：Transformer 通关与大模型实战

扫描二维码推送至手机访问。

本文链接：https://www.51blog.vip/?id=348

标签: AI 大模型深度学习

分享给朋友：

返回列表

上一篇：python怎么Fleiss Kappa

下一篇：Transformers 结构 Pipeline 使命详解：文本分类（text-classification 或 sentiment-analysis）

“实习生刚对字节大模型“投毒”，两人就联手获奖了” 的相关文章

探究Native Plugins：敞开大模型的技术之门

前语上一章节咱们了解了一下Semantic Kernnel中Plugins插件的概念以及学习了的 Semantic Kernel 模板插件的创立,本章节咱们来学习 Native Plugins 原生函数插件运用。经过函数界说插件在之前的章节中咱们介绍过在在 Semantic Kernel 中运...

完成阿里云模型服务灵积 DashScope 的 Semantic Kernel Connector

Semantic Kernel 内置的 IChatCompletionService 完结只支撑 OpenAI 与 Azure OpenAI，而我却计划结合 DashScope(阿里云模型服务灵积) 学习 Semantic Kernel。所以决议自己着手完结一个支撑 DashScope 的...

机器学习文本分类, 文本分类概述

1. 数据收集：收集需要分类的文本数据。2. 数据预处理：对文本数据进行清洗、分词、去除停用词、词干提取或词形还原等处理，以便于后续的分析。3. 特征提取：从预处理后的文本中提取有用的特征，如词频、TFIDF（词频逆文档频率）等。5. 模型评估：使用测试数据集来评估模型的性能，常用的指标包括准确率、...

ai写小说,技术革新与文学创作的未来

当然可以！我可以帮助你创作一篇小说。请告诉我你想要的主题、风格、人物设定、情节概要等，这样我可以更好地为你服务。AI写作小说：技术革新与文学创作的未来一、AI写作小说的兴起背景在互联网时代，信息爆炸使得人们对于文学作品的阅读需求日益多样化。与此同时，传统文学创作方式面临着创作速度慢、题材单一等问题。...

机器学习训练数据集,机器学习训练数据集的重要性

机器学习训练数据集的质量和数量对模型的性能有很大影响。高质量的数据集可以提供足够的信息，帮助模型学习到有用的模式。而大量的数据集可以提供更多的样本来训练模型，从而提高模型的泛化能力。在选择机器学习训练数据集时，需要考虑以下几个因素：1. 数据集的大小：数据集的大小应该足够大，以便模型能够学习到有用的...

机器学习摘要,未来科技发展的核心驱动力

机器学习：未来科技发展的核心驱动力随着信息技术的飞速发展，机器学习作为人工智能领域的一个重要分支，正逐渐成为推动社会进步和产业升级的核心驱动力。本文将简要介绍机器学习的基本概念、应用领域以及未来发展趋势。一、机器学习的基本概念机器学习（Machine Learning，ML）是一门研究如何让计算机从...

实习生刚对字节大模型“投毒”，两人就联手获奖了

“实习生刚对字节大模型“投毒”，两人就联手获奖了” 的相关文章

探究Native Plugins：敞开大模型的技术之门

完成阿里云模型服务灵积 DashScope 的 Semantic Kernel Connector

机器学习文本分类, 文本分类概述

ai写小说,技术革新与文学创作的未来

机器学习训练数据集,机器学习训练数据集的重要性

机器学习摘要,未来科技发展的核心驱动力

Copyright © 2024-2028 51blog All Rights Reserved