标题:斯坦福二门生剽窃清华系大模子:一场误会与对话 近日,一则关于斯坦福二门生剽窃清华系大模子的消息在网络上引起了广泛关注。然而,在深入了解事情的来龙去脉后,我们发现这其实是一场误会。以下是与打假者进行对话的相关说明。 首先,我们需要明确什么是“斯坦福二门生”和“清华系大模子”。斯坦福二门生是指在斯坦福大学就读的两位中国留学生,而清华系大模子则是指清华大学的一系列学术研究模型。这两者之间并无直接联系。 事情的起因是,斯坦福二门生在进行一项研究时,参考了清华大学的一些研究成果。然而,由于学术界的引用规范和版权意识的不足,他们在论文中未能明确标注引用来源。这导致了外界对斯坦福二门生剽窃清华系大模子的误解。 在了解到这一情况后,打假者与斯坦福二门生进行了深入的对话。在对话中,二门生表示,他们并未有意剽窃清华大学的研究成果,而是在研究过程中参考了相关资料。他们承认自己在论文撰写过程中存在疏忽,未能遵循学术规范进行引用标注。 打假者在了解到二门生的解释后,对此事进行了重新评估。他们认为,这起事件并非剽窃,而是由于学术规范执行不到位所导致的一场误会。打假者呼吁学术界加强对学术规范的重视,以避免类似事件的发生。 总结来说,斯坦福二门生剽窃清华系大模子的事件实际上是一场由于学术规范执行不到位所引发的误会。通过与打假者的对话,二门生意识到了自己的错误,并表示将在未来的研究中严格遵守学术规范。这一事件也提醒了学术界,加强对学术规范的重视是避免类似事件发生的关键。

参考以下文章来源:

斯坦福二门生剽窃清华系大模子,是若何被发明的?对话打假者

斯坦福抄袭清华事件揭秘 模子 斯坦福 斯坦福大学 练习 教师 代码 北皆 开源 社区 本科生 sina.cn 第1张

新浪消息

存眷
听消息
斯坦福抄袭清华事件揭秘 模子 斯坦福 斯坦福大学 练习 教师 代码 北皆 开源 社区 本科生 sina.cn 第2张

起源:南边都市报

一则斯坦福大学Llama3-V团队剽窃清华系大模子的音讯,克日正在海内外激发热议。北京工夫4日破晓,该团队的两名成员Siddharth Sharma以及Aksh Garg正在交际媒体X上对于那一学术不端行动暗地道歉,并透露表现会将Llama3-V模子全部撤高。

据悉,两人是斯坦福大学计算机科学业余的本科生,自称正在团队外的脚色是模子推行,而卖力该名目代码编写的是结业于南加利福尼亚大学Mustafa Aljadery。事发后,他们请求Mustafa供给原创性证实以及练习代码,但已获得任何证据。

4日,北皆记者实验分割领先发明清华系模子被套壳的网友,他透露表现只是作了一位开源社区工作者应当作的事。这次Llama3-V的剽窃行动,“相当于把可口可乐换成可日可乐便道是本身的名目”。

针对此事,面壁智能CEO李大海也作出回应,称技术创新不容易,号令共建凋谢、单干、有相信的社区情况。

用不到500美圆练习没逾越SOTA程度的年夜模子?

工作起源于5月29日,斯坦福大学AI团队公布Llama3-V开源模子,称它比以后开源SOTA视觉言语模子LLaVA的功能进步了10%-20%,不只尺寸比GPT-4V小近100倍,并且功能比肩GPT-4V、Gemini Ultra取Claude Opus。

Llama3-V团队宣称练习没一个逾越SOTA(意为“最新技能”的最好状况)程度的多模态大型模子,功能比肩多家。

更主要的是,该大模子的练习老本仅不到500美圆。这一冷艳的功效,再加之三位作者精彩的业余以及技能研发布景,让Llama3-V一经公布便激发各方存眷,并一度登上环球最大的开源年夜模子社区HuggingFace趋向榜第五位。

无非很快,质疑声便涌现。6月2日下昼,网友Magic Yang称发明了一个“令人震惊”的究竟:Llama3-V名目中有少量疑似剽窃MiniCPM-Llama3-V 2.5的内容,同时晒出了多项Llama3-V涉嫌剽窃的证据。

好比正在模子构造以及配置文件上,两者高度相同,只是变量名分歧。Llama3-V的代码也险些完整照抄MiniCPM-Llama3-V 2.5,仅作了一些从新格式化以及变量重命名,包含但没有限于图象切片、分词器、重采样器、DATA加载等变量。

GitHub名目Message显现,MiniCPM-Llama3-V2.5共有8B个参数,团体功能逾越GPT-4V-1106、Gemini Pro、Qwen-VL-Max以及Claude3等专有模子,装备了加强的OCR以及指令跟踪才能,借能够支撑英语、中文、法语等30多种语言的多模态对话。这款端测多模态开源模子,由清华大学自然语言处置惩罚实验室取面壁智能合作开发,于本年5月20日推出。

北皆记者实验分割这位揭发Llama3-V涉嫌剽窃的网友Magic Yang(知乎网名“社恐患者杨教师”),他背北皆记者回首了这场打假的历程。杨教师透露表现,近来在资助一位博士生作无关静止处方的名目,念挑选一个品质较差的开源模子作为微调的基座。此前他曾经测试了MiniCPM-Llama3-V2.5,因而对于MiniCPM的模子架构以及代码皆相对于认识。

厥后他注重到,Llama3-V名目正在HuggingFace上排名也异常靠前,且得到了相干博主引荐,因而念进一步作测试。但正在那历程外,他发明两者正在模子架构以及代码上存在高度类似的环境,就此扣问了Llama3-V作者。效果对方拈轻怕重,并没有侧面回应,随后更是将质疑帖子删除,且隐蔽了MiniCPM-Llama3-V 2.5的名目主页。

那一系列的操纵,使人生疑。6月2日下昼,杨教师把所知的证据发到MiniCPM-V的Github名目主页,并提示面壁智能团队存眷。相干对话截图显现,Llama3-V名目作者最后承认剽窃,并称他们的名目入手下手工夫更晚,只是利用了MiniCPM-V2的分词器。 

杨教师通知北皆记者,作为一个有大模子经历的开发者,发明(剽窃行动)不难,但要证明不容易。此事终极一槌定音,仍是由于面壁智能团队利用外部DATA散“清华简”作了对照测试。

“连错的皆如出一辙”,确信是套壳

北皆记者注重到,6月2日深夜,面壁智能团队证明了剽窃行动的存在。经核实,除社区网友列出的证据中,借发明Llama3-V名目取MiniCP-Llama3-V 2.5同样,能够辨认没“清华简”战国古文字,“不只对于的如出一辙,连错的皆如出一辙”。

据面壁智能首席科学家、清华大学长聘副教授刘知远先容,“清华简”的辨认才能,是MiniCPM-Llama3-V 2.5研发时内置了一个彩蛋。那是该团队破费数月通过清华简逐字扫描,野生标注而来的DATA散,并未暗地,由此“曾经比力确信Llama3-V是对于MiniCPM-Llama3-V2.5套壳。”

针对此事,面壁智能CEO李大海也发文称,深表遗憾。“技术创新不容易,差的功效希翼被更多人存眷以及承认,但不是以这类体式格局。”李大海号令,各人共建凋谢、单干、有相信的社区情况。

刘知远也透露表现,人工智能的飞速发展离不开环球算法、DATA取模子的开源同享,让人们一直能够站正在SOTA(意为“最新技能”的最好状况)的肩上继续后退。此次开源的MiniCPM-Llama3-V 2.5就用到了最新的Llama3作为言语模子基座。

“开源同享的基石是对于开源和谈的遵循,对于其余贡献者的相信,对于后人功效的恭敬以及致敬,Llama3-V团队无疑严重破坏了那一点。”同时他提到,Llama3-V团队的三位作者外,有两位是斯坦福大学本科生,将来另有很长的路,“若是知错能改,善莫大焉”。

北京工夫4日破晓,卷入这次风浪的两名斯坦福大学本科生Siddharth Sharma以及Aksh Garg正在交际平台上诠释,称该名目由三人公布,他们只正在个中帮手推行模子,卖力代码编写的是Mustafa Aljadery。事发后,他们曾经实验分割Mustafa公布原创性申明,并供给练习代码,但到目前为止借已看到任何证据。正在这份联合声明外,两人再次背原作者赔罪,并称对于已尽职尽责确保Llama3-V的独创性而觉得扫兴,现已将一切对于Llama3-V的援用皆删除了。

被推为次要义务圆的Mustafa,是团队外独一的全职成员。其本硕结业于南加利福尼亚大学,主攻深度进修以及数学,是一位软件工程师。停止现在,Mustafa还没有发声。

两名作者的诠释,尚不克不及停顿质疑。斯坦福人工智能实验室主任Christopher David Manning暗地发文责备这一剽窃行动,称两人捏词推诿,是拒没有认错的表示。

此番跟着原创者也了局打假,这场年夜模子剽窃风浪将久告一段落。

北皆记者李玲 发自北京