日本有码中文字幕第二页,免费三级a在线观看在线观看

日韩精品一区二区三区69_麻豆国产激情在线观看_欧美日韩一区三区不卡在线_亚洲一级二级三级免费观看


設(shè)為首頁(yè) \| 加入收藏 \| 繁體中文

你好,歡迎光臨大連瓦房店市市場(chǎng)協(xié)會(huì)網(wǎng)站

您現(xiàn)在的位置:大連瓦房店市市場(chǎng)協(xié)會(huì) > 服務(wù)常識(shí) > 媒體報(bào)道


用戶名:
密　碼:


忘記密碼?點(diǎn)這里重設(shè)

服務(wù)常識(shí)

服務(wù)常識(shí) > 媒體報(bào)道

斯坦福團(tuán)隊(duì)承認(rèn)抄襲中國(guó)大模型！核心證據(jù)來(lái)自2300多年前

來(lái)源：都市快報(bào)橙柿互動(dòng) 網(wǎng)易號(hào)　點(diǎn)擊數(shù)：1750次　更新時(shí)間：2024/6/5 9:27:47

#斯坦福抄襲中國(guó)大模型##斯坦福團(tuán)隊(duì)道歉#，今天下午，兩個(gè)詞條分別沖上微博熱搜第2和第5位，引發(fā)熱議。

斯坦福團(tuán)隊(duì)承認(rèn)抄襲中國(guó)大模型沖上熱搜

簡(jiǎn)單說(shuō)，就是國(guó)外一個(gè)AI團(tuán)隊(duì)主導(dǎo)的開源大模型，被證實(shí)套殼抄襲了國(guó)內(nèi)清華系明星創(chuàng)業(yè)公司面壁智能的開源模型。目前，團(tuán)隊(duì)已經(jīng)公開道歉，并下架模型。

斯坦福AI團(tuán)隊(duì)抄襲中國(guó)大模型

5月29日，一個(gè)來(lái)自斯坦福的AI團(tuán)隊(duì)在網(wǎng)上發(fā)布文章《Llama 3-V: Matching GPT4-V with a 100x Smaller Model and 500 Dollars》，并開始廣而告之：成功訓(xùn)練出一個(gè)SOTA多模態(tài)模型Llama3-V，性能比GPT-4V、Gemini Ultra、Claude Opus更強(qiáng)，而訓(xùn)練成本僅需500美元。后三個(gè)大模型，都是全球范圍知名的多模態(tài)“巨無(wú)霸”。

由于團(tuán)隊(duì)成員擁有斯坦福（其中兩人是斯坦福本科生）、特斯拉、SpaceX、亞馬遜等亮眼背景，Llama3-V第一時(shí)間被推到了聚光燈下，登上開發(fā)者社區(qū)Hugging Face（抱抱臉）首頁(yè)，引發(fā)眾多開發(fā)者關(guān)注。

很快，有用戶開始在Hugging Face以及社交平臺(tái)X上提出質(zhì)疑：Llama3-V是否套殼MiniCPM-Llama3-V 2.5？后者為面壁智能推出的開源端側(cè)多模態(tài)模型，5月21日剛剛發(fā)布。

事情迅速發(fā)酵。經(jīng)過(guò)一些開發(fā)者的比較，兩者在模型結(jié)構(gòu)、代碼、配置文件等方面完全相同，只是進(jìn)行了一些重新格式化，并將部分變量重新命名。

面對(duì)質(zhì)疑，斯坦福團(tuán)隊(duì)一開始選擇“辯解”：只是使用MiniCPM-Llama3-V 2.5的tokenizer（分詞器），并且宣稱在后者發(fā)布前就已開始這項(xiàng)工作。

6月2日晚，面壁智能團(tuán)隊(duì)確認(rèn)抄襲事實(shí)。

面壁智能首席科學(xué)家劉知遠(yuǎn)在知乎上表示：“已經(jīng)比較確信Llama3-V是對(duì)我們MiniCPM-Llama3-V 2.5套殼。”

而CEO李大海也在朋友圈發(fā)文：“我們對(duì)這件事深表遺憾。一方面感慨這也是一種受到國(guó)際團(tuán)隊(duì)認(rèn)可的方式，另一方面呼吁大家共建開放、合作、有信任的社區(qū)環(huán)境。”

CEO李大海對(duì)此事表示遺憾

目前，Llama3-V團(tuán)隊(duì)的其中兩位成員Aksh Garg和Siddharth Sharma，也就是那兩位斯坦福本科生，已在社交平臺(tái)上向面壁智能團(tuán)隊(duì)道歉：“我們向作者道歉，并對(duì)自己沒有努力驗(yàn)證這項(xiàng)工作的原創(chuàng)性感到失望。我們對(duì)所發(fā)生的事情承擔(dān)全部責(zé)任，并已撤下Llama3-V，再次致歉。”

Llama3-V團(tuán)隊(duì)的其中兩位成員在社交平臺(tái)道歉

同時(shí)，Aksh Garg解釋Siddharth Sharma和自己主要是負(fù)責(zé)推廣，編寫代碼的是Mustafa Aljadery，而他目前已經(jīng)聯(lián)系不上。

目前已經(jīng)看不到Mustafa Aljadery的社交平臺(tái)內(nèi)容

核心證據(jù)：來(lái)自戰(zhàn)國(guó)時(shí)期的清華簡(jiǎn)

在朋友圈發(fā)文中，李大海給出確認(rèn)抄襲的一大理由是：經(jīng)過(guò)測(cè)試，面壁智能團(tuán)隊(duì)發(fā)現(xiàn)Llama3-V不僅能識(shí)別“清華簡(jiǎn)”的戰(zhàn)國(guó)古文字，而且在犯錯(cuò)的地方也和MiniCPM-Llama3-V 2.5如出一轍。

公開資料顯示，清華簡(jiǎn)，是清華大學(xué)于2008年7月收藏的一批戰(zhàn)國(guó)竹簡(jiǎn)，屬于中國(guó)學(xué)術(shù)史上先秦文獻(xiàn)的重大發(fā)現(xiàn)。此后，清華大學(xué)成立專門研究團(tuán)隊(duì)，先后在已故著名歷史學(xué)家、考古學(xué)家、古文字學(xué)家李學(xué)勤及黃德寬教授的帶領(lǐng)下開展簡(jiǎn)文整理研究，以復(fù)原這批幸免于焚書坑儒與秦漢戰(zhàn)火的重要?dú)v史“拼圖”。

這些年里，研究者們?cè)谝婚g不足20平方米的小屋里，用一面42英寸顯示屏讀簡(jiǎn)，整理成果以一年一輯的速度出版公布，至今已出版13輯。諸子思想、歷史文化、天文歷法、律法術(shù)數(shù)、醫(yī)學(xué)方技……中國(guó)傳統(tǒng)文獻(xiàn)中的經(jīng)史子集均有發(fā)現(xiàn)，竹簡(jiǎn)的內(nèi)容逐漸清晰起來(lái)。

據(jù)李大海解釋，此次識(shí)別清華簡(jiǎn)的訓(xùn)練數(shù)據(jù)，采集和標(biāo)注均由清華NLP實(shí)驗(yàn)室和面壁智能團(tuán)隊(duì)完成。“耗時(shí)數(shù)月，從卷帙浩繁的清華簡(jiǎn)中一個(gè)字一個(gè)字掃描下來(lái)，并逐一進(jìn)行數(shù)據(jù)標(biāo)注，融合進(jìn)模型中”，且數(shù)據(jù)尚未對(duì)外公開。

Llama3-V在犯錯(cuò)的地方也和MiniCPM-Llama3-V 2.5如出一轍

此外，Llama3-V、MiniCPM-Llama3-V 2.5兩個(gè)模型在高斯擾動(dòng)驗(yàn)證（一種用于驗(yàn)證模型相似性的方法）后，在正確和錯(cuò)誤表現(xiàn)方面都高度相似。

巧的是，上周日清華大學(xué)在官方微信公眾號(hào)上轉(zhuǎn)載了新華社《瞭望》新聞周刊刊發(fā)的特稿《破譯千年竹簡(jiǎn) 求索文明密碼》，回憶這2500位先秦“客人”來(lái)到清華的故事。

文中提到，清華簡(jiǎn)整理研究工作的難點(diǎn)之一，就是“認(rèn)字”。“清華簡(jiǎn)是戰(zhàn)國(guó)時(shí)期楚國(guó)人所寫，其中有些字沒有流傳下來(lái)，有的字形是首次出現(xiàn)，即便將一些字辨識(shí)出來(lái)，其字義的理解也需要下大功夫去研究，因?yàn)檫@些竹簡(jiǎn)文獻(xiàn)只有極少數(shù)可與傳世文獻(xiàn)對(duì)照參證。因此，‘考字釋詞’耗費(fèi)巨大精力，把字詞探究清楚了，做到文通字順，才能真正了解文獻(xiàn)記載了什么內(nèi)容，進(jìn)而判斷其價(jià)值�！�

清華校園內(nèi)的戰(zhàn)國(guó)竹筒

橙柿互動(dòng)·都市快報(bào) 記者童蔚

以上文章轉(zhuǎn)載自互聯(lián)網(wǎng)，版權(quán)歸原創(chuàng)者所有。如有來(lái)源標(biāo)注錯(cuò)誤或者侵權(quán)，請(qǐng)聯(lián)系我們，我們將及時(shí)處理。

【刷新頁(yè)面】【加入收藏】【打印此文】【關(guān)閉窗口】

上一篇：施工事故實(shí)習(xí)生被建議追刑責(zé)背后：19天未消除的隱患和層層失守的監(jiān)管　下一篇：12位市民代表將走進(jìn)2024夏季達(dá)沃斯