福利片在线一区二区,久久国产免费,欧美aa一级,日韩三级精品

每日熱文:谷歌更新隱私政策,大模型“諸神之戰(zhàn)”背后的訓(xùn)練數(shù)據(jù)隱憂
2023-07-05 20:56:54 來源:21世紀(jì)經(jīng)濟報道 編輯:

21世紀(jì)經(jīng)濟報道記者王俊 南方財經(jīng)全媒體記者馮戀閣 實習(xí)生羅洛 北京、廣州報道“我們可能會收集公開的在線信息或來自其他公共來源的信息,幫助訓(xùn)練Google的人工智能模型。”近日,谷歌更新隱私政策,表示將利用網(wǎng)絡(luò)公開數(shù)據(jù)訓(xùn)練旗下的AI模型,相關(guān)條款已于7月1日生效。

谷歌的這一動作引發(fā)爭議,單方面通知用戶的行為是否合法合規(guī)?此舉又是否有“囤數(shù)據(jù)”之嫌?

此前,Twitter和社交網(wǎng)站Reddit已經(jīng)采取措施,限制第三方對其API的訪問。國外科技公司的一系列舉措背后,可能是大模型發(fā)展路上一個不可忽視的真相:訓(xùn)練數(shù)據(jù)的重要性愈發(fā)顯現(xiàn)。隨著大模型產(chǎn)業(yè)的快速發(fā)展,出于市場競爭的需要,模型規(guī)模將快速膨脹,但同時可用于訓(xùn)練的數(shù)據(jù)供給相對不足,且未來日趨稀缺。


(相關(guān)資料圖)

未來,數(shù)據(jù)或?qū)⒊蔀锳I發(fā)展的“兵家必爭之地”。

“囤數(shù)據(jù)”訓(xùn)練AI模型

近日,谷歌更新隱私政策,表示將利用網(wǎng)絡(luò)公開數(shù)據(jù)訓(xùn)練旗下的AI模型。在隱私協(xié)議的“可公開獲取的資源”一欄,谷歌提到:“我們可能會收集公開的在線信息或來自其他公共來源的信息,幫助訓(xùn)練Google的人工智能模型。”該大模型將會為谷歌翻譯、谷歌旗下聊天機器人產(chǎn)品“Bard”及Cloud AI等產(chǎn)品和功能提供助力。

對比去年年底發(fā)布的上一版隱私政策,谷歌將“收集信息以幫助訓(xùn)練語言模型”的相關(guān)措辭更改為“訓(xùn)練人工智能模型”,并新增明確了自家AI產(chǎn)品對于數(shù)據(jù)的使用權(quán)利。這似乎意味著,谷歌在訓(xùn)練旗下聊天機器人及其他AI模型,或未來開發(fā)AI產(chǎn)品的過程中,有權(quán)使用人們在網(wǎng)上公開發(fā)布的任意內(nèi)容。

南方財經(jīng)全媒體記者在檢索后發(fā)現(xiàn),7月5日,谷歌中文版隱私政策也已經(jīng)進行同步更新。

在競天公誠律師事務(wù)所合伙人袁立志看來,此次谷歌隱私政策的更新從實踐角度看不算重大變化。“無論在我國還是域外,對公開數(shù)據(jù)的正常收集和使用,在一般情況下不算違法。”不過他補充道,如果個人通過發(fā)送郵件等方式向信息處理者就相關(guān)使用表露明確拒絕,對其個人信息的收集和使用就應(yīng)當(dāng)停止。

北京大成律師事務(wù)所高級合伙人鄧志松也表示,就目前可獲得的信息而言,谷歌對收集與處理用戶個人信息的范圍和目的作出了詳細(xì)說明,即使以歐盟GDPR項下更為嚴(yán)格的“告知-同意”規(guī)則為標(biāo)準(zhǔn),谷歌的這一收集與處理行為至少在形式上具有合法性。至于其實施過程中可能涉及的實質(zhì)合法性判斷,及由此可能對AI等行業(yè)產(chǎn)生的影響,則尚待進一步觀察。

雖然此次更新并未對個人信息保護帶來影響,但暗藏背后的數(shù)據(jù)隱憂卻逐漸被公眾注意到。

“得數(shù)據(jù)者得天下”

數(shù)據(jù)是數(shù)字經(jīng)濟時代的“新石油”,處在時代中的人工智能技術(shù)亦受其影響。

以O(shè)penAI的幾代GPT模型為例,訓(xùn)練數(shù)據(jù)上,GPT-1預(yù)訓(xùn)練數(shù)據(jù)量僅有5GB;到了GPT-2,這個數(shù)據(jù)則增加至40GB;而在GPT3模型下,OpenAI用以訓(xùn)練模型的數(shù)據(jù)集數(shù)據(jù)量達(dá)到了驚人的45TB。

“大模型時代,得數(shù)據(jù)者得天下。”對外經(jīng)濟貿(mào)易大學(xué)數(shù)字經(jīng)濟與法律創(chuàng)新研究中心執(zhí)行主任張欣指出,一方面,訓(xùn)練數(shù)據(jù)是大模型訓(xùn)練的基石和燃料,如果沒有數(shù)據(jù),大模型的訓(xùn)練就無法開展和持續(xù);另一方面,當(dāng)前技術(shù)領(lǐng)域的研究顯示,各家大模型在算法層區(qū)別并不大,并且具有同質(zhì)化的趨勢。在此背景下,訓(xùn)練數(shù)據(jù)就成了真正區(qū)分且影響大模型性能的重要因素之一。

需求漸長,供給端卻并未馬上配合。目前,有多家處在“數(shù)據(jù)提供端”的公司對數(shù)據(jù)抓取、開源等做出了反應(yīng)。比如Twitter限制了用戶每天能查看的推文數(shù)量,幾乎使數(shù)據(jù)提供服務(wù)無法使用。馬斯克表示,這是對“數(shù)據(jù)抓取”和“系統(tǒng)操縱”的必要反應(yīng)。

今年1月,圖庫網(wǎng)站Getty Images對AI圖像生成器研發(fā)公司Stability AI提起法律訴訟,指其非法復(fù)制和處理版權(quán)圖像作為模型訓(xùn)練數(shù)據(jù)。4月,環(huán)球音樂集團發(fā)函要求Spotify等音樂流媒體平臺切斷AI公司的訪問權(quán)限,以阻止其版權(quán)歌曲被用于訓(xùn)練模型和生成音樂。

同樣在4月,Reddit官方宣布將對調(diào)用其API的公司收費,原因正是OpenAI、谷歌等公司利用該平臺上的數(shù)據(jù)訓(xùn)練模型。此外,IT技術(shù)問答網(wǎng)站Stack Overflow也計劃向AI大模型的開發(fā)者及公司收取數(shù)據(jù)訪問費用。

6月,中文在線、同方知網(wǎng)與中國工人出版社等國內(nèi)25家文化出版機構(gòu)發(fā)出共同倡議,強調(diào)“為人工智能學(xué)習(xí)模型提供可靠、穩(wěn)定、安全的內(nèi)容來源”等AIGC版權(quán)保護問題的重要性。

科技公司的系列動作,一定程度反映了數(shù)據(jù)的重要性。

在7月2日全球數(shù)字經(jīng)濟大會人工智能高峰論壇上,昆侖萬維科技股份有限公司CEO方漢表示,高質(zhì)量數(shù)據(jù)對大模型發(fā)展至關(guān)重要。

“坦白地講,最近三年的大模型訓(xùn)練積累的是對豐富的預(yù)訓(xùn)練數(shù)據(jù)深度加工的能力。OpenAI所有公開的論文和講演,對訓(xùn)練過程和訓(xùn)練算法都是公開的,但其從不公開模型結(jié)構(gòu)及數(shù)據(jù)處理。”方漢指出,目前全世界大模型預(yù)訓(xùn)練團隊都試圖重現(xiàn)OpenAI在模型架構(gòu)的動作以及預(yù)訓(xùn)練數(shù)據(jù)的動作,任何一家企業(yè)的預(yù)訓(xùn)練數(shù)據(jù)加工能力都至關(guān)重要。

數(shù)據(jù)稀缺、分散難題何解?

數(shù)據(jù)的重要性不言而喻,高質(zhì)量數(shù)據(jù)更是稀缺品。

早在去年,一項來自Epoch Al Research團隊的研究就揭示了一個殘酷的事實:模型還要繼續(xù)做大,但數(shù)據(jù)卻不夠用了。研究結(jié)果表明,高質(zhì)量的語言數(shù)據(jù)存量將在2026年耗盡,低質(zhì)量的語言數(shù)據(jù)和圖像數(shù)據(jù)的存量則分別在2030年至2050年、2030年至2060年枯竭。

這意味著如果數(shù)據(jù)效率沒有顯著提高或沒有新的數(shù)據(jù)源可用,那么到2040年,模型的規(guī)模增長將放緩。

百舸爭流是市場競爭的常態(tài),但過分競爭也有可能為行業(yè)帶來災(zāi)難。限制數(shù)據(jù)抓取,很可能導(dǎo)致新一輪的數(shù)據(jù)大戰(zhàn),進而引發(fā)平臺之間屏蔽、數(shù)據(jù)壟斷等問題。

國際標(biāo)準(zhǔn)化組織TC/154技術(shù)專家王翔指出,大模型的蓬勃發(fā)展對訓(xùn)練數(shù)據(jù)提出了很高的數(shù)量和質(zhì)量要求。在供給側(cè),人口增速、用網(wǎng)時間下降、制度性地理約束提高、高質(zhì)量數(shù)據(jù)匱乏等都在制約大模型未來發(fā)展,SOP化和轉(zhuǎn)發(fā)習(xí)慣也降低了供給能力;在需求側(cè),無論是主觀治理思路還是客觀基礎(chǔ)設(shè)施條件,以及大型語言模型所有者應(yīng)對市場的考量,都會持續(xù)強化數(shù)據(jù)壟斷。

此外,大模型訓(xùn)練中,面對的高質(zhì)量數(shù)據(jù)的稀缺、行業(yè)數(shù)據(jù)分散等問題應(yīng)如何解決?

受訪專家指出,未來健康的生態(tài)需要市場側(cè)和監(jiān)管側(cè)等多方的共同建設(shè)維護。

“首先還是需要相信市場的力量”,袁立志指出,隨著優(yōu)質(zhì)數(shù)據(jù)的需求逐漸顯現(xiàn),各個市場主體都會被“無形的手”推動向前。“數(shù)據(jù)資源的尋找、匯聚、清洗、標(biāo)注等各個環(huán)節(jié)預(yù)計都會因競爭的活躍而不斷改善,以滿足市場需求。”他表示。

張欣則具體指出,目前行業(yè)內(nèi)的開源數(shù)據(jù)集正在不斷增多,未來應(yīng)呼吁更多人工智能企業(yè)、從業(yè)者加入,建立更加良好的行業(yè)生態(tài)。“人工智能訓(xùn)練時的眾包思路也非常重要。”她認(rèn)為,企業(yè)之外,還可以善用技術(shù)社群的力量提升并開拓更多的高質(zhì)量數(shù)據(jù)集。

而監(jiān)管側(cè),在張欣看來,從法律法規(guī)層面明確訓(xùn)練數(shù)據(jù)集的合法性獲取路徑是監(jiān)管下一步應(yīng)當(dāng)關(guān)注的重點。“只有明確了合法獲取的路徑,大模型訓(xùn)練者才有更穩(wěn)定的合規(guī)預(yù)期以開展工作。”

袁立志認(rèn)為,監(jiān)管側(cè)數(shù)據(jù)要素市場的建設(shè)深入會為大模型領(lǐng)域的發(fā)展帶來良性影響。“數(shù)據(jù)要素市場建設(shè)走深意味著數(shù)據(jù)流通利用全流程提速提效,自然也惠及大模型的訓(xùn)練數(shù)據(jù)收集。”

關(guān)鍵詞:

相關(guān)閱讀
分享到:
版權(quán)和免責(zé)申明

凡注有"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"或電頭為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的稿件,均為環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶獨家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶",并保留"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的電頭。

福利片在线一区二区,久久国产免费,欧美aa一级,日韩三级精品
日韩在线精品| 国产在线日韩精品| 亚洲一区二区三区高清| 久久久9色精品国产一区二区三区| 色在线视频观看| 日韩在线免费| 免费在线观看精品| 91精品国产一区二区在线观看 | 麻豆一区二区三区| 成人在线超碰| 亚洲国产福利| 免费不卡在线视频| 中文字幕一区二区三区日韩精品 | 老司机久久99久久精品播放免费| 日韩精品中文字幕一区二区| 国产高清日韩| 国产在线一区不卡| a日韩av网址| 午夜在线视频观看日韩17c| 亚洲精品日韩久久| 伊人久久高清| 午夜久久久久| 国际精品欧美精品| 久久久久国产| 日韩一区二区三区高清在线观看 | 久久大逼视频| 精品免费av一区二区三区| 激情欧美亚洲| 国产欧美69| 亚洲免费一区二区| 欧美亚洲三区| 男女性色大片免费观看一区二区 | 日本中文字幕一区二区视频| 麻豆精品视频在线观看免费| 欧美精品一区二区三区精品| 精品女同一区二区三区在线观看| 婷婷成人在线| 国产亚洲第一伦理第一区| 99久久视频| 国产激情久久| 亚洲色图网站| 黄色aa久久| 日本精品国产| 精品一区在线| 精品国产精品久久一区免费式| 美女久久一区| 日韩欧美午夜| 国产亚洲人成a在线v网站| 欧美精品一区二区三区精品| 国内自拍视频一区二区三区| 在线免费观看亚洲| а√在线中文在线新版| 日韩精品成人| 鲁大师影院一区二区三区| 日韩福利一区| 国产劲爆久久| 日韩影院精彩在线| 久久三级视频| 99久久www免费| 日韩欧美少妇| 日韩欧美三区| 99pao成人国产永久免费视频| 久久69成人| 日本成人在线不卡视频| 欧美精品一线| 日韩在线短视频| 久久福利在线| 日韩欧美中文字幕在线视频| 国精品产品一区| 日本亚州欧洲精品不卡| av亚洲免费| 欧美激情视频一区二区三区免费| 综合精品一区| 免费在线观看日韩欧美| 国产一区日韩欧美| 成人小电影网站| 精品久久一区| 国产精品视频一区二区三区四蜜臂| 99视频一区| 亚洲夜间福利| 私拍精品福利视频在线一区| 国产一区2区| 国内精品伊人| 国产成人免费av一区二区午夜| 欧美亚洲免费| 国产亚洲电影| 欧美日韩调教| 日韩不卡一二三区| 日韩中文av| 青草久久视频| 国产亚洲久久| 国产精品2023| 麻豆精品少妇| 麻豆国产精品| 麻豆国产精品| zzzwww在线看片免费| 中文字幕在线看片| 亚洲人成在线网站| 久久久噜噜噜| 亚洲精品中文字幕乱码| 欧美特黄a级高清免费大片a级| 欧美高清不卡| 亚洲色诱最新| 一本一道久久a久久| 日本不卡高清| 国产精品亚洲综合久久| 国产精品毛片aⅴ一区二区三区| 久久av导航| 国产黄大片在线观看| 久久久久国产一区二区| 亚洲男女av一区二区| 亚洲三级网站| 欧美日韩中文| 国产伦精品一区二区三区视频| 国产欧美88| 国产色播av在线| 国产精品99一区二区| 蜜臀久久99精品久久久画质超高清 | 久久久久久久久久久妇女| 久久精品不卡| 男女男精品网站| 国产激情综合| 久久高清免费| 亚洲a级精品| 久久精品女人| 久久精品影视| 亚洲人成网站在线在线观看| 日韩在线网址| 给我免费播放日韩视频| 亚洲精品91| 国产精品a久久久久| 亚洲欧美一区在线| 久久国产视频网| 欧美成a人免费观看久久| 蜜桃视频一区二区三区在线观看| 91九色综合| 91精品啪在线观看国产18| 老鸭窝毛片一区二区三区| 国产伦精品一区二区三区在线播放| av中文资源在线资源免费观看| 亚洲少妇诱惑| 麻豆精品国产91久久久久久| 999久久久亚洲| 日本成人中文字幕在线视频| 日韩国产欧美一区二区| 亚洲三区欧美一区国产二区| 国产伦久视频在线观看| 四虎在线精品| 中文字幕在线官网| 日本精品国产| 欧美日韩国产欧| 精品免费av| 婷婷精品久久久久久久久久不卡| 国产白浆在线免费观看| 免费观看在线综合色| av在线最新| 国产图片一区| 亚洲在线国产日韩欧美| 成人国产精品一区二区网站| 亚洲理论在线| 欧美日韩一区二区综合| 国产精品激情| 影音先锋久久精品| 日韩欧美少妇| 麻豆国产精品视频| 亚洲精品美女91| 99热精品久久| av在线最新| 国产精品久久久久久久久久久久久久久| 亚洲激情五月| 成人国产精品一区二区网站| 亚洲精品影院在线观看| 久久在线视频免费观看| **爰片久久毛片| 视频一区视频二区在线观看| 毛片在线网站| 麻豆精品蜜桃视频网站| 日韩二区在线观看| 国产精品普通话对白| 成人久久久久| 福利片在线一区二区| 国产伦精品一区二区三区千人斩| 石原莉奈一区二区三区在线观看 | 欧美二区视频| 日韩免费视频| 福利一区视频| 久久久91麻豆精品国产一区| 91综合久久爱com| 香蕉久久一区| 首页国产欧美日韩丝袜| 欧美亚洲国产一区| 免费福利视频一区二区三区| 精品理论电影在线| 国产精久久久| 麻豆久久一区| 麻豆国产精品| 欧美aⅴ一区二区三区视频| 国产探花一区| 日韩激情啪啪| 欧美一级全黄|