
最新動(dòng)態(tài)
NEWS
數(shù)據(jù)來(lái)源:筆神作文微博發(fā)布
以聚合數(shù)據(jù)(一家基于API技術(shù)的綜合性數(shù)據(jù)處理服務(wù)商)為例,平臺(tái)能夠提供作文分類(lèi)列表、作文基本信息列表和作文內(nèi)容三種數(shù)據(jù)接口來(lái)幫助個(gè)人和企業(yè)獲得作文相關(guān)數(shù)據(jù)。該項(xiàng)服務(wù)的收費(fèi)標(biāo)準(zhǔn)為99元2萬(wàn)次。根據(jù)此收費(fèi)標(biāo)準(zhǔn)計(jì)算,258萬(wàn)次數(shù)據(jù)抓取成本超過(guò)1億。常見(jiàn)的API付費(fèi)調(diào)用標(biāo)準(zhǔn)有按調(diào)用次數(shù)計(jì)費(fèi)、按數(shù)據(jù)傳輸量計(jì)費(fèi)、按功能模塊計(jì)費(fèi)和按時(shí)間計(jì)費(fèi)??紤]到按時(shí)間計(jì)費(fèi)沒(méi)有公開(kāi)價(jià)格數(shù)據(jù),因此按照按調(diào)用次數(shù)計(jì)費(fèi)進(jìn)行估算,估算價(jià)格與實(shí)際價(jià)格相比應(yīng)偏高。
然而,無(wú)論采用何種計(jì)費(fèi)標(biāo)準(zhǔn),訓(xùn)練AI大模型的訓(xùn)練成本都不低。早有研究指出數(shù)據(jù)量會(huì)影響機(jī)器學(xué)習(xí)模型的準(zhǔn)確度。近期,許多專(zhuān)家也指出目前大型語(yǔ)言模型的訓(xùn)練中出現(xiàn)了“涌現(xiàn)現(xiàn)象”。“涌現(xiàn)現(xiàn)象”是指當(dāng)數(shù)量足夠多時(shí),在宏觀層面上會(huì)展現(xiàn)出微觀個(gè)體無(wú)法解釋的特殊現(xiàn)象。在AI大模型中的主要體現(xiàn)為當(dāng)模型規(guī)模達(dá)到一定程度時(shí),效果才會(huì)急劇增長(zhǎng),在模型規(guī)模小于某個(gè)臨界值之前,模型基本不具備任務(wù)解決能力。
名稱(chēng):八個(gè)模型參數(shù)數(shù)量與模型準(zhǔn)確性關(guān)系圖
數(shù)據(jù)來(lái)源:Wei, Jason, et al. "Emergent abilities of large language models." arXiv preprint arXiv:2206.07682 (2022).
隨著數(shù)據(jù)量的指數(shù)上升,所需的算力、電力等投入成本也會(huì)隨之上升。國(guó)盛證券計(jì)算機(jī)分析師劉高暢、楊然在發(fā)表于2023年2月12日的報(bào)告《ChatGPT需要多少算力》中估算,GPT-3訓(xùn)練一次的成本約為140萬(wàn)美元,對(duì)于一些更大的LLM模型,訓(xùn)練成本介于200萬(wàn)美元至1200萬(wàn)美元之間。這一成本對(duì)于全球科技大企業(yè)而言并不便宜,但尚在可接受范圍內(nèi)。2023年4月8日,華為高管公布的數(shù)據(jù)也顯示,AI大模型開(kāi)發(fā)和訓(xùn)練一次的成本高達(dá)1200萬(wàn)美元。
根據(jù)ARK Invest Big Ideas2023報(bào)告,類(lèi)似GPT-3級(jí)別性能的大型語(yǔ)言模型的訓(xùn)練成本從2020年的460萬(wàn)美元暴跌至2022年的45萬(wàn)美元,每年下降70%。其中,GPU和TPU的出現(xiàn),以及分布式系統(tǒng)和基于云的AI訓(xùn)練的實(shí)現(xiàn)對(duì)降低成本起到了關(guān)鍵性的作用。英偉達(dá)首席執(zhí)行官黃仁勛在2023年臺(tái)北電腦展上介紹,訓(xùn)練一個(gè)LLM大語(yǔ)言模型,將需要960個(gè)CPU組成的服務(wù)器集群,這將耗費(fèi)大約1000萬(wàn)美元(約合人民幣7070萬(wàn)元),并消耗11千兆瓦時(shí)的電力。相比之下,GPU服務(wù)器能夠以4%的成本和1.2%的電力消耗來(lái)訓(xùn)練一個(gè)LLM大語(yǔ)言模型。
此外,相關(guān)法律也正在逐步完善。在保護(hù)數(shù)據(jù)服務(wù)者的權(quán)益的同時(shí),促進(jìn)生成式人工智能技術(shù)健康發(fā)展和規(guī)范應(yīng)用。
在維護(hù)數(shù)據(jù)服務(wù)者的權(quán)益方面,早在2018年,杭州互聯(lián)網(wǎng)法院就公布了全國(guó)首例數(shù)據(jù)產(chǎn)品糾紛案,也是首例涉數(shù)據(jù)資源開(kāi)發(fā)應(yīng)用正當(dāng)性及數(shù)據(jù)權(quán)屬判定的新類(lèi)型不正當(dāng)競(jìng)爭(zhēng)案件。該案判決明確了網(wǎng)絡(luò)運(yùn)營(yíng)者對(duì)于其開(kāi)發(fā)的大數(shù)據(jù)產(chǎn)品,享有競(jìng)爭(zhēng)性財(cái)產(chǎn)權(quán)益。未經(jīng)許可,直接將他人數(shù)據(jù)產(chǎn)品作為自己獲取商業(yè)利益工具的,構(gòu)成不正當(dāng)競(jìng)爭(zhēng)行為。在數(shù)據(jù)侵權(quán)案件中,有些法院會(huì)根據(jù)“三重授權(quán)原則”來(lái)判斷涉案數(shù)據(jù)收集者搜集數(shù)據(jù)行為是否合法,即涉案數(shù)據(jù)收集者收集數(shù)據(jù)時(shí)需取得個(gè)人信息用戶(hù)的同意以及網(wǎng)絡(luò)運(yùn)營(yíng)商的同意,網(wǎng)絡(luò)運(yùn)營(yíng)商需取得個(gè)人信息用戶(hù)的同意。涉案數(shù)據(jù)收集者只有符合該原則,才能證明其搜集的數(shù)據(jù)具有正當(dāng)性,不構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。
根據(jù)威科先行數(shù)據(jù)庫(kù)數(shù)據(jù)整理,自2018年以來(lái),關(guān)鍵詞為“互聯(lián)網(wǎng)+反不正當(dāng)競(jìng)爭(zhēng)”的判決一共有5814例,占所有反不正當(dāng)競(jìng)爭(zhēng)判決的25%。該類(lèi)案件在2020年達(dá)到峰值后逐年下降。同年,《數(shù)據(jù)安全法(草案)》在中國(guó)人大網(wǎng)公布。該法案于2021年通過(guò)并正式實(shí)施。兩者之間可能存在相關(guān)性。
2018-2022年關(guān)鍵詞“互聯(lián)網(wǎng)+反不正當(dāng)競(jìng)爭(zhēng)”的判決數(shù)量統(tǒng)計(jì)圖
數(shù)據(jù)來(lái)源:根據(jù)威科先行數(shù)據(jù)庫(kù)數(shù)據(jù)自行整理
關(guān)鍵詞“互聯(lián)網(wǎng)+反不正當(dāng)競(jìng)爭(zhēng)”相關(guān)判決主要分布在北上廣及周邊輻射城市。針對(duì)互聯(lián)網(wǎng)反不正當(dāng)競(jìng)爭(zhēng)案件出現(xiàn)較多的省市,設(shè)立了北京、廣州、杭州互聯(lián)網(wǎng)法院。
2018-2022關(guān)鍵詞“互聯(lián)網(wǎng)+反不正當(dāng)競(jìng)爭(zhēng)”相關(guān)判決的地區(qū)分布TOP10
數(shù)據(jù)來(lái)源:根據(jù)威科先行數(shù)據(jù)庫(kù)數(shù)據(jù)自行整理
今年4月,面對(duì)AIGC的火熱發(fā)展,國(guó)家互聯(lián)網(wǎng)信息辦公室起草了《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》,并向社會(huì)公開(kāi)征求意見(jiàn)。5月中旬,北上深等地相繼發(fā)布了支持人工智能產(chǎn)業(yè)的政策文件。最新地方政策中均重點(diǎn)提到了算力端發(fā)展,加大算力基礎(chǔ)設(shè)施的投資力度,同時(shí)強(qiáng)調(diào)了人工智能的高質(zhì)量發(fā)展,拓展AI創(chuàng)新應(yīng)用場(chǎng)景的深度與廣度。
人們應(yīng)當(dāng)盡快從過(guò)去科幻電影傳導(dǎo)的“AI毀滅人類(lèi)”的思想恐懼中走出來(lái)。發(fā)展AI的意義不僅在于實(shí)現(xiàn)人類(lèi)可以完成的工作,提高工作效率,更應(yīng)該在于其帶來(lái)的跨界能力。在滿(mǎn)足社會(huì)需求和社會(huì)穩(wěn)定性的基礎(chǔ)上,如何利用AI多種數(shù)據(jù)分析優(yōu)勢(shì)和泛化能力實(shí)現(xiàn)產(chǎn)業(yè)的升級(jí)創(chuàng)新,是值得探討的問(wèn)題。