古风君子以泽,有声小说,怎么写网络小说

當(dāng)前位置：首頁 » 專題報道 » 第八屆數(shù)字中國建設(shè)峰會 » 嘉賓觀點

新質(zhì)生產(chǎn)力下的大模型產(chǎn)業(yè)化

2025年06月06日 14:10 來源：數(shù)字中國【打印】

商湯科技董事長兼CEO——徐立

　　非常高興能夠在這里分享商湯對科技在如此大模型數(shù)據(jù)化和資產(chǎn)化的情境下，如何有效利用我們的數(shù)據(jù)要素。

　　首先，在整個行業(yè)中，現(xiàn)在大模型的生成和制造遵循一個被認(rèn)為是經(jīng)驗性公理的尺度定律。這個尺度定律表明，隨著模型參數(shù)量、數(shù)據(jù)規(guī)模、訓(xùn)練時間的增加，模型的性能得到顯著提升。因此，性能的整體提升速度很快。這也解釋了為什么計算資源已經(jīng)成為這個時代的核心資源之一。

　　我們也看到，西方大量地投入計算資源作為核心基礎(chǔ)設(shè)施。但更重要的是如何更有效地利用好數(shù)據(jù)。很多人認(rèn)為數(shù)據(jù)的好壞無法區(qū)分，實際上，并非如此盡管數(shù)據(jù)質(zhì)量都有所下降，但下降的速度和程度，例如指數(shù)β，其實是不同的。

　　所以，我們的尺度定律在某種程度上可以為不同的數(shù)據(jù)資產(chǎn)打分，能夠跨越5—7個數(shù)量級的尺度，保持對性能的預(yù)測，并在較小的尺度上驗證性能優(yōu)劣。因此，我們進(jìn)行了很多關(guān)于數(shù)據(jù)的實驗。在一些真實的場景和問題下，我們發(fā)現(xiàn)當(dāng)一個模型在同樣的數(shù)據(jù)集上，小在較的尺度上領(lǐng)先時，在大較的尺度上也會領(lǐng)先。這不僅涉及推理計算、語言知識等問題，而是基于數(shù)據(jù)本身的質(zhì)量，而不是僅憑經(jīng)驗的分?jǐn)?shù)。

　　我們對三個不同數(shù)據(jù)集在兩個問題下進(jìn)行了數(shù)據(jù)質(zhì)量的打分，可以看到，斜率越大，說明性能提升越快。有了這個指數(shù)，才能真正對數(shù)據(jù)質(zhì)量進(jìn)行區(qū)分。也就是說，我們不需要極大的算力，可以用一些小模型配合更高質(zhì)量的數(shù)據(jù)，打造同樣的性能。例如Llama 80億參數(shù)的模型性能要比Llama2 700億參數(shù)的模型還要好，關(guān)鍵就在于數(shù)據(jù)質(zhì)量的差異。

　　我們在4月份發(fā)布的SenseChat日日新V5模型，是國內(nèi)首個性能超過GPT4- Turbo的，模型其成功的原因在于我們對行業(yè)數(shù)據(jù)進(jìn)行了細(xì)分，并且在這些數(shù)據(jù)上下功夫了很大的。

　　我們理解，在中國開發(fā)大模型的過程中，有一個很重要的行業(yè)優(yōu)勢在于如何利用好感知能力，對理解能力賦能。比如說比如在通用生成方面，我們發(fā)現(xiàn)，在很多垂直領(lǐng)域中，數(shù)據(jù)的構(gòu)造與我們對這些垂直領(lǐng)域能力的理解是相關(guān)的。

　　舉幾個例子，比如說模態(tài)的理解。舉例來說，這是一張手表的圖片，如果無法識別出來它的時間，就無法生成對應(yīng)的描述。我們還可以識別出這是什么品牌的表手，這是一張英文考卷，可以識別出上面英文題目的意思，并用中文進(jìn)行各種互動。當(dāng)然，很多情況下需要理解圖片背后的意思，比如，左邊是一只可愛的恐龍，右邊是一只真實的恐龍，上面寫著“我媽第一次叫我吃飯”“我媽第二次叫我吃飯”。讓AI來理解這張圖，就會知道一般媽媽第一次叫你吃飯脾氣比較好，第二次叫你吃飯時會表現(xiàn)出不耐煩，我想這種概念大家都能理解。

　　但是如果我們沒有在垂直方向上的理解，就很難真正意義上泛化這些問題。因此，中國在數(shù)據(jù)利用方面的核心優(yōu)勢在于結(jié)合非常大的產(chǎn)業(yè)化數(shù)據(jù)理解。

　　再來看生成，文本講多了，用圖片舉例子。方面以為如果我們要生成一張具有國家地理風(fēng)格的圖片，不理解這種風(fēng)格就很難生成出高質(zhì)量的結(jié)果。左邊是我們生成的圖片，右邊是行業(yè)中最好的，包括OpenAI的成果。在橫向?qū)Ρ戎?，我們認(rèn)為我們的模型目前在這一領(lǐng)域具有一定的領(lǐng)先性。

　　這是一個亞洲女孩的美術(shù)攝影，頭發(fā)略微凌亂，對細(xì)節(jié)的把握非常重要。在特定行業(yè)中，例如文字識別，如果你不認(rèn)識這個文字，就很難生成正確的內(nèi)容。我們的品牌掛到一棟樓上，只有，我們生成的圖片是正確的。再比如，如果我們能夠識別福建話，我們當(dāng)然可以生成福建話，但如果不行的話，生成過程就會變得非常困難。因此，行業(yè)場景的疊加是數(shù)據(jù)資產(chǎn)在大模型使用中最核心的產(chǎn)業(yè)化要素。

　　構(gòu)造行業(yè)場景差異化數(shù)據(jù)時，可以將大模型的數(shù)據(jù)分三層，與其能力有關(guān)，第一層叫世界知識，這是一個單純的記憶層，知識背后核心還是推理。真正意義上形成高質(zhì)量數(shù)據(jù)的核心在于從一個知識點到另一個知識點背后的思維鏈。

　　舉例來說，平行公理是一個數(shù)學(xué)公理，三角形內(nèi)角和是180度，這當(dāng)中的證明就是推理，一個模型的思考能力來自其背后強(qiáng)大的推理能力。因此，對于一些行業(yè)來說，如何構(gòu)造更好地推理數(shù)據(jù)是非常重要的。跟世界的交互執(zhí)行能力，有了交互數(shù)據(jù)才能更加豐富模型的核心能力。所以，我認(rèn)為可以通過行業(yè)構(gòu)造一個三層數(shù)據(jù)能力模型。

　　垂直領(lǐng)域的數(shù)據(jù)差異化就是在這三層當(dāng)中。比如，醫(yī)療方面就會明顯超GPT4越－，在一定垂直領(lǐng)域，你的數(shù)據(jù)比它更專業(yè)，構(gòu)造的思維鏈數(shù)據(jù)就會更加高端。所以，我認(rèn)為數(shù)據(jù)要素在整個環(huán)境當(dāng)中，模型的生成本身就是一種數(shù)據(jù)要素的消耗。而模型服務(wù)則是數(shù)據(jù)要素再次資產(chǎn)化的過程，因此，這構(gòu)成了一個完整的以數(shù)據(jù)為核心的生產(chǎn)資料，為生產(chǎn)力帶來突破的飛輪，我相信，這也是未來大模型時代具有巨大行業(yè)潛力的原因之一。

　　大家知道《時代周刊》通常用人是以物來做封面，少有用技術(shù)做封面。1997年，《時代周刊》用了克隆羊做封面。2015年，《時代周刊》用了虛擬現(xiàn)實做封面。2018年，用人工智能做封面。然而，這些技術(shù)的發(fā)展直到今天，仍未真正成為我們生活中不可或缺的基礎(chǔ)元素。這是為什么呢主要原因在于疊加的應(yīng)用并沒有那么充分，并不是改變我們生活當(dāng)中基礎(chǔ)要素的部分。

　　去年ChatGPT又被放到《時代周刊》上，我認(rèn)為ChatGPT火不是因為GPT，而是因為GPT本身的Thansformer架構(gòu)，這在2018年已經(jīng)成為行業(yè)共識，ChatGPT真正的疊加應(yīng)用才是它的革命性時刻。在中國，最不缺的就是垂直化數(shù)據(jù)，也希望借此跟大家一起推動這個時代應(yīng)用型的變化。

　　謝謝大家！

　?。ㄒ陨蟽?nèi)容根據(jù)嘉賓發(fā)言速記整理）

手伸进下面逗弄花珠_国产乱人激情h在线观看_一女多男黄色小说_亚洲日韩中文字幕在线播放

新質(zhì)生產(chǎn)力下的大模型產(chǎn)業(yè)化

采購頭條

政采動態(tài)

購買服務(wù)