2025年伊始,以DeepSeek為代表的開源大模型正如火如荼的私有化部署和構(gòu)建,各行各業(yè)都展示出了對(duì)大模型技術(shù)的熱忱與信心,本文整理了滿足會(huì)議舉辦相關(guān)需求的DeepSeek技術(shù)及應(yīng)用信息,希望能為各主辦方提供參考,同時(shí)由于AI與行業(yè)產(chǎn)業(yè)的結(jié)合有很多共同性,相信其它行業(yè)領(lǐng)域的需求也可以借鑒。為了方便閱讀,本文盡量精簡優(yōu)化及分成不同部分,這是其中第一部分。
第一部分,DeepSeek能做什么?
相信這幾年接觸過AI大模型的人士對(duì)ChatGPT,文心一言,通義千問,騰訊混元等語言模型都有所了解,也有過體驗(yàn),簡單說DeepSeek實(shí)現(xiàn)的基本上其它大模型都可以實(shí)現(xiàn),比如咨詢問題,輔助推理,代碼生成,翻譯,總得來說是基于NLP技術(shù)的語言解碼與編碼,從這點(diǎn)上說DeepSeek并不是有功能上大的改變,也就是說它能滿足的需求上邊提到的各大模型都可以滿足。
在會(huì)議領(lǐng)域,DeepSeek的幾個(gè)典型應(yīng)用示例
信息檢索:在會(huì)議中,DeepSeek 可以幫助與會(huì)者快速找到相關(guān)的文檔、研究論文或其他資料,提升信息獲取的效率。
內(nèi)容分析:通過分析會(huì)議記錄或討論內(nèi)容,DeepSeek 可以提取關(guān)鍵主題、趨勢和見解,幫助與會(huì)者更好地理解會(huì)議的核心內(nèi)容。
智能推薦:根據(jù)與會(huì)者的興趣和需求,DeepSeek 可以推薦相關(guān)的演講者、主題或后續(xù)的討論內(nèi)容,增強(qiáng)會(huì)議的互動(dòng)性。
實(shí)時(shí)翻譯和轉(zhuǎn)錄:在多語言會(huì)議中,DeepSeek 可以提供實(shí)時(shí)翻譯和轉(zhuǎn)錄服務(wù),幫助不同語言的與會(huì)者更好地溝通。
數(shù)據(jù)可視化:通過將會(huì)議數(shù)據(jù)可視化,DeepSeek 可以幫助與會(huì)者更直觀地理解復(fù)雜的信息和數(shù)據(jù)。
后續(xù)跟進(jìn):會(huì)議結(jié)束后,DeepSeek 可以幫助與會(huì)者整理會(huì)議紀(jì)要、行動(dòng)項(xiàng)和后續(xù)任務(wù),確保會(huì)議成果的落實(shí)。
第二部分,DeepSeek為什么特別?
說到功能方面,DeepSeek并沒有特別之處,但是在發(fā)布形式及授權(quán)方面就大不同了,原因有二:其一,它是開源的,可以免費(fèi)商用的,這在它的發(fā)布方式(Github.com平臺(tái)發(fā)布)及相關(guān)聲明中都有體現(xiàn)。其二,它的硬件需求相對(duì)較低。我們知道多數(shù)語言大模型建設(shè)需要巨大的開發(fā)和試錯(cuò)成本,雖然NLP技術(shù)發(fā)展時(shí)間已經(jīng)很漫長了,但是通信、計(jì)算技術(shù)和可用數(shù)據(jù)量級(jí)還從來沒有達(dá)到過現(xiàn)在的程度,所以以自然語言處理為核心的技術(shù)產(chǎn)品一直無法突破,就算是技術(shù)及數(shù)據(jù)量級(jí)達(dá)到足夠的級(jí)別,運(yùn)用和整合這些資源需要的相關(guān)成本還是很高的,雖然說截止2024年人類所有已經(jīng)產(chǎn)生的數(shù)據(jù)都已經(jīng)被收集并用于訓(xùn)練語言大模型并且開發(fā)人員已經(jīng)發(fā)現(xiàn)并不需要把所有的數(shù)據(jù)用于訓(xùn)練即可完成準(zhǔn)確性達(dá)到一定級(jí)別的大模型產(chǎn)品,但是這個(gè)探路過程是不可省略的,因此相關(guān)的成本是很大的。在以O(shè)penAI為代表的第一代大模型基礎(chǔ)上,理論上說通過不斷優(yōu)化一定會(huì)產(chǎn)生性價(jià)比更高的產(chǎn)品,而DeepSeek就是其中的代表。
補(bǔ)充一個(gè)大模型向小模型轉(zhuǎn)化的原理:
比如,一個(gè)國家有10億人,有50個(gè)城市,每個(gè)城市的人口結(jié)構(gòu)都類似,人們都需要研究數(shù)學(xué),語文等學(xué)科,也離不開吃穿住行各種活動(dòng),那么可以得出,雖然各個(gè)城市有大小,但是居住其中的人們的需求是相似的,這是前提。
以O(shè)penAI為代表的第一代語言大模型是將這個(gè)國家10億人的數(shù)據(jù)和需求作為目標(biāo)進(jìn)行分析解讀,所以它需要計(jì)算的數(shù)據(jù)量級(jí)就很大,因?yàn)榇竽P偷呐R界點(diǎn)以前沒有人達(dá)到過,所以需要盡可能的增大數(shù)據(jù)樣本,直到能實(shí)現(xiàn)類智能的突破。所以這個(gè)數(shù)據(jù)及難度量級(jí)一定是大于等于實(shí)際需求的量級(jí)的。
當(dāng)?shù)谝淮竽P蛯?shí)現(xiàn)之后,向下優(yōu)化就是更加合理的方式,因此如果不是以國家為目標(biāo)而是以城市為目標(biāo),那么按此假設(shè),只需要針對(duì)10億/50 = 0.2億的數(shù)據(jù)樣本及需求進(jìn)行分析即可滿足這一需求,當(dāng)然現(xiàn)實(shí)中網(wǎng)絡(luò)數(shù)據(jù)并不是按城市來區(qū)分的,需要進(jìn)行數(shù)據(jù)切分。 這樣成本就會(huì)下降許多,DeepSeek雖然不是完全按照這個(gè)邏輯開發(fā)的但是離不開二次優(yōu)化的路徑。
同理,不同垂直領(lǐng)域如代碼生成,大模型并不需要了解全世界所有人的需求,只需要針對(duì)軟件開發(fā)人員這一群體使用和產(chǎn)生的數(shù)據(jù)進(jìn)行處理即可,所以我們知道大模型最早做成熟的就是代碼生成這一功能,因?yàn)槿澜缬幸粋€(gè)超大的開源代碼平臺(tái)github.com,DeepSeek也在代碼生成原理這部分提到了如何從Github提取代碼再做整理優(yōu)化,提取最有價(jià)值的部分提供給開發(fā)人員。
所以說,DeepSeek之所以特別,是它找到了更小樣本進(jìn)行訓(xùn)練的方法,部署的數(shù)據(jù)集及運(yùn)算量都在很大的下降,同時(shí)它又通過開源授權(quán)讓所有人使用,所以這是一個(gè)突破,將人類應(yīng)用大語言模型的門檻大大降低了。
第三部分,什么人需要DeepSeek?
簡單說,就是需要針對(duì)垂直業(yè)務(wù)進(jìn)行二次開發(fā)的企業(yè)或個(gè)人。我們知道如果只是對(duì)話和代碼生成,使用通用語言大模型已經(jīng)足夠滿足需求,象百度的文心一言已經(jīng)決定2025年4月正式免費(fèi),可以說通用需求并不需要DeepSeek來提供支持,因?yàn)榻刂鼓壳癉eepSeek官網(wǎng)的網(wǎng)頁及API服務(wù)都已經(jīng)持續(xù)不堪重負(fù),而且看不到有緩解的跡象,從它開源的決策來看,DeepSeek可能并不想象第一代大模型一樣自己運(yùn)營,它的商業(yè)模式或許是提供技術(shù)支持,或許未來會(huì)有其它形式,因?yàn)殚_源產(chǎn)品一般不會(huì)直接從產(chǎn)品本身獲益。另外很多平臺(tái)都在接入DeepSeek為用戶提供服務(wù),所以DeepSeek開發(fā)商可能會(huì)離用戶比較遠(yuǎn)。
另一方面,對(duì)于行業(yè)用戶來說,業(yè)務(wù)與通用需求不同,數(shù)據(jù)又有自身的敏感性及保密要求,部署私有化的大語言模型會(huì)更可控,服務(wù)也方便定制化。從目前來看各行各業(yè),從生產(chǎn)到管理都有DeepSeek這樣的開源大模型的用武之地。
第四部分,如何部署DeepSeek?
DeepSeek的部署主要分為兩種形式,一種是私有服務(wù)器,另一種是使用云資源。
前者需要自行購置910b之類的大模型服務(wù)器,8卡成本大約在170萬左右,也可以選擇英偉達(dá)的h100等GPU,硬件方面需要一定的成本。當(dāng)然基于無GPU的硬件架構(gòu)也可以運(yùn)行輕量級(jí)的DeepSeek版本,主要還是看對(duì)結(jié)果和效率的需求。對(duì)于國企或涉密單位,自行購置及維護(hù)服務(wù)器似乎是必然選項(xiàng),不過也有國產(chǎn)天翼云之類的云服務(wù)商提供性價(jià)比更高的方案。
對(duì)商業(yè)用戶,選擇GPU云解決方案會(huì)更適合,尤其是對(duì)中小企業(yè)開發(fā)商而言,基于業(yè)務(wù)靈活性的需求采用可擴(kuò)展性的云GPU方案,初始階段可采購基本資源,業(yè)務(wù)成熟后再擴(kuò)容或者升級(jí)方案即可。
不同的硬件方案確定以后部署相對(duì)就比較簡單,這里就不再詳細(xì)列出。
下一部分將提供更細(xì)節(jié)的介紹,敬請(qǐng)關(guān)注。