人手一個ChatGPT的時代或許就要來了!
(資料圖)
當地時間4月12日,微軟宣布開源大語言模型訓練工具Deep Speed Chat,這意味著繼OpenAI開放GPT的API方便各大廠商直接接入后,更為底層的工具也開放給所有用戶使用。
開源底層訓練工具
人工智能行業(yè)又迎來重磅消息。
當地時間4月12日,微軟宣布開源了Deep Speed Chat,幫助用戶輕松訓練類ChatGPT等大語言模型。
據了解,這一工具是基于微軟Deep Speed深度學習優(yōu)化庫開發(fā)而成,具備訓練、強化推理等功能,還使用了RLHF(人工反饋機制的強化學習)技術,可將訓練速度提升15倍以上,成本卻大幅度降低。
簡單來說,這種接近“所見即所得”反饋的訓練工具,可以幫助沒有太多人工智能模型訓練基礎的用戶,在短時間內迅速訓練出定制化的ChatGPT大語言模型,堪稱“傻瓜式服務”。
據微軟披露,目前使用該工具訓練一個130億參數的類ChatGPT模型,只需1.25小時。而訓練一個1750億參數的模型,Deep Speed Chat也只需不到一天的時間,而這一參數規(guī)模相當于ChatGPT-3.5。
據介紹,Deep Speed Chat擁有強化推理、RLHF模塊、RLHF系統(tǒng)三大核心功能。
具體來看,首先是這一工具的強化推理能力對于用戶使用更為友好,只需一個腳本即可實現(xiàn)多個訓練步驟。
“傳統(tǒng)模型訓練需要諸多流程,包括調用預訓練模型,實施訓練標注等等?!币晃粯I(yè)內工程師告訴記者,從目前微軟介紹的情況來看,Deep Speed Chat可以大幅優(yōu)化這一過程的繁瑣度。此外,該工具還提供一個易于使用的推理API,用于在模型訓練后測試對話性能。
而RLHF模塊、RLHF系統(tǒng)則確保模型訓練過程中的精細度,同時實現(xiàn)模型訓練與推理能力的無縫切換。
從目前披露的情況來看,多位業(yè)內人士認為,相關的大模型訓練門檻的資金投入、專業(yè)性要求都將大幅下降。
有業(yè)內人士戲稱,如果說GPT引發(fā)了諸多行業(yè)的“工作危機”,那么如今Deep Speed Chat則可能將這場危機引入人工智能行業(yè)本身。
商業(yè)化領域迎重大變革
這無疑將引發(fā)整個人工智能領域商業(yè)化的變革。
“現(xiàn)在訓練大模型要依托超大的算力,背后是大量GPU集群,這些價格是一般小型企業(yè)乃至科研機構無法承擔的?!币晃粡氖氯斯ぶ悄苎芯康墓こ處煾嬖V記者,類GPT模型訓練此前存在的最大障礙是硬件設備。
事實上,在過去幾個月伴隨ChatGPT的走紅,類似Deep Speed Chat的訓練開發(fā)工具也紛紛面世。但總體而言,由于缺乏支持端到端的基于RLHF的規(guī)模化系統(tǒng),要想訓練ChatGPT模型整體效率依然不高。
有媒體此前調查發(fā)現(xiàn),現(xiàn)有的開源系統(tǒng)的訓練效率通常還不到,這些機器所能達到的最大效率的5%。
而微軟的Deep Speed Chat面世,或許意味著這一情況從商業(yè)的角度來看將大幅改善。
記者注意到,目前在Azure云上訓練一個OPT-13B模型(一種類似于GPT系列的大型語言模型)只需要9小時,而OPT-30B模型也只需18個小時,這兩種訓練分別花費不到300美元和600 美元。
即使是當前開源領域,參數最大的OPT-175B,訓練時長也僅需20個小時,其訓練價格也在5000美元左右。要知道此前千億參數領域的模型訓練,其成本均在百萬級美元。
對于此次微軟下場推出的這款重磅服務,有業(yè)內人士將之比喻為幾十年前家庭電腦的普及。
“現(xiàn)在我們每個人擁有一臺自己的電腦是稀松平常的事情,”一位業(yè)內人士認為,正是這種基礎建設的普及,推動了整個互聯(lián)網時代的到來,“而如今,一場新的基礎建設已將拉開大幕?!?/p>
(文章來源:上海證券報)
關鍵詞: