8月2日,雲(yún)從科技研究院産品總監(jiān)孫進(右二)和人工智慧訓練師進行真?zhèn)稳讼駭?shù)據(jù)採集。
如今,“遇事不決問AI(人工智慧)”正成為越來越多人的習慣,而AIGC(生成式人工智慧)産品,還能根據(jù)要求,自動生成視頻、文案、PPT等,堪稱“全能”。
其實,AI並非天生就這麼全能,它的這些本領(lǐng),來自人工智慧訓練師的“教導”。這群專業(yè)人才能讓AI從啥也不懂的“小白”,成長為上知天文下知地理的“全面手”。
7月30日,記者來到重慶人工智慧行業(yè)的頭部企業(yè)——重慶中科雲(yún)從科技有限公司(以下簡稱雲(yún)從科技),對這一新職業(yè)一探究竟。
訓練不易
集眾人之力“教”AI思考
人工智慧訓練師,是指使用智慧訓練軟體,在人工智慧産品實際使用過程中進行數(shù)據(jù)庫管理、演算法參數(shù)設(shè)置、人機交互設(shè)計、性能測試跟蹤及其他輔助作業(yè)的人員。
AI沒有生命,不能用常規(guī)的方式去交流。它能執(zhí)行的,是一串串由0與1組成的二進位代碼。因此,人工智慧訓練師要用智慧訓練軟體,把人類的意圖“翻譯”成代碼,再傳遞給AI。
根據(jù)工作內(nèi)容的不同,人工智慧訓練師又可分為數(shù)據(jù)工程師、演算法工程師、産品經(jīng)理、測試工程師等。AI的各種能力,就是他們“培養(yǎng)”出來的。
這是一個怎樣的過程?
“對AI應用來説,‘訓練’更類似于‘調(diào)試’。”雲(yún)從科技研究院産品總監(jiān)孫進告訴記者,AI的核心是演算法,可以理解為AI的“大腦”。“大腦”懂得越多、轉(zhuǎn)得越快,AI的能力就越強。
“教”AI的任務(wù)主要由演算法工程師承擔,其過程可以簡單理解為“做題”。
開始“做題”前,數(shù)據(jù)工程師會為AI找來“教材”。這些“教材”來自數(shù)據(jù)工程師們採集的各個場景和行業(yè)的大數(shù)據(jù),並且他們會對數(shù)據(jù)進行標注,便於AI理解。
題目從約等於小學難度的數(shù)學題開始,當AI在反覆訓練中學會解法,演算法工程師就會調(diào)整各項參數(shù),提高題目難度。
讓AI“做題”,目的是訓練其人工神經(jīng)網(wǎng)路。人工神經(jīng)網(wǎng)路是對人類大腦的模擬,網(wǎng)路越發(fā)達,AI的“大腦”就越好使。
“AI的‘刷題量’是人類難以匹敵的。”孫進説,以大家熟知的ChatGPT大模型為例,GPT-3(即第三代)的模型參數(shù)量達到1750億,其中凝聚的知識量遠超人類的“最強大腦”。
經(jīng)歷海量“刷題”,具備解決問題的能力後,AI還只是停留在代碼層面,不能直接使用。這時,就輪到人機交互工程師登場了。他們要從産品設(shè)計的角度,為AI設(shè)計一套“皮膚”,便於用戶向AI下達指令,獲取結(jié)果。
最後,測試工程師和産品經(jīng)理分別從技術(shù)層面和用戶層面出發(fā),對AI進行評審。評審通過,代表著AI通過“期末考試”,從啥也不懂的“小白”成為掌握知識的“專家”。
目標不低
培養(yǎng)會思考能決策的AI
上述流程,快則幾個月,慢則需要幾年。其間,雲(yún)從科技的研發(fā)團隊日夜“連軸轉(zhuǎn)”,隨時準備攻克技術(shù)問題。
記者在雲(yún)從科技看到,大部分工作人員都在電腦前忙碌。會議室裏,落地玻璃和白板上密密麻麻排列著手寫的公式、關(guān)鍵詞和各種示意圖。
“AI的訓練和數(shù)學密不可分,所以我們經(jīng)常開著會就把墻壁當成了演算紙。”孫進笑稱,團隊的大多數(shù)頭腦風暴,都伴隨著信手涂寫和計算。經(jīng)常是一個人寫完了思路,另一個人又提筆上去“對戰(zhàn)”。
不過,人工智慧訓練師的工作,並非只是坐在辦公室裏就可以完成的。他們還需要跑現(xiàn)場、記場景、採集數(shù)據(jù)。在一次次奔忙中,他們也會變成半個人工智慧行業(yè)的專家。
如今,雲(yún)從科技的AI大模型已在多個行業(yè)落地。今年3月,雲(yún)從科技自主研發(fā)推出國內(nèi)首款AI原生數(shù)據(jù)分析産品DataGPT,可實時分析會議對話,最快1秒生成報表。7月,雲(yún)從科技又發(fā)佈了智慧審查大模型,3秒內(nèi)可以檢查法律文書中的460多項監(jiān)督點,還可高效糾錯。
孫進表示,雲(yún)從科技正從單個AI産品研發(fā)轉(zhuǎn)向培養(yǎng)能思考、會工作的AI智慧體。
也就是説,人工智慧訓練師此前是把AI産品從懂得少的“小白”培養(yǎng)成知識淵博、術(shù)業(yè)有專攻的“專家”,而培養(yǎng)AI智慧體,則是打造一個懂得多、能幹事的“全能王”。
比起AI應用,AI智慧體更像一個全能助理。例如,用戶向AI智慧體提出“我要買火車票”的要求,AI智慧體就會調(diào)用日曆、購票平臺、工作安排、用戶個人資訊等應用介面。當AI智慧體發(fā)現(xiàn)購票指令的資訊不夠,還會反問用戶“您想去哪”,再根據(jù)目的地提供購票選擇。
在培養(yǎng)AI智慧體的過程中,人工智慧訓練師又出現(xiàn)了一個新的細分崗位:提示詞工程師。他們會把用戶需求分解成若干個提示詞(即指令),讓AI根據(jù)提示詞進行下一步應對。
門檻不高
未來各行業(yè)人才都可以擔任
成為人工智慧訓練師,門檻高不高?
孫進表示,人工智慧訓練師可以是學習人工智慧專業(yè)的人才,也可以由其他相關(guān)專業(yè)人才“跨行”而來。例如,學習電腦、自動化、軟體等相關(guān)專業(yè)的人才,可以在經(jīng)過培訓後成為人工智慧訓練師。
不僅如此,未來,人工智慧訓練師還有望來自各行各業(yè)。
為啥這麼説?因為每個行業(yè)對AI的需求不一樣。比如,車企需要懂汽車的AI,金融機構(gòu)需要能當客服的AI,礦山需要能抓安全生産的AI……
要做一個深度融入行業(yè)的AI産品,項目工期可能只有幾個月,只懂AI技術(shù)的人工智慧訓練師很難在這期間真正摸透行業(yè)需求。
但如果從該行業(yè)中找一個具備電腦、自動化等知識背景的人,把他培養(yǎng)成行業(yè)的人工智慧訓練師,他就能訓練出最符合行業(yè)和企業(yè)需求的AI。
目前,雲(yún)從科技已開發(fā)出可以訓練AI的AI産品,猶如“教練”。今後,行業(yè)人才只需指揮AI“教練”,就能對AI進行演算法訓練。
基於這一原理,雲(yún)從科技還開發(fā)了AI中臺,可以佈局在企業(yè),由員工來操作。不同企業(yè)也可以根據(jù)各自需求,通過AI中臺“定制”AI産品。
目前,重慶正在人工智慧人才培養(yǎng)領(lǐng)域不斷發(fā)力。重慶大學、西南大學、重慶郵電大學等高校都開設(shè)了人工智慧專業(yè)。同時,校企合作也越發(fā)緊密。例如,近年來,兩江新區(qū)持續(xù)推進哈工大、中軟卓越等“滿天星”人才超級工廠建設(shè),採取“機構(gòu)教學+企業(yè)實訓”等模式,開發(fā)人工智慧、大數(shù)據(jù)等專業(yè)“課程包”,培育實用型人才超2000人;又如,百度智慧雲(yún)(重慶)人工智慧人才産業(yè)基地與上百家企業(yè)、院校建立合作關(guān)係,培訓數(shù)字技能人才1600余人。
(責編:夏巖)