
中新網(wǎng)上海新聞3月13日電(記者 康玉湛) 近日,澳鵬Appen全球高級(jí)副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬在接受采訪時(shí)表示,以DeepSeek等大模型為代表的大模型紅利才剛剛開始,AI數(shù)據(jù)服務(wù)行業(yè)將進(jìn)入10至20年的景氣周期,澳鵬中國將在技術(shù)、交付、安全和渠道等方向持續(xù)布局,其中的戰(zhàn)略重點(diǎn)是技術(shù)和交付。而澳鵬作為AI數(shù)據(jù)服務(wù)行業(yè)的龍頭,其面向未來十年超級(jí)周期的布局,也將影響整個(gè)行業(yè)的發(fā)展方向。
據(jù)悉,澳鵬是少數(shù)最早投資技術(shù)和技術(shù)平臺(tái)的AI數(shù)據(jù)標(biāo)注服務(wù)商之一,澳鵬中國自2019年成立以來十分堅(jiān)定投資技術(shù),成立5年來向技術(shù)研發(fā)投資了1.1億人民幣,先后開發(fā)了MatrixGo企業(yè)級(jí)高精度數(shù)據(jù)標(biāo)注平臺(tái)以及大模型智能開發(fā)平臺(tái),通過雙技術(shù)平臺(tái)的建設(shè),實(shí)現(xiàn)了效率、質(zhì)量和安全性方面的顯著優(yōu)勢,搶得了市場先機(jī)。
大模型對(duì)于標(biāo)注數(shù)據(jù)的范圍、量級(jí)和復(fù)雜性要求,遠(yuǎn)遠(yuǎn)超過了之前的AI小模型。田小鵬認(rèn)為,原先的AI小模型都是項(xiàng)目制,而大模型是一個(gè)世界通用模型,要解決所有人類的問題甚至是對(duì)未來的思考,涉及范圍"匪夷所思"、遠(yuǎn)超想象;大模型對(duì)于標(biāo)注數(shù)據(jù)量級(jí)要求則是上億條甚至是幾十億條的海量級(jí),遠(yuǎn)超之前AI小模型的幾百、幾千條;而基礎(chǔ)大模型的學(xué)習(xí)速度非常快,一兩年內(nèi)就能消耗完所有的公開信息,接下來的難點(diǎn)在于專業(yè)和私域數(shù)據(jù)。
大模型與生成式AI無疑已經(jīng)成為實(shí)實(shí)在在的效率和增長引擎。2025年2月底澳鵬發(fā)布的年報(bào)顯示:2024年公司中國業(yè)務(wù)營收突破4.2億,年增長達(dá)到71% ,其中的大模型/AIGC業(yè)務(wù)增長了526%,多數(shù)AI龍頭,特別是大模型 AI企業(yè)成為了澳鵬的客戶。
田小鵬表示,在大模型啟動(dòng)AI數(shù)據(jù)服務(wù)超級(jí)周期的大門時(shí),全球"知識(shí)"資源+高速技術(shù)迭代+高安全合規(guī)正在重新定義AI數(shù)據(jù)服務(wù)行業(yè),所有的供應(yīng)商都被重新洗牌,傳統(tǒng)人力資源型服務(wù)商正被迅速邊緣化,全力投入高質(zhì)量技術(shù)研發(fā)和產(chǎn)品、實(shí)現(xiàn)供給全球"知識(shí)"資源、確保國內(nèi)外數(shù)據(jù)合規(guī)和安全的AI數(shù)據(jù)服務(wù)商才能真正接住超級(jí)周期的大盤。澳鵬中國將持之以恒地全力投入技術(shù)研發(fā)、垂直領(lǐng)域、全球資源布局和數(shù)據(jù)合規(guī)與安全等方向,與AI龍頭企業(yè)一起夯實(shí)新十年的增長路徑。
在通用領(lǐng)域,中國大模型取得了顯著突破。根據(jù)智源研究院2024年底的"百模"評(píng)測,豆包文生圖模型和視頻生成模型分別位列全球第二,騰訊Hunyuan Image文生圖、快手可靈1.5文生視頻、阿里巴巴Qwen2-Audio語音語言水平均位居全球第一。在垂直領(lǐng)域,以DeepSeek為代表的中國大模型正深入傳統(tǒng)行業(yè),如多地12345熱線接入后效率大幅提升,鎮(zhèn)江超級(jí)大腦單日數(shù)據(jù)處理量相當(dāng)于全市公務(wù)員10年工作量,天津地鐵接入后故障發(fā)生率降低50%等等。
作為AI數(shù)據(jù)服務(wù)行業(yè)龍頭企業(yè),澳鵬Appen公司的2024年全年報(bào)顯示,經(jīng)調(diào)整后的公司年增長16%、2024年下半年大模型收入占28%。在澳鵬中國,大模型及大模型相關(guān)業(yè)務(wù)已經(jīng)占據(jù)了營收的40%。澳鵬自2023年中旬推出大模型相關(guān)產(chǎn)品和服務(wù),僅僅一年多的時(shí)間發(fā)展成為了第一大業(yè)務(wù),用"爆發(fā)"形容并不為過。2024年,澳鵬中國全年實(shí)現(xiàn)了4.2億人民幣營收,其中大模型及大模型相關(guān)業(yè)務(wù)營收達(dá)到1億人民幣。
澳鵬中國目前在全球有9大高信安交付基地, 布局北美、歐洲、東南亞、中國等,同時(shí)更有覆蓋170+國家,290+種語言的超百萬的眾包資源,已經(jīng)是中國頭部的AI客戶在海外市場的"攻城略地"的長期和信任AI數(shù)據(jù)合作伙伴。
由于大模型對(duì)于標(biāo)注數(shù)據(jù)的要求直接從TB級(jí)躍升到PB級(jí)、從單一模態(tài)和簡單標(biāo)注跨越到多模態(tài)數(shù)據(jù)(文本、圖像、語音等)和復(fù)雜的標(biāo)注任務(wù)(如多輪對(duì)話、思維鏈標(biāo)注等),急需金融、法律、醫(yī)療、音樂、文學(xué)、數(shù)理、代碼、美學(xué)藝術(shù)等垂直領(lǐng)域的更高水平的專業(yè)知識(shí)等,這些都要求數(shù)據(jù)標(biāo)注服務(wù)商具有強(qiáng)大的技術(shù)平臺(tái)和研發(fā)能力,通過智能化的標(biāo)注平臺(tái)承載大模型"匪夷所思"的需求。除了開發(fā)智能標(biāo)注工具和平臺(tái)外,澳鵬對(duì)技術(shù)的投資還包括構(gòu)建多模態(tài)數(shù)據(jù)湖,統(tǒng)一管理文本、圖像、音頻等異構(gòu)數(shù)據(jù),支持靈活的數(shù)據(jù)組合與實(shí)驗(yàn),以及強(qiáng)化倫理與合規(guī)框架等。
田小鵬認(rèn)為,與全球大模型更側(cè)重通用性和多語言多語種模型泛化的模式不同,中國大模型更側(cè)重"通用+垂直領(lǐng)域",這意味著中國大模型在未來行業(yè)應(yīng)用場景、特定垂直領(lǐng)域創(chuàng)新方面獨(dú)樹一幟,也更在"局部領(lǐng)域"更容易實(shí)現(xiàn) AI 垂類實(shí)踐的突破,對(duì)特定行業(yè)和社會(huì)生產(chǎn)力的大幅快速提升。
此外,隨著大模型應(yīng)用向垂直領(lǐng)域的不斷深入,澳鵬中國將結(jié)合自身在大模型和各垂直領(lǐng)域數(shù)據(jù)服務(wù)中積累的豐富經(jīng)驗(yàn),研發(fā)高精尖垂類數(shù)據(jù)標(biāo)注平臺(tái),澳鵬中國計(jì)劃在2025年上半年推出專業(yè)的大模型醫(yī)療數(shù)據(jù)標(biāo)注平臺(tái)和具身智能數(shù)據(jù)標(biāo)注平臺(tái),進(jìn)一步賦能垂直領(lǐng)域客戶構(gòu)建高質(zhì)量模型訓(xùn)練數(shù)據(jù)。
注:請(qǐng)?jiān)谵D(zhuǎn)載文章內(nèi)容時(shí)務(wù)必注明出處!
編輯:康玉湛