欧美一级日韩一级|欧美亚洲国产精品久久高清|久久久久久久久网站|精品国产一区二区三区19|欧美性受xxxx狂喷水

Internet Develppment
互聯(lián)網(wǎng)開(kāi)發(fā)& 推廣服務(wù)提供商

我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。

歡迎瀏覽我們的案例。

首頁(yè) > 新聞中心 > 新聞動(dòng)態(tài) > 正文

文心一言發(fā)布已進(jìn)入倒計時(shí) InfoQ接觸到百度AI中臺的技術(shù)團隊

發(fā)布時(shí)間:2023-03-09 09:32:02來(lái)源:infoq


圖片來(lái)自網(wǎng)絡(luò )/侵刪

  文心一言的發(fā)布已經(jīng)進(jìn)入倒計時(shí)。在這個(gè)特殊的時(shí)間節點(diǎn),InfoQ 接觸到了百度 AI 中臺的技術(shù)團隊,試圖了解將全面支持文心一言在產(chǎn)業(yè)快速落地的工程化能力具體是什么樣子。

  國外,OpenAI 宣布正式推出面向商業(yè)用戶(hù)的 ChatGPT 和 Whisper 語(yǔ)音轉文字模型 API,開(kāi)發(fā)人員可以通過(guò) API 將 ChatGPT 和 Whisper 模型集成到自己的應用程序和服務(wù)中。

  國內,百度即將發(fā)布的文心一言已經(jīng)與 400 余家企業(yè)正式達成戰略合作。

  大模型的出現讓沉寂了許久的資本市場(chǎng)再度熱鬧起來(lái),投資人們近期不是在排會(huì )、就是在項目投決會(huì )上,相關(guān)概念股同樣漲幅可觀(guān)。從脈脈上放出的 AIGC 相關(guān)崗位來(lái)看,互聯(lián)網(wǎng)、電商、智能硬件等眾多領(lǐng)域的大廠(chǎng)全力開(kāi)搶相關(guān)人才,知名獵頭 CGL 等公司掛出 10 萬(wàn)月薪崗位開(kāi)始搶人。

  冷靜之下,本輪 AI 熱潮與此前幾輪呈現驚人的相似——熱點(diǎn)迸發(fā),資本涌入,創(chuàng )業(yè)公司層出不窮,最終由于缺乏規?;涞?,或不了了之,或大幅虧損。曾經(jīng)被資本認為至少有 1000 億美元估值的格靈深瞳實(shí)際不到 50 億,而“AI 四小龍”過(guò)去一年則飽受“長(cháng)期虧損、造血能力不足”的質(zhì)疑。

  歸根結底,AI 的規?;涞剡h不是某一項技術(shù)突破就能實(shí)現的,除算力、算法、數據外還需要大量工程性、過(guò)程性工作的加入。從數據采集、標注到模型訓練、上線(xiàn),任何一個(gè)環(huán)節出現問(wèn)題都會(huì )影響最終的落地效果。

  當新一輪的技術(shù)浪潮來(lái)襲,AI 工程化再次成為無(wú)法回避的問(wèn)題。

  那么為什么談?wù)摿诉@么多年,AI 工程化依舊無(wú)法尋找到最佳解決方案?MLOps 是最優(yōu)解嗎?如果是,這套方法論具體如何落地?可以給產(chǎn)業(yè)帶來(lái)哪些實(shí)際價(jià)值… 本文,InfoQ 采訪(fǎng)了百度 AI 中臺總監忻舟,百度 AI 中臺產(chǎn)品架構師靳偉以及百度智能云主任架構師謝永康,試圖探究上述問(wèn)題的答案。

  為什么談?wù)摿四敲炊嗄?,AI 工程化問(wèn)題依舊無(wú)法解決?

  雖然 AI 工程化問(wèn)題談?wù)摿硕嗄?,但一直沒(méi)有很好解決。主要原因在于如下三點(diǎn):首先,行業(yè)內部一直缺乏統一的規范,這就導致解決方案質(zhì)量良莠不齊,而 AI 開(kāi)發(fā)流程長(cháng)且復雜,從數據采集、數據標注、模型訓練、到應用,再到最后的數據回流和模型觀(guān)察,任何一個(gè)環(huán)節沒(méi)有規范都會(huì )出現問(wèn)題。

  其次是人才問(wèn)題,過(guò)去,業(yè)內人工智能相關(guān)的研發(fā)人才相對稀缺,且多集中在頭部互聯(lián)網(wǎng)大廠(chǎng),傳統企業(yè)基本都還在做數字化和自動(dòng)化轉型相關(guān)的事情,還沒(méi)走到智能化轉型的階段。最近幾年,相關(guān)高校的人工智能學(xué)院建設成果顯著(zhù),向社會(huì )輸送了大批優(yōu)秀人才,互聯(lián)網(wǎng)公司的人才也開(kāi)始外溢到傳統企業(yè),這讓傳統企業(yè)具備了向智能化轉型的基礎條件。

  最后是企業(yè)內部多年積累下來(lái)的歷史問(wèn)題非常復雜,比如企業(yè)的一個(gè)人工智能平臺所需要的數據需要從數十個(gè)系統獲得,而這些系統的對接工作需要花費大量時(shí)間和精力,分屬同一領(lǐng)域的不同企業(yè)的基礎設施并不完全相同,簡(jiǎn)單復制粘貼是無(wú)法達到效果的。

  這其中最關(guān)鍵的就是行業(yè)標準的建立,一套完善的標準意味著(zhù)在大部分領(lǐng)域通用的解決方案能力。過(guò)去一年,中國信息通信研究院為了更好地將互聯(lián)網(wǎng)大廠(chǎng)的 AI 能力賦能產(chǎn)業(yè),正式發(fā)布了《人工智能研發(fā)運營(yíng)一體化 (Model/MLOps) 能力成熟度模型第一部分:開(kāi)發(fā)管理》標準,百度智能云 AI 中臺解決方案參與了 MLOps 開(kāi)發(fā)管理服務(wù)能力評測,成為國內在開(kāi)發(fā)管理能力上達到旗艦級的 MLOps 平臺(面向產(chǎn)品方的最高等級)。


圖片來(lái)自網(wǎng)絡(luò )/侵刪

  圖注:MLOps 開(kāi)發(fā)管理部分評測的指標體系涉及 28 個(gè)能力子項,考察點(diǎn)近 200 余項,是一個(gè)非常全面與系統的測評

  簡(jiǎn)單來(lái)說(shuō),這套標準是首個(gè)匯集 AI 開(kāi)發(fā)全流程的最佳實(shí)踐寶典,可以幫助企業(yè)實(shí)現 AI 工程化落地,大幅提升 AI 研發(fā)和運營(yíng)的質(zhì)量和效率。那么,這樣一套“旗艦級”的 AI 中臺解決方案其具體架構是如何設計的?效果如何?能為產(chǎn)業(yè)帶來(lái)哪些實(shí)際價(jià)值?

  業(yè)內缺的不是 AI 中臺,而是全周期端到端

  MLOps(Machine Learning Operations)是一套面向機器學(xué)習項目和研發(fā)運營(yíng)管理體系,指在人工智能軟件項目的研發(fā)和運營(yíng)過(guò)程中統一和管理需求、開(kāi)發(fā)、測試、集成、部署和運營(yíng)等環(huán)節,實(shí)現模型持續訓練、持續集成、持續交付、持續監控的快速迭代和有效銜接。

  這套方法論其實(shí)早在 2015 年就誕生了,號稱(chēng)遵循此設計的“AI 中臺”解決方案也不在少數,那為什么沒(méi)解決問(wèn)題呢?

  因為大部分 AI 中臺都只解決了“某一段”的問(wèn)題,而百度智能云 AI 中臺是少有的端到端的覆蓋 AI 研發(fā)和運營(yíng)全生命周期的解決方案。

  2020 年,百度智能云將原有服務(wù)按照 MLOps 的過(guò)程整合為四大板塊,分別是數據樣本中心,專(zhuān)門(mén)做數據處理;開(kāi)發(fā)中心,提供專(zhuān)業(yè)的開(kāi)發(fā)平臺;模型中心,將開(kāi)發(fā)中心訓練好的模型統一管理,方便后期評估;服務(wù)運行平臺,將模型最終發(fā)布為一個(gè)在線(xiàn)服務(wù)或者端服務(wù),這四大平臺基本涵蓋了 MLOps 全生命周期。

  除此之外,百度智能云在“安全可控“上也提供了眾多周邊企業(yè)級管控服務(wù),比如模型風(fēng)險管理,可以記錄從模型立項、模型研發(fā)、數據收集,模型訓練到模型上線(xiàn)和下線(xiàn)全流程的所有數據及評估過(guò)程,問(wèn)題出現后可以迅速定位到責任人。另外針對結果,百度提供了模型的可解釋性,涉及訓練可解釋和預測可解釋兩部分。在訓練過(guò)程,企業(yè)可以得到模型的具體訓練方式以及哪些參數在發(fā)揮重要作用等信息;在預測過(guò)程,企業(yè)可以倒推到底是哪些數據或者決策路徑內的鏈條導致最終的結果是 Yes,這對注重安全的企業(yè)而言至關(guān)重要。

  靳偉表示上述四大板塊加管控服務(wù)就是百度智能云的 AI 中臺解決方案。那么,這樣一套全周期端到端的解決方案到底有哪些優(yōu)勢呢?

  從實(shí)施路徑來(lái)看,業(yè)內一般有兩種實(shí)現方式:一是針對 AI 領(lǐng)域人才相對缺乏,自身 AI 能力尚未建設完成的企業(yè),百度智能云可提供全套的解決方案。而不是如過(guò)去一樣建一個(gè) OCR、搞一個(gè)智能客服這樣的單點(diǎn)創(chuàng )新,是通過(guò)端到端把企業(yè)內部的底層 AI 基礎設施建好,未來(lái)才可能在此基礎上實(shí)現更多創(chuàng )新。

  二是具備一定研發(fā)實(shí)力的企業(yè),聚焦在個(gè)性化 AI 研發(fā)能力的構建,大幅提升 AI 模型落地應用推廣效率。在此情景下,基礎的方案可能完全起不了作用,只有具備端到端能力的解決方案才能助力研發(fā)人員快速搭建出一套適合企業(yè)發(fā)展的方案。

  從最終效果來(lái)看,百度 AI 中臺從需求和代碼管理、AI 模型生產(chǎn)、底層計算資源管理、數據管理及質(zhì)檢全流程均完善的管理工具,能夠為企業(yè)客戶(hù)提供較為快速和較高質(zhì)量的響應。

  具體到單點(diǎn)功能上,其提供的自動(dòng)標注能力相比于人工標注,成本平均降低 70%。特定場(chǎng)景下,數值遠超于此。在資源利用率層面,模型訓練本身是非常耗費 GPU 資源的,這在大模型時(shí)代尤為明顯。整個(gè)過(guò)程涉及資源合理利用、資源調度、虛擬化以及提升 GPU 的利用率等,而 MLOps 對此有明確的規范,百度的 AI 中臺基于這樣的規范實(shí)現,可以給到用戶(hù)更好地調度策略和虛擬化機制,確保資源利用率達到 80%,甚至 90%,這將為企業(yè)節省大量成本。

  面向未來(lái),百度的 AI 中臺將與大數據平臺實(shí)現深度聯(lián)動(dòng)。忻舟表示大數據和 AI 天生就應該在一起,MLOps 與 DataOps 的結合正在百度內部發(fā)生。未來(lái),用戶(hù)可以通過(guò)平臺產(chǎn)品的方式直接獲得這種能力,比如 AI 中臺、大數據中臺,也可以通過(guò) SDK 的方式來(lái)獲取相應能力,企業(yè)可以不用關(guān)心具體的實(shí)現方式,專(zhuān)注于與現有業(yè)務(wù)的具體結合。

  當然,在產(chǎn)業(yè)智能化升級的過(guò)程中,僅靠 AI 中臺顯然是不夠的,企業(yè)需要的是一個(gè)強悍的 AI 基礎設施,可以解決智能化轉型過(guò)程的一切問(wèn)題。

  強悍的不僅是 AI 大底座本身,而是燒錢(qián)也建不起的技術(shù)壁壘

  百度 AI 中臺與百舸異構計算平臺兩大部分共同構成了百度的 AI 大底座,形成了國內僅有的涵蓋“芯片 - 框架 - 模型 - 應用”的 AI 生產(chǎn)全要素智能基礎設施。

  其中,百度 AI 中臺整合了目前中國深度學(xué)習平臺市場(chǎng)綜合份額第一的“飛槳”和產(chǎn)業(yè)級知識增強大模型“文心大模型”,打通了百度的樣本中心、模型中心、AI 開(kāi)發(fā)平臺、AI 服務(wù)運行平臺,實(shí)現從數據存儲到模型訓練、生產(chǎn)、部署、測試的全鏈路、批量化生產(chǎn);百舸異構計算平臺整合了百度自研的 AI 芯片“昆侖芯”,可以提供高性?xún)r(jià)比的算力,承載海量數據的處理、超大模型的訓練和推理。

  百度是全球為數不多、進(jìn)行全棧布局的人工智能公司,且各個(gè)層面都有關(guān)鍵自研技術(shù),可以真正實(shí)現端到端優(yōu)化,大幅提升效率。

  以傳統能源行業(yè)的智能化升級為例,電力企業(yè)最擔心的兩大問(wèn)題:一是如何實(shí)現不同區域的電力資源按需調度,最終實(shí)現各區域的供需匹配,這個(gè)過(guò)程就要求員工 7x24 小時(shí)監控所有節點(diǎn)發(fā)回的電力信息;二是可以不受天氣溫度、地理位置的干擾對高壓線(xiàn)纜進(jìn)行巡檢且保證員工安全,很多高壓線(xiàn)纜處于深山密林中,巡檢人員很難進(jìn)去,并且巡檢人員需要爬上線(xiàn)纜做各種各樣的檢查,非常危險。這對 AI 技術(shù)的應用也帶來(lái)了實(shí)際挑戰:一是電網(wǎng)企業(yè)硬件設備眾多,數據、接口復雜,難以形成統一的感知和管理平臺;二是模型開(kāi)發(fā)難度高,電力設備分布在各種自然環(huán)境中,天氣溫度、地理位置等都會(huì )影響模型的最終效果,設備故障類(lèi)型較多。

  在國家電網(wǎng)的實(shí)際應用中,百度通過(guò) AI 大底座的能力幫助國網(wǎng)實(shí)現了人工智能“兩庫一平臺”的建設,促進(jìn)了人工智能技術(shù)在輸電、變電、配電、調度、電網(wǎng)企業(yè)營(yíng)銷(xiāo)、安全監察等各業(yè)務(wù)領(lǐng)域的落實(shí)、落地。并幫助國網(wǎng)福建建設了 AI 中臺,在此基礎上,協(xié)同打造電力大模型,構建了 AI 電力關(guān)鍵業(yè)務(wù)數據的全鏈條智能處理能力,實(shí)現需求、樣本、模型、應用和迭代的全流程業(yè)務(wù)貫通,支撐國網(wǎng)福建電力更高效、規范地打造 AI 應用。目前,這一方法已幫助他們在識別準確率提升了 30%,識別效率提升了 5 倍。變電端效率提升了 40—60 倍,啟動(dòng)送電時(shí)間縮短了 80%。未來(lái),通過(guò) AI 大底座的全棧優(yōu)勢將持續為國網(wǎng)實(shí)現端到端優(yōu)化模型效果,提供更高效能的服務(wù)。

  但是,真正強悍的不僅僅是 AI 大底座本身,還有這背后的技術(shù)壁壘。

  與云計算領(lǐng)域早期就擁有眾多開(kāi)源和標準化方案不同,構建 AI 能力所需要的數據、算法、算力以及工程化能力,每一環(huán)都具有極高的門(mén)檻,這也是 ChatGPT 帶給我們巨大沖擊之后,國內用戶(hù)第一時(shí)間把注意力投到百度身上的原因,只有百度過(guò)去這么多年堅定不移地在 AI 研發(fā)上投入重金,并最早在產(chǎn)業(yè)里面實(shí)現了規?;涞?。

  當其他企業(yè)還受限于芯片研發(fā)技術(shù)和找不到場(chǎng)景打磨時(shí),百度“昆侖芯”已上線(xiàn)數萬(wàn)片,廣泛用在百度搜索和無(wú)人駕駛汽車(chē)、愛(ài)奇藝、小度等業(yè)務(wù)場(chǎng)景。

  當其他企業(yè)還在糾結開(kāi)源框架選型時(shí),百度飛槳已經(jīng)成長(cháng)為一個(gè)自主可控的全棧平臺,凝聚了數百萬(wàn)開(kāi)發(fā)者,在產(chǎn)業(yè)里摸爬滾打四年多服務(wù)了數十萬(wàn)企事業(yè)單位。

  當其他企業(yè)臨時(shí)抱佛腳研究大模型時(shí),百度文心大模型已經(jīng)形成“模型層 + 工具與平臺層 + 產(chǎn)品與社區層”的整體布局,成為業(yè)界規模最大的產(chǎn)業(yè)大模型體系。

  作為一家既懂芯片,又懂算法,還有數據的企業(yè),百度智能云可以根據用戶(hù)實(shí)際場(chǎng)景的需要提供端到端的解決方案,在提供更優(yōu)的客戶(hù)體驗的同時(shí)大幅降低成本,不是每一家搞 AI 的公司都恰好能擁有強大的云計算能力,也不是每一家搞云計算的企業(yè)都能與如此強悍的 AI 大底座形成有效協(xié)同。

  一旦這套體系建立完成,云廠(chǎng)商將會(huì )在 AI 時(shí)代擁有極高壁壘。

  碎片化生態(tài)的變革:從百度“AI 大底座”開(kāi)始

  過(guò)去多年,場(chǎng)景的碎片化帶來(lái)了 AI 產(chǎn)品的碎片化,但也恰恰說(shuō)明業(yè)內并沒(méi)有一個(gè)通用、普適的人工智能產(chǎn)品出現,這里的原因很復雜,包括數據、算法、算力、生態(tài)建設等諸多方面。

  百度 AI 大底座的出現讓我們對打破這種“碎片化生態(tài)”重新燃起了希望。用戶(hù)只需要提出訴求,平臺就可以自動(dòng)輸出需要的結果,這就像一條流水線(xiàn)一樣易用、順暢。只有這樣的解決方案才可能真正實(shí)現“AI 普惠”的未來(lái)愿景。

  “AI 普惠在百度智能云有兩層含義,第一層含義是讓企業(yè)以更低的門(mén)檻獲得 AI 能力;第二個(gè)含義是以更高性?xún)r(jià)比的方式獲得 AI 能力,百度在做很多通用的 AI 平臺型產(chǎn)品和針對特定場(chǎng)景的解決方案,以期通過(guò)最具性?xún)r(jià)比的方式解決企業(yè)問(wèn)題,最終實(shí)現 AI 普惠。” 百度集團執行副總裁、百度智能云事業(yè)群總裁沈抖也在此前談到:“需要云計算廠(chǎng)商標準化地輸出智能化的底層能力,把芯片、大模型、深度學(xué)習框架等高門(mén)檻的技術(shù),變成像水電能一樣供客戶(hù)按需取用。”
 ?。?a href="http://www.chemdevice.net">碼上科技)

最新資訊
? 2018 河北碼上網(wǎng)絡(luò )科技有限公司 版權所有 冀ICP備18021892號-1   
? 2018 河北碼上科技有限公司 版權所有.
欧美一级日韩一级|欧美亚洲国产精品久久高清|久久久久久久久网站|精品国产一区二区三区19|欧美性受xxxx狂喷水