自2022年底ChatGPT問世以來,全球掀起了一場前所未有的人工智能大模型訓(xùn)練浪潮。短短數(shù)年間,大模型數(shù)量激增,參數(shù)規(guī)模與功能能力持續(xù)擴(kuò)展,推動AI技術(shù)加速突破。
與此同時(shí),行業(yè)正在從通用模型走向垂直場景定制,越來越多的廠商開始探索面向特定行業(yè)需求的定制化解決方案,以應(yīng)對復(fù)雜多樣的應(yīng)用環(huán)境。
麥肯錫全球研究院預(yù)計(jì),生成式人工智能將在全球范圍內(nèi)創(chuàng)造高達(dá)7萬億美元的新增經(jīng)濟(jì)價(jià)值,整體提升人工智能的經(jīng)濟(jì)效益約50%。其中,中國市場的潛在貢獻(xiàn)可達(dá)2萬億美元,約占全球總量的三分之一。
在這場變革中,交互式AI作為人與技術(shù)之間的橋梁,正成為釋放這一潛力的關(guān)鍵?!兜虑诮换ナ饺斯ぶ悄馨灼分赋?,交互式AI在提高運(yùn)營效率、降低勞動成本、提高服務(wù)質(zhì)量、重塑工作方式等方面,展現(xiàn)出顯著價(jià)值。
成立于2005年的聲通科技(02495.HK),是國內(nèi)較早聚焦企業(yè)級交互式AI解決方案的技術(shù)企業(yè)。近二十年來,聲通科技持續(xù)在融合通信與人工智能領(lǐng)域布局,并將其有效融入多個實(shí)際場景中。
劉藝涵 聲通科技副總經(jīng)理兼董事會秘書 受訪者供圖
“AI的真正價(jià)值,不在于參數(shù)的堆砌,而在于是否能落地產(chǎn)業(yè)解決實(shí)際問題?!甭曂萍几笨偨?jīng)理兼董事會秘書劉藝涵在接受時(shí)代周報(bào)專訪時(shí)表示,“我們堅(jiān)持‘小步快跑、深度突破’的策略,從企業(yè)用戶的真實(shí)需求出發(fā),打造高效、靈活且可快速落地的垂直場景解決方案。”
需求導(dǎo)向推動業(yè)務(wù)落地
時(shí)代周報(bào):聲通科技定位為交互式人工智能市場的提供商,在AI技術(shù)快速演進(jìn)的背景下,聲通科技如何保持自身產(chǎn)品和技術(shù)的進(jìn)步?
劉藝涵:面對AI技術(shù)的快速迭代,聲通科技堅(jiān)持以“技術(shù)創(chuàng)新驅(qū)動產(chǎn)品領(lǐng)先、需求導(dǎo)向推動業(yè)務(wù)落地”為核心策略。
我們的技術(shù)選擇更像是一輛“直達(dá)用戶目標(biāo),不走冗余路線”的小車,對客戶來說部署效率高、投入性價(jià)比強(qiáng)。這一思路也體現(xiàn)在公司的商業(yè)化結(jié)果上。以2022年為例,老客戶貢獻(xiàn)的收入占比達(dá)到70%,反映了公司在企業(yè)級領(lǐng)域的高度認(rèn)可與客戶粘性。
同時(shí),我們積極推進(jìn)多模態(tài)融合技術(shù)研發(fā),通過“類人感知”使AI具有更全面的世界理解和更高的輸出可信度。我們專注于企業(yè)可量化ROI的場景應(yīng)用,避免無效的算力競賽,幫助客戶實(shí)現(xiàn)顯著的經(jīng)濟(jì)效益和高可解釋性解決方案。
時(shí)代周報(bào):聲通科技強(qiáng)調(diào)“融合通信+AI+產(chǎn)品引擎”的全棧架構(gòu),這種架構(gòu)在實(shí)際應(yīng)用中相較于傳統(tǒng)解決方案有何不同?
劉藝涵:相比只專注AI或單一通信技術(shù)的企業(yè),聲通科技的融合通信背景深厚,并結(jié)合自研AI模型,能夠根據(jù)客戶需求靈活集成通信與AI功能。例如,在多人對話時(shí),單純依靠聲紋識別受限于環(huán)境噪音、音質(zhì)變化等問題。而我們通過將通信數(shù)據(jù)(如IP地址、設(shè)備信息)與AI模型結(jié)合,可更準(zhǔn)確地識別會話各方,提高整體識別的可靠性和適用范圍。
在端到端一體化體驗(yàn)方面,我們的交互式AI方案覆蓋聲音采集、語音識別、語義理解、知識圖譜檢索、語音合成等全流程,通過自研算法,端到端響應(yīng)速度可達(dá)百毫秒級,提升了用戶交互的流暢性和實(shí)時(shí)性。
此外,在多人會話及復(fù)雜語境下,系統(tǒng)能夠高精度識別多地方言及主流語言。例如,河南安陽方言識別準(zhǔn)確率已達(dá)95.2%。這種能力,特別適用于涉及多方、多地區(qū)及多語言的客戶場景,如智能客服、遠(yuǎn)程會議系統(tǒng)等。
綜合來看,全棧式解決方案在交付與運(yùn)維過程中,能有效降低15%至30%的系統(tǒng)集成及運(yùn)營成本,簡化供應(yīng)鏈管理,提升系統(tǒng)協(xié)調(diào)效率。
時(shí)代周報(bào):在車聯(lián)網(wǎng)(V2X)場景中,聲通科技的解決方案如何與主機(jī)廠或交通管理系統(tǒng)實(shí)現(xiàn)深度融合?
劉藝涵:聲通科技構(gòu)建了車端、路端與云端深度協(xié)同的車路云一體化智能網(wǎng)聯(lián)解決方案,實(shí)現(xiàn)了與主機(jī)廠以及交通管理系統(tǒng)的高效融合。
在車端,公司與金龍、東風(fēng)等主機(jī)廠深入合作,將具備AI大模型智能決策能力的駕駛系統(tǒng)集成到車輛中,顯著提升了車輛的自主感知和環(huán)境預(yù)測能力。相比于傳統(tǒng)單一的路測感知設(shè)備,我們的系統(tǒng)能夠有效突破其應(yīng)用局限,尤其在復(fù)雜路段和特殊交通場景下表現(xiàn)尤為突出。目前,車端的單車駕駛技術(shù)主要由聲通合作伙伴洛必德以及其他廠商提供。
在路端,我們針對重點(diǎn)區(qū)域和典型路段,構(gòu)建了高精度三維建模與多維數(shù)據(jù)融合的智能感知體系。路端設(shè)施不僅可實(shí)時(shí)采集并分析綜合交通信息,還能與經(jīng)過的智能車輛進(jìn)行互動聯(lián)動,為交通系統(tǒng)和車輛提供協(xié)同決策支持,助力城市交通智能化管理。
在云端,我們依托自研大模型,實(shí)現(xiàn)車輛、路端與云端的數(shù)據(jù)實(shí)時(shí)互通。云平臺可基于動態(tài)交通數(shù)據(jù)與實(shí)時(shí)場景需求,進(jìn)行智能分析與決策,并將結(jié)果快速下發(fā)至車端和路端,實(shí)現(xiàn)全局最優(yōu)的交通調(diào)度和管理。
通過這一體系,聲通科技能夠與主機(jī)廠實(shí)現(xiàn)軟硬件一體化適配,與交通管理部門進(jìn)行數(shù)據(jù)和決策層面的深度協(xié)同,有效提升交通效率與行車安全,推動智能網(wǎng)聯(lián)汽車在實(shí)際場景中的大規(guī)模落地與應(yīng)用。
AI需要可信
時(shí)代周報(bào):公司目前的人工智能能力涵蓋語音識別、情緒識別、知識圖譜等,那么自研與外采模型的比例大致如何?未來是否計(jì)劃開發(fā)自主的大語言模型或其他基礎(chǔ)模型?
劉藝涵:目前,公司的核心交互式人工智能技術(shù),包括語音識別、語義理解、語音生成、情緒識別和知識圖譜等均為公司自研,以保證核心技術(shù)可控性和安全性。
在AI技術(shù)研發(fā)方面,我們堅(jiān)持走可信AI的技術(shù)路線,以滿足政府及企業(yè)級客戶在實(shí)際應(yīng)用場景中對于準(zhǔn)確率的嚴(yán)格要求,因此公司并沒有直接采用市面上的大模型技術(shù),而是采用大模型增強(qiáng)知識圖譜的技術(shù)方案,有效解決了大模型的幻覺問題,使得推理過程具有邏輯白盒性,實(shí)現(xiàn)精準(zhǔn)問答與生成,并可以根據(jù)用戶反饋進(jìn)行修正和調(diào)優(yōu)。整體部署成本比較低,更適合政府及企業(yè)級客戶私有化部署的需求。
時(shí)代周報(bào):面對銀行、保險(xiǎn)、證券等客戶的高合規(guī)與高敏感數(shù)據(jù)場景,聲通科技如何確保數(shù)據(jù)安全、模型解釋性與系統(tǒng)可靠性?
劉藝涵:我們的系統(tǒng)部署全部本地化,確??蛻魯?shù)據(jù)不出本地環(huán)境。同時(shí),結(jié)合嚴(yán)格的訪問權(quán)限管理、數(shù)據(jù)加密與審計(jì)機(jī)制,全面保障數(shù)據(jù)安全與合規(guī)。在模型可解釋性方面,通過多模型融合和知識圖譜技術(shù),讓AI的每一步推理過程都可追溯、可驗(yàn)證。無論是大模型還是小樣本、零樣本模型,均支持可視化決策路徑,便于業(yè)務(wù)人員理解和監(jiān)管。
系統(tǒng)方面,我們構(gòu)建了高度模塊化、可擴(kuò)展架構(gòu),支持7×24小時(shí)運(yùn)行。通過全流程容災(zāi)備份與實(shí)時(shí)監(jiān)控,確保業(yè)務(wù)連續(xù)性與高可用性。同時(shí),在實(shí)際應(yīng)用中不斷結(jié)合多模態(tài)(如文本、音頻、視頻、傳感數(shù)據(jù)等)信息,進(jìn)一步提升系統(tǒng)的認(rèn)知廣度和處理準(zhǔn)確率,從而為金融客戶提供值得信賴的智能服務(wù)。
時(shí)代周報(bào):當(dāng)前不少城市強(qiáng)調(diào)“從感知走向認(rèn)知”的智能治理理念,公司如何通過語音交互、情緒識別等技術(shù)支持政府實(shí)現(xiàn)智能化決策與服務(wù)優(yōu)化?
劉藝涵:我們積極探索AI大模型在12345政務(wù)熱線的創(chuàng)新應(yīng)用,基于開源大模型,融合LLM大語言模型、UIE要素提取、機(jī)器學(xué)習(xí)、RAG檢索增強(qiáng)生成等技術(shù),形成六大創(chuàng)新應(yīng)用:坐席助手、智能分派、智能校對、動態(tài)預(yù)警、專題分析、智能專報(bào)。通過運(yùn)行服務(wù)和學(xué)習(xí)優(yōu)化機(jī)制,持續(xù)提升智能化效果。
時(shí)代周報(bào):目前聲通科技的業(yè)務(wù)重心仍在企業(yè)級市場,但隨著交互式AI應(yīng)用的普及,是否有布局C端產(chǎn)品(如智能語音終端、家庭助手、教育硬件等)的計(jì)劃?是否會參考科大訊飛在學(xué)習(xí)機(jī)等領(lǐng)域的經(jīng)驗(yàn),切入消費(fèi)級智能硬件市場?
劉藝涵:我們已經(jīng)推出以C端為終端客戶的AIGC(生成式人工智能)“旅圖拍”AI拍照一體機(jī),游客不僅可以通過AI拍照機(jī)拍攝高質(zhì)量的個性化照片,還能實(shí)時(shí)生成與景區(qū)文化特色相關(guān)的多媒體內(nèi)容,進(jìn)一步增強(qiáng)游客對景區(qū)的認(rèn)同感和記憶點(diǎn)。
同時(shí),該設(shè)備可為景區(qū)運(yùn)營方提供精準(zhǔn)的數(shù)據(jù)分析支持,包括游客行為偏好和熱點(diǎn)區(qū)域分布,從而優(yōu)化景區(qū)管理和資源配置,提升整體運(yùn)營效率。
本文鏈接:http://www.enbeike.cn/news-2-2269-0.html對話聲通科技董秘劉藝涵:AI的真正價(jià)值不是堆砌參數(shù),而是解決問題
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
點(diǎn)擊右上角微信好友
朋友圈
點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請點(diǎn)擊“
”按鈕
點(diǎn)擊右上角QQ
點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點(diǎn)擊“
”按鈕