ZEGO即構(gòu)科技顏延:創(chuàng)新加持創(chuàng)造,構(gòu)建極致音視頻體驗

近幾年,直播行業(yè)持續(xù)呈現(xiàn)爆發(fā)式增長,已經(jīng)完成了從秀場、電競向泛娛樂全行業(yè)的拓展,并呈現(xiàn)出深度融合教育、電商等多種生態(tài)的趨勢。在這種趨勢下,直播行業(yè)正迎來體驗升級的時代,如何應(yīng)對人們對實時性、穩(wěn)定性日益增長的剛性需求,以及對更多創(chuàng)新玩法的渴望,是直播行業(yè)需要面對的新挑戰(zhàn)。在6月9日的亞太內(nèi)容分發(fā)大會暨第九屆CDN峰會上,ZEGO即構(gòu)科技合伙人兼CPO顏延對即構(gòu)科技的云通訊技術(shù)做了詳細的分享。

ZEGO即構(gòu)科技顏延:創(chuàng)新加持創(chuàng)造,構(gòu)建極致音視頻體驗

01 音視頻的動態(tài)發(fā)展,造就即構(gòu)提供毫秒級延遲體驗

眾視Tech記者:您在本次大會演講主題《如何在千萬級并發(fā)規(guī)模下打造毫秒級延遲新體驗》,能否劇透或補充下如何理解云通訊技術(shù),目前音視頻技術(shù)遇到哪些問題,即構(gòu)科技能夠解決哪些問題?

顏延:隨著全球互聯(lián)網(wǎng)和電信基礎(chǔ)設(shè)施的快速發(fā)展,音視頻通信的應(yīng)用領(lǐng)域越來越廣,體驗效果越來越好。但一項最基本的技術(shù)挑戰(zhàn)仍然持續(xù),就是在復(fù)雜的網(wǎng)絡(luò)狀況下,追逐延遲更低、同步性更好的音視頻互動傳輸。

我覺得音視頻的發(fā)展一直是一個動態(tài)拉扯上升的過程,技術(shù)升級讓最初以單向分發(fā)為主的直播,演進到大量實時互動的形態(tài),而實時音視頻技術(shù)又反哺直播場景,進一步完善了體驗。同時,圍繞著音視頻又出現(xiàn)越來越多的互動形式,互動密度也大大提升。

比如說我們的低延遲直播產(chǎn)品(Low-Lantency Live,簡稱 L3),就是實時音視頻技術(shù)反哺直播場景,進一步優(yōu)化體驗的一個成熟應(yīng)用。我們團隊通過軟件定義多個基礎(chǔ)云網(wǎng)絡(luò),自研編織了一張海量有序數(shù)據(jù)大網(wǎng) MSDN(Massive Serial Data Network),通過 MSDN 與音視頻技術(shù)結(jié)合,我們構(gòu)建了支持千萬級并發(fā)、強同步、毫秒延遲的低延遲直播產(chǎn)品。

另一方面,我們能看到更多產(chǎn)業(yè)也將音視頻技術(shù)融入到他們的生產(chǎn)過程中,發(fā)生了相當(dāng)多的化學(xué)反應(yīng),新產(chǎn)業(yè)帶來新場景,新場景促成新升級。

目前對我們來說,怎樣把技術(shù)與各行各業(yè)做到更緊密的結(jié)合是最大的挑戰(zhàn),也就是技術(shù)與場景的結(jié)合。此外,由于基礎(chǔ)技術(shù)本身也在高速優(yōu)化的道路上,關(guān)聯(lián)性的技術(shù)發(fā)展比如深度學(xué)習(xí)、5G 等都帶來了極大促進作用,所以技術(shù)與技術(shù)之間的結(jié)合又是另一個我們深耕的課題。

02實時音視頻產(chǎn)品快速迭代,即構(gòu)讓技術(shù)融于無形

眾視Tech記者:目前 RTC 云通訊市場的現(xiàn)狀是什么樣的?客戶對云通訊技術(shù)的需求在發(fā)生什么樣的變化?

顏延:最初像 RTC 這個行業(yè),我們是從互聯(lián)網(wǎng)行業(yè)中的泛娛樂場景去接入的,因為泛娛樂本身在整個互聯(lián)網(wǎng)領(lǐng)域里算是數(shù)字化程度較高的細分場景。因此,音視頻技術(shù)可以快速去和用戶的需求做結(jié)合。隨著音視頻技術(shù)的快速蔓延,客戶的需求也從單一技術(shù)的“成本”和“性能”過渡到更加靈活、高效的場景解決方案上。

即構(gòu)從創(chuàng)業(yè)至今一直秉持的理念是“讓音視頻技術(shù)融于無形”,我們實時音視頻產(chǎn)品的迭代步履不停,同時又在云通信的不同層面上多點開花,推出了實時消息、低延遲直播產(chǎn)品、AI 視覺等產(chǎn)品,技術(shù)產(chǎn)品體系肉眼可見變得豐富立體,而融于“無形”的理念卻在咱們每個人腦海里烙印更深了。因為不僅僅是技術(shù)和產(chǎn)品在往前跑,更多行業(yè)的生產(chǎn)流程、生產(chǎn)場景也在推陳出新,這樣的變化并不意味著音視頻技術(shù)要成為改造行業(yè)的主角,而是各種行業(yè)在更大的范圍上包含了音視頻技術(shù)。所以我們也選擇用更結(jié)構(gòu)化、層次化的產(chǎn)品矩陣去嘗試多點融入,由此看到了一些化學(xué)反應(yīng)。

我們所做的事就是,除了提供底層的音視頻技術(shù)支持,為了滿足更多企業(yè)快速獲得音視頻能力的需求,我們還將 PaaS 產(chǎn)品方案化,滲透進具體的業(yè)務(wù)場景中,提供低代碼、可擴展、彈性伸縮的 aPaaS 模式解決方案,讓客戶可以更快、更低成本地實現(xiàn)音視頻產(chǎn)品。

比如,在線教育領(lǐng)域在去年疫情的催化下,出現(xiàn)了大量的線下轉(zhuǎn)線上的機構(gòu)。為此,我們在今年2月推出了業(yè)內(nèi)首個面向全行業(yè)的低代碼互動平臺產(chǎn)品 RoomKit,通過對業(yè)務(wù)場景能力的完整封裝,實現(xiàn)了互動房間的 0 碼搭建。就算是沒有技術(shù)團隊的客戶,也能夠通過 RoomKit 的功能可視化配置,完成產(chǎn)品的接入和上線。以在線教育為例,一個無需掌握音視頻開發(fā)能力的開發(fā)者,15 分鐘內(nèi)即可搭建好一個功能完善的在線教學(xué)平臺,大大降低了中小型機構(gòu)的創(chuàng)新門檻。

03 更進一步提供服務(wù),「低代碼+音視頻」快速搭建業(yè)務(wù)場景

眾視Tech記者:即構(gòu)科技解決方案覆蓋到了在線教育、遠程醫(yī)療、社交娛樂、互動電商、視頻會議等等方面,那么如何理解即構(gòu)科技「低代碼+音視頻」解決方案?即構(gòu)科技為何會選擇低代碼作為云通訊技術(shù)的突破口?有沒有典型案例可以分享?

顏延:像剛才提到的,我們在各行各業(yè)的業(yè)務(wù)結(jié)合和創(chuàng)造價值的過程中,發(fā)現(xiàn)我們需要更進一步做解決方案的優(yōu)化。因為即構(gòu)科技最初通過PaaS的形態(tài)提供產(chǎn)品服務(wù)的,這對于客戶的要求和標準較高,因此,我們做低價碼方案時,選擇去做aPaaS形態(tài)的方案。

此外,aPaaS 不用像 SaaS 廠商那樣重復(fù)組裝車輛的過程,而是依靠行業(yè)套件為客戶提供一輛輛成型的‘裸車’,用更接近于客戶產(chǎn)品的組合方式,將技術(shù)利用起來。

因此在疫情期間,即構(gòu)科技推出的小程序電商直播方案迎來了用戶需求高峰。受疫情影響,線下商場、專賣店、連鎖店的客戶都希望可以通過電商直播來完成自救,但是這些商家往往對如何通過音視頻SDK集成來搭建線上直播間沒有基本的概念。

針對這一需求,即構(gòu)科技將電商直播的核心功能封裝成“音視頻直播、商品列表、商品推送、IM 互動、后臺管理”等多個模塊,依托aPaaS模式為其提供服務(wù)。小程序電商直播的客戶,只需提前與即構(gòu)科技溝通場景需求,并提供一個小程序賬號,即構(gòu)在該小程序上進行技術(shù)部署,3-5天就能為客戶搭建一個多個功能的小程序直播間。我們省掉了小程序的構(gòu)建過程,省掉了如何上新、如何推送、如何讓主播進行后續(xù)管理等運營前期的準備過程,讓小程序電商直播的方案交付時間縮減了 90% 以上,客戶拓展速度提升了12倍。

另外在泛娛樂領(lǐng)域,我們通過全面了解熱門玩法,打造新的標準方案。比如線上 K 歌場景,我們是行業(yè)第一個落地真實時合唱場景的技術(shù)服務(wù)商,系統(tǒng)解決了以往線上K歌過程中,合唱者之間沒辦法實時對齊合唱的難題。我們克服了一系列技術(shù)難題后,把實時能力壓縮到了真正實施的狀態(tài),而不是用其他串行的方式去實現(xiàn)。

04 發(fā)揮技術(shù)優(yōu)勢,為客戶提供極致體驗

眾視Tech記者:音視頻云服務(wù)能夠讓端到端的互動延遲縮短到毫秒間,那么即構(gòu)科技是怎么樣利用音視頻云服務(wù)優(yōu)勢,為客戶提供解決方案的?

顏延:即構(gòu)科技的技術(shù)優(yōu)勢來源于自研的 RTC 引擎以及多云化技術(shù)架構(gòu),這一點我覺得可以分以下幾點來講:

首先是我們的自研引擎帶來的技術(shù)優(yōu)勢。為了確保能最大化的實現(xiàn)為客戶提供技術(shù)服務(wù)的目標,面對當(dāng)時現(xiàn)有的主流開源引擎的應(yīng)用局限,即構(gòu)在創(chuàng)業(yè)初期,選擇攻堅克難模式,走上了自研音視頻引擎的道路。對此,我們將能力層優(yōu)化到極致,不管是從架構(gòu)、軟件定義能力,還是算法作了補充。

其次,我們將多云化技術(shù)架構(gòu)做到了極致。我們選擇了全云化、真云化架構(gòu),深度融合頂級云商基礎(chǔ)設(shè)施,通過把它變成可商業(yè)化的技術(shù),實現(xiàn)其真正的價值,去服務(wù)社會、服務(wù)整個行業(yè)。

多云技術(shù)架構(gòu)視頻服務(wù)需要大量網(wǎng)絡(luò)帶寬和節(jié)點資源,而底層硬件、網(wǎng)絡(luò)、系統(tǒng)的穩(wěn)定性是整個平臺穩(wěn)定性的基礎(chǔ)。即構(gòu)音視頻的核心服務(wù)構(gòu)建在先進、成熟、穩(wěn)定的云計算 IaaS 能力之上,擁有十多年大規(guī)?;ヂ?lián)網(wǎng)服務(wù)的架構(gòu)實踐經(jīng)驗,在確保技術(shù)可控的前提下,把國際一流云商的技術(shù)積累和基礎(chǔ)設(shè)施整合進即構(gòu)的技術(shù)體系,相比自建基礎(chǔ)設(shè)施的提供商,即構(gòu)服務(wù)具有異常穩(wěn)定的基礎(chǔ)設(shè)施服務(wù)。

最后在服務(wù)方面,我們也在做大量工作,包括我們的服務(wù)團隊一直秉持走到業(yè)務(wù)中去,跟客戶一起成長的理念,形成與他們齊頭并進的狀態(tài)。為此,我們?yōu)榭蛻籼峁┮徽臼椒?wù),包括針對業(yè)務(wù)場景輸出博采眾長的組合方案,為業(yè)務(wù)提供技術(shù)指導(dǎo)等。

總而言之,我們從基礎(chǔ)的音視頻能力上延伸,對產(chǎn)品矩陣不斷完善,使更多的互動可能性抽象成一個個立體的產(chǎn)品形態(tài),再加上持續(xù)的優(yōu)質(zhì)服務(wù),讓客戶和開發(fā)者能完整地感知到我們的價值。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )