——聚焦行業(yè)、深入場景的應用,才是大模型的未來
將研究報告的撰寫時間,從兩個星期縮短到5分鐘。這不是給一兩句提示詞就自己生成通用報道的個人應用,而是保證準確度的行業(yè)應用,能撰寫提綱、能按需修改、能補充數據和產業(yè)政策……
在拓爾思拓天大模型成果發(fā)布會的現場實景演示中,其大模型產品展現了以上“驚人”的能力,給行業(yè)用戶帶來了功能上的震撼。
與當下大量出現的通用大模型不同,拓爾思拓天大模型聚焦在媒體、金融和政務三個行業(yè),同時深入到十個細分場景提供應用,能夠解決通用大模型存在的質量、時效、可控、成本等問題,很好地滿足行業(yè)客戶對大模型的需求。
拓爾思總裁施水才介紹說,除了行業(yè)場景的落地,高質量的數據、自研+開源增強+商業(yè)大模型合作的基礎能力,也是拓天行業(yè)大模型的核心競爭優(yōu)勢所在。
核心特點:不僅聚焦行業(yè),而且深入場景
今年以來,全球和中國的大模型市場都非?;鸨?,國內已經和即將發(fā)布的大模型就達到近百個。ChatGPT的流行帶火了大模型,但也把大家引上了toC的道路,這上百個大模型絕大多數都是類ChatGPT的通用大模型。
實際上,大模型未來的真正出路在toB。如今,很多大模型廠商已經認識到了這個問題,開始發(fā)力行業(yè)市場。其中絕大多數采用了“通用大模型+行業(yè)優(yōu)化定制”進入路徑,而拓爾思則直接從行業(yè)切入,打造媒體、金融和政務三個領域的行業(yè)大模型。
施水才表示,打造行業(yè)大模型,可以充分發(fā)揮拓爾思過去30年所積累的優(yōu)勢資源,“我們這些年做的事情,就是把技術落實到行業(yè)應用當中”。
他介紹說,之所以選擇媒體、金融和政務,是因為這三個行業(yè)的非結構化文本數據占比高,能凸顯語言大模型的優(yōu)勢;與此同時,拓爾思自1993年成立以來,也一直專注在這些行業(yè),擁有很好的積淀。
值得注意的是,拓爾思的拓天行業(yè)大模型,不僅僅實現了行業(yè)聚焦,而且進一步深入到細分的場景化應用,包括媒體行業(yè)的內容生產智能助手、新一代搜索與推薦、多模態(tài)傳播與服務,金融行業(yè)的投研、風控、審查、客服,政務行業(yè)的政策服務、新一代政民咨詢、公文輔助寫作等。
據悉,未來拓爾思還將面向更多行業(yè)、更多場景推出大模型服務。其中,網絡輿情大模型、公安大模型、知識產權大模型、法律大模型、審計大模型,已經列入計劃,將于年內推出。
先發(fā)優(yōu)勢:NLP技術、高質量數據、用戶積累
眾所周知,大模型是一個高投入、高成本的領域,尤其對數據和算力的要求很高。如果沒有雄厚的資金或者深厚的技術支持,很難將其實現商業(yè)落地。但對于在行業(yè)應用領域有著豐富經驗和積累的垂類技術型企業(yè),這反而成為了其在大模型領域的競爭優(yōu)勢。
施水才介紹說,能夠搶先躋身行業(yè)大模型賽道,是因為拓爾思擁有其他ICT廠商難以企及的先發(fā)優(yōu)勢,其中包括在NLP領域30年的技術積累、超過10年的高質量數據積累、一大批垂直行業(yè)頭部客戶積累等。
在NLP技術方面,拓爾思自成立以來,一直在引領國內全文檢索和搜索型數據庫、自然語言處理(NLP)技術的原始創(chuàng)新,并在輿情監(jiān)測等應用場景中落地。賽迪顧問前不久發(fā)布的報告顯示,在中國NLP市場競爭力分析中,拓爾思已經處于領導者象限。施水才也是我國該領域的專家。
在高質量數據方面,拓爾思擁有的數據量已經超過1500億,日均采集的數據量過億條。這些數據并非低質量的互聯網公開數據,而是來源權威可靠的高質量數據,比如全國數字報刊數據、各級新聞網站數據、新聞客戶端APP數據、團體機構社交媒體數據等。而且,這些數據都是實時更新的,能夠保證大模型推理內容的時效性。
在用戶積累方面,拓爾思的數智產品與服務已被國內外10000余家企業(yè)級用戶廣泛使用,并且在企業(yè)數字化轉型、數字政府、網絡內容安全、融媒體、金融科技和開源情報等領域實現了深度應用。拓天大模型,也集中在這些優(yōu)勢行業(yè),并充分融入了拓爾思多年積累的行業(yè)知識,提升大模型的準確度和專業(yè)性。
在NLP技術、高質量數據、行業(yè)應用場景方面的深厚積累,使得拓爾思能夠先行一步,在行業(yè)大模型市場中建立起領先優(yōu)勢。
基礎能力:以自主研發(fā)和工程化交付為保障
雖然拓天大模型不提供我們常見的通用toC服務,而是聚焦在三大行業(yè)、十大場景,但其底層仍然需要強大的AI基礎能力,包括內容生成、多輪對話、語義理解、跨模態(tài)交互、知識型搜索、邏輯推理、安全合規(guī)、數學計算、編程能力和插件擴展等能力。
施水才介紹說,拓爾思的大模型基礎能力,以自主研發(fā)為主,同時積極擁抱開源,在客戶需要時也可以與商業(yè)大模型進行合作。在中文特性增強的可控生成技術、融合搜索引擎的生成結果可信核查、融合稠密向量的跨模態(tài)能力加強、支持外界知識及時更新等四個方面,拓天大模型擁有領先的創(chuàng)新能力。
在自主研發(fā)之外,AI工程化能力,也是行業(yè)大模型從業(yè)者必備的能力,畢竟行業(yè)應用落地速度慢,是阻礙大模型迅速普及的一大瓶頸。
施水才說,與其他大模型公司不同,拓爾思一直在從事行業(yè)落地解決最后一公里的問題,具有很強的工程化交付能力。落實到行業(yè)大模型業(yè)務上,這樣的工程化交付能力,體現在模型預訓練、本地化部署、算力調優(yōu)、業(yè)務系統融合等多個方面。
拓天大模型可以通過私有化部署,來解決企業(yè)客戶最關心的數據安全可控問題;同時通過剪枝、量化、稀疏、蒸餾等優(yōu)化方案,有效降低大模型對算力資源的要求,實現大模型的輕量化部署。
強大的工程化交付能力,也讓拓爾思更了解大模型應該如何與企業(yè)的核心業(yè)務系統緊密融合。只有將大模型變成各業(yè)務板塊的“副駕駛”,才能真正在生產流程中發(fā)揮降本增效的價值。
面向未來:沿著正確的道路繼續(xù)向前
與市場上很多大模型公司只有PPT和DEMO不同,拓爾思此次發(fā)布的拓天行業(yè)大模型,已經落地應用。
施水才介紹說,拓爾思大模型的啟動,始于今年2月9日啟動的“209工程”。這一工程其實并不是從零開始的,而是把拓爾思多年的技術積累遷移到大模型上,形成新的商業(yè)模式。
如今,百度、阿里、華為都開始發(fā)力大模型的行業(yè)應用市場。施水才并不懼怕與巨頭的競爭,行業(yè)know-how的積累、客戶需求的認知,能夠幫助拓爾思建立起自己獨有的競爭優(yōu)勢。
與此同時,拓爾思也在積極構建行業(yè)大模型的生態(tài)合作體系,與模型伙伴、算力伙伴、應用伙伴、數據伙伴、投資伙伴等建立起緊密的合作關系,共同研發(fā)和推廣行業(yè)大模型,甚至與客戶共同拓展市場。
除了在行業(yè)大客戶的項目式交付,SaaS化交付模式也在施水才的構想當中。他希望通過云服務的模式,將行業(yè)大模型的場景化應用,落地到更多的中小企業(yè)客戶,實現AI的普惠化。
施水才認為,行業(yè)大模型的未來在于:場景集成化、AI應用原生化、部署工業(yè)化。沿著這種路徑,拓爾思正在實現行業(yè)大模型應用的快速落地,推動如今火熱的大模型市場朝著有應用、有場景、有商業(yè)模式的軌道健康發(fā)展。
面向未來,施水才表示,做大模型需要有理想、有信念、有情懷。作為一家上市公司,拓爾思既要背負當期業(yè)績的壓力,保證投資的回報,又要為長遠的發(fā)展布局,但施水才仍然堅定地把行業(yè)大模型這一面向未來的事業(yè)做下去,因為他相信這是一條正確的道路。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )