企業(yè)數(shù)據(jù)在生成人工智能中的關(guān)鍵作用

大量基于GenAI的工具和應(yīng)用涌入市場。其中一些應(yīng)用非常聰明且富有創(chuàng)意,但它們大多是ChatGPT等應(yīng)用背后的大型語言模型(LLM)的包裝器。這并不是要貶低LLM的語言、概念和單詞關(guān)系知識可以提供新的效率和生產(chǎn)力的數(shù)千種潛在場景。

但LLM和ChatGPT無法解決組織的所有信息問題。機器學(xué)習(xí)是人工智能應(yīng)用的核心。企業(yè)技術(shù)堆棧中的傳統(tǒng)工具(例如ERP、數(shù)據(jù)倉庫、電子商務(wù)和內(nèi)容/知識管理)越來越多地將機器學(xué)習(xí)納入核心功能。

檢索增強生成(RAG)

檢索增強生成(RAG)克服了這些限制。這種方法使用企業(yè)的數(shù)據(jù)作為事實來源。它不依賴于LLM對世界的了解,而是解釋用戶的查詢,通過多種機制之一檢索信息,并使答案易于人類理解和對話。但它需要組織的信息作為參考點——企業(yè)真相的來源,這是競爭差異化的源泉。

這些信息是什么樣的?它從客戶、交易和產(chǎn)品數(shù)據(jù)和內(nèi)容以及目標(biāo)市場特有的知識和專業(yè)知識以及企業(yè)的核心能力開始。您如何解決客戶遇到的問題?您如何通過產(chǎn)品和服務(wù)吸引目標(biāo)客戶?您的供應(yīng)商關(guān)系和供應(yīng)鏈理解如何幫助您擊敗競爭對手?

這些都是競爭差異化的來源。每一項都通過了解從供應(yīng)商到制造和分銷到最終客戶的數(shù)據(jù)、知識和內(nèi)容流來管理,包括了解接觸他們的最佳方式以及使用哪些營銷內(nèi)容。

GenAI似乎可以為創(chuàng)建營銷內(nèi)容提供很大幫助。但你們的GenAI營銷內(nèi)容與其他人有何不同?更好的提示?更多創(chuàng)意問題?上下文信息?仍然需要有人性和創(chuàng)造性的元素。機器可以實現(xiàn)自動化,但仍然需要人類來連接。我們不能將人類的能力外包給機器。

雖然機器學(xué)習(xí)和新一代人工智能工具可以使人類的許多日常活動和死記硬背的活動自動化,但仍然需要填寫訂單和在目錄中組織產(chǎn)品。用戶需要搜索感興趣的產(chǎn)品。他們需要了解、選擇、購買、使用和維護您組織的產(chǎn)品或解決方案。

這些功能中的每一個都需要一個數(shù)據(jù)存儲庫,而數(shù)據(jù)需要一定的結(jié)構(gòu)。企業(yè)中數(shù)據(jù)的核心結(jié)構(gòu)被稱為主數(shù)據(jù)。主數(shù)據(jù)有多種類型——客戶產(chǎn)品、財務(wù)、交易和內(nèi)容。市場上有許多不同的工具來解決該領(lǐng)域的特定用例。

主數(shù)據(jù)忽略了細微差別

但僅靠主數(shù)據(jù)就忽略了數(shù)據(jù)的許多細微差別和價值。通過了解一條信息如何與另一條信息相關(guān),可以得出并應(yīng)用真正的見解??蛻羯矸輬D是一種數(shù)據(jù)表示形式,它說明了各種屬性(例如客戶類型、興趣、過去的購買情況、購買意圖等)之間的關(guān)系。客戶身份圖可以幫助電子商務(wù)應(yīng)用向該客戶展示最相關(guān)的產(chǎn)品。這來自于整個客戶旅程中每個接觸點的數(shù)據(jù)耗盡時捕獲的客戶詳細信息。

接觸點留下數(shù)據(jù)痕跡

每個客戶接觸點都由各種客戶體驗技術(shù)支持,并且每個接觸點都在數(shù)據(jù)模型中捕獲客戶詳細信息-客戶描述符:人口統(tǒng)計、企業(yè)結(jié)構(gòu)、市場細分、技術(shù)素養(yǎng)、購買的產(chǎn)品以及更多詳細信息。這些描述符在機器學(xué)習(xí)中被稱為特征,它們也可以被稱為“屬性”,描述潛在客戶或客戶特征的元數(shù)據(jù)。他們是誰?我們對他們了解多少?他們?yōu)槭裁匆?guī)模的組織工作?他們的角色或地位是什么?他們的興趣是什么?他們的技術(shù)熟練程度如何?他們試圖實現(xiàn)什么目標(biāo)?他們對企業(yè)的總體職責(zé)是什么?

使用RAG減少幻覺

RAG顯著擴展了大型語言模型(LLM)在企業(yè)環(huán)境中的范圍。通常,雖然LLM擅長文本創(chuàng)作,但他們無法從企業(yè)數(shù)據(jù)庫中提取具體、詳細的數(shù)據(jù)。RAG通過檢索必要的信息來解決這個問題,以確保人工智能生成的響應(yīng)既相關(guān)又準(zhǔn)確。

信息預(yù)處理類似于現(xiàn)實世界圖書館中的編目。這包括將信息組織成類別并向每條信息分配關(guān)鍵字以便于檢索和識別。這個過程有助于使數(shù)據(jù)更容易訪問、更容易搜索和理解。

構(gòu)建參考庫

將組織好的數(shù)據(jù)存儲在矢量數(shù)據(jù)庫或合適的位置,為無縫集成到文本生成過程中奠定基礎(chǔ)。它涉及根據(jù)相關(guān)關(guān)鍵字或術(shù)語創(chuàng)建層次結(jié)構(gòu),然后可以使用該結(jié)構(gòu)快速輕松地定位相關(guān)文檔或文本。這可以比作在圖書館根據(jù)相關(guān)主題或類型將書籍上架的過程,這可以幫助顧客快速找到他們需要的資料。

編目系統(tǒng)以客戶身份圖為基礎(chǔ)(以及其他圖數(shù)據(jù)結(jié)構(gòu))。讓LLM能夠為客戶或員工獲得正確的答案意味著根據(jù)他們的背景檢索信息。這種背景來自他們在旅途中拋出的數(shù)字肢體語言。LLM是令人驚嘆的算法。但他們需要企業(yè)數(shù)據(jù)來提供真正的效用和競爭優(yōu)勢。這需要對這些數(shù)據(jù)、內(nèi)容和客戶目錄進行建模,以便LLM可以檢索正確的信息,而不是將其留給自己的、可能產(chǎn)生幻覺的設(shè)備。獲得這些問題的答案取決于是否有適當(dāng)策劃和結(jié)構(gòu)化的企業(yè)信息。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-02-21
企業(yè)數(shù)據(jù)在生成人工智能中的關(guān)鍵作用
大量基于GenAI的工具和應(yīng)用涌入市場。其中一些應(yīng)用非常聰明且富有創(chuàng)意,但它們大多是ChatGPT等應(yīng)用背后的大型語言模型(LLM)的包裝器。這并不是要貶低LLM的語言、概念和單詞關(guān)系知識可以提供新的效率和生產(chǎn)力的數(shù)千種潛在場景。

長按掃碼 閱讀全文