啦啦啦资源视频在线观看8,午夜无码十八禁在线观看,97精品伊人久久久大香线蕉

關(guān)于人工智能給數(shù)據(jù)中心電力帶來的問題，已經(jīng)有很多報道。緩解壓力的一種方法是使用“邊緣LLM”，這使得人工智能系統(tǒng)能夠在pc、平板電腦、筆記本電腦和智能手機(jī)上本地運行。

邊緣LLM的明顯優(yōu)勢包括降低LLM培訓(xùn)成本、減少查詢LLM的延遲、增強(qiáng)用戶隱私并提高可靠性。

如果能夠通過降低處理能力需求來減輕數(shù)據(jù)中心的壓力，那么邊緣的llm就有可能消除對千兆瓦級人工智能數(shù)據(jù)中心工廠的需求。但這種方法真的可行嗎？

隨著有關(guān)將支撐生成式人工智能的LLM轉(zhuǎn)移到邊緣的討論越來越多，我們仔細(xì)研究了這種轉(zhuǎn)變是否能夠真正減輕數(shù)據(jù)中心的壓力。

智能手機(jī)引領(lǐng)邊緣人工智能

發(fā)展最快的邊緣AI用例是智能手機(jī)上的輕量級LLM。華為已開發(fā)了不同大小的LLMPangu5.0，最小版本已與其智能手機(jī)操作系統(tǒng)HarmonyOS集成。運行該操作系統(tǒng)的設(shè)備包括華為Mate30Pro5G。

與此同時，三星開發(fā)了GaussLLM，用于三星GalaxyAI，該技術(shù)在其旗艦智能手機(jī)三星S24中運行。其AI功能包括實時翻譯、語音轉(zhuǎn)文本和總結(jié)筆記、圓圈搜索以及照片和消息輔助。

三星電子的LPDDR5XDRAM半導(dǎo)體也進(jìn)入了量產(chǎn)階段。這些12納米芯片直接在設(shè)備上處理內(nèi)存工作負(fù)載，使手機(jī)的操作系統(tǒng)能夠更快地與存儲設(shè)備一起工作，從而更有效地處理人工智能工作負(fù)載。

總體而言，智能手機(jī)制造商正在努力縮小LLM的大小。他們正試圖將其參數(shù)數(shù)量從ChatGPT-3的1750億個減少到20億個左右。

英特爾和AMD也參與了邊緣AI的開發(fā)。AMD正在開發(fā)能夠快速本地運行300億參數(shù)LLM的筆記本電腦芯片。同樣，英特爾也組建了一個合作伙伴生態(tài)系統(tǒng)，正在努力開發(fā)AIPC。這些支持AI的設(shè)備可能比普通型號更貴。但加價可能不會像預(yù)期的那么高，而且隨著采用率的提高，加價可能會大幅下降。

邊緣AI的昂貴部分主要在于訓(xùn)練。在推理模式下使用的訓(xùn)練模型不需要昂貴的設(shè)備來運行。早期的部署可能是針對錯誤和“幻覺”不太重要且聲譽(yù)受損風(fēng)險不太可能太大的場景。

示例包括增強(qiáng)型推薦引擎、人工智能驅(qū)動的互聯(lián)網(wǎng)搜索以及創(chuàng)建插圖或設(shè)計。在這里，依靠用戶來檢測可疑的響應(yīng)或表現(xiàn)不佳的圖像和設(shè)計。

數(shù)據(jù)中心對LLM的影響

隨著數(shù)據(jù)中心準(zhǔn)備大幅增加密度和功率需求以支持人工智能的發(fā)展，邊緣趨勢的LLM對數(shù)字基礎(chǔ)設(shè)施意味著什么？

在可預(yù)見的未來，在邊緣運行的模型將繼續(xù)在數(shù)據(jù)中心進(jìn)行訓(xùn)練。因此，目前來自人工智能的大量流量在短期內(nèi)不太可能減弱。但數(shù)據(jù)中心內(nèi)訓(xùn)練的模型已經(jīng)在發(fā)生變化。來自O(shè)penAI、谷歌和亞馬遜等企業(yè)的大規(guī)模模型將繼續(xù)存在。但規(guī)模較小、更專注的LLM正在崛起。

到2027年，企業(yè)使用的GenAI模型中將有超過50%專門針對某個行業(yè)或業(yè)務(wù)功能，而2023年這一比例約為1%。領(lǐng)域模型可以更小、計算強(qiáng)度更低，并降低與通用模型相關(guān)的幻覺風(fēng)險。

為減少GenAI的大小和處理強(qiáng)度而開展的開發(fā)工作，將延伸到可在各種設(shè)備上運行的更高效的邊緣LLM。一旦邊緣LLM獲得發(fā)展勢頭，它們有望減少需要在集中式數(shù)據(jù)中心進(jìn)行的AI處理量，這完全取決于規(guī)模。

目前，LLM訓(xùn)練在很大程度上主導(dǎo)了GenAI，因為模型仍在創(chuàng)建或完善中。但想象一下，數(shù)億用戶在智能手機(jī)和PC上本地使用LLM，查詢必須通過大型數(shù)據(jù)中心進(jìn)行處理。從規(guī)模上講，這種流量可能會讓數(shù)據(jù)中心不堪重負(fù)。因此，LLM在邊緣的價值可能要等到它們進(jìn)入主流后才能實現(xiàn)。

LLM：安全與隱私

任何與云端的LLM進(jìn)行交互的人，都有可能使組織面臨隱私問題和網(wǎng)絡(luò)安全漏洞的可能性。

隨著越來越多的查詢和提示在企業(yè)外部進(jìn)行，人們開始質(zhì)疑誰有權(quán)訪問這些數(shù)據(jù)。畢竟，用戶正在向人工智能系統(tǒng)詢問有關(guān)他們的健康、財務(wù)和業(yè)務(wù)的各種問題。

為此，這些用戶經(jīng)常輸入個人身份信息(PII)、敏感醫(yī)療保健數(shù)據(jù)、客戶信息甚至企業(yè)機(jī)密。

轉(zhuǎn)向規(guī)模較小的LLM，這些LLM可以包含在企業(yè)數(shù)據(jù)中心內(nèi)（因此不在云中運行），也可以在本地設(shè)備上運行，這是繞過廣泛使用LLM（如ChatGPT）所帶來的許多持續(xù)安全和隱私問題的一種方式。

如果使用人工智能作為個人助理，并且要處理機(jī)密信息、你不想公開的敏感信息，那么邊緣的安全和隱私確實非常重要。

邊緣LLM發(fā)展趨勢

邊緣上的LLM不會立即顯現(xiàn)出來——除了少數(shù)特殊用例。但邊緣趨勢似乎勢不可擋。67%的組織基礎(chǔ)設(shè)施硬件決策者已經(jīng)采用邊緣智能或正在采用。約三分之一的企業(yè)還將收集和執(zhí)行邊緣環(huán)境的AI分析，以便為員工提供更高、更快的價值洞察。

企業(yè)希望從移動設(shè)備、物聯(lián)網(wǎng)和其他設(shè)備收集相關(guān)輸入，以便在客戶提出要求或需要更大價值時為他們提供相關(guān)的用例驅(qū)動的洞察。

公用事業(yè)、采礦和交通維護(hù)等行業(yè)的現(xiàn)場工程和運營已經(jīng)面向個人設(shè)備，并已準(zhǔn)備好進(jìn)行LLM增強(qiáng)。由于此類邊緣LLM應(yīng)用具有商業(yè)價值，因此預(yù)計為具有LLM功能的現(xiàn)場設(shè)備或手機(jī)支付更多費用將不再是問題。

隨著采用率的提高，硬件價格下降后，邊緣LLM才能被消費者和企業(yè)廣泛使用。例如，AppleVisionPro主要部署在價格合理的商業(yè)解決方案中。

近期的其他用例包括電信和網(wǎng)絡(luò)管理、智能建筑和工廠自動化。Goetz表示，邊緣LLM的更高級用例（例如沉浸式零售和自動駕駛汽車）將不得不等待五年或更長時間。

在我們看到個人設(shè)備上的LLM蓬勃發(fā)展之前，針對特定行業(yè)和業(yè)務(wù)流程的專業(yè)LLM將會出現(xiàn)增長。一旦這些開發(fā)出來，就更容易擴(kuò)展和采用，因為不需要同時訓(xùn)練和調(diào)整模型、縮小模型和部署模型。

CIBIS峰會

由千家網(wǎng)主辦的2024年第25屆CIBIS建筑智能化峰會即將開啟，本屆峰會主題為：“匯智提質(zhì)：開啟未來新篇章”。屆時，我們將攜手全球知名智能化品牌及業(yè)內(nèi)專家，共同探討物聯(lián)網(wǎng)、AI、云計算、大數(shù)據(jù)、智慧建筑、智能家居、智慧安防等熱點話題與最新技術(shù)應(yīng)用，分享如何利用更智慧、更高效、更安全、更低碳的智慧技術(shù)，共同開啟未來美好智慧生活。

歡迎建筑智能化行業(yè)小伙伴報名參會，共同分享交流！

報名方式

長沙站（10月24日）：https://hdxu.cn/MrRqa

成都站（11月05日）：https://hdxu.cn/7FoIq

西安站（11月07日）：https://hdxu.cn/ToURP

北京站（11月19日）：https://hdxu.cn/aeV0J

上海站（11月21日）：https://hdxu.cn/xCWWb

廣州站（12月05日）：https://hdxu.cn/QaqDj

更多2024年峰會信息，詳見峰會官網(wǎng)：http://summit.qianjia.com

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

LLM如何幫助解決人工智能數(shù)據(jù)中心問題

下一篇