9月7日消息,據(jù)外媒援引知情人士透露,蘋果始終在增加構(gòu)建人工智能所需計(jì)算的預(yù)算,并且已經(jīng)擴(kuò)大到每天數(shù)百萬美元。該公司的一個(gè)目標(biāo)是開發(fā)一些功能,允許iPhone用戶使用簡單的語音命令來自動(dòng)執(zhí)行涉及多個(gè)步驟的任務(wù)。舉例來說,這項(xiàng)技術(shù)可以讓用戶命令Siri語音助手用他們最近拍攝的五張照片創(chuàng)建GIF動(dòng)圖,并將其發(fā)送給朋友。如今,iPhone用戶必須手動(dòng)完成這個(gè)過程。
據(jù)了解該團(tuán)隊(duì)的人士稱,早在四年前,蘋果的人工智能主管約翰·詹南德里亞(John Giannandrea)就被授權(quán)組建團(tuán)隊(duì),開發(fā)被稱為大語言模型(LLM)的對話式人工智能(或稱生成式人工智能)。當(dāng)時(shí),這項(xiàng)技術(shù)尚未成為軟件行業(yè)的焦點(diǎn)。在OpenAI于去年推出聊天機(jī)器人ChatGPT之后,人們才發(fā)現(xiàn)蘋果有先見之明。聊天機(jī)器人ChatGPT推動(dòng)了大語言模型的繁榮。
幾位蘋果員工表示,盡管詹南德里亞多次表達(dá)了對由人工智能語言模型驅(qū)動(dòng)的聊天機(jī)器人潛在用途的懷疑,但蘋果并不是完全沒有為語言模型的繁榮做好準(zhǔn)備。這要?dú)w功于詹南德里亞,他幫助對蘋果的軟件研究文化做出了改變。
這些變化現(xiàn)在正獲得回報(bào),因?yàn)榇笳Z言模型的出現(xiàn)可能會(huì)改變?nèi)藗儎?chuàng)造一切東西的方式,從計(jì)算機(jī)程序到幻燈片演示再到書籍,都是如此。這項(xiàng)技術(shù)還有望自動(dòng)化涉及文本的繁瑣、重復(fù)性的任務(wù),從摘要到處理企業(yè)IT票據(jù)或客戶服務(wù)查詢等。
這個(gè)名為“基礎(chǔ)模型”(Foundational Models)的對話式人工智能團(tuán)隊(duì),由幾位曾在谷歌工作多年的工程師組成,詹南德里亞在加入蘋果之前是他們的主管。該團(tuán)隊(duì)由龐若明(Ruoming Pang,音譯)領(lǐng)導(dǎo),他于2021年加入蘋果,此前在谷歌工作了15年,包括詹南德里亞負(fù)責(zé)領(lǐng)導(dǎo)的人工智能研究部門。
蘋果組建多個(gè)LLM團(tuán)隊(duì)
知情人士表示,“基礎(chǔ)模型”團(tuán)隊(duì)的規(guī)模仍然很小,大約有16人,但用于培訓(xùn)蘋果最先進(jìn)模型的預(yù)算已經(jīng)增加到每天數(shù)百萬美元。相比之下,開發(fā)ChatGPT的初創(chuàng)企業(yè)OpenAI首席執(zhí)行官薩姆·奧特曼(Sam Altman)曾表示,該公司在幾個(gè)月的時(shí)間里,花費(fèi)了超過1億美元來培訓(xùn)GPT-4,這是該公司為聊天機(jī)器人提供支持的最先進(jìn)軟件。
蘋果的“基礎(chǔ)模型”團(tuán)隊(duì)扮演著與谷歌和Meta等公司人工智能團(tuán)隊(duì)類似的角色。在這些公司,研究人員需要構(gòu)建人工智能模型,然后其他團(tuán)隊(duì)將這些模型應(yīng)用到公司的各種產(chǎn)品中。
不過,蘋果似乎至少還有另外兩個(gè)相對較新的團(tuán)隊(duì),正在開發(fā)語言或圖像模型。蘋果最近的一份人工智能研究報(bào)告和LinkedIn上的員工簡介顯示,該公司存在一個(gè)“視覺智能”(Visual Intelligence)團(tuán)隊(duì),致力于開發(fā)能夠生成“圖像、視頻或3D場景”的軟件。
另一個(gè)團(tuán)隊(duì)正在進(jìn)行涉及多模式人工智能的長期研究,這種模型可以識別和生成圖像、視頻或文本。這個(gè)多模式團(tuán)隊(duì)的領(lǐng)導(dǎo)者之一是喬恩·什倫斯(Jon Shlens),他曾在2021年底開始在蘋果工作,之前在谷歌從事人工智能工作。什倫斯于今年早些時(shí)候加入了谷歌的人工智能團(tuán)隊(duì)(現(xiàn)在被稱為Google DeepMind)。谷歌即將推出的Gemini模型具有多模式功能。
蘋果“基礎(chǔ)模型”團(tuán)隊(duì)已經(jīng)開發(fā)出幾個(gè)先進(jìn)的模型,并正在內(nèi)部測試。一位直接了解蘋果聊天機(jī)器人開發(fā)情況的人士說,一款基于大語言模型的蘋果聊天機(jī)器人最終可能會(huì)與使用蘋果AppleCare客戶互動(dòng)。AppleCare是該公司提供保修和技術(shù)支持的售后服務(wù)。
Siri升級
另外,Siri團(tuán)隊(duì)也計(jì)劃整合大語言模型,讓蘋果的智能語音助手用戶以目前無法實(shí)現(xiàn)的方式自動(dòng)完成某些復(fù)雜的任務(wù),比如前面提到的用簡單指令創(chuàng)建和發(fā)送GIF的例子。這項(xiàng)新功能與蘋果的快捷方式應(yīng)用Shortcuts有關(guān),該應(yīng)用允許用戶使用不同的應(yīng)用手動(dòng)編程一系列操作,預(yù)計(jì)將于明年與新版iPhone操作系統(tǒng)一起發(fā)布。一位知情人士說,谷歌也一直在努力將其大語言模型與語音助手整合,以便能夠理解和處理更復(fù)雜的任務(wù)。
據(jù)這位知情人士透露,蘋果“基礎(chǔ)模型”團(tuán)隊(duì)中的成員認(rèn)為,其最先進(jìn)的大語言模型AJAX GPT的功能超過了OpenAI的GPT 3.5,后者是支持ChatGPT最初版本的大語言模型。自那以后,OpenAI推出了一系列功能明顯更強(qiáng)大的模型。
關(guān)于蘋果如何在其產(chǎn)品中融入大語言模型,目前仍不清楚細(xì)節(jié)。據(jù)多位離職的蘋果機(jī)器學(xué)習(xí)工程師說,該公司領(lǐng)導(dǎo)層更喜歡在設(shè)備上運(yùn)行軟件,這提高了隱私和性能,而不是在云服務(wù)器上運(yùn)行。
但這可能很難實(shí)現(xiàn)。例如,據(jù)一位直接了解該模型的人士透露,AJAX GPT已經(jīng)接受了2000多億個(gè)參數(shù)的培訓(xùn)。參數(shù)反映了機(jī)器學(xué)習(xí)模型的大小和復(fù)雜性,參數(shù)數(shù)量越多,表示模型越復(fù)雜,需要更多的存儲(chǔ)空間和計(jì)算能力。一個(gè)擁有2000多億個(gè)參數(shù)的大語言模型,可能不適合在iPhone上運(yùn)行。
縮小大語言模型的規(guī)模已經(jīng)有先例可循。例如,谷歌的PaLM 2有四種尺寸,其中一種可以在設(shè)備上使用,另一種則可以離線使用。
蘋果發(fā)言人拒絕就此置評。
谷歌的影響力
詹南德里亞被同事們稱為J.G.,他最初加入蘋果是為了幫助改進(jìn)Siri,并為蘋果的軟件注入更多的機(jī)器學(xué)習(xí)功能。盡管他曾多次向同事們表示,對由大語言模型驅(qū)動(dòng)的聊天機(jī)器人的潛在用途持懷疑態(tài)度,但一位知情人士表示,在過去一年里,在看到一些內(nèi)部演示后,他開始承認(rèn)這項(xiàng)技術(shù)有能力完成指定任務(wù)。
蘋果“基礎(chǔ)模型”團(tuán)隊(duì)的組建源于詹南德里亞的決定,他希望讓蘋果更像他的前雇主,讓員工在進(jìn)行各種研究和發(fā)表論文方面有更大的靈活性。此前,對這些做法的限制損害了蘋果招聘人才的能力,盡管該公司成功地在其產(chǎn)品中使用了早期的人工智能技術(shù)。
2018年加入蘋果后,詹南德雷亞幫助從谷歌招聘了關(guān)鍵工程師和研究人員。他還支持更多地使用谷歌的云服務(wù),包括安裝了谷歌開發(fā)的人工智能芯片(即張量處理單元)的服務(wù)器,用來訓(xùn)練蘋果的機(jī)器學(xué)習(xí)模型,進(jìn)而幫助改進(jìn)Siri和提高其他產(chǎn)品功能。
據(jù)了解龐若明的人說,他在神經(jīng)網(wǎng)絡(luò)方面發(fā)表的研究成果吸引了大批追隨者。神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)的一個(gè)子集,涉及訓(xùn)練軟件識別數(shù)據(jù)中的模式和關(guān)系,類似于人類大腦的工作方式。龐若明某些比較著名的研究涉及神經(jīng)網(wǎng)絡(luò)如何與手機(jī)處理器協(xié)同工作,以及如何使用并行計(jì)算來訓(xùn)練神經(jīng)網(wǎng)絡(luò),并行計(jì)算是將較大的問題分解成多個(gè)處理器可以同時(shí)計(jì)算的較小任務(wù)的過程。
開源運(yùn)動(dòng)
龐若明對蘋果的影響可以從AXLearn中看出來,這是他的團(tuán)隊(duì)在過去1年中開發(fā)用于培訓(xùn)AJAX GPT的內(nèi)部軟件。AXLearn是一個(gè)機(jī)器學(xué)習(xí)框架,可以快速訓(xùn)練機(jī)器學(xué)習(xí)模型。AXLearn的部分構(gòu)成基于龐若明的研究,并針對谷歌張量處理單元進(jìn)行了優(yōu)化。
AXLearn是JAX的一個(gè)分支,JAX是谷歌研究人員開發(fā)的開源框架。如果將蘋果的AJAX GPT比作一棟房子,那AXLearn就是藍(lán)圖,而JAX就是用來繪制藍(lán)圖的筆和紙。蘋果用來培訓(xùn)大語言模型的數(shù)據(jù)主要源自建筑行業(yè),目前尚未公開。
今年7月份,蘋果“基礎(chǔ)模型”團(tuán)隊(duì)悄悄地將AXLearn的代碼上傳到代碼存儲(chǔ)庫GitHub,公眾可以使用它來培訓(xùn)自己的大語言模型,而不必從頭開始構(gòu)建所有內(nèi)容。蘋果公開發(fā)布AXLearn代碼的原因尚不清楚,但公司這樣做通常是希望其他工程師能對模型進(jìn)行改進(jìn)。在詹南德雷亞到來之前,對于向來行事隱秘的蘋果來說,開放可用于商業(yè)用途的源代碼的決定顯得不同尋常。
團(tuán)隊(duì)領(lǐng)導(dǎo)
荷蘭計(jì)算機(jī)科學(xué)家阿瑟·范·霍夫(Arthur Van Hoff)最初領(lǐng)導(dǎo)的團(tuán)隊(duì),后來成為蘋果“基礎(chǔ)模型”團(tuán)隊(duì)的骨干。據(jù)熟悉霍夫的人說,他是上世紀(jì)90年代開發(fā)Java的太陽微系統(tǒng)公司團(tuán)隊(duì)的早期成員,后來成為了知名的企業(yè)家?;舴蛴?019年加入蘋果,最初致力于開發(fā)新版Siri,內(nèi)部代號為黑鳥(Blackbird),但蘋果最終放棄了這個(gè)版本。
然后,霍夫的團(tuán)隊(duì)開始專注于構(gòu)建大語言模型,他們的目標(biāo)是將其用于黑鳥的基本版本。該團(tuán)隊(duì)最初只有幾名員工,其中最著名的是兩名專門從事自然語言處理的英國研究人員湯姆·岡特(Tom Gunter)和托馬斯·尼克森(Thomas Nickson)。這兩位研究人員都在牛津大學(xué)獲得了高等學(xué)位,并于2016年加入蘋果從事Siri的研究。
據(jù)知情人士透露,2021年,龐若明加入蘋果,幫助培訓(xùn)尖端的大語言模型。與其他蘋果研究人員不同,他獲得了留在紐約的特殊請求,并被授權(quán)在那里為公司的機(jī)器學(xué)習(xí)團(tuán)隊(duì)建立一個(gè)新的前哨基地。幾個(gè)月后,蘋果聘請了谷歌前人工智能高管達(dá)芙妮·梁(Daphne Luong)來監(jiān)督霍夫的團(tuán)隊(duì),并聘請谷歌研究員薩米·本吉奧(Samy Bengio)領(lǐng)導(dǎo)一個(gè)專注于長期機(jī)器學(xué)習(xí)研究的平行團(tuán)隊(duì)。
龐若明如今接管了“基礎(chǔ)模型”團(tuán)隊(duì),而霍夫則在今年早些時(shí)候開始無限期休假。據(jù)知情人士透露,龐若明團(tuán)隊(duì)的幾名成員目前常駐紐約。
谷歌云交易
龐若明被招聘之際,蘋果內(nèi)部越來越意識到大語言模型在機(jī)器學(xué)習(xí)領(lǐng)域正變得越來越重要。據(jù)知情人士透露,OpenAI的GPT-3于2020年6月發(fā)布,這促使蘋果機(jī)器學(xué)習(xí)團(tuán)隊(duì)要求獲得更多資金來訓(xùn)練他們自己的模型。
據(jù)兩名直接了解此事的人士透露,為了節(jié)省成本,蘋果的管理人員歷來鼓勵(lì)機(jī)器學(xué)習(xí)工程師使用谷歌的云計(jì)算服務(wù),而不是亞馬遜的類似服務(wù),因?yàn)楣雀璧某杀靖汀?/p>
據(jù)一位熟悉相關(guān)討論的離職蘋果高管透露,谷歌高管過去曾對蘋果表示,云服務(wù)定價(jià)較低,在一定程度上是對兩家公司之間廣泛商業(yè)合作的認(rèn)可。根據(jù)協(xié)議,谷歌搜索是蘋果Safari瀏覽器的默認(rèn)搜索提供商。多年來,蘋果始終是全球最大的云服務(wù)器租賃商,并已成為谷歌云的最大客戶之一,盡管它仍然是亞馬遜的重要客戶。
一名知情人士表示,蘋果還積極從谷歌和Meta的人工智能團(tuán)隊(duì)中招募人才。自從AXLearn代碼于7月上傳到GitHub上以來,已有18人對其進(jìn)行了改進(jìn),其中至少有12人在過去兩年內(nèi)加入了蘋果的機(jī)器學(xué)習(xí)團(tuán)隊(duì)。這些人中,有7人曾在谷歌或Meta工作過。(小小)
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )