5月15日消息,盡管OpenAI搶在Google I/O 2024大會(huì)之前發(fā)布了新的大模型和音視頻互動(dòng)功能,但是今天,Google一口氣發(fā)布了20多項(xiàng)AI大招,算是狠狠扳回一局。
這些Google AI大招中,在應(yīng)用端能很快就能讓用戶(hù)感知到的就有AI搜索和AI安卓系統(tǒng)等。
AI搜索
眾人期待的AI搜索并沒(méi)有在昨天OpenAI的發(fā)布會(huì)上亮相,而在今天Google I/O 2024大會(huì),Google和Alphabet CEO Sundar Pichai花了長(zhǎng)篇幅來(lái)介紹其最新的AI搜索。
這些AI搜索能力包括:
1、AI Overviews功能,相比傳統(tǒng)搜索引擎的結(jié)果,它為用戶(hù)呈現(xiàn)出完整的包括觀(guān)點(diǎn)、見(jiàn)解、鏈接的答案等。Google宣布即日起向每位美國(guó)用戶(hù)推出基于Gemini改進(jìn)的搜索體驗(yàn),本周將向更多國(guó)家開(kāi)放。
AI Overviews支持更復(fù)雜的搜索。
比如,你想找一個(gè)合適的普拉提工作室,需要同時(shí)考慮時(shí)間、價(jià)格、距離等因素。你可以在Google搜索輸入:“找到波士頓最好的瑜伽或普拉提工作室,告訴我他們的詳細(xì)介紹,以及從比肯山步行的時(shí)間。”
AI Overviews引入多步推理功能(Multi-step reasoning),把大問(wèn)題分解為小部分,并判斷優(yōu)先順序。
比如,搜索類(lèi)似于“為一組人創(chuàng)建一個(gè)易于準(zhǔn)備的3天膳食計(jì)劃”,你會(huì)得到一個(gè)從網(wǎng)上廣泛的食譜,還能直接將食譜中用到的食材等導(dǎo)出成購(gòu)物清單。這意味著用戶(hù)僅需提問(wèn),就能將所需的一切加入購(gòu)物車(chē)。
此外,Google搜索還將很快推出視頻搜索功能。例如,你在舊貨店買(mǎi)了一個(gè)唱機(jī),但當(dāng)你打開(kāi)它時(shí),它不工作了,帶針的金屬片出現(xiàn)了漂移。你可以錄制唱片機(jī)故障視頻并提問(wèn)搜索如何解決,你會(huì)得到一個(gè)解決步驟和資源,以解決問(wèn)題。
2、加持Gemini模型能力后更強(qiáng)的照片搜索(Ask Photos)功能;
使用該功能,用戶(hù)可以以自然的方式詢(xún)問(wèn)您想要的內(nèi)容。
例如:“給我看看我去過(guò)的每個(gè)國(guó)家公園里最好的照片?!盙oogle Photos就會(huì)顯示你需要的哪些照片,節(jié)省了你滾動(dòng)尋找的時(shí)間。
Ask Photos將在今年夏天推出。
此外,Google還表示,其AI搜索將很快推出多輪推理能力,可將復(fù)雜問(wèn)題分解處理,將原本需要幾分鐘甚至幾個(gè)小時(shí)的研究壓縮到在幾秒鐘內(nèi)完成,還將支持在搜索中對(duì)視頻提問(wèn)等等。
AI安卓
也是在Google I/O 2024大會(huì)前一周,有外媒放風(fēng),稱(chēng)蘋(píng)果正在考慮將OpenAI的技術(shù)整合到其下一代iPhone操作系統(tǒng)iOS 18中,并計(jì)劃在今年晚些時(shí)候?yàn)閕Phone推出一些新功能時(shí)使用OpenAI的技術(shù)。
不過(guò),關(guān)于蘋(píng)果和OpenAI合作的細(xì)節(jié)仍處于討論和計(jì)劃階段,具體合作內(nèi)容和時(shí)間表尚未最終確定。
而在Google I/O 2024大會(huì)上,Google宣布把AI直接嵌入到了安卓操作系統(tǒng)中,打造AI安卓——“首個(gè)內(nèi)置端側(cè)AI的移動(dòng)操作系統(tǒng)”。并直接甩出了未來(lái)將要具體落地AI的安卓版本——安卓15 Beta 2。
這意味著,把Gemini用在安卓系統(tǒng)底層后,所有搭載安卓系統(tǒng)的手機(jī),只要升級(jí)到安卓15 Beta 2及以后版本,都可能會(huì)享受到Google Gemini的AI能力。
一直以來(lái),蘋(píng)果iOS生態(tài)自成一系,iOS系統(tǒng)的穩(wěn)定好用是蘋(píng)果手機(jī)產(chǎn)品維持高價(jià)值的重要因素。
這次,Google率先將安卓系統(tǒng)和Gemini合體,AI安卓搶得先發(fā)優(yōu)勢(shì),壓力給到了蘋(píng)果iOS。
具體來(lái)看,在安卓上體驗(yàn)Google AI的方式包括:
1、畫(huà)圈搜索(Circle to Search):也就是哪里不會(huì)圈住哪里。你可以用一個(gè)簡(jiǎn)單的手勢(shì)圈住搜索手機(jī)上的任何東西——而不需要停止你正在做的事情或切換到不同的頁(yè)面。
例如,當(dāng)學(xué)生圈出一個(gè)他們被卡住的提示時(shí),他們會(huì)得到解決問(wèn)題的一步一步的指示,而不需要離開(kāi)當(dāng)前頁(yè)面。
Circle to Search目前已經(jīng)在超過(guò)1億臺(tái)設(shè)備上使用,有望在今年年底前將這一數(shù)字翻一番。
2、交互體驗(yàn):用戶(hù)將很快能夠在所在的應(yīng)用程序上方調(diào)出 Gemini 的疊加層,以便更輕松地以更多方式使用 Gemini。
例如,您可以將生成的圖片拖放到Gmail、Google Messages和其他地方,或者點(diǎn)擊”詢(xún)問(wèn)此視頻”,在YouTube視頻中查找特定信息。
該更新將在未來(lái)幾個(gè)月內(nèi)推出到數(shù)以?xún)|計(jì)的設(shè)備。
3、Gemini Nano 的多模態(tài)功能將引入 TalkBack,幫助視力受損或低視力的人們獲得更豐富、更清晰的圖像描述。
Gemini系列大模型
當(dāng)然,Google I/O 2024大會(huì)上最大的篇幅都是在講,能讓Google能夠腳踢蘋(píng)果iOS、拳打OpenAI的AI搜索背后的”大功臣“—— Gemini系列大模型。
會(huì)上,Google發(fā)布了包括Gemini 1.5 Flash輕量級(jí)模型、Gemini 1.5 Pro進(jìn)階版、視頻生成模型Veo、文生圖模型Imagen 3、音樂(lè)生成模型 Lyria等以及即將發(fā)布的下一代開(kāi)源大模型Gemma 2。
1、 Gemini 1.5 Flash:一個(gè)比 Gemini 1.5 Pro 更輕量級(jí)的模型,擁有 100 萬(wàn)的上下文窗口,旨在快速高效地進(jìn)行規(guī)?;?wù)。
Gemini 1.5 Flash 在總結(jié)摘要、聊天應(yīng)用、圖像和視頻字幕生成以及從長(zhǎng)文檔和表格中提取數(shù)據(jù)等方面表現(xiàn)出色。
2、Gemini 1.5 Pro:上下文窗口擴(kuò)展到 200 萬(wàn)個(gè) tokens ,另外還通過(guò)數(shù)據(jù)和算法的進(jìn)步增強(qiáng)了其代碼生成、邏輯推理和規(guī)劃、多輪對(duì)話(huà)以及音頻和圖像理解。
Gemini 1.5 Pro 可以對(duì) Google AI Studio 中上傳的視頻進(jìn)行圖像和音頻推理。同時(shí),Gemini 1.5 Pro 已經(jīng)整合到 Google 產(chǎn)品中,包括 Gemini Advanced 和 Workspace 應(yīng)用程序。
目前,100 萬(wàn) tokens 上下文窗口的Gemini 1.5 Pro 和Gemini 1.5 Flash 目前都已在 Google AI Studio 和 Vertex AI 中發(fā)布公開(kāi)預(yù)覽版。使用 API 的開(kāi)發(fā)者和 Google Cloud 客戶(hù)還可以通過(guò)候補(bǔ)名單獲取 200 萬(wàn) tokens 上下文窗口的Gemini 1.5 Pro。
3、將在未來(lái)幾周內(nèi)推出開(kāi)源模型Gemma 2:Gemma 2 采用了一種新型架構(gòu),Gemma 2 27B性能媲美Llama 3 70B,尺寸不到Llama 3 70B的一半。
4、視頻模型 Veo:可以生成高質(zhì)量的 1080p 分辨率視頻,時(shí)長(zhǎng)可超過(guò)一分鐘。Veo 基于多年的生成視頻模型工作,包括生成查詢(xún)網(wǎng)絡(luò)(GQN),DVD-GAN,Imagen-Video,Phenaki,WALT,VideoPoet 和 Lumiere — 結(jié)合架構(gòu)、scaling laws 和其他新穎技術(shù),以提高質(zhì)量和輸出分辨率。
5、高質(zhì)量文生圖模型 Imagen 3:Google目前質(zhì)量最高的文本到圖像模型,能夠生成具有更好細(xì)節(jié)、更豐富光線(xiàn)和比先前模型更少干擾性偽影的圖像。
6、音樂(lè)生成模型 Lyria:除了該模型外,還在開(kāi)發(fā)一套AI音樂(lè)創(chuàng)作工具M(jìn)usic AI Sandbox。
還有更多模型,這里不一一列出了。有需要可以閱讀Google文檔。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 《全職高手》登陸上海北外灘 成二次元愛(ài)好者熱門(mén)打卡地
- 新勢(shì)力2025年將迎決戰(zhàn)?銷(xiāo)量翻番才能活下去?
- 馬蜂窩大數(shù)據(jù):“元旦一日游”熱度上漲166%,不少人選擇“請(qǐng)四休九”
- 亞馬遜云科技陳曉建:2025年很多客戶(hù)將從生成式AI原型驗(yàn)證轉(zhuǎn)為生產(chǎn)應(yīng)用
- 林肯中國(guó)回應(yīng)“并入福特中國(guó)”傳聞:簡(jiǎn)化財(cái)務(wù)體系 各項(xiàng)業(yè)務(wù)保持不變
- 要做中國(guó)的OpenAI?字節(jié)跳動(dòng)2024年研發(fā)開(kāi)支接近BAT之和
- 螞蟻旗下跨境匯款平臺(tái)為開(kāi)發(fā)者提供收款服務(wù) 每日限額10萬(wàn)美元
- 要買(mǎi)車(chē)還能再等等!2025年新能源車(chē),這些關(guān)鍵技術(shù)將有重大升級(jí)
- AAAA,三七互娛發(fā)起的游心公益基金會(huì)社會(huì)組織評(píng)估等級(jí)再提升
- 網(wǎng)易云音樂(lè)2024年度聽(tīng)歌報(bào)告刷屏 你最喜歡的歌手是誰(shuí)?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。