阻礙人工智能進(jìn)步的8個(gè)問(wèn)題

本文作者:Azamat Abdoullaev

今天的人工智能 (AI) 是有限的。它還有很長(zhǎng)的路要走。

一些AI研究人員發(fā)現(xiàn),計(jì)算機(jī)通過(guò)反復(fù)試驗(yàn)學(xué)習(xí)的機(jī)器學(xué)習(xí)算法已經(jīng)成為一種“神秘力量”。

不同類型的人工智能

人工智能 (AI) 的最新進(jìn)展正在改善我們生活的許多方面。

人工智能分為三種類型:

狹義人工智能 (ANI),具有狹窄的能力范圍。

通用人工智能 (AGI),與人類能力相當(dāng)。

人工超級(jí)智能 (ASI),比人類更有智能。

今天的人工智能有什么問(wèn)題?

今天的人工智能主要由統(tǒng)計(jì)學(xué)習(xí)模型和算法驅(qū)動(dòng),稱為數(shù)據(jù)分析、機(jī)器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)或深度學(xué)習(xí)。它作為 IT 基礎(chǔ)設(shè)施(ML平臺(tái)、算法、數(shù)據(jù)、計(jì)算)和開發(fā)堆棧(從庫(kù)到語(yǔ)言、IDE、工作流和可視化)的組合來(lái)實(shí)現(xiàn)。

總之,其涉及:

一些應(yīng)用數(shù)學(xué)、概率論和統(tǒng)計(jì)學(xué)

一些統(tǒng)計(jì)學(xué)習(xí)算法,邏輯回歸,線性回歸,決策樹和隨機(jī)森林

一些機(jī)器學(xué)習(xí)算法,有監(jiān)督、無(wú)監(jiān)督和強(qiáng)化

一些人工神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)算法和模型,通過(guò)多層過(guò)濾輸入數(shù)據(jù)以預(yù)測(cè)和分類信息

一些優(yōu)化(壓縮和量化)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型

一些統(tǒng)計(jì)模式和推論,例如高通神經(jīng)處理SDK,

一些編程語(yǔ)言,如 Python 和 R.

一些ML平臺(tái)、框架和運(yùn)行時(shí),例如PyTorch、ONNX、Apache MXNet、TensorFlow、Caffe2、CNTK、SciKit-Learn 和 Keras,

一些集成開發(fā)環(huán)境(IDE),如PyCharm、Microsoft VS Code、Jupyter、MATLAB等,

一些物理服務(wù)器、虛擬機(jī)、容器、專用硬件(如 GPU)、基于云的計(jì)算資源(包括虛擬機(jī)、容器和無(wú)服務(wù)器計(jì)算)。

當(dāng)今使用的大多數(shù) AI 應(yīng)用都可以歸類為狹義 AI,稱為弱 AI。

它們都缺少通用人工智能和機(jī)器學(xué)習(xí),這由三個(gè)關(guān)鍵的交互引擎定義:

世界模型 [表示、學(xué)習(xí)和推理] 機(jī),或現(xiàn)實(shí)模擬機(jī)(世界超圖網(wǎng)絡(luò))。

世界知識(shí)引擎(全球知識(shí)圖譜)

世界數(shù)據(jù)引擎(全球數(shù)據(jù)圖網(wǎng)絡(luò))

通用AI和ML和DL應(yīng)用/機(jī)器/系統(tǒng)的區(qū)別在于將世界理解為多個(gè)似是而非的世界狀態(tài)表示,其現(xiàn)實(shí)機(jī)器和全球知識(shí)引擎以及世界數(shù)據(jù)引擎。

它是General/Real AI Stack 最重要的組成部分,與其真實(shí)世界的數(shù)據(jù)引擎交互,并提供智能功能/能力:

處理關(guān)于世界的信息

估計(jì)/計(jì)算/學(xué)習(xí)世界模型的狀態(tài)

概括其數(shù)據(jù)元素、點(diǎn)、集合

指定其數(shù)據(jù)結(jié)構(gòu)和類型

遷移其學(xué)習(xí)

將其內(nèi)容語(yǔ)境化

形成/發(fā)現(xiàn)因果數(shù)據(jù)模式,如因果規(guī)律、規(guī)則和規(guī)律

推斷所有可能的相互作用、原因、影響、循環(huán)、系統(tǒng)和網(wǎng)絡(luò)中的因果關(guān)系

以不同的范圍和規(guī)模以及不同的概括和規(guī)范水平預(yù)測(cè)/回顧世界的狀態(tài)

有效地和高效地與世界互動(dòng),適應(yīng)它,導(dǎo)航它并根據(jù)它的智能預(yù)測(cè)和處方操縱它的環(huán)境

事實(shí)上,它主要是依靠大數(shù)據(jù)計(jì)算、算法創(chuàng)新以及統(tǒng)計(jì)學(xué)習(xí)理論和聯(lián)結(jié)主義哲學(xué)的統(tǒng)計(jì)歸納推理機(jī)。

對(duì)于大多數(shù)人來(lái)說(shuō),它只是構(gòu)建一個(gè)簡(jiǎn)單的機(jī)器學(xué)習(xí) (ML) 模型,經(jīng)歷數(shù)據(jù)收集、管理、探索、特征工程、模型訓(xùn)練、評(píng)估,最后部署。

EDA:探索性數(shù)據(jù)分析

AI Ops — 管理 AI 的端到端生命周期

今天的人工智能的能力來(lái)自“機(jī)器學(xué)習(xí)”,需要針對(duì)每個(gè)不同的現(xiàn)實(shí)世界場(chǎng)景配置和調(diào)整算法。這使得它非常需要人工操作,并且需要花費(fèi)大量時(shí)間來(lái)監(jiān)督其開發(fā)。這種手動(dòng)過(guò)程也容易出錯(cuò)、效率低下且難以管理。更不用說(shuō)缺乏能夠配置和調(diào)整不同類型算法的專業(yè)知識(shí)。

配置、調(diào)整和模型選擇越來(lái)越自動(dòng)化,谷歌、微軟、亞馬遜、IBM 等所有大型科技公司都推出了類似的AutoML平臺(tái),使機(jī)器學(xué)習(xí)模型構(gòu)建過(guò)程自動(dòng)化。

AutoML涉及自動(dòng)化構(gòu)建基于機(jī)器學(xué)習(xí)算法的預(yù)測(cè)模型所需的任務(wù)。這些任務(wù)包括數(shù)據(jù)清理和預(yù)處理、特征工程、特征選擇、模型選擇和超參數(shù)調(diào)整,手動(dòng)執(zhí)行這些任務(wù)可能很乏味。

SAS4485-2020.pdf

所呈現(xiàn)的端到端 ML 管道由 3 個(gè)關(guān)鍵階段組成,同時(shí)缺少所有數(shù)據(jù)的來(lái)源,即世界本身:

自動(dòng)化機(jī)器學(xué)習(xí)——概述

Big-Tech AI 的關(guān)鍵秘密是作為暗深度神經(jīng)網(wǎng)絡(luò)的 Skin-Deep Machine Learning,它的模型需要通過(guò)大量標(biāo)記數(shù)據(jù)和包含盡可能多的層的神經(jīng)網(wǎng)絡(luò)架構(gòu)進(jìn)行訓(xùn)練。

每個(gè)任務(wù)都需要其特殊的網(wǎng)絡(luò)架構(gòu):

用于回歸和分類的人工神經(jīng)網(wǎng)絡(luò) (ANN)用于計(jì)算機(jī)視覺(jué)的卷積神經(jīng)網(wǎng)絡(luò) (CNN)用于時(shí)間序列分析的遞歸神經(jīng)網(wǎng)絡(luò) (RNN)用于特征提取的自組織映射用于推薦系統(tǒng)的深度玻爾茲曼機(jī)推薦系統(tǒng)的自動(dòng)編碼器

ANN作為一種信息處理范式被引入,似乎是受到生物神經(jīng)系統(tǒng)/大腦處理信息的方式的啟發(fā)。而這樣的人工神經(jīng)網(wǎng)絡(luò)被表示為“通用函數(shù)逼近器”,它可以學(xué)習(xí)/計(jì)算各種激活函數(shù)。

神經(jīng)網(wǎng)絡(luò)在測(cè)試階段通過(guò)特定的反向傳播和糾錯(cuò)機(jī)制進(jìn)行計(jì)算/學(xué)習(xí)。

試想一下,通過(guò)最小化錯(cuò)誤,這些多層系統(tǒng)有望有一天自己學(xué)習(xí)和概念化想法。

人工神經(jīng)網(wǎng)絡(luò) (ANN) 簡(jiǎn)介

總而言之,幾行R或Python代碼就足以實(shí)現(xiàn)機(jī)器智能,并且有大量在線資源和教程可以訓(xùn)練準(zhǔn)神經(jīng)網(wǎng)絡(luò),例如各種深度偽造網(wǎng)絡(luò),操縱圖像-視頻-音頻-文本,對(duì)世界的了解為零,如生成對(duì)抗網(wǎng)絡(luò)、BigGAN、CycleGAN、StyleGAN、GauGAN、Artbreeder、DeOldify等。

他們創(chuàng)造和修改面孔、風(fēng)景、通用圖像等,對(duì)它的全部?jī)?nèi)容了解為零。

使用循環(huán)一致的對(duì)抗網(wǎng)絡(luò)進(jìn)行不成對(duì)的圖像到圖像的轉(zhuǎn)換,使2019年成為新人工智能時(shí)代的 14 種深度學(xué)習(xí)和機(jī)器學(xué)習(xí)用途。

有無(wú)數(shù)的數(shù)字工具和框架以它們自己的方式運(yùn)行:

開放語(yǔ)言——Python是最受歡迎的,R和 Scala也在其中。

開放框架——Scikit-learn、XGBoost、TensorFlow等。

方法和技術(shù)——從回歸到最先進(jìn)的GAN和RL的經(jīng)典ML技術(shù)

提高生產(chǎn)力的能力——可視化建模、AutoAI 以幫助進(jìn)行特征工程、算法選擇和超參數(shù)優(yōu)化

開發(fā)工具——DataRobot、H2O、Watson Studio、Azure ML Studio、Sagemaker、Anaconda 等。

令人遺憾的是,數(shù)據(jù)科學(xué)家的工作環(huán)境:scikit-learn、R、SparkML、Jupyter、R、Python、XGboost、Hadoop、Spark、TensorFlow、Keras、PyTorch、Docker、Plumbr 等等,不勝枚舉。

現(xiàn)代 AI 堆棧和 AI 即服務(wù)消費(fèi)模型

構(gòu)建 AI 堆棧

冒充人工智能的,其實(shí)是虛假冒牌的人工智能。在最好的情況下,它是一種自動(dòng)學(xué)習(xí)技術(shù),ML/DL/NN 模式識(shí)別器,本質(zhì)上是數(shù)學(xué)和統(tǒng)計(jì)性質(zhì)的,無(wú)法憑直覺(jué)行事或?qū)ζ洵h(huán)境建模,具有零智能、零學(xué)習(xí)和 零理解。

阻礙人工智能進(jìn)步的問(wèn)題

盡管有許多優(yōu)點(diǎn),人工智能并不完美。以下是阻礙人工智能進(jìn)步的 8 個(gè)問(wèn)題以及根本錯(cuò)誤所在:

1. 缺乏數(shù)據(jù)

人工智能需要大量數(shù)據(jù)集進(jìn)行訓(xùn)練,這些數(shù)據(jù)集應(yīng)該具有包容性/公正性,并且質(zhì)量良好。有時(shí)他們必須等待生成新數(shù)據(jù)。

2. 耗時(shí)

人工智能需要足夠的時(shí)間讓算法學(xué)習(xí)和發(fā)展到足以以相當(dāng)高的準(zhǔn)確性和相關(guān)性實(shí)現(xiàn)其目的。它還需要大量資源才能發(fā)揮作用。這可能意味著對(duì)您的計(jì)算機(jī)能力有額外的要求。

3.結(jié)果解釋不力

另一個(gè)主要挑戰(zhàn)是準(zhǔn)確解釋算法生成的結(jié)果的能力,還必須根據(jù)自己的目的仔細(xì)選擇算法。

4. 高度易錯(cuò)

人工智能是自治的,但極易出錯(cuò)。假設(shè)使用足夠小的數(shù)據(jù)集訓(xùn)練算法,使其不具有包容性。最終會(huì)得到來(lái)自有偏見(jiàn)的訓(xùn)練集的有偏見(jiàn)的預(yù)測(cè)。在機(jī)器學(xué)習(xí)的情況下,這樣的失誤會(huì)引發(fā)一系列錯(cuò)誤,這些錯(cuò)誤可能會(huì)在很長(zhǎng)一段時(shí)間內(nèi)未被發(fā)現(xiàn)。當(dāng)他們確實(shí)被注意到時(shí),需要相當(dāng)長(zhǎng)的時(shí)間來(lái)識(shí)別問(wèn)題的根源,甚至更長(zhǎng)時(shí)間來(lái)糾正它。

5. 倫理問(wèn)題

相信數(shù)據(jù)和算法勝過(guò)我們自己的判斷的想法有其優(yōu)點(diǎn)和缺點(diǎn)。顯然,我們從這些算法中受益,否則,我們一開始就不會(huì)使用它們。這些算法使我們能夠通過(guò)使用可用數(shù)據(jù)做出明智的判斷來(lái)自動(dòng)化流程。然而,有時(shí)這意味著用算法取代某人的工作,這會(huì)帶來(lái)倫理后果。此外,如果出現(xiàn)問(wèn)題,我們應(yīng)該責(zé)怪誰(shuí)?

6. 缺乏技術(shù)資源

人工智能還是比較新的技術(shù)。從啟動(dòng)代碼到流程的維護(hù)和監(jiān)控,都需要機(jī)器學(xué)習(xí)專家來(lái)維護(hù)流程。人工智能和機(jī)器學(xué)習(xí)行業(yè)對(duì)市場(chǎng)來(lái)說(shuō)仍然比較新鮮。以人力形式尋找足夠的資源也很困難。因此,缺乏可用于開發(fā)和管理機(jī)器學(xué)習(xí)科學(xué)物質(zhì)的有才華的代表。數(shù)據(jù)研究人員通常需要混合空間洞察力,以及從頭到尾的數(shù)學(xué)、技術(shù)和科學(xué)知識(shí)。

7.基礎(chǔ)設(shè)施不足

人工智能需要大量的數(shù)據(jù)處理能力。繼承框架無(wú)法處理壓力下的責(zé)任和約束。應(yīng)該檢查基礎(chǔ)架構(gòu)是否可以處理人工智能中的問(wèn)題.、如果不能,應(yīng)該使用良好的硬件和適應(yīng)性強(qiáng)的存儲(chǔ)來(lái)完全升級(jí)。

8.緩慢的結(jié)果和偏見(jiàn)

人工智能非常耗時(shí)。由于數(shù)據(jù)和要求過(guò)載,提供結(jié)果的時(shí)間比預(yù)期的要長(zhǎng)。關(guān)注數(shù)據(jù)庫(kù)中的特定特征以概括結(jié)果在機(jī)器學(xué)習(xí)模型中很常見(jiàn),這會(huì)導(dǎo)致偏差。

結(jié)論

人工智能已經(jīng)接管了我們生活的許多方面。雖然不完美,但人工智能是一個(gè)不斷發(fā)展的領(lǐng)域,需求量很大。在沒(méi)有人為干預(yù)的情況下,它使用已經(jīng)存在和處理過(guò)的數(shù)據(jù)提供實(shí)時(shí)結(jié)果。它通常通過(guò)開發(fā)數(shù)據(jù)驅(qū)動(dòng)模型來(lái)幫助分析和評(píng)估大量數(shù)據(jù)。雖然人工智能有很多問(wèn)題,這是一個(gè)不斷發(fā)展的領(lǐng)域。從醫(yī)學(xué)診斷、疫苗研發(fā)到先進(jìn)的交易算法,人工智能已成為科學(xué)進(jìn)步的關(guān)鍵。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-05-18
阻礙人工智能進(jìn)步的8個(gè)問(wèn)題
雖然人工智能有很多問(wèn)題,這是一個(gè)不斷發(fā)展的領(lǐng)域。從醫(yī)學(xué)診斷、疫苗研發(fā)到先進(jìn)的交易算法,人工智能已成為科學(xué)進(jìn)步的關(guān)鍵。

長(zhǎng)按掃碼 閱讀全文