ML基礎(chǔ) | 一文詳解正態(tài)分布(附python實(shí)現(xiàn))

正態(tài)分布簡(jiǎn)介

你聽(tīng)說(shuō)過(guò)鐘形曲線嗎?它往往是全球人們討論最多的話題之一。很長(zhǎng)一段時(shí)間以來(lái),鐘形曲線決定了對(duì)員工的專業(yè)評(píng)估,可以是一個(gè)受人喜愛(ài)或令人恐懼的話題,而這取決于與誰(shuí)交談!看看這張圖片:

你認(rèn)為曲線的形狀意味著什么?作為一個(gè)數(shù)據(jù)科學(xué)家(或一個(gè)有抱負(fù)的科學(xué)家),你應(yīng)該能夠馬上回答這個(gè)問(wèn)題。在許多其他應(yīng)用中,鐘形曲線背后的思想是正態(tài)分布。正態(tài)分布是統(tǒng)計(jì)學(xué)的核心概念,是數(shù)據(jù)科學(xué)的支柱。在進(jìn)行探索性數(shù)據(jù)分析時(shí),我們首先探索數(shù)據(jù),而目的是找出其概率分布,對(duì)嗎?猜猜看,最常見(jiàn)的概率分布是什么?就是正態(tài)分布。看看這三個(gè)非常常見(jiàn)的正態(tài)分布示例:

你可以清楚地看到,出生體重、智商得分和股價(jià)回報(bào)率往往形成一個(gè)鐘形曲線。同樣,還有許多其他的社會(huì)和自然數(shù)據(jù)集遵循正態(tài)分布。正態(tài)分布對(duì)數(shù)據(jù)科學(xué)家來(lái)說(shuō)變得至關(guān)重要的另一個(gè)原因是中心極限定理,這個(gè)定理解釋了數(shù)學(xué)的魔力,是假設(shè)檢驗(yàn)的基礎(chǔ)。中心極限定理:https://www.a(chǎn)nalyticsvidhya.com/blog/2019/05/statistics-101-introduction-central-limit-theorem/?utm_source=blog&utm_medium=statistics-data-science-normal-distribution在本文中,我們將了解正態(tài)分布的意義和不同性質(zhì),以及如何使用這些性質(zhì)來(lái)檢查數(shù)據(jù)的正態(tài)性。目錄正態(tài)分布的性質(zhì)正態(tài)分布的經(jīng)驗(yàn)法則什么是標(biāo)準(zhǔn)正態(tài)分布?熟悉偏態(tài)分布左偏分布右偏分布如何檢驗(yàn)分布的正態(tài)性直方圖KDE圖Q_Q圖偏度峰度實(shí)現(xiàn)和理解正態(tài)分布的Python代碼正態(tài)分布的性質(zhì)

我們稱這條鐘形曲線為正態(tài)分布,卡爾·弗里德里?!じ咚拱l(fā)現(xiàn)了它,所以有時(shí)我們也把它稱為高斯分布。我們只需使用兩個(gè)參數(shù)即可簡(jiǎn)化正態(tài)分布的概率密度:平均值

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2020-06-02
ML基礎(chǔ) | 一文詳解正態(tài)分布(附python實(shí)現(xiàn))
正態(tài)分布簡(jiǎn)介你聽(tīng)說(shuō)過(guò)鐘形曲線嗎?它往往是全球人們討論最多的話題之一。

長(zhǎng)按掃碼 閱讀全文