MIT發(fā)布史上最強科學計算編程語言?

高層速讀

關鍵信息:備受期待的 Julia1.0 累積了開發(fā)者近十年的努力。JuliaCon2018 舉行了發(fā)布會,該社區(qū)正式將該版本設置為 1.0.0.。

關鍵數(shù)據(jù):研究者利用 Julia 在一臺超級計算機上分析天文圖像,速度提升了 1000 倍,在 15 分鐘內(nèi)將接近 2 億個天體進行分類。

關鍵意義:隨著人工智能的興起,現(xiàn)實世界對計算的速度及性能要求也越來越高,不同的編程語言由于自身的局限性難以兼顧,Julia打破了傳統(tǒng)編程語言的局限性

本月初,隨著的 1.0 版本發(fā)布的消息確認,一門名為“Julia”的高性能動態(tài)編程語言一夜之間刷爆了朋友圈和 GitHub。

MIT發(fā)布史上最強科學計算編程語言?

首先科普一下什么是“Julia”的高性能動態(tài)編程語言” ,Julia是一個新的高性能動態(tài)高級編程語言。語法和其他編程語言類似,易于其他語言用戶學習。Julia擁有豐富的函數(shù)庫,提供了數(shù)字精度、精致的增幅 器(sophisticated amplifier)和分布式并行運行方式。核心函數(shù)庫等大多數(shù)庫是由Julia編寫,但也用成熟的C和FORTRAN庫來處理線性代數(shù)、隨機數(shù)產(chǎn)生和字 符串處理等問題。Julia語言可定義函數(shù)并且根據(jù)用戶自定義的參數(shù)類型組合再進行重載。

這個編程語言的新版本之所以受到整個人工智能界的關注,最主要的原因正是其將 C 語言的速度、Ruby 的靈活、Python 的通用性前所未有地結(jié)合在一起,支持并行處理,易于學習和使用,尤其適合科學和工程計算。

更早之前,在今年 TOIBE 8 月份編程語言排行榜上,Julia 已迅速攀升至第 50 名。根據(jù) Julia 開發(fā)團隊的說法,在七項基礎算法的測試中,Julia 比 Python 快 20 倍,比 R 快 100 倍,比 Matlab 快 93 倍。也有越來越多的人相信,Julia 會成為未來的主流編程語言。

MIT發(fā)布史上最強科學計算編程語言?

圖丨在過去的三個月中,Julia 在 RedMonk 的排名中上升了三位,排名第 36 位(來源:RedMonk)

Julia 的崛起,與目前編程語言發(fā)展遭遇的瓶頸息息相關:隨著人工智能尤其是機器學習的興起,現(xiàn)實世界對計算的速度及性能要求也越來越高,不同的編程語言由于自身的局限性難以兼顧,例如說,在 Julia 誕生之前,很多人不得不把同樣的程序進行多次處理:首先使用 Python 或 R 這樣的語言來開發(fā)一種算法,并通過這些語言制作圖表,然后再用 C++或 Java 改寫程序,以獲得更好的計算機處理性能。

突破這種瓶頸無疑有兩個方向,一是基于現(xiàn)有編程語言進行優(yōu)化,二是“將革命進行到底”——專門開發(fā)一門新語言。后者自然成本更高。

Julia 的開發(fā)人員顯然選擇了后者,而且他們的野心不?。篔ulia 被專門設計為用于快速運行基礎數(shù)學,這正是大多數(shù)數(shù)據(jù)科學的基礎,如矩陣表達式和線性代數(shù)。

它的誕生可追溯到 2009 年。當時,正是基于對現(xiàn)有編程語言的“不滿”,麻省理工學院啟動了一個新型編程語言開發(fā)計劃,到了 2012 年的時候,這個計劃有了初步的成果,也就是如今的 Julia。

具體而言,Julia 項目由麻省理工學院教授 Alan Edelman 領導,另外幾位關鍵創(chuàng)造者則包括Jeff Bezanson(“Julia”名字來自于 Bezanson 的一個舊項目)、Stefan Karpinski 和 Viral Shah。其大部分關鍵發(fā)展成果都來自麻省理工學院的 Julia 實驗室,也有超過 700 名志愿者參與了 1.0 版本的制作。

“我們想開發(fā)一種開源的編程語言,我們希望這門語言有 C 語言一樣的速度、R 語言一樣的靈活性,有同像性(homoiconicity), 有像 Lisp 語言那樣擁有真正的宏特性,但是也像 Matlab 一樣有易于理解、被人所熟悉的數(shù)學標記。我們希望它像 Python 一樣易用,像 R 語言一樣適用于統(tǒng)計,像 Perl 一樣適用于字符串處理,處理線性代數(shù)像 Matlab 一樣強大,像 DOS 命令一樣擅長粘合程序。這似乎看起來簡單易學,但是想要讓黑客樂意去迎合它卻不是簡單之事。我們希望它具有互動性且能夠被編譯”,在《Why we created Julia》這篇文章中,Julia 團隊如此解釋他們開發(fā)這個語言的初衷。

MIT發(fā)布史上最強科學計算編程語言?

圖丨Viral Shah(來源:DT 君)

Viral Shah 也曾經(jīng)表示:“如果你是一名數(shù)學家、科學家或者工程師,你可以選擇一種速度快的語言,比如 C++或 Java,又或是任意一種容易學習的語言,比如 Matlab,R,或 Python,所以我們創(chuàng)造了 Julia 這種又快又便捷的語言。”如今,他已經(jīng)成為 Julia Computing 公司的 CEO,該公司致力于幫助其他公司使用 Julia 語言。

當然,Julia 的問世,除了讓人感慨 IT 行業(yè)發(fā)展之快、推陳出新之迅猛,另一方面也向所有人提出了一個新的問題:我究竟要不要學習這門新語言。這個問題將非常重要,就像 Y-Combinator 的聯(lián)合創(chuàng)始人 Paul Graham 所說的,“當你可以選擇你要用的編程語言時,不使用最強的那一種將是一個錯誤”。

在過去一年中,研究者利用 Julia 在一臺超級計算機上分析天文圖像,速度提升了 1000 倍,在 15 分鐘內(nèi)將接近 2 億個天體進行分類。從技術(shù)上來看,這種語言還會長期發(fā)展下去。然而,現(xiàn)在是一個里程碑的時刻:在本周于倫敦舉辦的 Julia 語言年會上,Julia 1.0 正式發(fā)布!一起發(fā)布的還有 JuliaCon。

Julia 的開發(fā)者之一、就職于 MIT 計算機科學與人工智能實驗室(CSAIL)的教授 Alan Edelman 表示:Julia 1.0 的發(fā)布證明,該語言已經(jīng)做好準備,將 Python 和 R 的高效性和易用性與 C++的閃電速度結(jié)合在一起,改變技術(shù)世界。

MIT發(fā)布史上最強科學計算編程語言?

圖丨Alan Edelman(來源:麻省理工學院官網(wǎng))

從實際應用來說,Julia 已經(jīng)用于自動駕駛汽車、機器人和 3D 打印機,此外還廣泛應用于精準醫(yī)療、增強現(xiàn)實、基因組學及風險管理。從 Julia 的生態(tài)系統(tǒng)來說,目前它主要的特征或應用領域為數(shù)據(jù)可視化、一般性的 UI 與網(wǎng)站、數(shù)據(jù)科學、機器學習、科學計算與平行計算等。

MIT發(fā)布史上最強科學計算編程語言?

Julia 目前下載量已經(jīng)達到了 200 萬次,且 Julia 社區(qū)開發(fā)了超過 1900 多個擴展包。這些擴展包包含各種各樣的數(shù)學庫、數(shù)學運算工具和用于通用計算的庫。除此之外,Julia 語言還可以輕松使用 Python、R、C/C++ 和 Java 中的庫,這極大地擴展了 Julia 語言的使用范圍。

MIT發(fā)布史上最強科學計算編程語言?

Julia 團隊

Julia 開發(fā)者對該語言提出了很多需求:

我們想要一種十分自由的開源語言,同時兼具 C 語言的速度和 Ruby 語言的靈活度。我們想要一種同像性語言,具有像 Lisp 一樣真正的宏,也有像 Maltlab 一樣淺顯易懂的數(shù)學符號。它是像 Python 一樣有用的通用編程語言,像 R 語言一樣便于統(tǒng)計的語言,像 Perl 一樣自然的字符串處理語言,像 Matlab 一樣強大的線性代數(shù)語言,也是像 shell 一樣的「膠水語言」。它簡單易學,卻能讓嚴苛的黑客們?yōu)橹畠A心。我們希望它兼具交互性和可編譯性。

圍繞這一語言,一個欣欣向榮的社區(qū)已經(jīng)蓬勃發(fā)展起來,為了同一目標,世界各地的人們不斷地重塑并改進著 Julia。超過 700 人對 Julia 做出了實質(zhì)性貢獻,更有不計其數(shù)的人制造了數(shù)千個驚人的 Julia 開源包??傊?,我們構(gòu)建了一種這樣的語言:

快速:Julia 為高性能而生。Julia 程序通過 LLVM 為多個平臺編譯高效的本地代碼。

通用:它使用多分派作為范例,使得表達許多面向?qū)ο蠛秃瘮?shù)式的編程模式變得容易。標準庫提供異步 I/O、進程控制、日志記錄、性能分析、包管理器等。

動態(tài):Julia 是動態(tài)型語言,與腳本語言類似,并且支持交互式使用。

專業(yè):它擅長數(shù)值計算,其語法適用于數(shù)學,支持多種數(shù)值數(shù)據(jù)類型,并具有良好

并行性:Julia 的多分派天生適合定義數(shù)字和類數(shù)組的數(shù)據(jù)類型。

多樣:Julia 擁有豐富的描述性數(shù)據(jù)類型,類型聲明使程序條理清晰且穩(wěn)定。

可組合:Julia 的包可以很好地組合在一起。單位數(shù)量的矩陣,或者貨幣和顏色的數(shù)據(jù)列表,都可以組合——而且性能很好。

當然,Julia 1.0 中最重要的一個新特征是對語言 API 穩(wěn)定性的承諾:為 Julia 1.0 編寫的代碼可以繼續(xù)在 Julia 1.1、1.2 等版本上使用。該語言是「完全成熟的」,核心語言開發(fā)者和社區(qū)都可以基于這個堅實的基礎構(gòu)建新的包、工具和特征。

Julia 1.0 不僅涉及穩(wěn)定性,還引入了多種新的強大、創(chuàng)新性語言功能。自 0.6 版本以來的新功能如下,更多詳細與準確的內(nèi)容請查看更新文檔原文:

一種全新的內(nèi)置程序包管理器給 Julia 1.0 帶來巨大的性能提升,并令其相比以往更容易進行程序包和依賴庫安裝。它還支持每項目(per-project)的包環(huán)境,并記錄工作應用的明確狀態(tài)來和其他人(以及你的未來項目)共享。最后,該新設計還完全支持私人包和軟件包存儲庫。你可以使用相同的工具安裝和管理你用于開源包生態(tài)系統(tǒng)的私人包。JuliaCon 的展示視頻對新設計和行為提供了很好的概述。

Julia 擁有對缺失值的新的標準表示。允許表示和處理缺失數(shù)據(jù)對于統(tǒng)計和數(shù)據(jù)科學來說是很基礎的。在典型的 Julia 編程形式中,新的解決方案是通用的、可組合的和高性能的。任何泛用群集類型可以高效地支持缺失值,僅需要允許元素包含預定義值 missing。這種「統(tǒng)一類型化」的群集的性能在過去版本中可能會非常慢,但如今的編譯器改進已經(jīng)允許 Julia 在其它系統(tǒng)中匹配自定義 C 或 C++的缺失值表示的速度,同時在通用性和靈活性上也遠遠超越過去的版本。

內(nèi)置的 String 類型現(xiàn)在可以安全地支持任意數(shù)據(jù)。你的程序不會在一項工作中因為無效 Unicode 的單個丟失字節(jié)就浪費數(shù)小時或數(shù)天的時間。所有的字符串數(shù)據(jù)在指示哪些字符是有效或無效的同時就已經(jīng)被保存,允許你的應用安全、方便地處理包含所有不可避免瑕疵的真實世界數(shù)據(jù)。

廣播(broadcasting)由于方便的語法特性已經(jīng)成為了一種核心的語言功能,并且已經(jīng)比過去更加強大。在 Julia 1.0 中,可以很簡單地將廣播擴展到自定義類型,并在 GPU 和其它向量化硬件上實現(xiàn)高效的優(yōu)化計算,為未來更高的性能效益奠定了基礎。

命名元數(shù)組是一種新的語言功能,可以通過命名使數(shù)據(jù)表示和訪問更加高效和方便。例如,你可以將一行數(shù)據(jù)表示為 row = (name="Julia", version=v"1.0.0", releases=8),并使用 row.version 來訪問 version 列,它與不那么便利的 row [2] 有相同的性能。

點運算符現(xiàn)在可以重載,并允許類型使用 obj.property 句法獲取除 getting 和 setting 結(jié)構(gòu)域外的含義。這對于使用 Python 和 Java 等面向?qū)ο笳Z言之間更加平滑的交互操作非常有用。屬性訪問器重載還允許獲取一列數(shù)據(jù)的語法匹配命名元組的語法:你可以編寫 table.version 以訪問表中的 version 列,這就和使用 row.version 訪問行的 version 字段一樣。

Julia 優(yōu)化器在很多方面比我們列出來的特征還要優(yōu)秀,但這里只會提一些亮點。優(yōu)化器現(xiàn)在可以通過函數(shù)調(diào)用傳播常數(shù),因此比以前能更好地消除無用代碼和實現(xiàn)靜態(tài)評估。編譯器在避免為長期目標分配短期包裝器方面也做得更好,這使得開發(fā)者能使用便捷的高級抽象并且不會產(chǎn)生性能損失。

現(xiàn)在可以用聲明參數(shù)類型的構(gòu)造函數(shù)的方式調(diào)用它們自己,這消除了語言句法中令人困惑且模糊的地方。

完全重新設計迭代協(xié)議,使之更易實現(xiàn)多種可迭代量。Julia 1.0 沒有設計三種不同泛型函數(shù)(start、next、done)的方法,而是設計 iterate 函數(shù)的一參數(shù)和二參數(shù)方法。這通常允許在開始狀態(tài)使用包含默認值的單一定義來便捷地定義迭代。更重要的是,這使得實現(xiàn)只在嘗試并無法生成值后才知道它們已經(jīng)被實施過的迭代器成為可能。這些迭代器在輸入/輸出(I/O)、網(wǎng)絡和生產(chǎn)者/消費者模式中是非常普遍的,Julia 可以用一種直接、準確的方式表達這些迭代器。

作用域規(guī)則(scope rule)被簡化。局部作用域的結(jié)構(gòu)現(xiàn)在可以一致地進行使用,不用管某命名的全局約束是否已經(jīng)存在。

Julia 語言本身是非常好的學習器,很多組件被分割封裝進 Julia 的標準庫包,而不是作為基礎語言的一部分。如果你需要它們,可以導入它們(無需安裝)。未來,標準庫還將出現(xiàn)多種版本,并獨立于 Julia 更新,這使得它們可以更快地迭代。

欲獲取更多人工智能最新行業(yè)資訊及深度報告:AIBizHerald

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2018-08-27
MIT發(fā)布史上最強科學計算編程語言?
研究者利用Julia在一臺超級計算機上分析天文圖像,速度提升了1000倍,在15分鐘內(nèi)將接近2億個天體進行分類。

長按掃碼 閱讀全文