總覽Git和GitHub是任何想要編程的數(shù)據(jù)科學專業(yè)人員的必備工具在此面向初學者的綜合指南中,可以了解到Git和GitHub的相關內(nèi)容和意義介紹。“一個人能做的事情很少,但我們一起,就可以做很多事情。” ——海倫·凱勒聽說過版本控制嗎?當我開始編程時,我還沒聽說過這個工具。尤其是在為各種數(shù)據(jù)科學任務編寫代碼時頭暈目眩,那時還沒有意識到編寫高效代碼的重要性以及管理整個代碼庫的必要性。直到進入這個行業(yè)時,才明白版本控制的重要性。我學到的第一件事是清楚了Git和GitHub的意義。雖然一直很了解它們(經(jīng)常使用它們來克隆Google Research和其他頂級數(shù)據(jù)科學組織的開源代碼),但從未真正理解它們的真正用途。
版本控制之美對我來說是一個啟示。我可以創(chuàng)建一個遠程項目,讓我所有的團隊成員同時獨立地處理不同的功能,但在一天結束時仍然有一個穩(wěn)定的運行代碼,這種方式讓我著迷。瞬間,我發(fā)現(xiàn)了一個解決在協(xié)作項目時曾經(jīng)面臨的問題的靈丹妙藥。我非常高興與你分享這篇有關Git和GitHub的文章。我們將介紹這兩種工具的工作方式以及如何使用它們使你的數(shù)據(jù)科學項目更容易跟蹤。作為數(shù)據(jù)科學家,你需要對這些工具有扎實的了解。你不僅會面臨有關此問題的面試問題,而且你將在數(shù)據(jù)科學領域中非常依賴Git和GitHub。
如果你正在與一個項目的其他數(shù)據(jù)科學家合作(這種情況經(jīng)常發(fā)生),那么有時你必須更新一段代碼或一個功能。Git和GitHub將在這里幫助你創(chuàng)建更好的工作流程。無論你進行什么更改,你都可以輕松地將其提供給所有協(xié)作者。如果你輸入有誤,也可以隨時回到以前的版本目錄。
什么是Git?什么是GitHub?熟悉Git術語Git入門初始化存儲庫配置Git了解如何在Git中提交文件查看日志在GitHub上上傳到遠程存儲庫將Git遠程添加到你的存儲庫使用Push克隆GitHub存儲庫分支與合并使用Pull為世界貢獻力量尾注讓我們深入了解Git和GitHub的世界!
什么是Git?Git(https://git-scm.com/) 是一種廣泛使用的版本控制系統(tǒng)(Version Control System ,VCS),可讓你跟蹤對代碼所做的所有修改。這意味著,如果新功能引起了任何錯誤,都可以輕松回到以前的版本。但是Git不只是VCS,它還是分布式VCS。這意味著項目的每個協(xié)作者都將擁有在本地計算機上所做更改的歷史記錄,因此人們可以處理項目的不同功能,而不必與托管該項目的遠程版本服務器進行通信。你可以輕松地將對項目所做的任何更改與遠程副本合并,這將大大提高工作效率。由于它是用C語言編寫的,所以速度和性能從一開始就在Git中根深蒂固。除此之外,在實際保存對項目的任何更改之前,Git還提供了大量緩存區(qū)。如果你想了解更多有關Git的信息,請訪問其官方網(wǎng)站(https://git-scm.com/about/branching-and-merging) ,找到問題的答案!
什么是GitHub?GitHub(https://github.com/) 是一個廣泛使用的版本控制平臺,其核心是Git,它使你可以托管項目的遠程版本,所有協(xié)作者都可以從中訪問它。不僅你自己的團隊成員,而且GitHub的任何成員都可以為你的代碼做出貢獻(當然,如果你選擇接受所做的更改)。我們將在本文中詳細討論這些。GitHub就像一個社交平臺,你可以在其中找到大量帶有其代碼的開源項目。在該平臺上可以找到所有新興技術。你可以在驚人的項目上進行合作,并就自己的貢獻進行討論!這將是你找到的最佳開源平臺,也是數(shù)據(jù)科學家的夢想!你可以在GitHub看看我們最好的開源數(shù)據(jù)科學項目,每月都收集在這里:(https://www.a(chǎn)nalyticsvidhya.com/blog/tag/github-repositories)在GitHub上可以做很多事情,讓我們開始吧。熟悉Git術語存儲庫(Repository)
Repository或Repo是一個文件夾,其中包含所有項目文件和每個文件所做的修訂歷史。在項目的整個生命周期中,將使用項目的兩個存儲庫:遠程存儲庫和本地存儲庫:遠程存儲庫包含你的項目,任何人從任何地方都可以訪問它。你的遠程存儲庫位于GitHub服務器上,任何人都可以訪問它們本地存儲庫是駐留在本地計算機上的遠程存儲庫的副本。你所做的所有更改將保存在本地存儲庫中。除非你將它們推送到遠程存儲庫,否則你的同伴開發(fā)人員將無法看到它們克?。–loning)git clone < Repo-URL >克隆意味著在本地計算機上創(chuàng)建遠程存儲庫的副本?,F(xiàn)在,你可以在本地計算機上對項目進行更改。提交(Commit)git commit -m “< commit message >”提交更改時,將對文件所做的更改保存在repo中。在本地計算機上使用Git時,使用commit命令會將文件保存在本地存儲庫中,要在遠程存儲庫中進行這些更改,你可以使用push命令。推送(Push)git push origin < branch >Push命令允許你將本地存儲庫上的所有更改傳輸?shù)竭h程存儲庫上。傳輸之后,所有其他開發(fā)人員都可以訪問你所做的更改,并且他們可以更新其本地存儲庫。拉?。≒ull)git pull < remote-repo >如果push意味著將代碼傳輸?shù)竭h程存儲庫,則Pull命令允許你將所有更改從遠程存儲庫傳輸?shù)奖镜卮鎯臁R虼?,開發(fā)人員將其推送到遠程存儲庫的任何更改,都可以使用pull命令將其轉移到本地存儲庫中。你還需要了解一些術語,但現(xiàn)在不需要。我們將在本文的后半部分詳細介紹它們?,F(xiàn)在,讓我們創(chuàng)建我們的第一個GitHub存儲庫!Git入門你應該做的第一件事是在系統(tǒng)上下載Git。對已經(jīng)準備好的人表示敬意!其他人,請轉到此處(https://git-scm.com/downloads) 為你的操作系統(tǒng)下載Git。這很簡單,你可以很快完成?,F(xiàn)在,Git程序旨在與Unix風格的命令行環(huán)境一起使用。Linux和macOS已經(jīng)在其本地命令行終端中為此提供了一個接口。因此,我在本文中使用的所有git命令都可以在其終端上正常工作。但是,Windows具有完全不同的命令行界面,稱為命令提示符,它不是Unix風格的命令行環(huán)境,那么我們該怎么辦?不用擔心,你在安裝Git時已經(jīng)安裝了Git Bash。Git Bash是Windows的命令行界面,可以模擬Git命令行,因此只要你在Git Bash中實現(xiàn)Git命令,就可以了。我將交替使用術語“終端”或“命令行”來指代macOS和Linux用戶的命令行環(huán)境,以及Windows用戶的Git Bash。我要你做的下一件事是創(chuàng)建一個項目文件夾,你將在其中保存本地存儲庫,然后按照以下步驟在該項目文件夾中打開終端:打開終端或Git Bash鍵入命令cd,這意味著更改目錄(或文件夾)導航到項目文件夾所在的位置,但不要打開它現(xiàn)在,只需將文件夾拖放到終端內(nèi)即可,這會將終端導航到你的項目目錄/工作目錄
準備好開始使用Git!初始化存儲庫存儲庫或存儲庫是一個文件夾,其中包含所有項目文件和對每個文件進行的修訂。你在上面創(chuàng)建的項目目錄不是存儲庫,一個存儲庫需要使用git init命令(https://git-scm.com/docs/git-init) 初始化。
完成此操作后,將在項目/工作存儲庫中創(chuàng)建一個隱藏的.git文件夾,這是你本地的Git存儲庫。如果看不到它,可能是因為它是隱藏的,你需要更改設置中的某些屬性以使其可見,但是也不用擔心,即使你沒有看到它,它仍然存在。Git會將你對項目文件所做的所有更改存儲在此文件夾中。
配置Git但是在我們對存儲庫進行任何更改之前,我們希望Git知道我們是誰。我們可以使用git config命令來做到這一點。使用此設置,我們可以設置用戶名和用戶電子郵件地址?,F(xiàn)在,每次我們提交時,Git都會保存此信息,以便你知道誰進行了更改。git config — global user.namegit config — global user.email
如果使用–global選項,則Git將為系統(tǒng)中的所有存儲庫保存此信息,如果只希望為該特定存儲庫保存信息,則可以將其省略。了解如何在Git中提交文件現(xiàn)在,你可以開始構建項目并將文件添加到項目目錄。我的項目是用不同的編程語言編寫“ Hello world”,因此我將為此目的在我的項目目錄中添加一些文件,你也應該對項目目錄執(zhí)行相同的操作,因為它現(xiàn)在為空。創(chuàng)建文件并將其添加到項目目錄后,你可以使用git add <file-name>將它們添加到本地Git存儲庫中。
如果要一次添加多個文件,請使用git add。
我們完成了嗎?提交更改的命令不是用別的命令嗎?你是絕對正確的!我們尚未將文件添加到本地存儲庫。我們剛剛告訴Git,已經(jīng)進行了一些更改,我們希望將這些更改保存在下一次提交/保存中,到目前為止,這些“added”文件位于一個名為“ 暫存區(qū)”的位置。暫存區(qū)是工作目錄和本地repo之間的一個中間位置,在將所做的任何更改提交到repo之前,都可以在這里進行檢查。
1234下一頁>(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )