來源 |?Analytics Vidhya
整理 |?磐石
【磐創AI導讀】:Github是全球最大的開源代碼社區。接下來磐創AI將為大家介紹幾個六月Github熱點項目庫。歡迎大家關注我們的公眾號:磐創AI。
目錄
對于數據科學和機器學習而言,GitHub無疑是最受歡迎的平臺之一。它是在代碼和項目之間共享和協作的絕佳工具,它降低了進入開源世界的壁壘,并在傳播知識和擴展機器學習社區方面發揮了巨大的作用。
在六月份,有一些驚艷的python項目開放了源代碼。從可以定位5000個關鍵點的姿態估計模型(DensePose)到用一種模型實現多個NLP任務的Salesforce's decaNLP再到包含由詳細注釋的強化學習算法集合的git庫Reinforcement Learning Notebooks。下面將一一進行簡單介紹。
接下來,讓我們一起看看六月份的熱點Git倉庫。
今年,人體姿態估計在深度學習界引發了廣泛關注。這一趨勢在Facebook開放他們的姿態估計框架'DensePose'的源代碼后更是被推到了一個新的高度。該技術可識別人體中超過5000個關節點(對于上下文來說,其他方法以10或20個關節進行操作)。從上圖中可以看出該技術的實現結果。
DensePose已經在目標檢測平臺Detectron中創建好并由Caffe2提供支持。除了代碼之外,此存儲庫還包含用于可視化DensePose-COCO數據集的notebook。
盡管自然語言處理(NLP)有吸引力,但它無疑是一個很難步入一個領域。你需要去處理大量非結構化文本,這并不容易。而這個NLP Progress存儲庫就是專門用于跟進NLP領域最新進展的倉庫。它列舉了一些非常有用的數據集和當前依存句法分析(depency parsing)、part-of-speech tagging(詞性標注)和閱讀理解(reading comprehension)的最優方法(state-of-the-art)。
如果你對NLP領域感興趣或者茫然的話,可以star這個存儲倉庫并持續關注它的動態。同時,將來還會有一些技術補充到列表里,如信息提取技術,關系抽取技術,語法錯誤糾正技術(grammatical error correction)等。
模型的大規模應用是數據科學家進入該領域時面臨的挑戰之一,設計和構建模型又是數據科學家們進行機器學習的原因。但如果你不能將這個模型應用到實際應用中去,它本質上就變成了一塊無用的代碼。
因此,Databricks(由Spark創建者創建)決定為這些機器學習(ML)模型應用難題構建開源解決方案--名為MLflow,它是一個管理整個機器學習生命周期(從開始到生產)的平臺,并且被設計可以使用任何庫。自從它發布以來,它獲得了極大的關注(GitHub上star數1,355)。
本文另一個NLP存儲庫推薦。當涉及到情感分析或機器翻譯等自然語言處理任務時,一般來說是需要建立專門針對該任務的模型。那么,你有沒有建立一個同時可以進行情感分析、語義分析和問答的模型呢?這就是Salesforce研究人員企圖用此存儲庫去實現的效果。
他們發表了一篇研究性論文,概述了一個可以同時完成10個不同NLP任務的模型。在論文中,他們還向社區發起了一個挑戰(decaNLP)--你能建立一個這樣的模型并改進“我們”提供的方法嗎?Salesforce建造的模型被稱為“自然語言處理領域的瑞士軍刀”。
強化學習日益流行,在開源社區中同樣是如此。該存儲庫是來自Richard Sutton和Andrew Barto的書和其他研究論文中的強化學習算法的集合。這些算法以notebook的格式提供給大家。
存儲庫的創建者建議大家邊看書邊實踐這些算法,以達到更好的學習目的。這些notebook有著很詳細的注釋都,很適合有意向進入強化學習的領域的人去學習。
總結:
以上是對六月份github上幾個熱點的項目倉庫的整理總結,涵蓋計算機視覺、自然語言處理、強化學習多個領域。希望對你有所幫助,同時歡迎在評論中留言討論和推薦一些其他不錯的git存儲庫。

? 2025. All Rights Reserved. 滬ICP備2023009024號-1