几周前我提dao过若何经由过程应用git的提交元数据(metadata)和Rapleaf API 来收集Github上热点组织的一些统计材料(日记, 每个组织的数据)。

如今我又对这些数据按编程说话而bu是组织进行划分产生了兴趣。网上关于各编程说话对应的屌丝法度榜样员的描述比比皆是,但我照样很好奇它们是若何与实际中的人们对应起来的。一开端,我想先简单地统计一下每种编程说话应用者的年纪、收入和性别。基于我已经收集的数据,这一工作照样比较轻松的:

  • 对于统计每个repo应用的编程说话,我应用Github自带的说话统计成果。例如,Github估计这个项目中75%是java代码。
  • 统计了每个项目中某种说话代码占用大年夜于50%的那些供献者的收入
  • 过滤出那些收入点>100的编程说话

须要解释的是:

  • 所有这些数据都来自开源项目,因而可能无fa精确地表现那些闭源开辟者们的收入程度。
  • Rapleaf并没有完全统计所有人的收入,是以数据可能存在误差。
  • 数据(年纪、性别……)有误差
  • 没有对Github上所有项目进行统计,是以结论可能bu具有代表性。

下面是收入的统计成果,升序分列:

LanguageAverage Household Income ($)Data Points
Puppet87,589.29112
Haskell89,973.82191
PHP94,031.19978
CoffeeScript94,890.80435
VimL94,967.11532
Shell96,930.54979
Lua96,930.69101
Erlang97,306.55168
Clojure97,500.00269
Python97,578.872314
JavaScript97,598.753443
Emacs Lisp97,774.65355
C#97,823.31665
Ruby98,238.743242
C++99,147.93845
CSS99,881.40527
Perl100,295.45990
C100,766.512120
Go101,158.01231
Scala101,460.91243
ColdFusion101,536.70109
Objective-C101,801.60562
Groovy102,650.86116
Java103,179.391402
XSLT106,199.19123
ActionScript108,119.47113

r6FNfVP.png

这是上表对应的柱状图:

对于大年夜多半说话的排名照样比较相符预期的,得出了一下结论:

  • Haskell是一种异常学术化的(academic)说话,是以学术界bu会以薪资而有名。
  • PHP是一种异常通用的说话,通俗的、年青的、低收入的法度榜样员都可以上手。
  • 从图谱右侧最高的部分可看出,Java和ActionScript多用于企业级软件的开辟,是以其薪资待遇是相当的可不雅。

另一方面,因为对某些说话,像XSLT, Puppet, CoffeeScriptbu太熟悉,大年夜家zhi道为什么这些说话排名较高或收入较低吗?感激告zhi。

最后,对统计成果或方fa有任何想fa或建议请告zhi我,我还会再出一份按年纪、性别排名的编程说话申报。

via:http://bpodgursky.wordpress.com/2013/08/21/average-income-per-programming-language/