近几年,天天有人张口闭口说开源,而不久前“儿童编程届”五年级开始学已经晚了的“tensorflow”就是GitHub上2018年最热门的开源项目。什么是开源?什么是开源项目?什么是开源协议?以及在码农届几乎无人不知无人不用的GitHub又是什么呢?
开源(open source),在互联网领域,可以简单理解为是“开放源代码”的简称。通常来说,指的是将软件项目的源代码向大众开放,允许大众获取、使用、修改和发行。在硬件等其它领域也可以套用开源的概念,本文暂不提。
开源项目(open source project),简单理解就是,开放源代码的软件项目。可以认为,开源项目的产出物是软件程序,这包括,一个开源项目,可以不断对一款开源软件进行维护和升级,或者有可能在一个开源项目中,产出多款不同的开源软件(但很可能彼此有联系)。
开源软件(open source software),直接的字面意思是公开源代码的软件,也就是说,如果软件的源代码是开源的,那么这个软件就可以称之为开源软件。不过,对于很多商业公司来说,开源软件,只能看作是某个开源项目给出的“软件示例”而已,因为软件的源代码已经开放出来了,那么这些商业公司,完全可以根据自己的需要,基于这个示例,修改或衍生出真正适合自己的软件产品。
开源社区(open source community),为某个开源项目的开发成员提供的一个学习和交流的空间。由于开源项目常常需要散布在全世界的开发人员共同参与推进,所以开源社区就成了他们沟通交流的必要途径。
开源协议(Open Source License),是指开源软件所遵循的许可协议,获得了开源软件的用户,需要在该协议的允许范围内对软件的源代码进行使用、修改和发行(包括以盈利为目的商业发行)。
GitHub,是一个面向软件项目的托管平台,可以用于托管各种类型的软件项目,包括开源项目和私有项目。由于大量开源项目基于GitHub进行托管,方便来自世界各地的开发人员共同工作以及获取开源软件,所以在开源项目领域,GitHub的影响力很大,是开源项目的首选托管平台。
用一句话串联一下这几个概念:在GitHub上,发布了一个软件项目,是开源的,这个开源项目会产出一款使用了MIT开源协议的开源软件供大家免费获取,如果想加入这个开源项目共同工作,可以来这个项目的开源社区参与讨论,网址是:xxx.xxx.xxx
开源的意义主要在于合作,通过合作,才能形成围绕某个开源项目的软件生态。例如最早也只最著名的开源项目之一“Linux”操作系统,其成功很大程度上是依靠开源社区为其提供的源源不断的代码支持,使其从当年一个人的“小项目”日益壮大起来。
相应的,如果不准备和不允许他人参与自己的项目中,那么这样的项目就是私有项目,而即便私有项目所产出的软件也能够免费提供出来给大家使用,但这样的软件也只能称之为免费软件,而非开源软件。
接下来重点说说开源协议。
开源软件虽然通常都是免费的,但并不等于软件的开发者们(开源社区)完全放弃了自己的权利和对软件的控制。为了保证开源软件不被一些商业机构或个人窃取,成为他们不劳而获的牟利工具,并影响开源项目的长远发展,开源社区开发出了各种开源协议,用于维护自己的软件版权。
在开源协议里面,会详尽表述使用者在获得代码后拥有的权利和义务,包括可以进行何种操作,而何种操作又是被禁止的。
开源协议种类非常之多,并且同一款协议会有很多个变种版本。开源协议规定得太宽松,会导致开发者们丧失对开源软件的很多权利,而太严格又不便于使用者们的使用以及开源软件的传播。
常见的开源协议有:GPL、LGPL、BSD、Apache 2.0、MIT
1、GPL
Linux就是采用了GPL协议。GPL协议允许代码的获取、代码的免费使用和引用、代码的修改和衍生,但要求对修改和衍生代码的进行开源,不允许修改和衍生的代码做为私有闭源的商业软件发布和销售。
这也就是为什么我们能用各种免费的linux操作系统,以及linux上各种各样的由个人,组织,以及商业软件公司开发的免费软件了。
GPL协议的主要内容是,只要在一个软件中使用到了包含GPL 协议的产品(GPL类库),则该软件产品必须也采用GPL协议,既必须也是开源和免费,这就是所谓的“传染性”。
由于GPL严格要求使用了GPL类库的软件产品必须使用GPL协议,对于使用GPL协议的开源代码,商业软件或者对代码有保密要求的部门就不适合集成/采用作为类库和二次开发的基础。
2、LGPL
LGPL是GPL的一个为主要为类库使用设计的开源协议。和GPL不同,LGPL允许商业软件通过类库引用(link)方式使用LGPL类库而不需要开源商业软件的代码。这使得采用LGPL协议的开源代码可以被商业软件作为类库引用并发布和销售。
但是如果修改LGPL协议的代码或者衍生,则所有修改的代码,涉及修改部分的额外代码和衍生的代码都必须采用LGPL协议。因此LGPL协议的开源代码很适合作为第三方类库被商业软件引用,但不适合希望以LGPL协议代码为基础,通过修改和衍生的方式做二次开发的商业软件采用。
3、BSD
BSD开源协议是一个给予使用者很大自由的协议。开发者可以自由使用和修改源代码,也可以将修改后的源代码作为开源或者专有软件再发布。但是有以下几个要求:
如果再发布的产品中含有源代码,则在源代码中必须带有原来代码中的BSD协议。
如果再发布的只是二进制类库/软件,则需要在类库/软件的文档和版权申明中包含原有代码中的BSD协议。
不可以用开源代码的作者/机构名字和原来产品的名字做市场推广。
BSD 代码鼓励代码共享,但需要尊重代码作者的著作权。BSD由于允许使用者修改和重新发布代码,也允许使用或在BSD代码上开发商业软件发布和销售,因此是对商业集成很友好的协议。而很多的公司企业在选用开源产品的时候都首选BSD协议,因为可以完全控制这些第三方的代码,在必要的时候可以修改或者二次开发。
4、Apache 2.0:
Apache Licence 2.0的简称,Apache Licence是著名的非盈利开源组织Apache采用的协议。该协议和BSD类似,同样鼓励代码共享和最终原作者的著作权,同样允许源代码修改和再发布。但是也需要遵循以下条件:
需要给代码的用户一份Apache Licence。
如果修改了代码,需要再被修改的文件中说明。
在衍生的代码中(修改和有源代码衍生的代码中)需要带有原来代码中的协议,商标,专利声明和其他原来作者规定需要包含的说明。
如果再发布的产品中包含一个Notice文件,则在Notice文件中需要带有Apache Licence。你可以再Notice中增加自己的许可,但是不可以表现为对Apache Licence构成更改。
Apache Licence也是对商业应用友好的许可,使用者也可以在需要的时候修改代码来满足并作为开源或商业产品发布/销售。
5、MIT:
MIT是和BSD一样宽泛的许可协议,源自麻省理工学院(Massachusetts Institute of Technology, MIT)。使用MIT协议的开源软件作者只保留版权,而对使用者无任何其它限制。MIT与BSD类似,但是比BSD协议更加宽松,是目前最少限制的协议。这个协议唯一的条件就是在修改后的代码或者发行包中包含原作者的许可信息,且适用于商业软件。使用MIT的软件项目有:jquery、Node.js。