blog post: gpl d debian software skew
authorStefano Zacchiroli <zack@upsilon.cc>
Sat, 18 Feb 2012 16:33:00 +0000 (17:33 +0100)
committerStefano Zacchiroli <zack@upsilon.cc>
Sat, 18 Feb 2012 16:33:00 +0000 (17:33 +0100)
blog/posts/2012/02/gpl_d_debian_software_skew.mdwn [new file with mode: 0644]

diff --git a/blog/posts/2012/02/gpl_d_debian_software_skew.mdwn b/blog/posts/2012/02/gpl_d_debian_software_skew.mdwn
new file mode 100644 (file)
index 0000000..0f03321
--- /dev/null
@@ -0,0 +1,60 @@
+At [FOSDEM](http://fosdem.org/2012/), John Sullivan delivered an interesting
+talk titled
+[Is copyleft being framed?](http://fosdem.org/2012/schedule/event/is_copyleft_being_framed)
+to verify alleged claims on the decline of GPL-d software. The crux of the talk
+is the analysis he performed on the Debian archive to discover the amount of
+software we distribute that is covered by GPL, LGPL, or AGPL ("GPL-d" for short
+in the remainder).
+
+John's talk steps in an interesting and long running debate (a recent summary
+of which is available in this
+[ITWire article](http://www.itwire.com/business-it-news/open-source/52838-gpl-use-in-debian-on-the-rise-study)).
+The most interesting part is the discrepancy among John's results and
+[Blackduck](http://www.blackducksoftware.com/)'s, which are often use to
+[argue how the popularity of the GPL license is declining](http://blogs.the451group.com/opensource/2011/12/15/on-the-continuing-decline-of-the-gpl/).
+That might be the case. Or not. The more analyses we do to find it out, the
+better.
+
+The underlying assumption on John's work is that Debian is a representative
+sample of the Free Software out there, which I think is a reasonable
+assumption. I find the analysis presented in the talk completely satisfactorily
+from a purely scientific point of view. The same cannot be said by Blackduck's
+result: both their methods and data are secret, making it impossible for anyhow
+to reproduce their experiments. Highly *un*scientific.
+
+Still, John's results are surprising: as much as 87 percent of Lenny's packages
+and 93 percent of Squeeze's are GPL-d. That seems *a lot*.  Puzzled about that,
+John discussed with me the issue before his talk, in search for pitfalls in his
+methods or data. Finding none, I pointed him to the almighty
+[DktrKranz](http://dktrkranz.wordpress.com/) for some extra review; who found
+nothing either. To stay on the safe side, even during his talk John called for
+independent reviews of his results. **What could be wrong?**
+
+The tool used to gather the data is
+[license-count](http://anonscm.debian.org/gitweb/?p=dbnpolicy/policy.git;a=blob;f=tools/license-count;hb=HEAD)
+from the `debian-policy` package. Input data are the `debian/copyright` files
+of all Debian source packages. If `license-count` is not bugged, our
+`debian/copyright` files might be. One thing that occurred to me only a few
+days ago is the **habit of declaring a different license for Debian packaging**
+(the files under `debian/`) than the software being packaged itself. That's a
+bad habit---because it might cause unwanted license mixtures via patches that
+live under `debian/`---but I've seen several occurrences of it in the Debian
+archive. For name and (self-)shame: I've also been guilty of it in the past,
+*when I was young™*.
+
+**Is that reason enough to skew results and overestimate GPL-d software?** I
+don't think so, I hope not, but ultimately… I don't know. It'd be nice to rule
+out the possibility entirely. So if anyone is willing to do some sampling of
+affected `debian/copyright` files and propose patches for `license-count` to
+exclude those "false positives", please shout. (As a bonus point: that would
+also help to take more sound decision for the typical use case of
+`license-count`, i.e. deciding when a license should be added to
+`/usr/share/common-licenses`.)
+
+Other independent reviews of the results are equally welcome.
+
+Note: the above, as well as John's analysis, would be a trivial exercise if
+[DEP-5](http://dep.debian.net/deps/dep5/) were already widely deployed in the
+Debian archive.
+
+[[!tag lang/english planet-debian gpl fosdem]]