update blog post to add link to John slides
[homepage.git] / blog / posts / 2012 / 02 / gpl_d_debian_software_skew.mdwn
1 [[!meta title="GPL-d Debian software skew (?)"]]
2
3 At [FOSDEM](http://fosdem.org/2012/), John Sullivan delivered an interesting
4 talk titled
5 [Is copyleft being framed?](http://fosdem.org/2012/schedule/event/is_copyleft_being_framed)
6 to verify alleged claims on the decline of GPL-d
7 software. ([Slides](http://info9.net/wiki/fosdem/LegalIssuesDevRoom/Speakers/sullivan_slides.pdf)
8 are available.) The crux of the talk is the analysis he performed on the Debian
9 archive to discover the amount of software we distribute that is covered by
10 GPL, LGPL, or AGPL ("GPL-d" for short in the remainder).
11
12 John's talk steps in an interesting and long running debate (a recent summary
13 of which is available in this
14 [ITWire article](http://www.itwire.com/business-it-news/open-source/52838-gpl-use-in-debian-on-the-rise-study)).
15 The most interesting part is the discrepancy among John's results and
16 [Blackduck](http://www.blackducksoftware.com/)'s, which are often use to
17 [argue how the popularity of the GPL license is declining](http://blogs.the451group.com/opensource/2011/12/15/on-the-continuing-decline-of-the-gpl/).
18 That might be the case. Or not. The more analyses we do to find it out, the
19 better.
20
21 The underlying assumption on John's work is that Debian is a representative
22 sample of the Free Software out there, which I think is a reasonable
23 assumption. I find the analysis presented in the talk completely satisfactorily
24 from a purely scientific point of view. The same cannot be said by Blackduck's
25 result: both their methods and data are secret, making it impossible for anyhow
26 to reproduce their experiments. Highly *un*scientific.
27
28 Still, John's results are surprising: as much as 87 percent of Lenny's packages
29 and 93 percent of Squeeze's are GPL-d. That seems *a lot*.  Puzzled about that,
30 John discussed with me the issue before his talk, in search for pitfalls in his
31 methods or data. Finding none, I pointed him to the almighty
32 [DktrKranz](http://dktrkranz.wordpress.com/) for some extra review; who found
33 nothing either. To stay on the safe side, even during his talk John called for
34 independent reviews of his results. **What could be wrong?**
35
36 The tool used to gather the data is
37 [license-count](http://anonscm.debian.org/gitweb/?p=dbnpolicy/policy.git;a=blob;f=tools/license-count;hb=HEAD)
38 from the `debian-policy` package. Input data are the `debian/copyright` files
39 of all Debian source packages. If `license-count` is not bugged, our
40 `debian/copyright` files might be. One thing that occurred to me only a few
41 days ago is the **habit of declaring a different license for Debian packaging**
42 (the files under `debian/`) than the software being packaged itself. That's a
43 bad habit—because it might cause unwanted license mixtures via patches that
44 live under `debian/`—but I've seen several occurrences of it in the Debian
45 archive. For name and (self-)shame: I've also been guilty of it in the past,
46 *when I was young™*.
47
48 **Is that reason enough to skew results and overestimate GPL-d software?** I
49 don't think so, I hope not, but ultimately… I don't know. It'd be nice to rule
50 out the possibility entirely. So if anyone is willing to do some sampling of
51 affected `debian/copyright` files and propose patches for `license-count` to
52 exclude those "false positives", please shout. (As a bonus point: that would
53 also help to take more sound decision for the typical use case of
54 `license-count`, i.e. deciding when a license should be added to
55 `/usr/share/common-licenses`.)
56
57 Other independent reviews of the results are equally welcome.
58
59 Note: the above, as well as John's analysis, would be a trivial exercise if
60 [DEP-5](http://dep.debian.net/deps/dep5/) were already widely deployed in the
61 Debian archive.
62
63 ----
64
65 **Update**: add link to John's slides
66
67 [[!tag lang/english planet-debian debian gpl fosdem]]