add missing season in recent TV
[homepage.git] / research / publications.mdwn
1 [[!meta stylesheet=papers rel="stylesheet"]]
3 [[!img img/emblem-documents.png link="no" class="flow" alt="documents"]]
4 Here is a list of my **academic papers**, classified by type of publication and
5 in reverse chronological order:
7 [[!toc]]
9 You might also be interested in my author profiles on
10 [**DBLP**]( and
11 [**Google Scholar**](
14 # <span title="international, peer-reviewed journals">international, peer-reviewed journal articles</span>
16  1. <a class="paper-download" href="swh-provenance-emse.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="swh-provenance-emse.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> Guillaume Rousseau, <a href="">Roberto Di Cosmo</a>, <a href="">Stefano Zacchiroli</a>. **Software Provenance Tracking at the Scale of Public Source Code**.  <em>
17         In <a href="">Empirical
18         Software Engineering</a>, volume 25,
19         issue 4,
20         <a href="">pp. 2930-2959</a>.
21         ISSN 1382-3256,
22         Springer. 2020.
23       </em>
24     [[!toggle id=id82 text="Abstract..."]] [[!toggleable id=id82 text="""
25     *Abstract:* We study the possibilities to track provenance of software source code artifacts within the largest publicly accessible corpus of publicly available source code, the Software Heritage archive, with over 4 billions unique source code files and 1 billion commits capturing their development histories across 50 million software projects. We perform a systematic and generic estimate of the replication factor across the different layers of this corpus, analysing how much the same artifacts (e.g., SLOC, files or commits) appear in different contexts (e.g., files, commits or source code repositories). We observe a combinatorial explosion in the number of identical source code files across different commits. To discuss the implication of these findings, we benchmark different data models for capturing software provenance information at this scale, and we identify a viable solution, based on the properties of isochrone subgraphs, that is deployable on commodity hardware, is incremental and appears to be maintainable for the foreseeable future. Using these properties, we quantify, at a scale never achieved previously, the growth rate of original, i.e. never-seen-before, source code files and commits, and find it to be exponential over a period of more than 40 years.
26     """]]
27  1. <a class="paper-download" href="nms-oss-won-lost.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="nms-oss-won-lost.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Mathieu O'Neil</a>, <a href="">Laure Muselli</a>, <a href="">Mahin Raissi</a>, <a href="">Stefano Zacchiroli</a>. **"Open source has won and lost the war": Legitimising commercial-communal hybridisation in a FOSS project**.  <em>To appear in <a href="">New Media and
28       Society</a>.  ISSN 1461-4448,
29       2020.</em>
30     [[!toggle id=id81 text="Abstract..."]] [[!toggleable id=id81 text="""
31     *Abstract:* Information technology (IT) firms are paying developers in Free and Open Source Software (FOSS) projects, leading to the emergence of hybrid forms of work. In order to understand how the firm-project hybridisation process occurs, we present the results of an online survey of participants in the Debian project, as well as interviews with Debian Developers. We find that the intermingling of the commercial logic of the firm and the communal logic of the project requires rhetorical legitimation. We analyse the discourses used to legitimise firm-project cooperation as well as the organisational mechanisms which facilitate this cooperation. A first phase of legitimation, based on firm adoption of open licenses and developer self-fulfilment, aims to erase the commercial/communal divide. A second more recent phase seeks to professionalise work relations inside the project and, in doing so, challenges the social order which restricts participation in FOSS. Ultimately, hybridisation raises the question of the fair distribution of the profits firms derive from FOSS.
32     """]]
33  1. <a class="paper-download" href="cise-2020-doi.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="cise-2020-doi.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Morane Gruenpeter</a>, <a href="">Stefano Zacchiroli</a>. **Referencing Source Code Artifacts: a Separate Concern in Software Citation**.  <em>
34         In <a href="">Computing in Science
35         and Engineering</a>, volume 22,
36         issue 2,
37         <a href="">pp. 33-43</a>.
38         ISSN 1521-9615, IEEE.
39         March 2020.
40       </em>
41     [[!toggle id=id78 text="Abstract..."]] [[!toggleable id=id78 text="""
42     *Abstract:* Among the entities involved in software citation, software source code requires special attention, due to the role it plays in ensuring scientific reproducibility. To reference source code we need identifiers that are not only unique and persistent, but also support integrity checking intrinsically. Suitable iden- tifiers must guarantee that denoted objects will always stay the same, without relying on external third parties and administrative processes. We analyze the role of identifiers for digital objects (IDOs), whose properties are different from, and complementary to, those of the various digital identifiers of objects (DIOs) that are today popular building blocks of software and data citation toolchains. We argue that both kinds of identifiers are needed and detail the syntax, semantics, and practical implementation of the persistent identifiers (PIDs) adopted by the Software Heritage project to reference billions of software source code artifacts such as source code files, directories, and commits.
43     """]]
44  1. <a class="paper-download" href="cscw-2018-rtce.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="cscw-2018-rtce.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Gabriele D'Angelo</a>, <a href="">Angelo Di Iorio</a>, <a href="">Stefano Zacchiroli</a>. **Spacetime Characterization of Real-Time Collaborative Editing**.  <em>
45         In <a href="">Proceedings of
46         the ACM on Human-Computer Interaction</a>,
47         volume 2, issue CSCW,
48         Article No. <a href="">41</a>.
49         ISSN 2573-0142, ACM,
50         November 2018.
51       </em>
52     [[!toggle id=id71 text="Abstract..."]] [[!toggleable id=id71 text="""
53     *Abstract:* Real-Time Collaborative Editing (RTCE) is a popular way of instrumenting cooperative work on documents, in particular on the Web. Little is known in the literature yet about RTCE usage patterns in the real world. In this paper we study how a popular RTCE editor (Etherpad) is used in the wild, digging into the edit histories of a large collection of documents (about 14 000 pads), retrieved from one of the most popular public instances of the platform, hosted by the Wikimedia Foundation. The pad analysis is supported by a novel conceptual model that allows to label edit operations as "collaborative" or not depending on their distance---in edit position (space), edit time, or spacetime (both)---from edits made by other authors. The model is applied to classify all edits from the pad corpus. Classification results are further used to characterize the collaboration behavior of pad authors. Findings show that: 1) about half of the pads have a single author and hence witnessed no collaboration; 2) collaboration on common document parts happens often, but it happens asynchronously with authors taking turns in editing; and 3) simultaneous editing of common document parts happens very rarely. These findings help in revisiting early RTCE design decisions (e.g., the granularity of conflict management in RTCE protocols) and give insights on how to address novel needs (e.g., end-to-end encryption and offline editing).
54     """]]
55  1. <a class="paper-download" href="cacm-2018-software-heritage.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="cacm-2018-software-heritage.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Jean-François Abramatic</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Stefano Zacchiroli</a>. **Building the Universal Archive of Source Code**.  <em>
56         In <a href="">Communications of the
57         ACM</a>, October 2018,
58         volume 61, number 10,
59         pp. <a href="">29-31</a>.
60         ISSN 0001-0782, ACM.
61       </em>
62  1. <a class="paper-download" href="jopp-10-debian-survey.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="jopp-10-debian-survey.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Mathieu O'Neil</a>, <a href="">Mahin Raissi</a>, Molly de Blanc, <a href="">Stefano Zacchiroli</a>. **Preliminary Report on the Influence of Capital in an Ethical-Modular Project: Quantitative data from the 2016 Debian Survey**.  <em>In <a href="">Journal of Peer
63       Production</a>,
64       <a href="">issue 10</a>.
65       ISSN 2213-5316, 2017.</em>
66  1. <a class="paper-download" href="debsources-ese-2016.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="debsources-ese-2016.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Matthieu Caneill</a>, <a href="">Daniel M. Germán</a>, <a href="">Stefano Zacchiroli</a>. **The Debsources Dataset: Two Decades of Free and Open Source Software**.  <em>
67         In <a href="">Empirical Software
68         Engineering</a>, volume 22,
69         <a href="">pp. 1405-1437</a>,
70         June, 2017.
71         ISSN 1382-3256, Springer.
72       </em>
73     [[!toggle id=id62 text="Abstract..."]] [[!toggleable id=id62 text="""
74     *Abstract:* We present the Debsources Dataset: source code and related metadata spanning two decades of Free and Open Source Software (FOSS) history, seen through the lens of the Debian distribution. The dataset spans more than 3 billion lines of source code as well as metadata about them such as: size metrics (lines of code, disk usage), developer-defined symbols (ctags), file-level checksums (SHA1, SHA256, TLSH), file media types (MIME), release information (which version of which package containing which source code files has been released when), and license information (GPL, BSD, etc). The Debsources Dataset comes as a set of tarballs containing deduplicated unique source code files organized by their SHA1 checksums (the source code), plus a portable PostgreSQL database dump (the metadata). A case study is run to show how the Debsources Dataset can be used to easily and efficiently instrument very long-term analyses of the evolution of Debian from various angles (size, granularity, licensing, etc.), getting a grasp of major FOSS trends of the past two decades. The Debsources Dataset is Open Data, released under the terms of the CC BY-SA 4.0 license, and available for download from Zenodo with DOI reference 10.5281/zenodo.61089.
75     """]]
76  1. <a class="paper-download" href="ic-2014-aeolus.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="ic-2014-aeolus.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Jacopo Mauro</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Gianluigi Zavattaro</a>. **Aeolus: a Component Model for the Cloud**.  <em>In <a href="">Information
77       and Computation</a>, volume 239, <a href="">pp. 100-121</a>. 2014.
78       ISSN 0890-5401, Elsevier.</em>
79     [[!toggle id=id56 text="Abstract..."]] [[!toggleable id=id56 text="""
80     *Abstract:* We introduce the Aeolus component model, which is specifically designed to capture realistic scenarii arising when configuring and deploying distributed applications in the so-called cloud environments, where interconnected components can be deployed on clusters of heterogeneous virtual machines, which can be in turn created, destroyed, and connected on-the-fly. The full Aeolus model is able to describe several component characteristics such as dependencies, conflicts, non-functional requirements (replication requests and load limits), as well as the fact that component interfaces to the world might vary depending on the internal component state. When the number of components needed to build an application grows, it becomes important to be able to automate activities such as deployment and reconfiguration. This correspond, at the level of the model, to the ability to decide whether a desired target system configuration is reachable, which we call the achievability problem, and producing a path to reach it. In this work we show that the achievability problem is undecidable for the full Aeolus model, a strong limiting result for automated configuration in the cloud. We also show that the problem becomes decidable, but Ackermann-hard, as soon as one drops non-functional requirements. Finally, we provide a polynomial time algorithm for the further restriction of the model where support for inter-component conflicts is also removed.
81     """]]
82  1. <a class="paper-download" href="scp2013-futures.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="scp2013-futures.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Learning from the Future of Component Repositories**.  <em>In <a href="">Science
83       of Computer Programming</a>,
84       volume 90, part B,
85       <a href="">pp. 93-115</a>.
86       ISSN 0167-6423, Elsevier,
87       2014.</em>
88     [[!toggle id=id50 text="Abstract..."]] [[!toggleable id=id50 text="""
89     *Abstract:* An important aspect of the quality assurance of large component repositories is to ensure the logical coherence of component metadata, and to this end one needs to identify incoherences as early as possible. Some relevant classes of problems can be formulated in term of properties of the future repositories into which the current repository may evolve. However, checking such properties on all possible future repositories requires a way to construct a finite representation of the infinite set of all potential futures. A class of properties for which this can be done is presented in this work. We illustrate the practical usefulness of the approach with two quality assurance applications: (i) establishing the amount of "forced upgrades" induced by introducing new versions of existing components in a repository, and (ii) identifying outdated components that are currently not installable and need to be upgraded in order to become installable again. For both applications we provide experience reports obtained on the Debian free software distribution.
90     """]]
91  1. <a class="paper-download" href="infsof2012-mpm.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="infsof2012-mpm.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **A Modular Package Manager Architecture**.  <em>In <a href="">Information
92       and Software Technology</a>,
93       volume 55, issue 2,
94       <a href="">pp. 459-474</a>.
95       ISSN 0950-5849, Elsevier,
96       February 2013.</em>
97     [[!toggle id=id42 text="Abstract..."]] [[!toggleable id=id42 text="""
98     *Abstract:* The success of modern software distributions in the Free and Open Source world can be explained, among other factors, by the availability of a large collection of software packages and the possibility to easily install and remove those components using state of the art package managers. However, package managers are often built using a monolithic architecture and hard-wired and ad-hoc dependency solvers implementing some customized heuristics. In this paper we propose a modular architecture relying on precise interface formalisms that allows the system administrator to choose from a variety of dependency solvers and backends. We argue that this is the path that leads to the next generation of package managers that will deliver better results, offer more expressive preference languages, and be easily adaptable to new platforms. We have built a working prototype, called MPM, following the design advocated in this paper, and we show how it largely outperforms a variety of state of the art package managers.
99     """]]
100  1. <a class="paper-download" href="jss2012-concern.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="jss2012-concern.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Dependency Solving: a Separate Concern in Component Evolution Management**.  <em>In <a href="">Journal
101       of Systems and Software</a>,
102       volume 85, issue 10,
103       <a href="">pp. 2228-2240</a>.
104       ISSN 0164-1212, Elsevier,
105       October 2012.</em>
106     [[!toggle id=id40 text="Abstract..."]] [[!toggleable id=id40 text="""
107     *Abstract:* Maintenance of component-based software platforms often has to face rapid evolution of software components. Component dependencies, conflicts, and package managers with dependency solving capabilities are the key ingredients of prevalent software maintenance technologies that have been proposed to keep software installations synchronized with evolving component repositories. We review state-of-the-art package managers and their ability to keep up with evolution at the current growth rate of popular component-based platforms, and conclude that their dependency solving abilities are not up to the task. We show that the complexity of the underlying upgrade planning problem is NP-complete even for seemingly simple component models, and argue that the principal source of complexity lies in multiple available versions of components. We then discuss the need of expressive languages for user preferences, which makes the problem even more challenging. We propose to establish dependency solving as a separate concern from other upgrade aspects, and present CUDF as a formalism to describe upgrade scenarios. By analyzing the result of an international dependency solving competition, we provide evidence that the proposed approach is viable.
108     """]]
109  1. <a class="paper-download" href="ahci2012-wiki.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="ahci2012-wiki.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Angelo Di Iorio</a>, Francesco Draicchio, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Constrained Wiki: The WikiWay to Validating Content**.  <em>In <a href="">Advances in Human-Computer
110       Interaction</a>, volume 2012,
111       article ID 893575, <a href="">pp. 1-19</a>.
112       ISSN 1687-5893, Hindawi, 2012</em>
113     [[!toggle id=id39 text="Abstract..."]] [[!toggleable id=id39 text="""
114     *Abstract:* The "WikiWay" is the open editing philosophy of wikis meant to foster open collaboration and continuous improvement of their content. Just like other online communities, wikis often introduce and enforce conventions, constraints, and rules for their content, but do so in a considerably softer way, expecting authors to deliver content that satisfies the conventions and the constraints, or, failing that, having volunteers of the community, the WikiGnomes, fix others' content accordingly. Constrained wikis is our generic framework for wikis to implement validators of community-specific constraints and conventions that preserve the WikiWay and their open collaboration features. To this end, specific requirements need to be observed by validators and a specific software architecture can be used for their implementation, that is, as independent functions (implemented as internal modules or external services) used in a nonintrusive way. Two separate proof-of-concept validators have been implemented for MediaWiki and MoinMoin, respectively, providing an annotated view functions, that is, presenting content authors with violation warnings, rather than preventing them from saving a noncompliant text.
115     """]]
116  1. <a class="paper-download" href="scp2010-evolution.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="scp2010-evolution.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Davide Di Ruscio</a>, <a href="">Patrizio Pelliccione</a>, <a href="">Alfonso Pierantonio</a>, <a href="">Stefano Zacchiroli</a>. **Supporting Software Evolution in Component-Based FOSS Systems**.  <em>In <a href="">Science
117       of Computer Programming</a>, volume 76,
118       issue 12,
119       <a href="">pp. 1144-1160</a>.
120       ISSN 0167-6423,
121       Elsevier, 2011.</em>
122     [[!toggle id=id35 text="Abstract..."]] [[!toggleable id=id35 text="""
123     *Abstract:* FOSS (Free and Open Source Software) systems present interesting challenges in system evolution. On one hand, most FOSS systems are based on very fine-grained units of software deployment, called packages, which promote system evolution; on the other hand, FOSS systems are among the largest software systems known and require sophisticated static and dynamic conditions to be verified, in order to successfully deploy upgrades on user machines. The slightest error in one of these conditions can turn a routine upgrade into a system administrator nightmare. In this paper we introduce a model-based approach to support the upgrade of FOSS systems. The approach promotes the simulation of upgrades to predict failures before affecting the real system. Both fine-grained static aspects (e.g. configuration incoherences) and dynamic aspects (e.g. the execution of configuration scripts) are taken into account, improving over the state of the art of upgrade planners. The effectiveness of the approach is validated by instantiating the approach to widely-used FOSS distributions.
124     """]]
125  1. <a class="paper-download" href="nrhm-overlapping-conversions.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="nrhm-overlapping-conversions.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Paolo Marinelli</a>, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Towards the unification of formats for overlapping markup**.  <em>
126         In <a href="">New Review
127         of Hypermedia and Multimedia</a>,
128         <a href="">volume 14</a>,
129         <a href="">issue 1</a>,
130         January 2008,
131         <a href="">pp. 57-94</a>.
132         <a href="">Taylor and Francis</a>,
133         <a href="">ISSN 1361-4568</a>.
134       </em>
135     [[!toggle id=id20 text="Abstract..."]] [[!toggleable id=id20 text="""
136     *Abstract:* Overlapping markup refers to the issue of how to represent data structures more expressive than trees, for example direct acyclic graphs, using markup (meta-)languages which have been designed with trees in mind, for example XML. In this paper we observe that the state of the art in overlapping markup is far from being the widespread and consistent stack of standards and technologies readily available for XML and develop a roadmap for closing the gap. In particular we present in the paper the design and implementation of what we believe to be the first needed step, namely: a syntactic conversion framework among the plethora of overlapping markup serialization formats. The algorithms needed to perform the various conversions are presented in pseudo-code, they are meant to be used as blueprints for researchers and practitioners which need to write batch translation programs from one format to the other.
137     """]]
138  1. <a class="paper-download" href="mcs-disambiguation-errors.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="mcs-disambiguation-errors.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Claudio Sacerdoti Coen</a>, <a href="">Stefano Zacchiroli</a>. **Spurious Disambiguation Errors and How to Get Rid of Them**.  <em>
139         In <a href="">Mathematics in
140         Computer Science</a>, volume 2,
141         number 2,
142         <a href="">pp. 355-378</a>,
143         December 2008. Springer Birkhäuser,
144         <a href="">ISSN 1661-8270</a>.
145       </em>
146     [[!toggle id=id19 text="Abstract..."]] [[!toggleable id=id19 text="""
147     *Abstract:* The disambiguation approach to the input of formulae enables users of mathematical assistants to type correct formulae in a terse syntax close to the usual ambiguous mathematical notation. When it comes to incorrect formulae however, far too many typing errors are generated; among them we want to present only errors related to the formula interpretation meant by the user, hiding errors related to other interpretations. We study disambiguation errors and how to classify them into the spurious and genuine error classes. To this end we give a general presentation of the classes of disambiguation algorithms and efficient disambiguation algorithms. We also quantitatively assess the quality of the presented error classification criteria benchmarking them in the setting of a formal development of constructive algebra.
148     """]]
149  1. <a class="paper-download" href="matita.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="matita.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Andrea Asperti</a>, <a href="">Claudio Sacerdoti Coen</a>, <a href="">Enrico Tassi</a>, <a href="">Stefano Zacchiroli</a>. **User Interaction with the Matita Proof Assistant**.  <em>
150         In <a href="">Journal of
151         Automated Reasoning</a>,
152         <a href="">volume 39,
153         number 2</a>. Springer
154         Netherlands, <a href="">ISSN
155         0168-7433</a>, <a href="">pp.
156         109-139</a>, 2007.
157       </em>
158     [[!toggle id=id9 text="Abstract..."]] [[!toggleable id=id9 text="""
159     *Abstract:* Matita is a new, document-centric, tactic-based interactive theorem prover. This paper focuses on some of the distinctive features of the user interaction with Matita, mostly characterized by the organization of the library as a searchable knowledge base, the emphasis on a high-quality notational rendering, and the complex interplay between syntax, presentation, and semantics.
160     """]]
162 # editorials
164  1. <a class="paper-download" href="oss-2017-proceedings.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="oss-2017-proceedings.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> Federico Balaguer, <a href="">Roberto Di Cosmo</a>, Alejandra Garrido, Fabio Kon, Gregorio Robles, <a href="">Stefano Zacchiroli</a>. **Open Source Systems: Towards Robust Practices**.  <em>
165         13th IFIP WG 2.13 International Conference, OSS 2017, Buenos Aires,
166         Argentina, May 22-23, 2017, Proceedings. IFIP
167         Advances in Information and Communication Technology
168         496, Springer
169         2017, ISBN 978-3-319-57734-0.
170       </em>
171  1. <a class="paper-download" href="jopp-10-editorial.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="jopp-10-editorial.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Mathieu O'Neil</a>, <a href="">Stefano Zacchiroli</a>. **Making Lovework: Editorial Notes for the JoPP issue on Peer Production and Work**.  <em>In <a href="">Journal of Peer
172       Production</a>,
173       <a href="">issue 10</a>.
174       ISSN 2213-5316, 2017.</em>
175  1. <a class="paper-download" href="jwe-wt-2014-editorial.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="jwe-wt-2014-editorial.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Angelo Di Iorio</a>, <a href="">Davide Rossi</a>, <a href="">Stefano Zacchiroli</a>. **Editorial**.  <em>In <a href="">Journal of Web
176       Engineering</a>, volume 14,
177       number 1-2, pp. 1-2.
178       ISSN 1540-9589, Rinton Press,
179       March 2015.</em>
180  1. <a class="paper-download" href="scp-wt-2012-editorial.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="scp-wt-2012-editorial.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Angelo Di Iorio</a>, <a href="">Davide Rossi</a>, <a href="">Stefano Zacchiroli</a>. **Web Technologies: Selected and extended papers from WT ACM SAC 2012**.  <em>In <a href="">Science
181       of Computer Programming</a>, volume 94,
182       part 1,
183       <a href="">pp. 1-2</a>.
184       ISSN 0167-6423, Elsevier, 2014.</em>
185  1. <a class="paper-download" href="spe-wt-2011-editorial.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="spe-wt-2011-editorial.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Angelo Di Iorio</a>, <a href="">Davide Rossi</a>, <a href="">Stefano Zacchiroli</a>. **Editorial**.  <em>In <a href="">Software:
186       Practice and Experience</a>, volume 43, issue
187       12,
188       <a href="">pp. 1393-1394</a>.
189       ISSN 1097-024X, Wiley, 2013.</em>
192 # book chapters
194  1. <a class="paper-download" href="web30-semantics-templating.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="web30-semantics-templating.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Angelo Di Iorio</a>, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Wiki Semantics via Wiki Templating**.  <em>
195         Chapter 34 of <a href="">Handbook
196         of research on Web 2.0, 3.0 and x.0: technologies, business and social
197         applications</a>. San Murugesan Ed.,
198         <a href="">pp. 329-348</a>,
199         IGI Global, 2010,
200         ISBN 978-1605663845.
201       </em>
202     [[!toggle id=id21 text="Abstract..."]] [[!toggleable id=id21 text="""
203     *Abstract:* A foreseeable incarnation of Web 3.0 could inherit machine understandability from the Semantic Web, and collaborative editing from Web 2.0 applications. We review the research and development trends which are getting today Web nearer to such an incarnation. We present semantic wikis, microformats, and the so-called "lowercase semantic web": they are the main approaches at closing the technological gap between content authors and Semantic Web technologies. We discuss a too often neglected aspect of the associated technologies, namely how much they adhere to the wiki philosophy of open editing: is there an intrinsic incompatibility between semantic rich content and unconstrained editing? We argue that the answer to this question can be "no", provided that a few yet relevant shortcomings of current Web technologies will be fixed soon.
204     """]]
206 # <span title="international, peer-reviewed conferences">international, peer-reviewed conference proceedings</span>
208  1. <a class="paper-download" href="msr-2020-topology.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="msr-2020-topology.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Antoine Pietri</a>, Guillaume Rousseau, <a href="">Stefano Zacchiroli</a>. **Determining the Intrinsic Structure of Public Software Development History**.  <em>
209         To appear in proceedings of <a href="">MSR 2020</a>: The 17th International
210         Conference on Mining Software Repositories, May 2020,
211         Seoul, South Korea. Co-located with <a href="">ICSE 2020</a>.
212         IEEE 2020.
213       </em>
214     [[!toggle id=id80 text="Abstract..."]] [[!toggleable id=id80 text="""
215     *Abstract:* Background: Collaborative software development has produced a wealth of version control system (VCS) data that can now be analyzed in full. Little is known about the intrinsic structure of the entire corpus of publicly available VCS as an interconnected graph. Understanding its structure is needed to determine the best approach to analyze it in full and to avoid methodological pitfalls when doing so. Objective: We intend to determine the most salient network topology properties of public software development history as captured by VCS. We will explore: degree distributions, determining whether they are scale-free or not; distribution of connect component sizes; distribution of shortest path lengths. Method: We will use Software Heritage---which is the largest corpus of public VCS data---compress it using webgraph compression techniques, and analyze it in-memory using classic graph algorithms. Analyses will be performed both on the full graph and on relevant subgraphs. Limitations: The study is exploratory in nature; as such no hypotheses on the findings is stated at this time. Chosen graph algorithms are expected to scale to the corpus size, but it will need to be confirmed experimentally. External validity will depend on how representative Software Heritage is of the software commons.
216     """]]
217  1. <a class="paper-download" href="msr-2020-forks.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="msr-2020-forks.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Antoine Pietri</a>, Guillaume Rousseau, <a href="">Stefano Zacchiroli</a>. **Forking Without Clicking: on How to Identify Software Repository Forks**.  <em>
218         To appear in proceedings of <a href="">MSR 2020</a>: The 17th International
219         Conference on Mining Software Repositories, May 2020,
220         Seoul, South Korea. Co-located with <a href="">ICSE 2020</a>.
221         IEEE 2020.
222       </em>
223     [[!toggle id=id79 text="Abstract..."]] [[!toggleable id=id79 text="""
224     *Abstract:* The notion of software "fork" has been shifting over time from the (negative) phenomenon of community disagreements that result in the creation of separate development lines and ultimately software products, to the (positive) practice of using distributed version control system (VCS) repositories to collaboratively improve a single product without stepping on each others toes. In both cases the VCS repositories participating in a fork share parts of a common development history. Studies of software forks generally rely on hosting platform metadata, such as GitHub, as the source of truth for what constitutes a fork. These “forge forks” however can only identify as forks repositories that have been created on the platform, e.g., by clicking a "fork" button on the platform user interface. The increased diversity in code hosting platforms (e.g., GitLab) and the habits of significant development communities (e.g., the Linux kernel, which is not primarily hosted on any single platform) call into question the reliability of trusting code hosting platforms to identify forks. Doing so might introduce selection and methodological biases in empirical studies. In this article we explore various definitions of "software forks", trying to capture forking workflows that exist in the real world. We quantify the differences in how many repositories would be identified as forks on GitHub according to the various definitions, confirming that a significant number could be overlooked by only considering forge forks. We study the structure and size of fork networks, observing how they are affected by the proposed definitions and discuss the potential impact on empirical research.
225     """]]
226  1. <a class="paper-download" href="saner-2020-swh-graph.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="saner-2020-swh-graph.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Paolo Boldi</a>, <a href="">Antoine Pietri</a>, <a href="">Sebastiano Vigna</a>, <a href="">Stefano Zacchiroli</a>. **Ultra-Large-Scale Repository Analysis via Graph Compression**.  <em>
227         In proceedings of <a href="">SANER 2020</a>: The 27th IEEE
228         International Conference on Software Analysis, Evolution and
229         Reengineering, February 18-21, 2020, London, Ontario,
230         Canada, <a href="">pp. 184-194</a>.
231         IEEE 2020.
232       </em>
233     [[!toggle id=id77 text="Abstract..."]] [[!toggleable id=id77 text="""
234     *Abstract:* We consider the problem of mining the development history—as captured by modern version control systems—of ultra-large-scale software archives (e.g., tens of millions software repositories corresponding). We show that graph compression techniques can be applied to the problem, dramatically reducing the hardware resources needed to mine similarly-sized corpus. As a concrete use case we compress the full Software Heritage archive, consisting of 5 billion unique source code files and 1 billion unique commits, harvested from more than 80 million software projects—encompassing a full mirror of GitHub. The resulting compressed graph fits in less than 100 GB of RAM, corresponding to a hardware cost of less than 300 U.S. dollars. We show that the compressed in-memory representation of the full corpus can be accessed with excellent performances, with edge lookup times close to memory random access. As a sample exploitation experiment we show that the compressed graph can be used to conduct clone detection at this scale, benefiting from main memory access speed.
235     """]]
236  1. <a class="paper-download" href="saner-2020-deps.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="saner-2020-deps.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Georgios Gousios</a>, <a href="">Stefano Zacchiroli</a>. **Dependency Solving Is Still Hard, but We Are Getting Better at It**.  <em>
237         In proceedings of <a href="">SANER 2020</a>: The 27th IEEE
238         International Conference on Software Analysis, Evolution and
239         Reengineering, February 18-21, 2020, London, Ontario,
240         Canada, <a href="">pp. 547-551</a>.
241         IEEE 2020.
242       </em>
243     [[!toggle id=id76 text="Abstract..."]] [[!toggleable id=id76 text="""
244     *Abstract:* Dependency solving is a hard (NP-complete) problem in all non-trivial component models due to either mutually incompatible versions of the same packages or explicitly declared package conflicts. As such, software upgrade planning needs to rely on highly specialized dependency solvers, lest falling into pitfalls such as incompleteness—a combination of package versions that satisfy dependency constraints does exist, but the package manager is unable to find it. In this paper we look back at proposals from dependency solving research dating back a few years. Specifically, we review the idea of treating dependency solving as a separate concern in package manager implementations, relying on generic dependency solvers based on tried and tested techniques such as SAT solving, PBO, MILP, etc. By conducting a census of dependency solving capabilities in state-of-the-art package managers we conclude that some proposals are starting to take off (e.g., SAT-based dependency solving) while—with few exceptions—others have not (e.g., outsourcing dependency solving to reusable components). We reflect on why that has been the case and look at novel challenges for dependency solving that have emerged since.
245     """]]
246  1. <a class="paper-download" href="msr-2020-challenge.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="msr-2020-challenge.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Antoine Pietri</a>, <a href="">Diomidis Spinellis</a>, <a href="">Stefano Zacchiroli</a>. **The Software Heritage Graph Dataset: Large-scale Analysis of Public Software Development History**.  <em>
247         To appear in proceedings of <a href="">MSR 2020</a>: The 17th International
248         Conference on Mining Software Repositories, May 2020,
249         Seoul, South Korea. Co-located with <a href="">ICSE 2020</a>.
250         IEEE 2020.
251       </em>
252     [[!toggle id=id75 text="Abstract..."]] [[!toggleable id=id75 text="""
253     *Abstract:* Software Heritage is the largest existing public archive of software source code and accompanying development history. It spans more than five billion unique source code files and one billion unique commits, coming from more than 80 million software projects. These software artifacts were retrieved from major collaborative development platforms (e.g., GitHub, GitLab) and package repositories (e.g., PyPI, Debian, NPM), and stored in a uniform representation linking together source code files, directories, commits, and full snapshots of version control systems (VCS) repositories as observed by Software Heritage during periodic crawls. This dataset is unique in terms of accessibility and scale, and allows to explore a number of research questions on the long tail of public software development, instead of solely focusing on "most starred" repositories as it often happens.
254     """]]
255  1. <a class="paper-download" href="msr-2019-swh.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="msr-2019-swh.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Antoine Pietri</a>, <a href="">Diomidis Spinellis</a>, <a href="">Stefano Zacchiroli</a>. **The Software Heritage Graph Dataset: Public software development under one roof**.  <em>
256         In proceedings of <a href="">MSR
257         2019</a>: The 16th International Conference on Mining Software
258         Repositories, May 2019, Montreal, Canada. Co-located with
259         <a href="">ICSE 2019</a>.
260         <a href="">pp. 138-142</a>,
261         IEEE 2019.
262       </em>
263     [[!toggle id=id73 text="Abstract..."]] [[!toggleable id=id73 text="""
264     *Abstract:* Software Heritage is the largest existing public archive of software source code and accompanying development history: it currently spans more than five billion unique source code files and one billion unique commits, coming from more than 80 million software projects. This paper introduces the Software Heritage graph dataset: a fully-deduplicated Merkle DAG representation of the Software Heritage archive. The dataset links together file content identifiers, source code directories, Version Control System (VCS) commits tracking evolution over time, up to the full states of VCS repositories as observed by Software Heritage during periodic crawls. The dataset's contents come from major development forges (including GitHub and GitLab), FOSS distributions (e.g., Debian), and language-specific package managers (e.g., PyPI). Crawling information is also included, providing timestamps about when and where all archived source code artifacts have been observed in the wild. The Software Heritage graph dataset is available in multiple formats, including downloadable CSV dumps and Apache Parquet files for local use, as well as a public instance on Amazon Athena interactive query service for ready-to-use powerful analytical processing. Source code file contents are cross-referenced at the graph leaves, and can be retrieved through individual requests using the Software Heritage archive API.
265     """]]
266  1. <a class="paper-download" href="ipres-2018-doi.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="ipres-2018-doi.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Morane Gruenpeter</a>, <a href="">Stefano Zacchiroli</a>. **Identifiers for Digital Objects: the Case of Software Source Code Preservation**.  <em>
267         In proceedings of <a href="">iPRES 2018</a>: 15th International
268         Conference on Digital Preservation, Boston, MA, USA,
269         24-27 September 2018, 9 pages.
270       </em>
271     [[!toggle id=id70 text="Abstract..."]] [[!toggleable id=id70 text="""
272     *Abstract:* In the very broad scope addressed by digital preservation initiatives, a special place belongs to the scientific and technical artifacts that we need to properly archive to enable scientific reproducibility. For these artifacts we need identifiers that are not only unique and persistent, but also support integrity in an intrinsic way. They must provide strong guarantees that the object denoted by a given identifier will always be the same, without relying on third parties and external administrative processes. In this article, we report on our quest for this identifiers for digital objects (IDOs), whose properties are different from, and complementary to, those of the various digital identifiers of objects (DIOs) that are in widespread use today. We argue that both kinds of identifiers are needed and present the framework for intrinsic persistent identifiers that we have adopted in Software Heritage for preserving billions of software artifacts.
273     """]]
274  1. <a class="paper-download" href="ipres-2017-software-heritage.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="ipres-2017-software-heritage.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Roberto Di Cosmo</a>, <a href="">Stefano Zacchiroli</a>. **Software Heritage: Why and How to Preserve Software Source Code**.  <em>
275         In Proceedings of <a href="">iPRES
276         2017</a>: 14th International Conference on Digital
277         Preservation, Kyoto, Japan, 25-29 September 2017, 10
278         pages.
279       </em>
280     [[!toggle id=id65 text="Abstract..."]] [[!toggleable id=id65 text="""
281     *Abstract:* Software is now a key component present in all aspects of our society. Its preservation has attracted growing attention over the past years within the digital preservation community. We claim that source code—the only representation of software that contains human readable knowledge—is a precious digital object that needs special handling: it must be a first class citizen in the preservation landscape and we need to take action immediately, given the in- creasingly more frequent incidents that result in permanent losses of source code collections. In this paper we present Software Heritage, an ambitious initiative to collect, preserve, and share the entire corpus of publicly accessible software source code. We discuss the archival goals of the project, its use cases and role as a participant in the broader digital preservation ecosystem, and detail its key design decisions. We also report on the project road map and the current status of the Software Heritage archive that, as of early 2017, has collected more than 3 billion unique source code files and 700 million commits coming from more than 50 million software development projects.
282     """]]
283  1. <a class="paper-download" href="aeolus-icsoc-2015.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="aeolus-icsoc-2015.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, Antoine Eiche, <a href="">Jacopo Mauro</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Gianluigi Zavattaro</a>, <a href="">Jakub Zwolakowski</a>. **Automatic Deployment of Services in the Cloud with Aeolus Blender**.  <em>In proceedings of <a href="">ICSOC 2015</a>: 13th International Conference on
284         Service Oriented Computing, November 16-19, 2015, Goa, India.
285         ISBN 978-3-662-48615-3, <a href="">pp. 397-411</a>,
286         Springer-Verlag 2015.
287       </em>
288     [[!toggle id=id61 text="Abstract..."]] [[!toggleable id=id61 text="""
289     *Abstract:* We present Aeolus Blender (Blender in the following), a software product for the automatic deployment and configuration of complex service-based, distributed software systems in the "cloud". By relying on a configuration optimiser and a deployment planner, Blender fully automates the deployment of real-life applications on OpenStack cloud deployments, by exploiting a knowledge base of software services provided by the Mandriva Armonic tool suite. The final deployment is guaranteed to satisfy not only user requirements and relevant software dependencies, but also to be optimal with respect to the number of used virtual machines.
290     """]]
291  1. <a class="paper-download" href="aeolus-concur-2015.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="aeolus-concur-2015.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Michael Lienhardt</a>, <a href="">Jacopo Mauro</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Gianluigi Zavattaro</a>, <a href="">Jakub Zwolakowski</a>. **Automatic Application Deployment in the Cloud: from Practice to Theory and Back**.  <em>In proceedings of <a href="">CONCUR 2015</a>: 26th
292       International Conference on Concurrency Theory,
293       September 1-4, 2015, Madrid, Spain.
294       Leibniz International Proceedings in Informatics
295       (LIPIcs) 42,
296       <a href="">pp. 1-16</a>,
297       ISBN 978-3-939897-91-0,
298       Schloss Dagstuhl--Leibniz-Zentrum fuer Informatik 2015.
299       </em>
300     [[!toggle id=id60 text="Abstract..."]] [[!toggleable id=id60 text="""
301     *Abstract:* The problem of deploying a complex software application has been formally investigated in previous work by means of the abstract component model named Aeolus. As the problem turned out to be undecidable, simplified versions of the model were investigated in which decidability was restored by introducing limitations on the ways components are described. In this paper, we take an opposite approach, and investigate the possibility to address a relaxed version of the deployment problem without limiting the expressiveness of the component model. We identify three problems to be solved in sequence: (i) the verification of the existence of a final configuration in which all the constraints imposed by the single components are satisfied, (ii) the generation of a concrete configuration satisfying such constraints, and (iii) the synthesis of a plan to reach such a configuration possibly going through intermediary configurations that violate the non-functional constraints.
302     """]]
303  1. <a class="paper-download" href="debsources-msr-2015.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="debsources-msr-2015.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Stefano Zacchiroli</a>. **The Debsources Dataset: Two Decades of Debian Source Code Metadata**.  <em>In proceedings of <a href="">MSR 2015</a>: The 12th Working Conference
304       on Mining Software Repositories, May 16-17, 2015, Florence,
305       Italy. Co-located with
306       <a href="">ICSE 2015</a>.
307       ISBN ISBN 978-0-7695-5594-2,
308       <a href="">pp. 466-469</a>,
309       IEEE 2015.
310       </em>
311     [[!toggle id=id59 text="Abstract..."]] [[!toggleable id=id59 text="""
312     *Abstract:* We present the Debsources Dataset: distribution metadata and source code metrics spanning two decades of Free and Open Source Software (FOSS) history, seen through the lens of the Debian distribution. Debsources is a software platform used to gather, search, and publish on the Web the full source code of the Debian operating system, as well as measures about it. A notable public instance of Debsources is available at; it includes both current and historical releases of Debian. Plugins to compute popular source code metrics (lines of code, defined symbols, disk usage) and other derived data (e.g., checksums) have been written, integrated, and run on all the source code available on The Debsources Dataset is a PostgreSQL database dump of metadata, as of February 10th, 2015. The dataset contains both Debian-specific metadata—e.g., which software packages are available in which release, which source code file belong to which package, release dates, etc.—and source code information gathered by running Debsources plugins. The Debsources Dataset offer a very long-term historical view of the macro-level evolution and constitution of FOSS through the lens of popular, representative FOSS projects of their times.
313     """]]
314  1. <a class="paper-download" href="distcheck-msr-2015.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="distcheck-msr-2015.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Louis Gesbert</a>, <a href="">Fabrice Le Fessant</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Mining Component Repositories for Installability Issues**.  <em>In proceedings of <a href="">MSR 2015</a>: The 12th Working Conference
315       on Mining Software Repositories, May 16-17, 2015, Florence,
316       Italy. Co-located with
317       <a href="">ICSE 2015</a>.
318       ISBN ISBN 978-0-7695-5594-2,
319       <a href="">pp. 24-33</a>,
320       IEEE 2015.
321       </em>
322     [[!toggle id=id58 text="Abstract..."]] [[!toggleable id=id58 text="""
323     *Abstract:* Component repositories play an increasingly relevant role in software life-cycle management, from software distribution to end-user, to deployment and upgrade management. Software components shipped via such repositories are equipped with rich metadata that describe their relationship (e.g., dependencies and conflicts) with other components. In this practice paper we show how to use a tool, distcheck, that uses component metadata to identify all the components in a repository that cannot be installed (e.g., due to unsatisfiable dependencies), provides detailed information to help developers understanding the cause of the problem, and fix it in the repository. We report about detailed analyses of several repositories: the Debian distribution, the OPAM package collection, and Drupal modules. In each case, distcheck is able to efficiently identify not installable components and provide valuable explanations of the issues. Our experience provides solid ground for generalizing the use of distcheck to other component repositories.
324     """]]
325  1. <a class="paper-download" href="zephyrus-ase-2014.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="zephyrus-ase-2014.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Michael Lienhardt</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Jakub Zwolakowski</a>, Antoine Eiche, Alexis Agahi. **Automated Synthesis and Deployment of Cloud Applications**.  <em>
326         In proceedings of <a href="">ASE
327         2014</a>: 29th IEEE/ACM International Conference on Automated Software
328         Engineering, September 15-19, 2014, Vasteras, Sweden. ISBN
329         978-1-4503-3013-8, <a href="">pp. 211-222</a>,
330         ACM 2014.
331       </em>
332     [[!toggle id=id54 text="Abstract..."]] [[!toggleable id=id54 text="""
333     *Abstract:* Complex networked applications are assembled by connecting software components distributed across multiple machines. Building and deploying such systems is a challenging problem which requires a significant amount of expertise: the system architect must ensure that all component dependencies are satisfied, avoid conflicting components, and add the right amount of component replicas to account for quality of service and fault-tolerance. In a cloud environment, one also needs to minimize the virtual resources provisioned upfront, to reduce the cost of operation. Once the full architecture is designed, it is necessary to correctly orchestrate the deployment phase, to ensure all components are started and connected in the right order. We present a toolchain that automates the assembly and deployment of such complex distributed applications. Given as input a high-level specification of the desired system, the set of available components together with their requirements, and the maximal amount of virtual resources to be committed, it synthesizes the full architecture of the system, placing components in an optimal manner using the minimal number of available machines, and automatically deploys the complete system in a cloud environment.
334     """]]
335  1. <a class="paper-download" href="debsources-esem-2014.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="debsources-esem-2014.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Matthieu Caneill</a>, <a href="">Stefano Zacchiroli</a>. **Debsources: Live and Historical Views on Macro-Level Software Evolution**.  <em>
336         In proceedings of <a href="">ESEM 2014</a>: 8th
337         International Symposium on Empirical Software Engineering and
338         Measurement, September 18-19, 2014, Torino, Italy. ISBN <a href="">
339         978-1-4503-2774-9</a>, ACM 2014.
340       </em>
341     [[!toggle id=id53 text="Abstract..."]] [[!toggleable id=id53 text="""
342     *Abstract:* Context. Software evolution has been an active field of research in recent years, but studies on macro-level software evolution---i.e., on the evolution of large software collections over many years---are scarce, despite the increasing popularity of intermediate vendors as a way to deliver software to final users. Goal. We want to ease the study of both day-by-day and long-term Free and Open Source Software (FOSS) evolution trends at the macro-level, focusing on the Debian distribution as a proxy of relevant FOSS projects. Method. We have built Debsources, a software platform to gather, search, and publish on the Web all the source code of Debian and measures about it. We have set up a public Debsources instance at, integrated it into the Debian infrastructure to receive live updates of new package releases, and written plugins to compute popular source code metrics. We have injected all current and historical Debian releases into it. Results. The obtained dataset and Web portal provide both long term-views over the past 20 years of FOSS evolution and live insights on what is happening at sub-day granularity. By writing simple plugins (~100 lines of Python each) and adding them to our Debsources instance we have been able to easily replicate and extend past empirical analyses on metrics as diverse as lines of code, number of packages, and rate of change---and make them perennial. We have obtained slightly different results than our reference study, but confirmed the general trends and updated them in light of 7 extra years of evolution history. Conclusions. Debsources is a flexible platform to monitor large FOSS collections over long periods of time. Its main instance and dataset are valuable resources for scholars interested in macro-level software evolution.
343     """]]
344  1. <a class="paper-download" href="esocc2013-aeolus.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="esocc2013-aeolus.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> Michel Catan, <a href="">Roberto Di Cosmo</a>, Antoine Eiche, Tudor A. Lascu, <a href="">Michael Lienhardt</a>, <a href="">Jacopo Mauro</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Gianluigi Zavattaro</a>, <a href="">Jakub Zwolakowski</a>. **Aeolus: Mastering the Complexity of Cloud Application Deployment**.  <em>In proceedings of ESOCC 2013: Service-Oriented and Cloud
345       Computing, 2nd European Conference, Málaga, Spain,
346       September 11-13, 2013.
347       LNCS <a href="">8135</a>,
348       pp. <a href="">1-3</a>,
349       Springer-Verlag, 2013.</em>
350     [[!toggle id=id51 text="Abstract..."]] [[!toggleable id=id51 text="""
351     *Abstract:* Cloud computing offers the possibility to build sophisticated software systems on virtualized infrastructures at a fraction of the cost necessary just few years ago, but deploying/maintaining/reconfiguring such software systems is a serious challenge. The main objective of the Aeolus project, an initiative funded by ANR (the French "Agence Nationale de la Recherche"), is to tackle the scientific problems that need to be solved in order to ease the problem of efficient and cost-effective deployment and administration of the complex distributed architectures which are at the heart of cloud applications.
352     """]]
353  1. <a class="paper-download" href="fmco2012-foss-components.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="fmco2012-foss-components.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Formal Aspects of Free and Open Source Software Components**.  <em>In proceedings of FMCO 2012: <a href="">HATS International School on
354       Formal Models for Components and Objects</a>, Bertinoro,
355       Italy, 24-28 September 2012. LNCS
356       <a href="">7866</a>,
357       pp. <a href="">216-239</a>,
358       Springer-Verlag, 2013.</em>
359     [[!toggle id=id49 text="Abstract..."]] [[!toggleable id=id49 text="""
360     *Abstract:* Free and Open Source Software (FOSS) distributions are popular solutions to deploy and maintain software on server, desktop, and mobile computing equipment. The typical deployment method in the FOSS setting relies on software distributions as vendors, packages as independently deployable components, and package managers as upgrade tools. We review research results from the past decade that apply formal methods to the study of inter-component relationships in the FOSS context. We discuss how those results are being used to attack both issues faced by users, such as dealing with upgrade failures on target machines, and issues important to distributions such as quality assurance processes for repositories containing tens of thousands, rapidly evolving software packages.
361     """]]
362  1. <a class="paper-download" href="icalp2013-aeolus.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="icalp2013-aeolus.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Jacopo Mauro</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Gianluigi Zavattaro</a>. **Component Reconfiguration in the Presence of Conflicts**.  <em>In proceedings of ICALP 2013: <a href="">40th International Colloquium on
363       Automata, Languages and Programming</a>, Riga, Latvia, 8-12
364       July, 2013.  LNCS
365       <a href="">7966</a>,
366       pp. <a href="">187-198</a>,
367       Springer-Verlag,
368       2013.</em>
369     [[!toggle id=id45 text="Abstract..."]] [[!toggleable id=id45 text="""
370     *Abstract:* Components are traditionally modeled as black-boxes equipped with interfaces that indicate provided/required ports and, often, also conflicts with other components that cannot coexist with them. In modern tools for automatic system management, components become grey-boxes that show relevant internal states and the possible actions that can be acted on the components to change such state during the deployment and reconfiguration phases. However, state-of-the-art tools in this field do not support a systematic management of conflicts. In this paper we investigate the impact of conflicts by precisely characterizing the increment of complexity on the reconfiguration problem.
371     """]]
372  1. <a class="paper-download" href="msr2012-conflicts.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="msr2012-conflicts.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Cyrille Valentin Artho</a>, Kuniyasu Suzaki, <a href="">Roberto Di Cosmo</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Why do software packages conflict?**.  <em>In proceedings of <a href="">MSR
373       2012</a>: <a href="">9th IEEE Working Conference
374       on Mining Software Repositories</a>, co-located with <a href="">ICSE 2012</a>,
375       IEEE, ISBN 978-1-4673-1760-3, <a href="">pp. 141-150</a>.
376       2-3 June 2012, Zurich, Switzerland.</em>
377     [[!toggle id=id44 text="Abstract..."]] [[!toggleable id=id44 text="""
378     *Abstract:* Determining whether two or more packages cannot be installed together is an important issue in the quality assurance process of package-based distributions. Unfortunately, the sheer number of different configurations to test makes this task particularly challenging, and hundreds of such incompatibilities go undetected by the normal testing and distribution process until they are later reported by a user as bugs that we call "conflict defects". We performed an extensive case study of conflict defects extracted from the bug tracking systems of Debian and Red Hat. According to our results, conflict defects can be grouped into five main categories. We show that with more detailed package meta-data, about 30% of all conflict defects could be prevented relatively easily, while another 30% could be found by targeted testing of packages that share common resources or characteristics. These results allow us to make precise suggestions on how to prevent and detect conflict defects in the future.
379     """]]
380  1. <a class="paper-download" href="sefm2012-aeolus.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="sefm2012-aeolus.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Gianluigi Zavattaro</a>. **Towards a Formal Component Model for the Cloud**.  <em>In proceedings of SEFM 2012: <a href="">10th International Conference on
381       Software Engineering and Formal Methods</a>, Thessaloniki,
382       Greece, 1-5 October, 2012. LNCS 7504,
383       ISBN 978-3-642-33825-0,
384       pp. 156-171, Springer-Verlag,
385       2012.</em>
386     [[!toggle id=id43 text="Abstract..."]] [[!toggleable id=id43 text="""
387     *Abstract:* We consider the problem of deploying and (re)configuring resources in a "cloud" setting, where interconnected software components and services can be deployed on clusters of heterogeneous (virtual) machines that can be created and connected on-the-fly. We introduce the Aeolus component model to capture similar scenarii from realistic cloud deployments, and instrument automated planning of day-to-day activities such as software upgrade planning, service deployment, elastic scaling, etc. We formalize the model and characterize the feasibility and complexity of configuration achievability in Aeolus.
388     """]]
389  1. <a class="paper-download" href="cbse2012-futures.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="cbse2012-futures.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Learning from the Future of Component Repositories**.  <em>In proceedings of CBSE 2012:
390       <a href="">15th International ACM
391       SIGSOFT Symposium on Component Based Software
392       Engineering</a>, Bertinoro, Italy, June 26-28, 2012.
393       ISBN 978-1-4503-1345-2,
394       <a href="">pp. 51-60</a>,
395       ACM 2012. <em>Award:</em> <a href="">ACM SIGSOFT</a> Distinguished Paper
396       Award.</em>
397     [[!toggle id=id41 text="Abstract..."]] [[!toggleable id=id41 text="""
398     *Abstract:* An important aspect of the quality assurance of large component repositories is the logical coherence of component metadata. We argue that it is possible to identify certain classes of such problems by checking relevant properties of the possible future repositories into which the current repository may evolve. In order to make a complete analysis of all possible futures effective however, one needs a way to construct a finite set of representatives of this infinite set of potential futures. We define a class of properties for which this can be done. We illustrate the practical usefulness of the approach with two quality assurance applications: (i) establishing the amount of "forced upgrades" induced by introducing new versions of existing components in a repository, and (ii) identifying outdated components that need to be upgraded in order to ever be installable in the future. For both applications we provide experience reports obtained on the Debian distribution.
399     """]]
400  1. <a class="paper-download" href="cbse2011-mpm.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="cbse2011-mpm.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **MPM: a modular package manager**.  <em>In proceedings of CBSE 2011: <a href="">14th International ACM SIGSOFT
401       Symposium on Component Based Software Engineering</a>,
402       Boulder, Colorado, USA, 21-23 June, 2011. ISBN
403       978-1-4503-0723-9,
404       <a href="">pp. 179-188</a>,
405       ACM 2011. <em>Award:</em> <a href="">ACM SIGSOFT</a> Distinguished Paper
406       Award.</em>
407     [[!toggle id=id36 text="Abstract..."]] [[!toggleable id=id36 text="""
408     *Abstract:* Software distributions in the FOSS world rely on so-called package managers for the installation and removal of packages on target machines. State-of-the-art package managers are monolithic in architecture, and each of them is hard-wired to an ad-hoc dependency solver implementing a customized heuristics. In this paper we propose a modular architecture allowing for pluggable dependency solvers and backends. We argue that this is the path that leads to the next generation of package managers that will deliver better results, accept more expressive input languages, and can be easily adaptable to new platforms. We present a working prototype, called MPM, which has been implemented following the design advocated in this paper.
409     """]]
410  1. <a class="paper-download" href="splc2010-fd-deps.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="splc2010-fd-deps.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Stefano Zacchiroli</a>. **Feature Diagrams as Package Dependencies**.  <em>In proceedings of SPLC 2010: <a href="">14th International Software
411       Product Line Conference</a>, Jeju Island, South Korea, 13-17
412       September 2010. LNCS <a href="">6287</a>,
413       ISBN 978-3-642-15578-9, <a href="">pp. 476-480</a>,
414       Springer-Verlag, 2010.</em>
415     [[!toggle id=id34 text="Abstract..."]] [[!toggleable id=id34 text="""
416     *Abstract:* FOSS (Free and Open Source Software) distributions use dependencies and package managers to maintain huge collections of packages and their installations; recent research have led to efficient and complete configuration tools and techniques, based on state of the art solvers, that are being adopted in industry. We show how to encode a significant subset of Free Feature Diagrams as interdependent packages, enabling to reuse package tools and research results into software product lines.
417     """]]
418  1. <a class="paper-download" href="msr2010-udd.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="msr2010-udd.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Lucas Nussbaum</a>, <a href="">Stefano Zacchiroli</a>. **The Ultimate Debian Database: Consolidating Bazaar Metadata for Quality Assurance and Data Mining**.  <em>In proceedings of <a href="">MSR 2010</a>:
419       <a href="">7th IEEE Working
420       Conference on Mining Software Repositories</a>, co-located
421       with <a href="">ICSE 2010</a>,
422       IEEE, ISBN 978-1-4244-6802-7, <a href=";arnumber=5463277">pp. 52-61</a>.
423       2-3 May 2010, Cape Town, South Africa.</em>
424     [[!toggle id=id33 text="Abstract..."]] [[!toggleable id=id33 text="""
425     *Abstract:* FLOSS distributions like RedHat and Ubuntu require a lot more complex infrastructures than most other FLOSS projects. In the case of community-driven distributions like Debian, the development of such an infrastructure is often not very organized, leading to new data sources being added in an impromptu manner while hackers set up new services that gain acceptance in the community. Mixing and matching data is then harder than should be, albeit being badly needed for Quality Assurance and data mining. Massive refactoring and integration is not a viable solution either, due to the constraints imposed by the bazaar development model. This paper presents the Ultimate Debian Database (UDD), which is the countermeasure adopted by the Debian project to the above "data hell". UDD gathers data from various data sources into a single, central SQL database, turning Quality Assurance needs that could not be easily implemented before into simple SQL queries. The paper also discusses the customs that have contributed to the data hell, the lessons learnt while designing UDD, and its applications and potentialities for data mining on FLOSS distributions.
426     """]]
427  1. <a class="paper-download" href="sac10-coclo.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="sac10-coclo.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Gabriele D'Angelo</a>, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Content Cloaking: Preserving Privacy with Google Docs and other Web Applications**.  <em>In proceedings of ACM SAC 2010: <a href="">25th Annual ACM
428       Symposium on Applied Computing</a>, ISBN
429       978-1-60558-639-7, <a href="">pp. 826-830</a>.
430       22-26 March 2010, Sierre, Switzerland.</em>
431     [[!toggle id=id31 text="Abstract..."]] [[!toggleable id=id31 text="""
432     *Abstract:* Web office suites such as Google Docs offer unparalleled collaboration experiences in terms of low software requirements, ease of use, data ubiquity, and availability. When the data holder (Google, Microsoft, etc.) is not perceived as trusted though, those benefits are considered at stake with important privacy requirements. Content cloaking is a lightweight, cryptographic, client-side solution to protect content from data holders while using web office suites and other "Web 2.0", AJAX-based, collaborative applications.
433     """]]
434  1. <a class="paper-download" href="strongdeps-esem-2009.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="strongdeps-esem-2009.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, Jaap Boender, <a href="">Roberto Di Cosmo</a>, <a href="">Stefano Zacchiroli</a>. **Strong Dependencies between Software Components**.  <em>
435         In proceedings of <a href="">ESEM 2009</a>: 3rd
436         International Symposium on Empirical Software Engineering and
437         Measurement, ISBN 978-1-4244-4842-5, <a href="">pp.
438         89-99</a>. October 15-16, 2009 - Lake Buena Vista,
439         Florida, USA.
440       </em>
441     [[!toggle id=id28 text="Abstract..."]] [[!toggleable id=id28 text="""
442     *Abstract:* Component-based systems often describe context requirements in terms of explicit inter-component dependencies. Studying large instances of such systems, such as free and open source software (FOSS) distributions, in terms of declared dependencies between packages is appealing. It is however also misleading when the language to express dependencies is as expressive as boolean formulae, which is often the case. In such settings, a more appropriate notion of component dependency exists: strong dependency. This paper introduces such notion as a first step towards modeling semantic, rather then syntactic, inter-component relationships. Furthermore, a notion of component sensitivity is derived from strong dependencies, with applications to quality assurance and to the evaluation of upgrade risks. An empirical study of strong dependencies and sensitivity is presented, in the context of one of the largest, freely available, component-based system.
443     """]]
444  1. <a class="paper-download" href="enase2009-upgrade.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="enase2009-upgrade.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Antonio Cicchetti</a>, <a href="">Davide Di Ruscio</a>, <a href="">Patrizio Pelliccione</a>, <a href="">Alfonso Pierantonio</a>, <a href="">Stefano Zacchiroli</a>. **A Model Driven Approach to Upgrade Package-Based Software Systems**.  <em>In proceedings of <a href="">ENASE
445       2009</a>: 4th international conference on Evaluation of Novel Aspects to
446       Software Engineering; held in conjunction with <a href="">ICEIS 2009</a>. 6-10 May 2009, Milan, Italy.
447       <a href="">CCIS
448       volume 69</a>, ISBN 978-3-642-14818-7,
449       <a href="">pp.
450       262-276</a>, Springer-Verlag,
451       2010.</em>
452     [[!toggle id=id26 text="Abstract..."]] [[!toggleable id=id26 text="""
453     *Abstract:* Complex software systems are more and more based on the abstraction of package, brought to popularity by Free and Open Source Software (FOSS) distributions. While helpful as an encapsulation layer, packages do not solve all problems of deployment, and more generally of management, of large software collections. In particular upgrades, which often affect several packages at once due to inter-package dependencies, often fail and do not hold good transactional properties. This paper shows how to apply model driven techniques to describe and manage software upgrades of FOSS distributions. It is discussed how to model static and dynamic aspects of package upgrades, the latter being the most challenging aspect to deal with, in order to be able to predict common causes of upgrade failures and undo residual effects of failed or undesired upgrades.
454     """]]
455  1. <a class="paper-download" href="sac09-manners.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="sac09-manners.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Angelo Di Iorio</a>, <a href="">Davide Rossi</a>, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Where are your Manners? Sharing Best Community Practices in the Web 2.0**.  <em>In proceedings of ACM SAC 2009: the <a href="">24th Annual ACM
456       Symposium on Applied Computing</a>. ISBN
457       978-1-60558-166-8, <a href=";coll=ACM&amp;dl=ACM&amp;type=series&amp;idx=SERIES179&amp;part=series&amp;WantType=Proceedings&amp;title=SAC">pp. 681-687</a>, ACM.</em>
458     [[!toggle id=id23 text="Abstract..."]] [[!toggleable id=id23 text="""
459     *Abstract:* The Web 2.0 fosters the creation of communities by offering users a wide array of social software tools. But, while the success of these tools is based on their ability to support different interaction patterns among users by imposing as less limitations as possible, the communities they support are not free of rules (just think about the posting rules in a community forum or the editing rules in a thematic wiki). In this paper we propose a framework for the sharing of best community practices in the form of a (potentially rule-based) annotation layer that can be integrated with existing Web 2.0 community tools (with specific focus on wikis). This solution is characterized by minimal intrusiveness and plays nicely within the open spirit of the Web 2.0 by proving users with behavioral hints rather than by enforcing the strict adherence to a set of rules.
460     """]]
461  1. <a class="paper-download" href="wiki-templating.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="wiki-templating.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Angelo Di Iorio</a>, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Wiki Content Templating**.  <em>
462         In Proceedings of <a href="">WWW 2008</a>:
463         17th International World Wide Web Conference. April 21-25,
464         2008 Beijing, China. ACM ISBN
465         978-1-60558-085-2/08/04, <a href="">pp.
466         615-624</a>.
467       </em>
468     [[!toggle id=id18 text="Abstract..."]] [[!toggleable id=id18 text="""
469     *Abstract:* Wiki content templating enables reuse of content structures among wiki pages. In this paper we present a thorough study of this widespread feature, showing how its two state of the art models (functional and creational templating) are sub-optimal. We then propose a third, better, model called lightly constrained (LC) templating and show its implementation in the Moin wiki engine. We also show how LC templating implementations are the appropriate technologies to push forward semantically rich web pages on the lines of (lowercase) semantic web and microformats.
470     """]]
471  1. <a class="paper-download" href="disambiguation-errors.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="disambiguation-errors.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Claudio Sacerdoti Coen</a>, <a href="">Stefano Zacchiroli</a>. **Spurious Disambiguation Error Detection**.  <em>
472         In Proceedings of <a href="">MKM 2007</a>: The
473         6th International Conference on Mathematical Knowledge
474         Management.  Hagenberg, Austria -- 27-30 June 2007. <a href="">LNAI 4573</a>,
475         Springer Berlin / Heidelberg, ISBN
476         978-3-540-73083-5, <a href="">pp.
477         381-392</a>, 2007.
478       </em>
479     [[!toggle id=id14 text="Abstract..."]] [[!toggleable id=id14 text="""
480     *Abstract:* The disambiguation approach to the input of formulae enables the user to type correct formulae in a terse syntax close to the usual ambiguous mathematical notation. When it comes to incorrect formulae we want to present only errors related to the interpretation meant by the user, hiding errors related to other interpretations (spurious errors). We propose a heuristic to recognize spurious errors, which has been integrated with the disambiguation algorithm of [1].
481     """]]
482  1. <a class="paper-download" href="matita-crafting.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="matita-crafting.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Andrea Asperti</a>, <a href="">Claudio Sacerdoti Coen</a>, <a href="">Enrico Tassi</a>, <a href="">Stefano Zacchiroli</a>. **Crafting a Proof Assistant**.  <em>
483         In Proceedings of <a href="">Types 2006</a>: Types for
484         Proofs and Programs. Nottingham, UK -- April 18-21, 2006.
485         LNCS <a href="">4502</a>,
486         Springer Berlin / Heidelberg, ISBN
487         978-3-540-74463-4, <a href="">pp.
488         18-32</a>, 2007.
489       </em>
490     [[!toggle id=id10 text="Abstract..."]] [[!toggleable id=id10 text="""
491     *Abstract:* Proof assistants are complex applications whose development has never been properly systematized or documented. This work is a contribution in this direction, based on our experience with the development of Matita: a new interactive theorem prover based, as Coq, on the Calculus of Inductive Constructions (CIC). In particular, we analyze its architecture focusing on the dependencies of its components, how they implement the main functionalities, and their degree of reusability. The work is a first attempt to provide a ground for a more direct comparison between different systems and to highlight the common functionalities, not only in view of reusability but also to encourage a more systematic comparison of different softwares and architectural solutions.
492     """]]
493  1. <a class="paper-download" href="notation.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="notation.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Luca Padovani</a>, <a href="">Stefano Zacchiroli</a>. **From Notation to Semantics: There and Back Again**.  <em>
494         In Proceedings of <a href="">MKM 2006</a>: The 5th
495         International Conference on Mathematical Knowledge
496         Management.  Wokingham, UK -- August 11-12, 2006. <a href="">LNAI
497         4108</a>, Springer Berlin / Heidelberg, ISBN
498         978-3-540-37104-5, <a href="">pp.
499         194-207</a>, 2006.
500       </em>
501     [[!toggle id=id6 text="Abstract..."]] [[!toggleable id=id6 text="""
502     *Abstract:* Mathematical notation is a structured, open, and ambiguous language. In order to support mathematical notation in MKM applications one must necessarily take into account presentational as well as semantic aspects. The former are required to create a familiar, comfortable, and usable interface to interact with. The latter are necessary in order to process the information meaningfully. In this paper we investigate a framework for dealing with mathematical notation in a meaningful, extensible way, and we show an effective instantiation of its architecture to the field of interactive theorem proving. The framework builds upon well-known concepts and widely-used technologies and it can be easily adopted by other MKM applications.
503     """]]
504  1. <a class="paper-download" href="whelp.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="whelp.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Andrea Asperti</a>, <a href="">Ferruccio Guidi</a>, <a href="">Claudio Sacerdoti Coen</a>, <a href="">Enrico Tassi</a>, <a href="">Stefano Zacchiroli</a>. **A Content Based Mathematical Search Engine: Whelp**.  <em>
505         In Proceedings of <a href="">TYPES
506         2004</a>: Types for Proofs and Programs. Paris, France --
507         December 15-18, 2004. LNCS <a href="">3839</a>,
508         Springer Berlin / Heidelberg, ISBN
509         3-540-31428-8, <a href="">pp.
510         17-32</a>, 2006.
511       </em>
512     [[!toggle id=id5 text="Abstract..."]] [[!toggleable id=id5 text="""
513     *Abstract:* The prototype of a content based search engine for mathematical knowledge supporting a small set of queries requiring matching and/or typing operations is described. The prototype, called Whelp, exploits a metadata approach for indexing the information that looks far more flexible than traditional indexing techniques for structured expressions like substitution, discrimination, or context trees. The prototype has been instantiated to the standard library of the Coq proof assistant extended with many user contributions.
514     """]]
515  1. <a class="paper-download" href="gmetadom.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="gmetadom.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Luca Padovani</a>, <a href="">Claudio Sacerdoti Coen</a>, <a href="">Stefano Zacchiroli</a>. **A Generative Approach to the Implementation of Language Bindings for the Document Object Model**.  <em>
516         In Proceedings of <a href="">GPCE'04</a> 3rd International Conference
517         on Generative Programming and Component
518         Engineering. Vancouver, Canada -- October 24-28, 2004 LNCS
519         <a href="">3286</a>,
520         Springer Berlin / Heidelberg, ISBN
521         3-540-23580-9, <a href="">pp.
522         469-487</a>, 2004.
523       </em>
524     [[!toggle id=id4 text="Abstract..."]] [[!toggleable id=id4 text="""
525     *Abstract:* The availability of a C implementation for the Document Object Model (DOM) gives the interesting opportunity of generating bindings for different programming languages automatically. Because of the DOM bias towards Java-like languages, a C implementation that fakes objects, inheritance, polymorphism, exceptions and uses reference-counting introduces a gap between the API specification and its actual implementation that the bindings should try to close. In this paper we overview the generative approach in this particular context and apply it for the generation of C++ and OCaml bindings.
526     """]]
527  1. <a class="paper-download" href="disambiguation.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="disambiguation.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Claudio Sacerdoti Coen</a>, <a href="">Stefano Zacchiroli</a>. **Efficient Ambiguous Parsing of Mathematical Formulae**.  <em>
528         In Proceedings of <a href="">MKM 2004</a>: 3rd
529         International Conference on Mathematical Knowledge
530         Management. September 19-21, 2004 Bialowieza - Poland.
531         LNCS <a href="">3119</a>,
532         Springer Berlin / Heidelberg, ISBN
533         3-540-23029-7, <a href="">pp.
534         347-362</a>, 2004.
535       </em>
536     [[!toggle id=id2 text="Abstract..."]] [[!toggleable id=id2 text="""
537     *Abstract:* Mathematical notation has the characteristic of being ambiguous: operators can be overloaded and information that can be deduced is often omitted. Mathematicians are used to this ambiguity and can easily disambiguate a formula making use of the context and of their ability to find the right interpretation. Software applications that have to deal with formulae usually avoid these issues by fixing an unambiguous input notation. This solution is annoying for mathematicians because of the resulting tricky syntaxes and becomes a show stopper to the simultaneous adoption of tools characterized by different input languages. In this paper we present an efficient algorithm suitable for ambiguous parsing of mathematical formulae. The only requirement of the algorithm is the existence of a validity predicate over abstract syntax trees of incomplete formulae with placeholders. This requirement can be easily fulfilled in the applicative area of interactive proof assistants, and in several other areas of Mathematical Knowledge Management.
538     """]]
540 # <span title="international, peer-reviewed workshops">international, peer-reviewed workshop proceedings</span>
542  1. <a class="paper-download" href="cudf-ocaml-2014.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="cudf-ocaml-2014.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Louis Gesbert</a>, <a href="">Fabrice Le Fessant</a>, <a href="">Stefano Zacchiroli</a>. **Using Preferences to Tame your Package Manager**.  <em>In proceedings of <a href="">OCaml 2014</a>: The OCaml
543       Users and Developers Workshop, September 5, 2014, Gothenburg,
544       Sweden. Co-located with <a href="">ICFP 2014</a>. 2014.</em>
545     [[!toggle id=id57 text="Abstract..."]] [[!toggleable id=id57 text="""
546     *Abstract:* Determining whether some components can be installed on a system is a complex problem: not only it is NP-complete in the worst case, but there can also be exponentially many solutions to it. Ordinary package managers use ad-hoc heuristics to solve this installation problem and choose a particular solution, making extremely difficult to change or sidestep these heuristics when the result is not the one we expect. When software repositories become complex enough, one gets vastly superior results by delegating dependency handling to a specialised solver, and use optimisation functions (or preferences) to control the class of solutions that are found. The opam package manager relies on the CUDF pivot format, which allows OCaml users that have a CUDF-compliant solver on their machine to reap the benefits of preferences-based dependency resolution. Thanks to the solver farm provided by Irill, these benefits are now extended to the OCaml community at large. In this talk we will present the preferences language and explain how to use it.
547     """]]
548  1. <a class="paper-download" href="lococo2011-conflicts.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="lococo2011-conflicts.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Cyrille Valentin Artho</a>, <a href="">Roberto Di Cosmo</a>, Kuniyasu Suzaki, <a href="">Stefano Zacchiroli</a>. **Sources of Inter-package Conflicts in Debian**.  <em>
549         In proceedings of <a href="">LoCoCo 2011</a> International
550         Workshop on Logics for Component Configuration, affiliated
551         with <a href="">CP 2011</a>
552       </em>
553     [[!toggle id=id38 text="Abstract..."]] [[!toggleable id=id38 text="""
554     *Abstract:* Inter-package conflicts require the presence of two or more packages in a particular configuration, and thus tend to be harder to detect and localize than conventional (intra-package) defects. Hundreds of such inter-package conflicts go undetected by the normal testing and distribution process until they are later reported by a user. The reason for this is that current meta-data is not fine-grained and accurate enough to cover all common types of conflicts. A case study of inter-package conflicts in Debian has shown that with more detailed package meta-data, at least one third of all package conflicts could be prevented relatively easily, while another one third could be found by targeted testing of packages that share common resources or characteristics. This paper reports the case study and proposes ideas to detect inter-package conflicts in the future.
555     """]]
556  1. <a class="paper-download" href="mooml-iwoce-2009.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="mooml-iwoce-2009.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Expressing Advanced User preferences in Component Installation**.  <em>
557         In proceedings of <a href="">IWOCE
558         2009</a>: International Workshop on Open Component
559         Ecosystem, affiliated with <a href="">ESEC/FSE
560         2009</a>. Foundations of Software Engineering, ISBN
561         978-1-60558-677-9, <a href="">pp. 31-40</a>,
562         ACM 2009.
563       </em>
564     [[!toggle id=id30 text="Abstract..."]] [[!toggleable id=id30 text="""
565     *Abstract:* State of the art component-based software collections, such as FOSS distributions, are made of up to dozens of thousands components, with complex inter-dependencies and conflicts. Given a particular installation of such a system, each request to alter the set of installed components has potentially (too) many satisfying answers. We present an architecture that allows to express advanced user preferences about package selection in FOSS distributions. The architecture is composed by a distribution-independent format for describing available and installed packages called CUDF (Common Upgradeability Description Format), and a foundational language called MooML to specify optimization criteria. We present the syntax and semantics of CUDF and MooML, and discuss the partial evaluation mechanism of MooML which allows to gain efficiency in package dependency solvers.
566     """]]
567  1. <a class="paper-download" href="modernization-iwoce-2009.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="modernization-iwoce-2009.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Davide Di Ruscio</a>, <a href="">Patrizio Pelliccione</a>, <a href="">Alfonso Pierantonio</a>, <a href="">Stefano Zacchiroli</a>. **Towards maintainer script modernization in FOSS distributions**.  <em>
568         In proceedings of <a href="">IWOCE
569         2009</a>: International Workshop on Open Component
570         Ecosystem, affiliated with <a href="">ESEC/FSE
571         2009</a>. Foundations of Software Engineering, ISBN
572         978-1-60558-677-9, <a href="">pp. 11-20</a>,
573         ACM 2009.
574       </em>
575     [[!toggle id=id29 text="Abstract..."]] [[!toggleable id=id29 text="""
576     *Abstract:* Free and Open Source Software (FOSS) distributions are complex software systems, made of thousands packages that evolve rapidly, independently, and without centralized coordination. During packages upgrades, corner case failures can be encountered and are hard to deal with, especially when they are due to misbehaving maintainer scripts: executable code snippets used to finalize package configuration. In this paper we report a software modernization experience, the process of representing existing legacy systems in terms of models, applied to FOSS distributions. We present a process to define meta-models that enable dealing with upgrade failures and help rolling back from them, taking into account maintainer scripts. The process has been applied to widely used FOSS distributions and we report about such experiences.
577     """]]
578  1. <a class="paper-download" href="hotswup-package-upgrade.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="hotswup-package-upgrade.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Paulo Trezentos</a>, <a href="">Stefano Zacchiroli</a>. **Package Upgrades in FOSS Distributions: Details and Challenges**.  <em>In proceedings of <a href="">HotSWUp'08: Hot Topics in Software
579       Upgrades</a>. October 20, 2008, Nashville, Tennessee,
580       USA. ACM ISBN
581       978-1-60558-304-4.</em>
582     [[!toggle id=id22 text="Abstract..."]] [[!toggleable id=id22 text="""
583     *Abstract:* The upgrade problems faced by Free and Open Source Software distributions have characteristics not easily found elsewhere. We describe the structure of packages and their role in the upgrade process. We show that state of the art package managers have shortcomings inhibiting their ability to cope with frequent upgrade failures. We survey current countermeasures to such failures, argue that they are not satisfactory, and sketch alternative solutions.
584     """]]
585  1. <a class="paper-download" href="steve-latvia.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="steve-latvia.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Paolo Marinelli</a>, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Streaming Validation of Schemata: the Lazy Typing Discipline**.  <em>
586         In Proceedings of <a href="">Extreme Markup
587         Languages 2007</a>: The Markup Theory and Practice
588         Conference. August 7-10, 2007 Montreal, Canada.
589       </em>
590     [[!toggle id=id15 text="Abstract..."]] [[!toggleable id=id15 text="""
591     *Abstract:* Assertions, identity constraints, and conditional type assignments are (planned) features of XML Schema which rely on XPath evaluation to various ends. The allowed XPath subset exploitable in those features is trimmed down for streamability concerns partly understandable (the apparent wish to avoid buffering to determine the evaluation of an expression) and partly artificial. In this paper we dissect the XPath language in subsets with varying streamability characteristics. We also identify the larger subset which is compatible with the typing discipline we believe underlies some of the choices currently present in the XML Schema specifications. We describe such a discipline as imposing that the type of an element has to be decided when its start tag is encountered and its validity has to be when its end tag is. We also propose an alternative lazy typing discipline where both type assignment and validity assessment are fired as soon as they are available in a best effort manner. We believe our discipline is more flexible and delegate to schema authors the choice of where to place in the trade-off between using larger XPath subsets and increasing buffering requirements or expeditiousness of typing information availability.
592     """]]
593  1. <a class="paper-download" href="streaming-co-constraints.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="streaming-co-constraints.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Paolo Marinelli</a>, <a href="">Stefano Zacchiroli</a>. **Co-Constraint Validation in a Streaming Context**.  <em>
594         In Proceedings of <a href="">XML 2006</a>: The world's oldest
595         and biggest XML conference. <em>Award</em>: Winner of the
596         <a href="">XML
597         Scholarship 2006</a> as best student paper.  Boston, MA -- December
598         5-7, 2006.
599       </em>
600     [[!toggle id=id13 text="Abstract..."]] [[!toggleable id=id13 text="""
601     *Abstract:* In many use cases applications are bound to be run consuming only a limited amount of memory. When they need to validate large XML documents, they have to adopt streaming validation, which does not rely on an in-memory representation of the whole input document. In order to validate an XML document, different kinds of constraints need to be verified. Co-constraints, which relate the content of elements to the presence and values of other attributes or elements, are one such kind of constraints. In this paper we propose an approach to the problem of validating in a streaming fashion an XML document against a schema also specifying co-constraints. We describe how the streaming evaluation of co-constraints influences the output of the validation process. Our proposal makes use of the validation language SchemaPath, a light extension to XML Schema, adding conditional type assignment for the support of co-constraints. The paper is based on the description of our streaming SchemaPath validator.
602     """]]
603  1. <a class="paper-download" href="tinycals.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="tinycals.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Claudio Sacerdoti Coen</a>, <a href="">Enrico Tassi</a>, <a href="">Stefano Zacchiroli</a>. **Tinycals: Step by Step Tacticals**.  <em>
604         In Proceedings of <a href="">UITP 2006</a>:
605         User Interfaces for Theorem Provers. Seattle, WA -- August
606         21, 2006. <a href="">ENTCS
607         (Elsevier, ISSN 1571-0661)</a>,
608         <a href="">volume 174,
609         issue 2, pp. 125-142.
610         May 2007</a>.
611       </em>
612     [[!toggle id=id8 text="Abstract..."]] [[!toggleable id=id8 text="""
613     *Abstract:* Most of the state-of-the-art proof assistants are based on procedural proof languages, scripts, and rely on LCF tacticals as the primary tool for tactics composition. In this paper we discuss how these ingredients do not interact well with user interfaces based on the same interaction paradigm of Proof General (the de facto standard in this field), identifying in the coarse-grainedness of tactical evaluation the key problem. We propose Tinycals as an alternative to a subset of LCF tacticals, showing that the user does not experience the same problem if tacticals are evaluated in a more fine-grained manner. We present the formal operational semantics of tinycals as well as their implementation in the Matita proof assistant.
614     """]]
615  1. <a class="paper-download" href="constrainedwiki.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="constrainedwiki.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Angelo Di Iorio</a>, <a href="">Stefano Zacchiroli</a>. **Constrained Wiki: an Oxymoron?**.  <em>
616         In Proceedings of <a href="">WikiSym 2006</a>: the 2006
617         International Symposium on Wikis. Odense, Denmark -- August
618         21-23, 2006.  ACM, 2006, ISBN
619         1-59593-413-8, <a href="">pp.
620         89-98</a>.
621       </em>
622     [[!toggle id=id7 text="Abstract..."]] [[!toggleable id=id7 text="""
623     *Abstract:* In this paper we propose a new wiki concept -- light constraints -- designed to encode community best practices and domain-specific requirements, and to assist in their application. While the idea of constraining user editing of wiki content seems to inherently contradict "The Wiki Way", it is well-known that communities of users involved in wiki sites have the habit of establishing best authoring practices. For domain-specific wiki systems which process wiki content, it is often useful to enforce some well-formedness conditions on specific page contents. This paper describes a general framework to think about the interaction of wiki system with constraints, and presents a generic architecture which can be easily incorporated into existing wiki systems to exploit the capabilities enabled by light constraints.
624     """]]
625  1. <a class="paper-download" href="mathsearch.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="mathsearch.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Andrea Asperti</a>, <a href="">Stefano Zacchiroli</a>. **Searching Mathematics on the Web: State of the Art and Future Developments**.  <em>
626         In Proceedings of <a href="">New Developments in
627         Electronic Publishing AMS/SMM</a> Special Session, Houston,
628         May 2004 ECM4 Satellite Conference, Stockholm, June 2004 <a href="">pp. 9-18</a>.
629         FIZ Karlsruhe, ISBN 3-88127-107-4.
630       </em>
631     [[!toggle id=id3 text="Abstract..."]] [[!toggleable id=id3 text="""
632     *Abstract:* A huge amount of mathematical knowledge is nowadays available on the World Wide Web. Many different solutions and technologies for searching that knowledge have been developed as well. We present the state of the art of searching mathematics on the Web, giving some insight on future developments in this area.
633     """]]
634  1. <a class="paper-download" href="hbugs.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="hbugs.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Claudio Sacerdoti Coen</a>, <a href="">Stefano Zacchiroli</a>. **Brokers and Web-Services for Automatic Deduction: a Case Study**.  <em>
635         In Proceedings of <a href="">Calculemus 2003</a>:
636         11th Symposium on the Integration of Symbolic Computation and
637         Mechanized Reasoning. Roma, Italy -- September 10-12, 2003,
638         Aracne Editrice. ISBN
639         88-7999-545-6, pp. 43-57, 2003.
640       </em>
641     [[!toggle id=id1 text="Abstract..."]] [[!toggleable id=id1 text="""
642     *Abstract:* We present a planning broker and several Web-Services for automatic deduction. Each Web-Service implements one of the tactics usually available in interactive proof-assistants. When the broker is submitted a proof status (an incomplete proof tree and a focus on an open goal) it dispatches the proof to the Web-Services, collects the successful results, and send them back to the client as hints as soon as they are available. In our experience this architecture turns out to be helpful both for experienced users (who can take benefit of distributing heavy computations) and beginners (who can learn from it).
643     """]]
645 # <span title="national, peer-reviewed journals">national, peer-reviewed journal articles</span>
647  1. <a class="paper-download" href="studia11-dh-ocaml.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="studia11-dh-ocaml.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Mehdi Dogguy</a>, <a href="">Stéphane Glondu</a>, <a href="">Sylvain Le Gall</a>, <a href="">Stefano Zacchiroli</a>. **Enforcing Type-Safe Linking using Inter-Package Relationships**.  <em>In <a href="">Studia
648       Informatica Universalis</a>, volume 9,
649       issue 1, pp. 129-157.
650       ISSN 1625-7545, Hermann 2011.</em>
651     [[!toggle id=id37 text="Abstract..."]] [[!toggleable id=id37 text="""
652     *Abstract:* Strongly-typed languages rely on link-time checks to ensure that type safety is not violated at the borders of compilation units. Such checks entail very fine-grained dependencies among compilation units, which are at odds with the implicit assumption of backward compatibility that is relied upon by common library packaging techniques adopted by FOSS (Free and Open Source Software) package-based distributions. As a consequence, package managers are often unable to prevent users to install a set of libraries which cannot be linked together. We discuss how to guarantee link-time compatibility using inter-package relationships; in doing so, we take into account real-life maintainability problems such as support for automatic package rebuild and manageability of ABI (Application Binary Interface) strings by humans. We present the dh_ocaml implementation of the proposed solution, which is currently in use in the Debian distribution to safely deploy more than 300 OCaml-related packages.
653     """]]
655 # <span title="national, peer-reviewed conferences and workshops">national, peer-reviewed conference and workshop procedings</span>
657  1. <a class="paper-download" href="benevol-2018-swh.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="benevol-2018-swh.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Antoine Pietri</a>, <a href="">Stefano Zacchiroli</a>. **Towards Universal Software Evolution Analysis**.  <em>
658         In proceedings of <a href="">BENEVOL 2018</a>: The 17th
659         Belgium-Netherlands Software Evolution Workshop, Delft,
660         Netherlands, December 2018.
661         CEUR Workshop Proceedings (CEUR-WS)
662         vol. 2361
663         <a href="">pp. 6-10</a>,
664         ISSN 1613-0073.
665       </em>
666     [[!toggle id=id72 text="Abstract..."]] [[!toggleable id=id72 text="""
667     *Abstract:* Software evolution studies have mostly focused on individual software products, generally developed as Free/Open Source Software (FOSS) projects, and more sparingly on software collections like component and package ecosystems. We argue in this paper that the next step in this organic scale expansion is universal software evolution analysis, i.e., the study of software evolution at the scale of the whole body of publicly available software. We consider the case of Software Heritage, the largest existing archive of publicly available software source code artifacts (more than 5 B unique files archived and 1 B commits, coming from more than 80 M software projects). We propose research requirements that would allow to leverage the Software Heritage archive to study universal software evolution. We discuss the challenges that need to be overcome to address such requirements and outline a research roadmap to do so.
668     """]]
669  1. <a class="paper-download" href="jfla10-dh-ocaml.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="jfla10-dh-ocaml.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Mehdi Dogguy</a>, <a href="">Stéphane Glondu</a>, <a href="">Sylvain Le Gall</a>, <a href="">Stefano Zacchiroli</a>. **Enforcing Type-Safe Linking using Inter-Package Relationships**.  <em>In proceedings of JFLA 2010: <a href="">21st Journée Francophones des Langages
670       Applicatifs</a>, pp. 29-54. 30/01-02/02/2010 -
671       La Ciotat, France.</em>
672     [[!toggle id=id32 text="Abstract..."]] [[!toggleable id=id32 text="""
673     *Abstract:* Strongly-typed languages rely on link-time checks to ensure that type safety is not violated at the borders of compilation units. Such checks entail very fine-grained dependencies among compilation units, which are at odds with the implicit assumption of backward compatibility that is relied upon by common library packaging techniques adopted by FOSS (Free and Open Source Software) package-based distributions. As a consequence, package managers are often unable to prevent users to install a set of libraries which cannot be linked together. We discuss how to guarantee link-time compatibility using inter-package relationships; in doing so, we take into account real-life maintainability problems such as support for automatic package rebuild and manageability of ABI (Application Binary Interface) strings by humans. We present the dh_ocaml implementation of the proposed solution, which is currently in use in the Debian distribution to safely deploy more than 300 OCaml-related packages.
674     """]]
676 # <span title="official research reports of research institutions">technical reports</span>
678  1. <a class="paper-download" href="swh-provenance-tr.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="swh-provenance-tr.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> Guillaume Rousseau, <a href="">Roberto Di Cosmo</a>, <a href="">Stefano Zacchiroli</a>. **Growth and Duplication of Public Source Code over Time: Provenance Tracking at Scale**.  <em>
679         Inria
680         <a href="">technical
681         report</a>, 2019.
682       </em>
683     [[!toggle id=id74 text="Abstract..."]] [[!toggleable id=id74 text="""
684     *Abstract:* We study the evolution of the largest known corpus of publicly available source code, i.e., the Software Heritage archive (4B unique source code files, 1B commits capturing their development histories across 50M software projects). On such corpus we quantify the growth rate of original, never-seen-before source code files and commits. We find the growth rates to be exponential over a period of more than 40 years. We then estimate the multiplication factor, i.e., how much the same artifacts (e.g., files or commits) appear in different contexts (e.g., commits or source code distribution places). We observe a combinatorial explosion in the multiplication of identical source code files across different commits. We discuss the implication of these findings for the problem of tracking the provenance of source code artifacts (e.g., where and when a given source code file or commit has been observed in the wild) for the entire body of publicly available source code. To that end we benchmark different data models for capturing software provenance information at this scale and growth rate. We identify a viable solution that is deployable on commodity hardware and appears to be maintainable for the foreseeable future.
685     """]]
686  1. <a class="paper-download" href="aeolus-blender-tr.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="aeolus-blender-tr.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Roberto Di Cosmo</a>, Antoine Eiche, <a href="">Jacopo Mauro</a>, <a href="">Gianluigi Zavattaro</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Jakub Zwolakowski</a>. **Automatic Deployment of Software Components in the Cloud with the Aeolus Blender**.  <em>
687         Inria <a href="">technical
688         report</a> 2015.
689       </em>
690     [[!toggle id=id63 text="Abstract..."]] [[!toggleable id=id63 text="""
691     *Abstract:* Cloud computing allows to build sophisticated software sys-tems on virtualized infrastructures at a fraction of the cost that was necessary just a few years ago. The deployment of such complex systems, though, is still a serious issue due to the need of deploying a large number of packages and services, their elaborated interdependencies, and the need to define the (ideally optimal) allocation of software compo-nents onto available computing resources. In this paper we present the Aeolus Blender (Blender in the following), a toolchain that automates the assembly and deployment of complex component-based software systems in the "cloud". By relying on a configuration optimizer and a deployment planner, Blender fully automates the deploy-ment of real-life cloud applications on OpenStack infrastruc-tures, by exploiting a knowledge base of software compo-nents defined in the Mandriva Armonic tool-suite. The final deployment is guaranteed to satisfy not only user require-ments and software dependencies, but also to be optimal with respect to the number of used virtual machines.
692     """]]
693  1. <a class="paper-download" href="zephyrus-tr.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="zephyrus-tr.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Roberto Di Cosmo</a>, <a href="">Michael Lienhardt</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Jakub Zwolakowski</a>. **Optimal Provisioning in the Cloud**.  <em>
694         <a href="">Aeolus
695         project</a> <a href="">technical
696         report</a>, 7 Juin 2013.
697       </em>
698     [[!toggle id=id48 text="Abstract..."]] [[!toggleable id=id48 text="""
699     *Abstract:* Complex distributed systems are classically assembled by deploying several existing software components to multiple servers. Building such systems is a challenging problem that requires a significant amount of problem solving as one must i) ensure that all inter-component dependencies are satisfied; ii) ensure that no conflicting components are deployed on the same machine; and iii) take into account replication and distribution to account for quality of service, or possible failure of some services. We propose a tool, Zephyrus, that automates to a great extent assembling complex distributed systems. Given i) a high level specification of the desired system architecture, ii) the set of available components and their requirements) and iii) the current state of the system, Zephyrus is able to generate a formal representation of the desired system, to place the components in an optimal manner on the available machines, and to interconnect them as needed.
700     """]]
701  1. <a class="paper-download" href="icalp2013-tr.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="icalp2013-tr.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Roberto Di Cosmo</a>, <a href="">Jacopo Mauro</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Gianluigi Zavattaro</a>. **Component reconfiguration in the presence of conflicts**.  <em>
702         <a href="">Aeolus
703         project</a> <a href="">technical
704         report</a>, 22 Avril 2013.
705       </em>
706     [[!toggle id=id47 text="Abstract..."]] [[!toggleable id=id47 text="""
707     *Abstract:* Components are traditionally modeled as black-boxes equipped with interfaces that indicate provided/required ports and, often, also conflicts with other components that cannot coexist with them. In modern tools for automatic system management, components become grey-boxes that show relevant internal states and the possible actions that can be acted on the components to change such state during the deployment and reconfiguration phases. However, state-of-the-art tools in this field do not support a systematic management of conflicts. In this paper we investigate the impact of conflicts by precisely characterizing the increment of complexity on the reconfiguration problem.
708     """]]
709  1. <a class="paper-download" href="mancoosi-tr3.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="mancoosi-tr3.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Common Upgradeability Description Format (CUDF) 2.0**.  <em>
710         <a href="">Mancoosi project</a>
711         <a href="">technical
712         report 3</a>, 24 November 2009.
713       </em>
714     [[!toggle id=id66 text="Abstract..."]] [[!toggleable id=id66 text="""
715     *Abstract:* The solver competition which will be organized by Mancoosi relies on the standardized format for describing package upgrade scenarios. This document describes the Common Upgradeability Description Format (CUDF), the document format used to encode upgrade scenarios, abstracting over distribution-specific details. Solvers taking part in the competition will be fed with input in CUDF format. The format is not specific to Mancoosi and is meant to be generally useful to describe upgrade scenarios when abstraction over distribution-specific details is desired.
716     """]]
717  1. <a class="paper-download" href="strongdeps-tr.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="strongdeps-tr.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Pietro Abate</a>, Jaap Boender, <a href="">Roberto Di Cosmo</a>, <a href="">Stefano Zacchiroli</a>. **Strong Dependencies between Software Components**.  <em>
718         <a href="">Mancoosi project</a>
719         <a href="">technical
720         report 2</a>, 22 May 2009.
721       </em>
722     [[!toggle id=id27 text="Abstract..."]] [[!toggleable id=id27 text="""
723     *Abstract:* Component-based systems often describe context requirements in terms of explicit inter-component dependencies. Studying large instances of such systems, such as free and open source software (FOSS) distributions, in terms of declared dependencies between packages is appealing. It is however also misleading when the language to express dependencies is as expressive as boolean formulae, which is often the case. In such settings, a more appropriate notion of component dependency exists: strong dependency. This paper introduces such notion as a first step towards modeling semantic, rather then syntactic, inter-component relationships. Furthermore, a notion of component sensitivity is derived from strong dependencies, with applications to quality assurance and to the evaluation of upgrade risks. An empirical study of strong dependencies and sensitivity is presented, in the context of one of the largest, freely available, component-based system.
724     """]]
725  1. <a class="paper-download" href="mancoosi-d2.1.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="mancoosi-d2.1.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Davide Di Ruscio</a>, <a href="">Patrizio Pelliccione</a>, <a href="">Alfonso Pierantonio</a>, <a href="">Stefano Zacchiroli</a>. **Metamodel for Describing System Structure and State**.  <em>
726         <a href="">Mancoosi project</a>
727         deliverable,
728         <a href="">D2.1</a>,
729         work package 2. January 2009.
730       </em>
731     [[!toggle id=id25 text="Abstract..."]] [[!toggleable id=id25 text="""
732     *Abstract:* Today's software systems are very complex modular entities, made up of many interacting components that must be deployed and coexist in the same context. Modern operating systems provide the basic infrastructure for deploying and handling all the components that are used as the basic blocks for building more complex systems even though a generic and comprehensive support is far from being provided. In fact, in Free and Open Source Software (FOSS) systems, components evolve independently from each other and because of the huge amount of available components and their different project origins, it is not easy to manage the life cycle of a distribution. Users are in fact allowed to choose and install a wide variety of alternatives whose consistency cannot be checked a priori to their full extent. It is possible to easily make the system unusable by installing or removing some packages that "break" the consistency of what is installed in the system itself. This document proposes a model-driven approach to simulate system upgrades in advance and to detect predictable upgrade failures, possibly by notifying the user before the system is affected. The approach relies on an abstract representation of the systems and packages which are given in terms of models that are expressive enough to isolate inconsistent configurations (e.g., situations in which installed components rely on the presence of disappeared sub-components) that are currently not expressible as inter-package relationships.
733     """]]
734  1. <a class="paper-download" href="mancoosi-d5.1.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="mancoosi-d5.1.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Description of the CUDF Format**.  <em>
735         <a href="">Mancoosi project</a>
736         deliverable,
737         <a href="">D5.1</a>,
738         work package 5. November 2008.
739       </em>
740     [[!toggle id=id24 text="Abstract..."]] [[!toggleable id=id24 text="""
741     *Abstract:* This document contains several related specifications, taken together they describe the document formats related to the solver competition which will be organized by Mancoosi. In particular, this document describes: DUDF (Distribution Upgradeability Description Format), the document format to be used to submit upgrade problem instances from user machines to a (distribution-specific) database of upgrade problems; CUDF (Common Upgradeability Description Format), the document format used to encode upgrade problems, abstracting over distribution-specific details. Solvers taking part in the competition will be fed with input in CUDF format.
742     """]]
743  1. <a class="paper-download" href="flea.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="flea.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Luca Padovani</a>, <a href="">Stefano Zacchiroli</a>. **Stream Processing of XML Documents Made Easy with LALR(1) Parser Generators**.  <em>
744         <a href="">Technical
745         report UBLCS-2007-23</a>, September 2007,
746         <a href="">Department of Computer Science</a>, <a href="">University of Bologna</a>.
747       </em>
748     [[!toggle id=id17 text="Abstract..."]] [[!toggleable id=id17 text="""
749     *Abstract:* Because of their fully annotated structure, XML documents are normally believed to require a straightforward parsing phase. However, the standard APIs for accessing their content (the Document Object Model and the Simple API for XML) provide a programming interface that is very low-level and is thus inadequate for the recognition of any structure that is not isomorphic to its XML encoding. Even when the document undergoes validation, its unmarshalling into application-specific data using these APIs requires poorly maintainable, tedious-to-write, and possibly inefficient code. We describe a technique for the simultaneous parsing, validation, and unmarshalling of XML documents that combines a stream-oriented XML parser with a LALR(1) parser in order to guarantee efficient stream processing, expressive validation capabilities, and the possibility to associate user-provided actions with specific patterns occurring in the source documents.
750     """]]
751  1. <a class="paper-download" href="wiki-templating-tr.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="wiki-templating-tr.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Angelo Di Iorio</a>, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Templating Wiki Content for Fun and Profit**.  <em>
752         <a href="">Technical
753         report UBLCS-2007-21</a>, August 2007,
754         <a href="">Department of Computer Science</a>, <a href="">University of Bologna</a>.
755       </em>
756     [[!toggle id=id16 text="Abstract..."]] [[!toggleable id=id16 text="""
757     *Abstract:* Content templating enables reuse of content structures between wiki pages. Such a feature is implemented in several mainstream wiki engines. Systematic study of its conceptual models and comparison of the available implementations are unfortunately missing in the wiki literature. In this paper we aim to fill this gap first analyzing template-related user needs, and then reviewing existing approaches at content templating. Our investigation shows that two models emerge, functional and creational templating, and that both have weakness failing to properly fit in "The Wiki Way". As a solution, we propose the adoption of creational templates enriched with light constraints, showing that such a solution has a low implementative footprint in state-of-the-art wiki engines, and that it has a synergy with semantic wikis.
758     """]]
760 # dissertations
762  1. <a class="paper-download" href="hdr-thesis.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="hdr-thesis.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Stefano Zacchiroli</a>. **Large-scale Modeling, Analysis, and Preservation of Free and Open Source Software**.  <em>
763         HDR (Habilitation à diriger des recherches) dissertation, defended
764         publicly on 27 November 2017, at Université Paris Diderot, France,
765         before a jury composed of: Ahmed Bouajjani, Carlo Ghezzi, Jesus M.
766         Gonzalez-Barahona, Roberto Di Cosmo, Jean-Bernard Stefani, Diomidis
767         Spinellis, Andreas Zeller.
768       </em>
769  1. <a class="paper-download" href="phd-thesis.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="phd-thesis.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Stefano Zacchiroli</a>. **User Interaction Widgets for Interactive Theorem Proving**.  <em>
770         Ph.D. dissertation, <a href="">Technical
771           report UBLCS-2007-10</a>, March 2007, <a href="">Department of Computer Science</a>, <a href="">University of Bologna</a> (advisor: <a href="">Andrea Asperti</a>; refereed
772         by: <a href="">Christoph
773           Benzmueller</a>, <a href="">Marino
774           Miculan</a>).
775       </em>
776     [[!toggle id=id12 text="Abstract..."]] [[!toggleable id=id12 text="""
777     *Abstract:* Matita (that means pencil in Italian) is a new interactive theorem prover under development at the University of Bologna. When compared with state-of-the-art proof assistants, Matita presents both traditional and innovative aspects. The underlying calculus of the system, namely the Calculus of (Co)Inductive Constructions (CIC for short), is well-known and is used as the basis of another mainstream proof assistant, Coq, with which Matita is to some extent compatible. In the same spirit of several other systems, proof authoring is conducted by the user as a goal directed proof search, using a script for storing textual commands for the system. In the tradition of LCF, the proof language of Matita is procedural and relies on tactic and tacticals to proceed toward proof completion. The interaction paradigm offered to the user is based on the script management technique at the basis of the popularity of the Proof General generic interface for interactive theorem provers: while editing a script the user can move forth the execution point to deliver commands to the system, or back to retract (or "undo") past commands. Matita has been developed from scratch in the past 8 years by several members of the Helm research group, this thesis author is one of such members. Matita is now a full-fledged proof assistant with a library of about 1.000 concepts. Several innovative solutions spun-off from this development effort. This thesis is about the design and implementation of some of those solutions, in particular those relevant for the topic of user interaction with theorem provers, and of which this thesis author was a major contributor. Joint work with other members of the research group is pointed out where needed. The main topics discussed in this thesis are briefly summarized below. Disambiguation. Most activities connected with interactive proving require the user to input mathematical formulae. Being mathematical notation ambiguous, parsing formulae typeset as mathematicians like to write down on paper is a challenging task; a challenge neglected by several theorem provers which usually prefer to fix an unambiguous input syntax. Exploiting features of the underlying calculus, Matita offers an efficient disambiguation engine which permit to type formulae in the familiar mathematical notation. Step-by-step tacticals. Tacticals are higher-order constructs used in proof scripts to combine tactics together. With tacticals scripts can be made shorter, readable, and more resilient to changes. Unfortunately they are de facto incompatible with state-of-the-art user interfaces based on script management. Such interfaces indeed do not permit to position the execution point inside complex tacticals, thus introducing a trade-off between the usefulness of structuring scripts and a tedious big step execution behavior during script replaying. In Matita we break this trade-off with tinycals: an alternative to a subset of LCF tacticals which can be evaluated in a more fine-grained manner. Extensible yet meaningful notation. Proof assistant users often face the need of creating new mathematical notation in order to ease the use of new concepts. The framework used in Matita for dealing with extensible notation both accounts for high quality bidimensional rendering of formulae (with the expressivity of MathML-Presentation) and provides meaningful notation, where presentational fragments are kept synchronized with semantic representation of terms. Using our approach interoperability with other systems can be achieved at the content level, and direct manipulation of formulae acting on their rendered forms is possible too. Publish/subscribe hints. Automation plays an important role in interactive proving as users like to delegate tedious proving sub-tasks to decision procedures or external reasoners. Exploiting the Web-friendliness of Matita we experimented with a broker and a network of web services (called tutors) which can try independently to complete open sub-goals of a proof, currently being authored in Matita. The user receives hints from the tutors on how to complete sub-goals and can interactively or automatically apply them to the current proof. Another innovative aspect of Matita, only marginally touched by this thesis, is the embedded content-based search engine Whelp which is exploited to various ends, from automatic theorem proving to avoiding duplicate work for the user. We also discuss the (potential) reusability in other systems of the widgets presented in this thesis and how we envisage the evolution of user interfaces for interactive theorem provers in the Web 2.0 era.
778     """]]
779  1. <a class="paper-download" href="master-thesis.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="master-thesis.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Stefano Zacchiroli</a>. **Web services per il supporto alla dimostrazione interattiva (Web services for interactive theorem proving)**.  <em>
780         Master thesis (Italian only), March 2003, <a href="">Department of Computer Science</a>, <a href="">University of Bologna</a> (advisor: <a href="">Andrea Asperti</a>; refereed
781         by: <a href="">Nadia Busi</a>).
782       </em>
785 # miscellanea
787  1. <a class="paper-download" href="debconf8-mancoosi.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="debconf8-mancoosi.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Solving package dependencies: from EDOS to Mancoosi**.  <em>In proceedings of <a href="">DebConf8</a>: 9th annual conference
788       of the <a href="">Debian</a> project
789       developers. August 10-16, 2008, Mar del Plata,
790       Argentina.</em>
791     [[!toggle id=id21.1 text="Abstract..."]] [[!toggleable id=id21.1 text="""
792     *Abstract:* Mancoosi (Managing the Complexity of the Open Source Infrastructure) is an ongoing research project funded by the European Union for addressing some of the challenges related to the "upgrade problem" of interdependent software components of which Debian packages are prototypical examples. Mancoosi is the natural continuation of the EDOS project which has already contributed tools for distribution-wide quality assurance in Debian and other GNU/Linux distributions. The consortium behind the project consists of several European public and private research institutions as well as some commercial GNU/Linux distributions from Europe and South America. Debian is represented by a small group of Debian Developers who are working in the ranks of the involved universities to drive and integrate back achievements into Debian. This paper presents relevant results from EDOS in dependency management and gives an overview of the Mancoosi project and its objectives, with a particular focus on the prospective benefits for Debian.
793     """]]