last movie
[homepage.git] / research / publications.mdwn
1 [[!meta stylesheet=papers rel="stylesheet"]]
3 [[!img img/emblem-documents.png link="no" class="flow" alt="documents"]]
4 Here is a list of my **academic papers**, classified by type of publication and
5 in reverse chronological order:
7 [[!toc]]
9 You might also be interested in my author profiles on
10 [**DBLP**]( and
11 [**Google Scholar**](
14 # <span title="international, peer-reviewed journals">international, peer-reviewed journal articles</span>
16  1. <a class="paper-download" href="cscw-2018-rtce.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="cscw-2018-rtce.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Gabriele D'Angelo</a>, <a href="">Angelo Di Iorio</a>, <a href="">Stefano Zacchiroli</a>. **Spacetime Characterization of Real-Time Collaborative Editing**.  <em>
17         In <a href="">Proceedings of
18         the ACM on Human-Computer Interaction</a>,
19         Volume 2, Issue CSCW,
20         Article No. <a href="">41</a>.
21         ACM, November 2018.
22       </em>
23     [[!toggle id=id71 text="Abstract..."]] [[!toggleable id=id71 text="""
24     *Abstract:* Real-Time Collaborative Editing (RTCE) is a popular way of instrumenting cooperative work on documents, in particular on the Web. Little is known in the literature yet about RTCE usage patterns in the real world. In this paper we study how a popular RTCE editor (Etherpad) is used in the wild, digging into the edit histories of a large collection of documents (about 14 000 pads), retrieved from one of the most popular public instances of the platform, hosted by the Wikimedia Foundation. The pad analysis is supported by a novel conceptual model that allows to label edit operations as "collaborative" or not depending on their distance---in edit position (space), edit time, or spacetime (both)---from edits made by other authors. The model is applied to classify all edits from the pad corpus. Classification results are further used to characterize the collaboration behavior of pad authors. Findings show that: 1) about half of the pads have a single author and hence witnessed no collaboration; 2) collaboration on common document parts happens often, but it happens asynchronously with authors taking turns in editing; and 3) simultaneous editing of common document parts happens very rarely. These findings help in revisiting early RTCE design decisions (e.g., the granularity of conflict management in RTCE protocols) and give insights on how to address novel needs (e.g., end-to-end encryption and offline editing).
25     """]]
26  1. <a class="paper-download" href="cacm-2018-software-heritage.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="cacm-2018-software-heritage.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Jean-François Abramatic</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Stefano Zacchiroli</a>. **Building the Universal Archive of Source Code**.  <em>
27         In <a href="">Communications of the
28         ACM</a>, October 2018,
29         Volume 61, Number 10,
30         pp. <a href="">29-31</a>.
31         ISSN 0001-0782, ACM.
32       </em>
33  1. <a class="paper-download" href="debsources-ese-2016.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="debsources-ese-2016.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Matthieu Caneill</a>, <a href="">Daniel M. Germán</a>, <a href="">Stefano Zacchiroli</a>. **The Debsources Dataset: Two Decades of Free and Open Source Software**.  <em>
34         In <a href="">Empirical Software
35         Engineering</a>,
36         Volume 22,
37         <a href="">pp. 1405-1437</a>,
38         June, 2017.
39         ISSN 1382-3256, Springer.
40       </em>
41     [[!toggle id=id62 text="Abstract..."]] [[!toggleable id=id62 text="""
42     *Abstract:* We present the Debsources Dataset: source code and related metadata spanning two decades of Free and Open Source Software (FOSS) history, seen through the lens of the Debian distribution. The dataset spans more than 3 billion lines of source code as well as metadata about them such as: size metrics (lines of code, disk usage), developer-defined symbols (ctags), file-level checksums (SHA1, SHA256, TLSH), file media types (MIME), release information (which version of which package containing which source code files has been released when), and license information (GPL, BSD, etc). The Debsources Dataset comes as a set of tarballs containing deduplicated unique source code files organized by their SHA1 checksums (the source code), plus a portable PostgreSQL database dump (the metadata). A case study is run to show how the Debsources Dataset can be used to easily and efficiently instrument very long-term analyses of the evolution of Debian from various angles (size, granularity, licensing, etc.), getting a grasp of major FOSS trends of the past two decades. The Debsources Dataset is Open Data, released under the terms of the CC BY-SA 4.0 license, and available for download from Zenodo with DOI reference 10.5281/zenodo.61089.
43     """]]
44  1. <a class="paper-download" href="ic-2014-aeolus.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="ic-2014-aeolus.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Jacopo Mauro</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Gianluigi Zavattaro</a>. **Aeolus: a Component Model for the Cloud**.  <em>In <a href="">Information
45       and Computation</a>, Volume 239, <a href="">pp. 100-121</a>. 2014.
46       ISSN 0890-5401, Elsevier.</em>
47     [[!toggle id=id56 text="Abstract..."]] [[!toggleable id=id56 text="""
48     *Abstract:* We introduce the Aeolus component model, which is specifically designed to capture realistic scenarii arising when configuring and deploying distributed applications in the so-called cloud environments, where interconnected components can be deployed on clusters of heterogeneous virtual machines, which can be in turn created, destroyed, and connected on-the-fly. The full Aeolus model is able to describe several component characteristics such as dependencies, conflicts, non-functional requirements (replication requests and load limits), as well as the fact that component interfaces to the world might vary depending on the internal component state. When the number of components needed to build an application grows, it becomes important to be able to automate activities such as deployment and reconfiguration. This correspond, at the level of the model, to the ability to decide whether a desired target system configuration is reachable, which we call the achievability problem, and producing a path to reach it. In this work we show that the achievability problem is undecidable for the full Aeolus model, a strong limiting result for automated configuration in the cloud. We also show that the problem becomes decidable, but Ackermann-hard, as soon as one drops non-functional requirements. Finally, we provide a polynomial time algorithm for the further restriction of the model where support for inter-component conflicts is also removed.
49     """]]
50  1. <a class="paper-download" href="scp2013-futures.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="scp2013-futures.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Learning from the Future of Component Repositories**.  <em>In <a href="">Science
51       of Computer Programming</a>,
52       Volume 90, Part B,
53       <a href="">pp. 93-115</a>.
54       ISSN 0167-6423, Elsevier,
55       2014.</em>
56     [[!toggle id=id50 text="Abstract..."]] [[!toggleable id=id50 text="""
57     *Abstract:* An important aspect of the quality assurance of large component repositories is to ensure the logical coherence of component metadata, and to this end one needs to identify incoherences as early as possible. Some relevant classes of problems can be formulated in term of properties of the future repositories into which the current repository may evolve. However, checking such properties on all possible future repositories requires a way to construct a finite representation of the infinite set of all potential futures. A class of properties for which this can be done is presented in this work. We illustrate the practical usefulness of the approach with two quality assurance applications: (i) establishing the amount of "forced upgrades" induced by introducing new versions of existing components in a repository, and (ii) identifying outdated components that are currently not installable and need to be upgraded in order to become installable again. For both applications we provide experience reports obtained on the Debian free software distribution.
58     """]]
59  1. <a class="paper-download" href="infsof2012-mpm.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="infsof2012-mpm.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **A Modular Package Manager Architecture**.  <em>In <a href="">Information
60       and Software Technology</a>,
61       Volume 55, Issue 2,
62       <a href="">pp. 459-474</a>.
63       ISSN 0950-5849, Elsevier,
64       February 2013.</em>
65     [[!toggle id=id42 text="Abstract..."]] [[!toggleable id=id42 text="""
66     *Abstract:* The success of modern software distributions in the Free and Open Source world can be explained, among other factors, by the availability of a large collection of software packages and the possibility to easily install and remove those components using state of the art package managers. However, package managers are often built using a monolithic architecture and hard-wired and ad-hoc dependency solvers implementing some customized heuristics. In this paper we propose a modular architecture relying on precise interface formalisms that allows the system administrator to choose from a variety of dependency solvers and backends. We argue that this is the path that leads to the next generation of package managers that will deliver better results, offer more expressive preference languages, and be easily adaptable to new platforms. We have built a working prototype, called MPM, following the design advocated in this paper, and we show how it largely outperforms a variety of state of the art package managers.
67     """]]
68  1. <a class="paper-download" href="jss2012-concern.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="jss2012-concern.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Dependency Solving: a Separate Concern in Component Evolution Management**.  <em>In <a href="">Journal
69       of Systems and Software</a>,
70       Volume 85, Issue 10,
71       <a href="">pp. 2228-2240</a>.
72       ISSN 0164-1212, Elsevier,
73       October 2012.</em>
74     [[!toggle id=id40 text="Abstract..."]] [[!toggleable id=id40 text="""
75     *Abstract:* Maintenance of component-based software platforms often has to face rapid evolution of software components. Component dependencies, conflicts, and package managers with dependency solving capabilities are the key ingredients of prevalent software maintenance technologies that have been proposed to keep software installations synchronized with evolving component repositories. We review state-of-the-art package managers and their ability to keep up with evolution at the current growth rate of popular component-based platforms, and conclude that their dependency solving abilities are not up to the task. We show that the complexity of the underlying upgrade planning problem is NP-complete even for seemingly simple component models, and argue that the principal source of complexity lies in multiple available versions of components. We then discuss the need of expressive languages for user preferences, which makes the problem even more challenging. We propose to establish dependency solving as a separate concern from other upgrade aspects, and present CUDF as a formalism to describe upgrade scenarios. By analyzing the result of an international dependency solving competition, we provide evidence that the proposed approach is viable.
76     """]]
77  1. <a class="paper-download" href="ahci2012-wiki.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="ahci2012-wiki.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Angelo Di Iorio</a>, Francesco Draicchio, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Constrained Wiki: The WikiWay to Validating Content**.  <em>In <a href="">Advances in Human-Computer
78       Interaction</a>, Volume 2012, Article ID
79       893575, <a href="">pp. 1-19</a>.
80       Hindawi, 2012</em>
81     [[!toggle id=id39 text="Abstract..."]] [[!toggleable id=id39 text="""
82     *Abstract:* The "WikiWay" is the open editing philosophy of wikis meant to foster open collaboration and continuous improvement of their content. Just like other online communities, wikis often introduce and enforce conventions, constraints, and rules for their content, but do so in a considerably softer way, expecting authors to deliver content that satisfies the conventions and the constraints, or, failing that, having volunteers of the community, the WikiGnomes, fix others' content accordingly. Constrained wikis is our generic framework for wikis to implement validators of community-specific constraints and conventions that preserve the WikiWay and their open collaboration features. To this end, specific requirements need to be observed by validators and a specific software architecture can be used for their implementation, that is, as independent functions (implemented as internal modules or external services) used in a nonintrusive way. Two separate proof-of-concept validators have been implemented for MediaWiki and MoinMoin, respectively, providing an annotated view functions, that is, presenting content authors with violation warnings, rather than preventing them from saving a noncompliant text.
83     """]]
84  1. <a class="paper-download" href="scp2010-evolution.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="scp2010-evolution.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Davide Di Ruscio</a>, <a href="">Patrizio Pelliccione</a>, <a href="">Alfonso Pierantonio</a>, <a href="">Stefano Zacchiroli</a>. **Supporting Software Evolution in Component-Based FOSS Systems**.  <em>In <a href="">Science
85       of Computer Programming</a>, Volume 76, Issue
86       12,
87       <a href="">pp. 1144-1160</a>.
88       ISSN 0167-6423,
89       Elsevier, 2011.</em>
90     [[!toggle id=id35 text="Abstract..."]] [[!toggleable id=id35 text="""
91     *Abstract:* FOSS (Free and Open Source Software) systems present interesting challenges in system evolution. On one hand, most FOSS systems are based on very fine-grained units of software deployment, called packages, which promote system evolution; on the other hand, FOSS systems are among the largest software systems known and require sophisticated static and dynamic conditions to be verified, in order to successfully deploy upgrades on user machines. The slightest error in one of these conditions can turn a routine upgrade into a system administrator nightmare. In this paper we introduce a model-based approach to support the upgrade of FOSS systems. The approach promotes the simulation of upgrades to predict failures before affecting the real system. Both fine-grained static aspects (e.g. configuration incoherences) and dynamic aspects (e.g. the execution of configuration scripts) are taken into account, improving over the state of the art of upgrade planners. The effectiveness of the approach is validated by instantiating the approach to widely-used FOSS distributions.
92     """]]
93  1. <a class="paper-download" href="nrhm-overlapping-conversions.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="nrhm-overlapping-conversions.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Paolo Marinelli</a>, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Towards the unification of formats for overlapping markup**.  <em>
94         In <a href="">New Review
95         of Hypermedia and Multimedia</a>, <a href="">Volume
96         14</a>, <a href="">Issue
97         1</a>, January 2008, <a href="">pp. 57-94</a>.
98         <a href="">Taylor and Francis</a>,
99         <a href="">ISSN
100         1361-4568</a>.
101       </em>
102     [[!toggle id=id20 text="Abstract..."]] [[!toggleable id=id20 text="""
103     *Abstract:* Overlapping markup refers to the issue of how to represent data structures more expressive than trees, for example direct acyclic graphs, using markup (meta-)languages which have been designed with trees in mind, for example XML. In this paper we observe that the state of the art in overlapping markup is far from being the widespread and consistent stack of standards and technologies readily available for XML and develop a roadmap for closing the gap. In particular we present in the paper the design and implementation of what we believe to be the first needed step, namely: a syntactic conversion framework among the plethora of overlapping markup serialization formats. The algorithms needed to perform the various conversions are presented in pseudo-code, they are meant to be used as blueprints for researchers and practitioners which need to write batch translation programs from one format to the other.
104     """]]
105  1. <a class="paper-download" href="mcs-disambiguation-errors.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="mcs-disambiguation-errors.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Claudio Sacerdoti Coen</a>, <a href="">Stefano Zacchiroli</a>. **Spurious Disambiguation Errors and How to Get Rid of Them**.  <em>
106         In <a href="">Mathematics in
107         Computer Science</a>, Volume 2, Number
108         2, <a href="">pp. 355-378</a>,
109         December 2008. Springer Birkhäuser,
110         <a href="">ISSN 1661-8270</a>.
111       </em>
112     [[!toggle id=id19 text="Abstract..."]] [[!toggleable id=id19 text="""
113     *Abstract:* The disambiguation approach to the input of formulae enables users of mathematical assistants to type correct formulae in a terse syntax close to the usual ambiguous mathematical notation. When it comes to incorrect formulae however, far too many typing errors are generated; among them we want to present only errors related to the formula interpretation meant by the user, hiding errors related to other interpretations. We study disambiguation errors and how to classify them into the spurious and genuine error classes. To this end we give a general presentation of the classes of disambiguation algorithms and efficient disambiguation algorithms. We also quantitatively assess the quality of the presented error classification criteria benchmarking them in the setting of a formal development of constructive algebra.
114     """]]
115  1. <a class="paper-download" href="matita.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="matita.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Andrea Asperti</a>, <a href="">Claudio Sacerdoti Coen</a>, <a href="">Enrico Tassi</a>, <a href="">Stefano Zacchiroli</a>. **User Interaction with the Matita Proof Assistant**.  <em>
116         In <a href="">Journal of
117         Automated Reasoning</a>, <a href="">Volume
118         39, Number 2</a>. Springer
119         Netherlands, <a href="">ISSN
120         0168-7433</a>, <a href="">pp.
121         109-139</a>, 2007.
122       </em>
123     [[!toggle id=id9 text="Abstract..."]] [[!toggleable id=id9 text="""
124     *Abstract:* Matita is a new, document-centric, tactic-based interactive theorem prover. This paper focuses on some of the distinctive features of the user interaction with Matita, mostly characterized by the organization of the library as a searchable knowledge base, the emphasis on a high-quality notational rendering, and the complex interplay between syntax, presentation, and semantics.
125     """]]
127 # editorials
129  1. <a class="paper-download" href="oss-2017-proceedings.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="oss-2017-proceedings.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> Federico Balaguer, <a href="">Roberto Di Cosmo</a>, Alejandra Garrido, Fabio Kon, Gregorio Robles, <a href="">Stefano Zacchiroli</a>. **Open Source Systems: Towards Robust Practices**.  <em>
130         13th IFIP WG 2.13 International Conference, OSS 2017, Buenos Aires,
131         Argentina, May 22-23, 2017, Proceedings. IFIP
132         Advances in Information and Communication Technology
133         496, Springer
134         2017, ISBN 978-3-319-57734-0.
135       </em>
136  1. <a class="paper-download" href="jopp-10-editorial.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="jopp-10-editorial.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Mathieu O'Neil</a>, <a href="">Stefano Zacchiroli</a>. **Making Lovework: Editorial Notes for the JoPP issue on Peer Production and Work**.  <em>In <a href="">Journal of Peer
137       Production</a>,
138       <a href="">Issue 10</a>.
139       ISSN 2213-5316, 2017.</em>
140  1. <a class="paper-download" href="jwe-wt-2014-editorial.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="jwe-wt-2014-editorial.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Angelo Di Iorio</a>, <a href="">Davide Rossi</a>, <a href="">Stefano Zacchiroli</a>. **Editorial**.  <em>In <a href="">Journal of Web
141       Engineering</a>, Volume 14, Number 1-2,
142       pp. 1-2.
143       ISSN 1540-9589, Rinton Press, 2014.</em>
144  1. <a class="paper-download" href="scp-wt-2012-editorial.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="scp-wt-2012-editorial.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Angelo Di Iorio</a>, <a href="">Davide Rossi</a>, <a href="">Stefano Zacchiroli</a>. **Web Technologies: Selected and extended papers from WT ACM SAC 2012**.  <em>In <a href="">Science
145       of Computer Programming</a>, Volume 94,
146       Part 1,
147       <a href="">pp. 1-2</a>.
148       ISSN 0167-6423, Elsevier, 2014.</em>
149  1. <a class="paper-download" href="spe-wt-2011-editorial.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="spe-wt-2011-editorial.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Angelo Di Iorio</a>, <a href="">Davide Rossi</a>, <a href="">Stefano Zacchiroli</a>. **Editorial**.  <em>In <a href="">Software:
150       Practice and Experience</a>, Volume 43, Issue
151       12,
152       <a href="">pp. 1393-1394</a>.
153       ISSN 1097-024X, Wiley, 2013.</em>
156 # book chapters
158  1. <a class="paper-download" href="web30-semantics-templating.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="web30-semantics-templating.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Angelo Di Iorio</a>, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Web Semantics via Wiki Templating**.  <em>
159         Chapter 34 of <a href="">Handbook
160         of research on Web 2.0, 3.0 and x.0: technologies, business and social
161         applications</a>. San Murugesan Ed.,
162         Information Science Reference,
163         November 2009, ISBN
164         978-1605663845.
165       </em>
166     [[!toggle id=id21 text="Abstract..."]] [[!toggleable id=id21 text="""
167     *Abstract:* A foreseeable incarnation of Web 3.0 could inherit machine understandability from the Semantic Web, and collaborative editing from Web 2.0 applications. We review the research and development trends which are getting today Web nearer to such an incarnation. We present semantic wikis, microformats, and the so-called "lowercase semantic web": they are the main approaches at closing the technological gap between content authors and Semantic Web technologies. We discuss a too often neglected aspect of the associated technologies, namely how much they adhere to the wiki philosophy of open editing: is there an intrinsic incompatibility between semantic rich content and unconstrained editing? We argue that the answer to this question can be "no", provided that a few yet relevant shortcomings of current Web technologies will be fixed soon.
168     """]]
170 # <span title="international, peer-reviewed conferences">international, peer-reviewed conference proceedings</span>
172  1. <a class="paper-download" href="msr-2019-swh.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="msr-2019-swh.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> Antoine Pietri, <a href="">Diomidis Spinellis</a>, <a href="">Stefano Zacchiroli</a>. **The Software Heritage Graph Dataset: Public software development under one roof**.  <em>
173         To appear in proceedings of <a href="">MSR 2019</a>: The 16th International
174         Conference on Mining Software Repositories, May 2019,
175         Montreal, Canada. Co-located with <a href="">ICSE 2019</a>.
176       </em>
177     [[!toggle id=id73 text="Abstract..."]] [[!toggleable id=id73 text="""
178     *Abstract:* Software Heritage is the largest existing public archive of software source code and accompanying development history: it currently spans more than five billion unique source code files and one billion unique commits, coming from more than 80 million software projects. This paper introduces the Software Heritage graph dataset: a fully-deduplicated Merkle DAG representation of the Software Heritage archive. The dataset links together file content identifiers, source code directories, Version Control System (VCS) commits tracking evolution over time, up to the full states of VCS repositories as observed by Software Heritage during periodic crawls. The dataset's contents come from major development forges (including GitHub and GitLab), FOSS distributions (e.g., Debian), and language-specific package managers (e.g., PyPI). Crawling information is also included, providing timestamps about when and where all archived source code artifacts have been observed in the wild. The Software Heritage graph dataset is available in multiple formats, including downloadable CSV dumps and Apache Parquet files for local use, as well as a public instance on Amazon Athena interactive query service for ready-to-use powerful analytical processing. Source code file contents are cross-referenced at the graph leaves, and can be retrieved through individual requests using the Software Heritage archive API.
179     """]]
180  1. <a class="paper-download" href="ipres-2018-doi.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="ipres-2018-doi.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Morane Gruenpeter</a>, <a href="">Stefano Zacchiroli</a>. **Identifiers for Digital Objects: the Case of Software Source Code Preservation**.  <em>
181         In proceedings of <a href="">iPRES 2018</a>: 15th International
182         Conference on Digital Preservation, Boston, MA, USA,
183         September 2018, 9 pages.
184       </em>
185     [[!toggle id=id70 text="Abstract..."]] [[!toggleable id=id70 text="""
186     *Abstract:* In the very broad scope addressed by digital preservation initiatives, a special place belongs to the scientific and technical artifacts that we need to properly archive to enable scientific reproducibility. For these artifacts we need identifiers that are not only unique and persistent, but also support integrity in an intrinsic way. They must provide strong guarantees that the object denoted by a given identifier will always be the same, without relying on third parties and external administrative processes. In this article, we report on our quest for this identifiers for digital objects (IDOs), whose properties are different from, and complementary to, those of the various digital identifiers of objects (DIOs) that are in widespread use today. We argue that both kinds of identifiers are needed and present the framework for intrinsic persistent identifiers that we have adopted in Software Heritage for preserving billions of software artifacts.
187     """]]
188  1. <a class="paper-download" href="ipres-2017-software-heritage.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="ipres-2017-software-heritage.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Roberto Di Cosmo</a>, <a href="">Stefano Zacchiroli</a>. **Software Heritage: Why and How to Preserve Software Source Code**.  <em>
189         In Proceedings of <a href="">iPRES
190         2017</a>: 14th International Conference on Digital
191         Preservation, Kyoto, Japan, September 2017, 10
192         pages.
193       </em>
194     [[!toggle id=id65 text="Abstract..."]] [[!toggleable id=id65 text="""
195     *Abstract:* Software is now a key component present in all aspects of our society. Its preservation has attracted growing attention over the past years within the digital preservation community. We claim that source code—the only representation of software that contains human readable knowledge—is a precious digital object that needs special handling: it must be a first class citizen in the preservation landscape and we need to take action immediately, given the in- creasingly more frequent incidents that result in permanent losses of source code collections. In this paper we present Software Heritage, an ambitious initiative to collect, preserve, and share the entire corpus of publicly accessible software source code. We discuss the archival goals of the project, its use cases and role as a participant in the broader digital preservation ecosystem, and detail its key design decisions. We also report on the project road map and the current status of the Software Heritage archive that, as of early 2017, has collected more than 3 billion unique source code files and 700 million commits coming from more than 50 million software development projects.
196     """]]
197  1. <a class="paper-download" href="aeolus-icsoc-2015.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="aeolus-icsoc-2015.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, Antoine Eiche, <a href="">Jacopo Mauro</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Gianluigi Zavattaro</a>, <a href="">Jakub Zwolakowski</a>. **Automatic Deployment of Services in the Cloud with Aeolus Blender**.  <em>In proceedings of <a href="">ICSOC 2015</a>: 13th International Conference on
198         Service Oriented Computing, November 16-19, 2015, Goa, India.
199         ISBN 978-3-662-48615-3, <a href="">pp. 397-411</a>,
200         Springer-Verlag 2015.
201       </em>
202     [[!toggle id=id61 text="Abstract..."]] [[!toggleable id=id61 text="""
203     *Abstract:* We present Aeolus Blender (Blender in the following), a software product for the automatic deployment and configuration of complex service-based, distributed software systems in the "cloud". By relying on a configuration optimiser and a deployment planner, Blender fully automates the deployment of real-life applications on OpenStack cloud deployments, by exploiting a knowledge base of software services provided by the Mandriva Armonic tool suite. The final deployment is guaranteed to satisfy not only user requirements and relevant software dependencies, but also to be optimal with respect to the number of used virtual machines.
204     """]]
205  1. <a class="paper-download" href="aeolus-concur-2015.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="aeolus-concur-2015.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Michael Lienhardt</a>, <a href="">Jacopo Mauro</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Gianluigi Zavattaro</a>, <a href="">Jakub Zwolakowski</a>. **Automatic Application Deployment in the Cloud: from Practice to Theory and Back**.  <em>In proceedings of <a href="">CONCUR 2015</a>: 26th
206       International Conference on Concurrency Theory,
207       September 1-4, 2015, Madrid, Spain.
208       Leibniz International Proceedings in Informatics
209       (LIPIcs) 42,
210       <a href="">pp. 1-16</a>,
211       ISBN 978-3-939897-91-0,
212       Schloss Dagstuhl--Leibniz-Zentrum fuer Informatik 2015.
213       </em>
214     [[!toggle id=id60 text="Abstract..."]] [[!toggleable id=id60 text="""
215     *Abstract:* The problem of deploying a complex software application has been formally investigated in previous work by means of the abstract component model named Aeolus. As the problem turned out to be undecidable, simplified versions of the model were investigated in which decidability was restored by introducing limitations on the ways components are described. In this paper, we take an opposite approach, and investigate the possibility to address a relaxed version of the deployment problem without limiting the expressiveness of the component model. We identify three problems to be solved in sequence: (i) the verification of the existence of a final configuration in which all the constraints imposed by the single components are satisfied, (ii) the generation of a concrete configuration satisfying such constraints, and (iii) the synthesis of a plan to reach such a configuration possibly going through intermediary configurations that violate the non-functional constraints.
216     """]]
217  1. <a class="paper-download" href="debsources-msr-2015.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="debsources-msr-2015.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Stefano Zacchiroli</a>. **The Debsources Dataset: Two Decades of Debian Source Code Metadata**.  <em>In proceedings of <a href="">MSR 2015</a>: The 12th Working Conference
218       on Mining Software Repositories, May 16-17, 2015, Florence,
219       Italy. Co-located with
220       <a href="">ICSE 2015</a>.
221       ISBN ISBN 978-0-7695-5594-2,
222       <a href="">pp. 466-469</a>,
223       IEEE 2015.
224       </em>
225     [[!toggle id=id59 text="Abstract..."]] [[!toggleable id=id59 text="""
226     *Abstract:* We present the Debsources Dataset: distribution metadata and source code metrics spanning two decades of Free and Open Source Software (FOSS) history, seen through the lens of the Debian distribution. Debsources is a software platform used to gather, search, and publish on the Web the full source code of the Debian operating system, as well as measures about it. A notable public instance of Debsources is available at; it includes both current and historical releases of Debian. Plugins to compute popular source code metrics (lines of code, defined symbols, disk usage) and other derived data (e.g., checksums) have been written, integrated, and run on all the source code available on The Debsources Dataset is a PostgreSQL database dump of metadata, as of February 10th, 2015. The dataset contains both Debian-specific metadata—e.g., which software packages are available in which release, which source code file belong to which package, release dates, etc.—and source code information gathered by running Debsources plugins. The Debsources Dataset offer a very long-term historical view of the macro-level evolution and constitution of FOSS through the lens of popular, representative FOSS projects of their times.
227     """]]
228  1. <a class="paper-download" href="distcheck-msr-2015.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="distcheck-msr-2015.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Louis Gesbert</a>, <a href="">Fabrice Le Fessant</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Mining Component Repositories for Installability Issues**.  <em>In proceedings of <a href="">MSR 2015</a>: The 12th Working Conference
229       on Mining Software Repositories, May 16-17, 2015, Florence,
230       Italy. Co-located with
231       <a href="">ICSE 2015</a>.
232       ISBN ISBN 978-0-7695-5594-2,
233       <a href="">pp. 24-33</a>,
234       IEEE 2015.
235       </em>
236     [[!toggle id=id58 text="Abstract..."]] [[!toggleable id=id58 text="""
237     *Abstract:* Component repositories play an increasingly relevant role in software life-cycle management, from software distribution to end-user, to deployment and upgrade management. Software components shipped via such repositories are equipped with rich metadata that describe their relationship (e.g., dependencies and conflicts) with other components. In this practice paper we show how to use a tool, distcheck, that uses component metadata to identify all the components in a repository that cannot be installed (e.g., due to unsatisfiable dependencies), provides detailed information to help developers understanding the cause of the problem, and fix it in the repository. We report about detailed analyses of several repositories: the Debian distribution, the OPAM package collection, and Drupal modules. In each case, distcheck is able to efficiently identify not installable components and provide valuable explanations of the issues. Our experience provides solid ground for generalizing the use of distcheck to other component repositories.
238     """]]
239  1. <a class="paper-download" href="zephyrus-ase-2014.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="zephyrus-ase-2014.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Michael Lienhardt</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Jakub Zwolakowski</a>, Antoine Eiche, Alexis Agahi. **Automated Synthesis and Deployment of Cloud Applications**.  <em>
240         In proceedings of <a href="">ASE
241         2014</a>: 29th IEEE/ACM International Conference on Automated Software
242         Engineering, September 15-19, 2014, Vasteras, Sweden. ISBN
243         978-1-4503-3013-8, <a href="">pp. 211-222</a>,
244         ACM 2014.
245       </em>
246     [[!toggle id=id54 text="Abstract..."]] [[!toggleable id=id54 text="""
247     *Abstract:* Complex networked applications are assembled by connecting software components distributed across multiple machines. Building and deploying such systems is a challenging problem which requires a significant amount of expertise: the system architect must ensure that all component dependencies are satisfied, avoid conflicting components, and add the right amount of component replicas to account for quality of service and fault-tolerance. In a cloud environment, one also needs to minimize the virtual resources provisioned upfront, to reduce the cost of operation. Once the full architecture is designed, it is necessary to correctly orchestrate the deployment phase, to ensure all components are started and connected in the right order. We present a toolchain that automates the assembly and deployment of such complex distributed applications. Given as input a high-level specification of the desired system, the set of available components together with their requirements, and the maximal amount of virtual resources to be committed, it synthesizes the full architecture of the system, placing components in an optimal manner using the minimal number of available machines, and automatically deploys the complete system in a cloud environment.
248     """]]
249  1. <a class="paper-download" href="debsources-esem-2014.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="debsources-esem-2014.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Matthieu Caneill</a>, <a href="">Stefano Zacchiroli</a>. **Debsources: Live and Historical Views on Macro-Level Software Evolution**.  <em>
250         In proceedings of <a href="">ESEM 2014</a>: 8th
251         International Symposium on Empirical Software Engineering and
252         Measurement, September 18-19, 2014, Torino, Italy. ISBN <a href="">
253         978-1-4503-2774-9</a>, ACM 2014.
254       </em>
255     [[!toggle id=id53 text="Abstract..."]] [[!toggleable id=id53 text="""
256     *Abstract:* Context. Software evolution has been an active field of research in recent years, but studies on macro-level software evolution---i.e., on the evolution of large software collections over many years---are scarce, despite the increasing popularity of intermediate vendors as a way to deliver software to final users. Goal. We want to ease the study of both day-by-day and long-term Free and Open Source Software (FOSS) evolution trends at the macro-level, focusing on the Debian distribution as a proxy of relevant FOSS projects. Method. We have built Debsources, a software platform to gather, search, and publish on the Web all the source code of Debian and measures about it. We have set up a public Debsources instance at, integrated it into the Debian infrastructure to receive live updates of new package releases, and written plugins to compute popular source code metrics. We have injected all current and historical Debian releases into it. Results. The obtained dataset and Web portal provide both long term-views over the past 20 years of FOSS evolution and live insights on what is happening at sub-day granularity. By writing simple plugins (~100 lines of Python each) and adding them to our Debsources instance we have been able to easily replicate and extend past empirical analyses on metrics as diverse as lines of code, number of packages, and rate of change---and make them perennial. We have obtained slightly different results than our reference study, but confirmed the general trends and updated them in light of 7 extra years of evolution history. Conclusions. Debsources is a flexible platform to monitor large FOSS collections over long periods of time. Its main instance and dataset are valuable resources for scholars interested in macro-level software evolution.
257     """]]
258  1. <a class="paper-download" href="esocc2013-aeolus.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="esocc2013-aeolus.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> Michel Catan, <a href="">Roberto Di Cosmo</a>, Antoine Eiche, Tudor A. Lascu, <a href="">Michael Lienhardt</a>, <a href="">Jacopo Mauro</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Gianluigi Zavattaro</a>, <a href="">Jakub Zwolakowski</a>. **Aeolus: Mastering the Complexity of Cloud Application Deployment**.  <em>In proceedings of ESOCC 2013: Service-Oriented and Cloud
259       Computing, 2nd European Conference, Málaga, Spain,
260       September 11-13, 2013.
261       LNCS <a href="">8135</a>,
262       pp. <a href="">1-3</a>,
263       Springer-Verlag, 2013.</em>
264     [[!toggle id=id51 text="Abstract..."]] [[!toggleable id=id51 text="""
265     *Abstract:* Cloud computing offers the possibility to build sophisticated software systems on virtualized infrastructures at a fraction of the cost necessary just few years ago, but deploying/maintaining/reconfiguring such software systems is a serious challenge. The main objective of the Aeolus project, an initiative funded by ANR (the French "Agence Nationale de la Recherche"), is to tackle the scientific problems that need to be solved in order to ease the problem of efficient and cost-effective deployment and administration of the complex distributed architectures which are at the heart of cloud applications.
266     """]]
267  1. <a class="paper-download" href="fmco2012-foss-components.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="fmco2012-foss-components.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Formal Aspects of Free and Open Source Software Components**.  <em>In proceedings of FMCO 2012: <a href="">HATS International School on
268       Formal Models for Components and Objects</a>, Bertinoro,
269       Italy, 24-28 September 2012. LNCS
270       <a href="">7866</a>,
271       pp. <a href="">216-239</a>,
272       Springer-Verlag, 2013.</em>
273     [[!toggle id=id49 text="Abstract..."]] [[!toggleable id=id49 text="""
274     *Abstract:* Free and Open Source Software (FOSS) distributions are popular solutions to deploy and maintain software on server, desktop, and mobile computing equipment. The typical deployment method in the FOSS setting relies on software distributions as vendors, packages as independently deployable components, and package managers as upgrade tools. We review research results from the past decade that apply formal methods to the study of inter-component relationships in the FOSS context. We discuss how those results are being used to attack both issues faced by users, such as dealing with upgrade failures on target machines, and issues important to distributions such as quality assurance processes for repositories containing tens of thousands, rapidly evolving software packages.
275     """]]
276  1. <a class="paper-download" href="icalp2013-aeolus.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="icalp2013-aeolus.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Jacopo Mauro</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Gianluigi Zavattaro</a>. **Component Reconfiguration in the Presence of Conflicts**.  <em>In proceedings of ICALP 2013: <a href="">40th International Colloquium on
277       Automata, Languages and Programming</a>, Riga, Latvia, 8-12
278       July, 2013.  LNCS
279       <a href="">7966</a>,
280       pp. <a href="">187-198</a>,
281       Springer-Verlag,
282       2013.</em>
283     [[!toggle id=id45 text="Abstract..."]] [[!toggleable id=id45 text="""
284     *Abstract:* Components are traditionally modeled as black-boxes equipped with interfaces that indicate provided/required ports and, often, also conflicts with other components that cannot coexist with them. In modern tools for automatic system management, components become grey-boxes that show relevant internal states and the possible actions that can be acted on the components to change such state during the deployment and reconfiguration phases. However, state-of-the-art tools in this field do not support a systematic management of conflicts. In this paper we investigate the impact of conflicts by precisely characterizing the increment of complexity on the reconfiguration problem.
285     """]]
286  1. <a class="paper-download" href="msr2012-conflicts.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="msr2012-conflicts.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Cyrille Valentin Artho</a>, Kuniyasu Suzaki, <a href="">Roberto Di Cosmo</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Why do software packages conflict?**.  <em>In proceedings of <a href="">MSR
287       2012</a>: <a href="">9th IEEE Working Conference
288       on Mining Software Repositories</a>, co-located with <a href="">ICSE 2012</a>,
289       IEEE, ISBN 978-1-4673-1760-3, <a href="">pp. 141-150</a>.
290       June 2-3, Zurich, Switzerland.</em>
291     [[!toggle id=id44 text="Abstract..."]] [[!toggleable id=id44 text="""
292     *Abstract:* Determining whether two or more packages cannot be installed together is an important issue in the quality assurance process of package-based distributions. Unfortunately, the sheer number of different configurations to test makes this task particularly challenging, and hundreds of such incompatibilities go undetected by the normal testing and distribution process until they are later reported by a user as bugs that we call "conflict defects". We performed an extensive case study of conflict defects extracted from the bug tracking systems of Debian and Red Hat. According to our results, conflict defects can be grouped into five main categories. We show that with more detailed package meta-data, about 30% of all conflict defects could be prevented relatively easily, while another 30% could be found by targeted testing of packages that share common resources or characteristics. These results allow us to make precise suggestions on how to prevent and detect conflict defects in the future.
293     """]]
294  1. <a class="paper-download" href="sefm2012-aeolus.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="sefm2012-aeolus.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Gianluigi Zavattaro</a>. **Towards a Formal Component Model for the Cloud**.  <em>In proceedings of SEFM 2012: <a href="">10th International Conference on
295       Software Engineering and Formal Methods</a>, Thessaloniki,
296       Greece, 1-5 October, 2012. LNCS 7504,
297       pp. 156-171, Springer-Verlag,
298       2012.</em>
299     [[!toggle id=id43 text="Abstract..."]] [[!toggleable id=id43 text="""
300     *Abstract:* We consider the problem of deploying and (re)configuring resources in a "cloud" setting, where interconnected software components and services can be deployed on clusters of heterogeneous (virtual) machines that can be created and connected on-the-fly. We introduce the Aeolus component model to capture similar scenarii from realistic cloud deployments, and instrument automated planning of day-to-day activities such as software upgrade planning, service deployment, elastic scaling, etc. We formalize the model and characterize the feasibility and complexity of configuration achievability in Aeolus.
301     """]]
302  1. <a class="paper-download" href="cbse2012-futures.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="cbse2012-futures.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Learning from the Future of Component Repositories**.  <em>In proceedings of CBSE 2012:
303       <a href="">15th International ACM
304       SIGSOFT Symposium on Component Based Software
305       Engineering</a>, Bertinoro, Italy, June 26-28, 2012.
306       ISBN 978-1-4503-1345-2,
307       <a href="">pp. 51-60</a>,
308       ACM 2012.
309       <em>Award:</em> <a href="">Best
310       Paper Award</a>.</em>
311     [[!toggle id=id41 text="Abstract..."]] [[!toggleable id=id41 text="""
312     *Abstract:* An important aspect of the quality assurance of large component repositories is the logical coherence of component metadata. We argue that it is possible to identify certain classes of such problems by checking relevant properties of the possible future repositories into which the current repository may evolve. In order to make a complete analysis of all possible futures effective however, one needs a way to construct a finite set of representatives of this infinite set of potential futures. We define a class of properties for which this can be done. We illustrate the practical usefulness of the approach with two quality assurance applications: (i) establishing the amount of "forced upgrades" induced by introducing new versions of existing components in a repository, and (ii) identifying outdated components that need to be upgraded in order to ever be installable in the future. For both applications we provide experience reports obtained on the Debian distribution.
313     """]]
314  1. <a class="paper-download" href="cbse2011-mpm.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="cbse2011-mpm.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **MPM: a modular package manager**.  <em>In proceedings of CBSE 2011: <a href="">14th International ACM SIGSOFT
315       Symposium on Component Based Software Engineering</a>,
316       Boulder, Colorado, USA, 21-23 June, 2011. ISBN
317       978-1-4503-0723-9,
318       <a href="">pp. 179-188</a>,
319       ACM 2011. <em>Award:</em> <a href="">ACM SIGSOFT</a> Distinguished Paper
320       Award</em>
321     [[!toggle id=id36 text="Abstract..."]] [[!toggleable id=id36 text="""
322     *Abstract:* Software distributions in the FOSS world rely on so-called package managers for the installation and removal of packages on target machines. State-of-the-art package managers are monolithic in architecture, and each of them is hard-wired to an ad-hoc dependency solver implementing a customized heuristics. In this paper we propose a modular architecture allowing for pluggable dependency solvers and backends. We argue that this is the path that leads to the next generation of package managers that will deliver better results, accept more expressive input languages, and can be easily adaptable to new platforms. We present a working prototype, called MPM, which has been implemented following the design advocated in this paper.
323     """]]
324  1. <a class="paper-download" href="splc2010-fd-deps.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="splc2010-fd-deps.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Stefano Zacchiroli</a>. **Feature Diagrams as Package Dependencies**.  <em>In proceedings of SPLC 2010: <a href="">14th International Software
325       Product Line Conference</a>, Jeju Island, South Korea, 13-17
326       September 2010. LNCS <a href="">6287</a>,
327       ISBN 978-3-642-15578-9, <a href="">pp. 476-480</a>,
328       Springer-Verlag, 2010.</em>
329     [[!toggle id=id34 text="Abstract..."]] [[!toggleable id=id34 text="""
330     *Abstract:* FOSS (Free and Open Source Software) distributions use dependencies and package managers to maintain huge collections of packages and their installations; recent research have led to efficient and complete configuration tools and techniques, based on state of the art solvers, that are being adopted in industry. We show how to encode a significant subset of Free Feature Diagrams as interdependent packages, enabling to reuse package tools and research results into software product lines.
331     """]]
332  1. <a class="paper-download" href="msr2010-udd.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="msr2010-udd.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Lucas Nussbaum</a>, <a href="">Stefano Zacchiroli</a>. **The Ultimate Debian Database: Consolidating Bazaar Metadata for Quality Assurance and Data Mining**.  <em>In proceedings of <a href="">MSR
333       2010</a>: <a href="">7th IEEE Working
334       Conference on Mining Software Repositories</a>, co-located
335       with <a href="">ICSE 2010</a>,
336       IEEE, ISBN 978-1-4244-6802-7, <a href=";arnumber=5463277">pp. 52-61</a>.
337       02-03/05/2010, Cape Town, South Africa.</em>
338     [[!toggle id=id33 text="Abstract..."]] [[!toggleable id=id33 text="""
339     *Abstract:* FLOSS distributions like RedHat and Ubuntu require a lot more complex infrastructures than most other FLOSS projects. In the case of community-driven distributions like Debian, the development of such an infrastructure is often not very organized, leading to new data sources being added in an impromptu manner while hackers set up new services that gain acceptance in the community. Mixing and matching data is then harder than should be, albeit being badly needed for Quality Assurance and data mining. Massive refactoring and integration is not a viable solution either, due to the constraints imposed by the bazaar development model. This paper presents the Ultimate Debian Database (UDD), which is the countermeasure adopted by the Debian project to the above "data hell". UDD gathers data from various data sources into a single, central SQL database, turning Quality Assurance needs that could not be easily implemented before into simple SQL queries. The paper also discusses the customs that have contributed to the data hell, the lessons learnt while designing UDD, and its applications and potentialities for data mining on FLOSS distributions.
340     """]]
341  1. <a class="paper-download" href="sac10-coclo.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="sac10-coclo.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Gabriele D'Angelo</a>, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Content Cloaking: Preserving Privacy with Google Docs and other Web Applications**.  <em>In proceedings of ACM SAC 2010: <a href="">25th Annual ACM
342       Symposium on Applied Computing</a>, ISBN
343       978-1-60558-639-7, <a href="">pp. 826-830</a>.
344       22-26/03/2010 - Sierre, Switzerland.</em>
345     [[!toggle id=id31 text="Abstract..."]] [[!toggleable id=id31 text="""
346     *Abstract:* Web office suites such as Google Docs offer unparalleled collaboration experiences in terms of low software requirements, ease of use, data ubiquity, and availability. When the data holder (Google, Microsoft, etc.) is not perceived as trusted though, those benefits are considered at stake with important privacy requirements. Content cloaking is a lightweight, cryptographic, client-side solution to protect content from data holders while using web office suites and other "Web 2.0", AJAX-based, collaborative applications.
347     """]]
348  1. <a class="paper-download" href="strongdeps-esem-2009.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="strongdeps-esem-2009.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Pietro Abate</a>, Jaap Boender, <a href="">Roberto Di Cosmo</a>, <a href="">Stefano Zacchiroli</a>. **Strong Dependencies between Software Components**.  <em>
349         In proceedings of <a href="">ESEM 2009</a>: 3rd
350         International Symposium on Empirical Software Engineering and
351         Measurement, ISBN 978-1-4244-4842-5, <a href="">pp.
352         89-99</a>. October 15-16, 2009 - Lake Buena Vista,
353         Florida, USA.
354       </em>
355     [[!toggle id=id28 text="Abstract..."]] [[!toggleable id=id28 text="""
356     *Abstract:* Component-based systems often describe context requirements in terms of explicit inter-component dependencies. Studying large instances of such systems, such as free and open source software (FOSS) distributions, in terms of declared dependencies between packages is appealing. It is however also misleading when the language to express dependencies is as expressive as boolean formulae, which is often the case. In such settings, a more appropriate notion of component dependency exists: strong dependency. This paper introduces such notion as a first step towards modeling semantic, rather then syntactic, inter-component relationships. Furthermore, a notion of component sensitivity is derived from strong dependencies, with applications to quality assurance and to the evaluation of upgrade risks. An empirical study of strong dependencies and sensitivity is presented, in the context of one of the largest, freely available, component-based system.
357     """]]
358  1. <a class="paper-download" href="enase2009-upgrade.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="enase2009-upgrade.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Antonio Cicchetti</a>, <a href="">Davide Di Ruscio</a>, <a href="">Patrizio Pelliccione</a>, <a href="">Alfonso Pierantonio</a>, <a href="">Stefano Zacchiroli</a>. **A Model Driven Approach to Upgrade Package-Based Software Systems**.  <em>In proceedings of <a href="">ENASE
359       2009</a>: 4th international conference on Evaluation of Novel Aspects to
360       Software Engineering; held in conjunction with <a href="">ICEIS 2009</a>. 6-10 May 2009, Milan, Italy.
361       <a href="">CCIS
362       Volume 69</a>, <a href="">pp.
363       262-276</a>, Springer-Verlag,
364       2010.</em>
365     [[!toggle id=id26 text="Abstract..."]] [[!toggleable id=id26 text="""
366     *Abstract:* Complex software systems are more and more based on the abstraction of package, brought to popularity by Free and Open Source Software (FOSS) distributions. While helpful as an encapsulation layer, packages do not solve all problems of deployment, and more generally of management, of large software collections. In particular upgrades, which often affect several packages at once due to inter-package dependencies, often fail and do not hold good transactional properties. This paper shows how to apply model driven techniques to describe and manage software upgrades of FOSS distributions. It is discussed how to model static and dynamic aspects of package upgrades, the latter being the most challenging aspect to deal with, in order to be able to predict common causes of upgrade failures and undo residual effects of failed or undesired upgrades.
367     """]]
368  1. <a class="paper-download" href="sac09-manners.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="sac09-manners.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Angelo Di Iorio</a>, <a href="">Davide Rossi</a>, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Where are your Manners? Sharing Best Community Practices in the Web 2.0**.  <em>In proceedings of ACM SAC 2009: the <a href="">24th Annual ACM
369       Symposium on Applied Computing</a>. ISBN
370       978-1-60558-166-8, <a href=";coll=ACM&amp;dl=ACM&amp;type=series&amp;idx=SERIES179&amp;part=series&amp;WantType=Proceedings&amp;title=SAC">pp. 681-687</a>, ACM.</em>
371     [[!toggle id=id23 text="Abstract..."]] [[!toggleable id=id23 text="""
372     *Abstract:* The Web 2.0 fosters the creation of communities by offering users a wide array of social software tools. But, while the success of these tools is based on their ability to support different interaction patterns among users by imposing as less limitations as possible, the communities they support are not free of rules (just think about the posting rules in a community forum or the editing rules in a thematic wiki). In this paper we propose a framework for the sharing of best community practices in the form of a (potentially rule-based) annotation layer that can be integrated with existing Web 2.0 community tools (with specific focus on wikis). This solution is characterized by minimal intrusiveness and plays nicely within the open spirit of the Web 2.0 by proving users with behavioral hints rather than by enforcing the strict adherence to a set of rules.
373     """]]
374  1. <a class="paper-download" href="wiki-templating.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="wiki-templating.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Angelo Di Iorio</a>, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Wiki Content Templating**.  <em>
375         In Proceedings of <a href="">WWW 2008</a>:
376         17th International World Wide Web Conference. April 21-25,
377         2008 Beijing, China. ACM ISBN
378         978-1-60558-085-2/08/04, <a href="">pp.
379         615-624</a>.
380       </em>
381     [[!toggle id=id18 text="Abstract..."]] [[!toggleable id=id18 text="""
382     *Abstract:* Wiki content templating enables reuse of content structures among wiki pages. In this paper we present a thorough study of this widespread feature, showing how its two state of the art models (functional and creational templating) are sub-optimal. We then propose a third, better, model called lightly constrained (LC) templating and show its implementation in the Moin wiki engine. We also show how LC templating implementations are the appropriate technologies to push forward semantically rich web pages on the lines of (lowercase) semantic web and microformats.
383     """]]
384  1. <a class="paper-download" href="disambiguation-errors.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="disambiguation-errors.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Claudio Sacerdoti Coen</a>, <a href="">Stefano Zacchiroli</a>. **Spurious Disambiguation Error Detection**.  <em>
385         In Proceedings of <a href="">MKM 2007</a>: The
386         6th International Conference on Mathematical Knowledge
387         Management.  Hagenberg, Austria -- 27-30 June 2007. <a href="">LNAI 4573</a>,
388         Springer Berlin / Heidelberg, ISBN
389         978-3-540-73083-5, <a href="">pp.
390         381-392</a>, 2007.
391       </em>
392     [[!toggle id=id14 text="Abstract..."]] [[!toggleable id=id14 text="""
393     *Abstract:* The disambiguation approach to the input of formulae enables the user to type correct formulae in a terse syntax close to the usual ambiguous mathematical notation. When it comes to incorrect formulae we want to present only errors related to the interpretation meant by the user, hiding errors related to other interpretations (spurious errors). We propose a heuristic to recognize spurious errors, which has been integrated with the disambiguation algorithm of [1].
394     """]]
395  1. <a class="paper-download" href="matita-crafting.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="matita-crafting.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Andrea Asperti</a>, <a href="">Claudio Sacerdoti Coen</a>, <a href="">Enrico Tassi</a>, <a href="">Stefano Zacchiroli</a>. **Crafting a Proof Assistant**.  <em>
396         In Proceedings of <a href="">Types 2006</a>: Types for
397         Proofs and Programs. Nottingham, UK -- April 18-21, 2006.
398         LNCS <a href="">4502</a>,
399         Springer Berlin / Heidelberg, ISBN
400         978-3-540-74463-4, <a href="">pp.
401         18-32</a>, 2007.
402       </em>
403     [[!toggle id=id10 text="Abstract..."]] [[!toggleable id=id10 text="""
404     *Abstract:* Proof assistants are complex applications whose development has never been properly systematized or documented. This work is a contribution in this direction, based on our experience with the development of Matita: a new interactive theorem prover based, as Coq, on the Calculus of Inductive Constructions (CIC). In particular, we analyze its architecture focusing on the dependencies of its components, how they implement the main functionalities, and their degree of reusability. The work is a first attempt to provide a ground for a more direct comparison between different systems and to highlight the common functionalities, not only in view of reusability but also to encourage a more systematic comparison of different softwares and architectural solutions.
405     """]]
406  1. <a class="paper-download" href="notation.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="notation.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Luca Padovani</a>, <a href="">Stefano Zacchiroli</a>. **From Notation to Semantics: There and Back Again**.  <em>
407         In Proceedings of <a href="">MKM 2006</a>: The 5th
408         International Conference on Mathematical Knowledge
409         Management.  Wokingham, UK -- August 11-12, 2006. <a href="">LNAI
410         4108</a>, Springer Berlin / Heidelberg, ISBN
411         978-3-540-37104-5, <a href="">pp.
412         194-207</a>, 2006.
413       </em>
414     [[!toggle id=id6 text="Abstract..."]] [[!toggleable id=id6 text="""
415     *Abstract:* Mathematical notation is a structured, open, and ambiguous language. In order to support mathematical notation in MKM applications one must necessarily take into account presentational as well as semantic aspects. The former are required to create a familiar, comfortable, and usable interface to interact with. The latter are necessary in order to process the information meaningfully. In this paper we investigate a framework for dealing with mathematical notation in a meaningful, extensible way, and we show an effective instantiation of its architecture to the field of interactive theorem proving. The framework builds upon well-known concepts and widely-used technologies and it can be easily adopted by other MKM applications.
416     """]]
417  1. <a class="paper-download" href="whelp.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="whelp.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Andrea Asperti</a>, <a href="">Ferruccio Guidi</a>, <a href="">Claudio Sacerdoti Coen</a>, <a href="">Enrico Tassi</a>, <a href="">Stefano Zacchiroli</a>. **A Content Based Mathematical Search Engine: Whelp**.  <em>
418         In Proceedings of <a href="">TYPES
419         2004</a>: Types for Proofs and Programs. Paris, France --
420         December 15-18, 2004. LNCS <a href="">3839</a>,
421         Springer Berlin / Heidelberg, ISBN
422         3-540-31428-8, <a href="">pp.
423         17-32</a>, 2006.
424       </em>
425     [[!toggle id=id5 text="Abstract..."]] [[!toggleable id=id5 text="""
426     *Abstract:* The prototype of a content based search engine for mathematical knowledge supporting a small set of queries requiring matching and/or typing operations is described. The prototype, called Whelp, exploits a metadata approach for indexing the information that looks far more flexible than traditional indexing techniques for structured expressions like substitution, discrimination, or context trees. The prototype has been instantiated to the standard library of the Coq proof assistant extended with many user contributions.
427     """]]
428  1. <a class="paper-download" href="gmetadom.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="gmetadom.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Luca Padovani</a>, <a href="">Claudio Sacerdoti Coen</a>, <a href="">Stefano Zacchiroli</a>. **A Generative Approach to the Implementation of Language Bindings for the Document Object Model**.  <em>
429         In Proceedings of <a href="">GPCE'04</a> 3rd International Conference
430         on Generative Programming and Component
431         Engineering. Vancouver, Canada -- October 24-28, 2004 LNCS
432         <a href="">3286</a>,
433         Springer Berlin / Heidelberg, ISBN
434         3-540-23580-9, <a href="">pp.
435         469-487</a>, 2004.
436       </em>
437     [[!toggle id=id4 text="Abstract..."]] [[!toggleable id=id4 text="""
438     *Abstract:* The availability of a C implementation for the Document Object Model (DOM) gives the interesting opportunity of generating bindings for different programming languages automatically. Because of the DOM bias towards Java-like languages, a C implementation that fakes objects, inheritance, polymorphism, exceptions and uses reference-counting introduces a gap between the API specification and its actual implementation that the bindings should try to close. In this paper we overview the generative approach in this particular context and apply it for the generation of C++ and OCaml bindings.
439     """]]
440  1. <a class="paper-download" href="disambiguation.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="disambiguation.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Claudio Sacerdoti Coen</a>, <a href="">Stefano Zacchiroli</a>. **Efficient Ambiguous Parsing of Mathematical Formulae**.  <em>
441         In Proceedings of <a href="">MKM 2004</a>: 3rd
442         International Conference on Mathematical Knowledge
443         Management. September 19-21, 2004 Bialowieza - Poland.
444         LNCS <a href="">3119</a>,
445         Springer Berlin / Heidelberg, ISBN
446         3-540-23029-7, <a href="">pp.
447         347-362</a>, 2004.
448       </em>
449     [[!toggle id=id2 text="Abstract..."]] [[!toggleable id=id2 text="""
450     *Abstract:* Mathematical notation has the characteristic of being ambiguous: operators can be overloaded and information that can be deduced is often omitted. Mathematicians are used to this ambiguity and can easily disambiguate a formula making use of the context and of their ability to find the right interpretation. Software applications that have to deal with formulae usually avoid these issues by fixing an unambiguous input notation. This solution is annoying for mathematicians because of the resulting tricky syntaxes and becomes a show stopper to the simultaneous adoption of tools characterized by different input languages. In this paper we present an efficient algorithm suitable for ambiguous parsing of mathematical formulae. The only requirement of the algorithm is the existence of a validity predicate over abstract syntax trees of incomplete formulae with placeholders. This requirement can be easily fulfilled in the applicative area of interactive proof assistants, and in several other areas of Mathematical Knowledge Management.
451     """]]
453 # <span title="international, peer-reviewed workshops">international, peer-reviewed workshop proceedings</span>
455  1. <a class="paper-download" href="cudf-ocaml-2014.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="cudf-ocaml-2014.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Pietro Abate</a>, <a href="">Roberto Di Cosmo</a>, <a href="">Louis Gesbert</a>, <a href="">Fabrice Le Fessant</a>, <a href="">Stefano Zacchiroli</a>. **Using Preferences to Tame your Package Manager**.  <em>In proceedings of <a href="">OCaml 2014</a>: The OCaml
456       Users and Developers Workshop, September 5, 2014, Gothenburg,
457       Sweden. Co-located with <a href="">ICFP 2014</a>. 2014.</em>
458     [[!toggle id=id57 text="Abstract..."]] [[!toggleable id=id57 text="""
459     *Abstract:* Determining whether some components can be installed on a system is a complex problem: not only it is NP-complete in the worst case, but there can also be exponentially many solutions to it. Ordinary package managers use ad-hoc heuristics to solve this installation problem and choose a particular solution, making extremely difficult to change or sidestep these heuristics when the result is not the one we expect. When software repositories become complex enough, one gets vastly superior results by delegating dependency handling to a specialised solver, and use optimisation functions (or preferences) to control the class of solutions that are found. The opam package manager relies on the CUDF pivot format, which allows OCaml users that have a CUDF-compliant solver on their machine to reap the benefits of preferences-based dependency resolution. Thanks to the solver farm provided by Irill, these benefits are now extended to the OCaml community at large. In this talk we will present the preferences language and explain how to use it.
460     """]]
461  1. <a class="paper-download" href="lococo2011-conflicts.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="lococo2011-conflicts.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Cyrille Valentin Artho</a>, <a href="">Roberto Di Cosmo</a>, Kuniyasu Suzaki, <a href="">Stefano Zacchiroli</a>. **Sources of Inter-package Conflicts in Debian**.  <em>
462         In proceedings of <a href="">LoCoCo 2011</a> International
463         Workshop on Logics for Component Configuration, affiliated
464         with <a href="">CP 2011</a>
465       </em>
466     [[!toggle id=id38 text="Abstract..."]] [[!toggleable id=id38 text="""
467     *Abstract:* Inter-package conflicts require the presence of two or more packages in a particular configuration, and thus tend to be harder to detect and localize than conventional (intra-package) defects. Hundreds of such inter-package conflicts go undetected by the normal testing and distribution process until they are later reported by a user. The reason for this is that current meta-data is not fine-grained and accurate enough to cover all common types of conflicts. A case study of inter-package conflicts in Debian has shown that with more detailed package meta-data, at least one third of all package conflicts could be prevented relatively easily, while another one third could be found by targeted testing of packages that share common resources or characteristics. This paper reports the case study and proposes ideas to detect inter-package conflicts in the future.
468     """]]
469  1. <a class="paper-download" href="mooml-iwoce-2009.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="mooml-iwoce-2009.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Expressing Advanced User preferences in Component Installation**.  <em>
470         In proceedings of <a href="">IWOCE
471         2009</a>: International Workshop on Open Component
472         Ecosystem, affiliated with <a href="">ESEC/FSE
473         2009</a>. Foundations of Software Engineering, ISBN
474         978-1-60558-677-9, <a href="">pp. 31-40</a>,
475         ACM 2009.
476       </em>
477     [[!toggle id=id30 text="Abstract..."]] [[!toggleable id=id30 text="""
478     *Abstract:* State of the art component-based software collections, such as FOSS distributions, are made of up to dozens of thousands components, with complex inter-dependencies and conflicts. Given a particular installation of such a system, each request to alter the set of installed components has potentially (too) many satisfying answers. We present an architecture that allows to express advanced user preferences about package selection in FOSS distributions. The architecture is composed by a distribution-independent format for describing available and installed packages called CUDF (Common Upgradeability Description Format), and a foundational language called MooML to specify optimization criteria. We present the syntax and semantics of CUDF and MooML, and discuss the partial evaluation mechanism of MooML which allows to gain efficiency in package dependency solvers.
479     """]]
480  1. <a class="paper-download" href="modernization-iwoce-2009.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="modernization-iwoce-2009.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Davide Di Ruscio</a>, <a href="">Patrizio Pelliccione</a>, <a href="">Alfonso Pierantonio</a>, <a href="">Stefano Zacchiroli</a>. **Towards maintainer script modernization in FOSS distributions**.  <em>
481         In proceedings of <a href="">IWOCE
482         2009</a>: International Workshop on Open Component
483         Ecosystem, affiliated with <a href="">ESEC/FSE
484         2009</a>. Foundations of Software Engineering, ISBN
485         978-1-60558-677-9, <a href="">pp. 11-20</a>,
486         ACM 2009.
487       </em>
488     [[!toggle id=id29 text="Abstract..."]] [[!toggleable id=id29 text="""
489     *Abstract:* Free and Open Source Software (FOSS) distributions are complex software systems, made of thousands packages that evolve rapidly, independently, and without centralized coordination. During packages upgrades, corner case failures can be encountered and are hard to deal with, especially when they are due to misbehaving maintainer scripts: executable code snippets used to finalize package configuration. In this paper we report a software modernization experience, the process of representing existing legacy systems in terms of models, applied to FOSS distributions. We present a process to define meta-models that enable dealing with upgrade failures and help rolling back from them, taking into account maintainer scripts. The process has been applied to widely used FOSS distributions and we report about such experiences.
490     """]]
491  1. <a class="paper-download" href="hotswup-package-upgrade.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="hotswup-package-upgrade.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Roberto Di Cosmo</a>, <a href="">Paulo Trezentos</a>, <a href="">Stefano Zacchiroli</a>. **Package Upgrades in FOSS Distributions: Details and Challenges**.  <em>In proceedings of <a href="">HotSWUp'08: Hot Topics in Software
492       Upgrades</a>. October 20, 2008, Nashville, Tennessee,
493       USA. ACM ISBN
494       978-1-60558-304-4.</em>
495     [[!toggle id=id22 text="Abstract..."]] [[!toggleable id=id22 text="""
496     *Abstract:* The upgrade problems faced by Free and Open Source Software distributions have characteristics not easily found elsewhere. We describe the structure of packages and their role in the upgrade process. We show that state of the art package managers have shortcomings inhibiting their ability to cope with frequent upgrade failures. We survey current countermeasures to such failures, argue that they are not satisfactory, and sketch alternative solutions.
497     """]]
498  1. <a class="paper-download" href="steve-latvia.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="steve-latvia.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Paolo Marinelli</a>, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Streaming Validation of Schemata: the Lazy Typing Discipline**.  <em>
499         In Proceedings of <a href="">Extreme Markup
500         Languages 2007</a>: The Markup Theory and Practice
501         Conference. August 7-10, 2007 Montreal, Canada.
502       </em>
503     [[!toggle id=id15 text="Abstract..."]] [[!toggleable id=id15 text="""
504     *Abstract:* Assertions, identity constraints, and conditional type assignments are (planned) features of XML Schema which rely on XPath evaluation to various ends. The allowed XPath subset exploitable in those features is trimmed down for streamability concerns partly understandable (the apparent wish to avoid buffering to determine the evaluation of an expression) and partly artificial. In this paper we dissect the XPath language in subsets with varying streamability characteristics. We also identify the larger subset which is compatible with the typing discipline we believe underlies some of the choices currently present in the XML Schema specifications. We describe such a discipline as imposing that the type of an element has to be decided when its start tag is encountered and its validity has to be when its end tag is. We also propose an alternative lazy typing discipline where both type assignment and validity assessment are fired as soon as they are available in a best effort manner. We believe our discipline is more flexible and delegate to schema authors the choice of where to place in the trade-off between using larger XPath subsets and increasing buffering requirements or expeditiousness of typing information availability.
505     """]]
506  1. <a class="paper-download" href="streaming-co-constraints.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="streaming-co-constraints.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Paolo Marinelli</a>, <a href="">Stefano Zacchiroli</a>. **Co-Constraint Validation in a Streaming Context**.  <em>
507         In Proceedings of <a href="">XML 2006</a>: The world's oldest
508         and biggest XML conference. <em>Award</em>: Winner of the
509         <a href="">XML
510         Scholarship 2006</a> as best student paper.  Boston, MA -- December
511         5-7, 2006.
512       </em>
513     [[!toggle id=id13 text="Abstract..."]] [[!toggleable id=id13 text="""
514     *Abstract:* In many use cases applications are bound to be run consuming only a limited amount of memory. When they need to validate large XML documents, they have to adopt streaming validation, which does not rely on an in-memory representation of the whole input document. In order to validate an XML document, different kinds of constraints need to be verified. Co-constraints, which relate the content of elements to the presence and values of other attributes or elements, are one such kind of constraints. In this paper we propose an approach to the problem of validating in a streaming fashion an XML document against a schema also specifying co-constraints. We describe how the streaming evaluation of co-constraints influences the output of the validation process. Our proposal makes use of the validation language SchemaPath, a light extension to XML Schema, adding conditional type assignment for the support of co-constraints. The paper is based on the description of our streaming SchemaPath validator.
515     """]]
516  1. <a class="paper-download" href="tinycals.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="tinycals.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Claudio Sacerdoti Coen</a>, <a href="">Enrico Tassi</a>, <a href="">Stefano Zacchiroli</a>. **Tinycals: Step by Step Tacticals**.  <em>
517         In Proceedings of <a href="">UITP 2006</a>:
518         User Interfaces for Theorem Provers. Seattle, WA -- August
519         21, 2006. <a href="">ENTCS
520         (Elsevier, ISSN 1571-0661)</a>, <a href="">Volume
521         174, Issue 2,
522         pp. 125-142. May 2007</a>.
523       </em>
524     [[!toggle id=id8 text="Abstract..."]] [[!toggleable id=id8 text="""
525     *Abstract:* Most of the state-of-the-art proof assistants are based on procedural proof languages, scripts, and rely on LCF tacticals as the primary tool for tactics composition. In this paper we discuss how these ingredients do not interact well with user interfaces based on the same interaction paradigm of Proof General (the de facto standard in this field), identifying in the coarse-grainedness of tactical evaluation the key problem. We propose Tinycals as an alternative to a subset of LCF tacticals, showing that the user does not experience the same problem if tacticals are evaluated in a more fine-grained manner. We present the formal operational semantics of tinycals as well as their implementation in the Matita proof assistant.
526     """]]
527  1. <a class="paper-download" href="constrainedwiki.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="constrainedwiki.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Angelo Di Iorio</a>, <a href="">Stefano Zacchiroli</a>. **Constrained Wiki: an Oxymoron?**.  <em>
528         In Proceedings of <a href="">WikiSym 2006</a>: the 2006
529         International Symposium on Wikis. Odense, Denmark -- August
530         21-23, 2006.  ACM, 2006, ISBN
531         1-59593-417-0, <a href="">pp.
532         89-98</a>.
533       </em>
534     [[!toggle id=id7 text="Abstract..."]] [[!toggleable id=id7 text="""
535     *Abstract:* In this paper we propose a new wiki concept -- light constraints -- designed to encode community best practices and domain-specific requirements, and to assist in their application. While the idea of constraining user editing of wiki content seems to inherently contradict "The Wiki Way", it is well-known that communities of users involved in wiki sites have the habit of establishing best authoring practices. For domain-specific wiki systems which process wiki content, it is often useful to enforce some well-formedness conditions on specific page contents. This paper describes a general framework to think about the interaction of wiki system with constraints, and presents a generic architecture which can be easily incorporated into existing wiki systems to exploit the capabilities enabled by light constraints.
536     """]]
537  1. <a class="paper-download" href="mathsearch.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="mathsearch.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Andrea Asperti</a>, <a href="">Stefano Zacchiroli</a>. **Searching Mathematics on the Web: State of the Art and Future Developments**.  <em>
538         In Proceedings of <a href="">New Developments in
539         Electronic Publishing AMS/SMM</a> Special Session, Houston,
540         May 2004 ECM4 Satellite Conference, Stockholm, June 2004 <a href="">pp. 9-18</a>.
541         FIZ Karlsruhe, ISBN 3-88127-107-4.
542       </em>
543     [[!toggle id=id3 text="Abstract..."]] [[!toggleable id=id3 text="""
544     *Abstract:* A huge amount of mathematical knowledge is nowadays available on the World Wide Web. Many different solutions and technologies for searching that knowledge have been developed as well. We present the state of the art of searching mathematics on the Web, giving some insight on future developments in this area.
545     """]]
546  1. <a class="paper-download" href="hbugs.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="hbugs.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Claudio Sacerdoti Coen</a>, <a href="">Stefano Zacchiroli</a>. **Brokers and Web-Services for Automatic Deduction: a Case Study**.  <em>
547         In Proceedings of <a href="">Calculemus 2003</a>:
548         11th Symposium on the Integration of Symbolic Computation and
549         Mechanized Reasoning. Roma, Italy -- September 10-12, 2003,
550         Aracne Editrice. ISBN
551         88-7999-545-6, pp. 43-57, 2003.
552       </em>
553     [[!toggle id=id1 text="Abstract..."]] [[!toggleable id=id1 text="""
554     *Abstract:* We present a planning broker and several Web-Services for automatic deduction. Each Web-Service implements one of the tactics usually available in interactive proof-assistants. When the broker is submitted a proof status (an incomplete proof tree and a focus on an open goal) it dispatches the proof to the Web-Services, collects the successful results, and send them back to the client as hints as soon as they are available. In our experience this architecture turns out to be helpful both for experienced users (who can take benefit of distributing heavy computations) and beginners (who can learn from it).
555     """]]
557 # <span title="national, peer-reviewed journals">national, peer-reviewed journal articles</span>
559  1. <a class="paper-download" href="studia11-dh-ocaml.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="studia11-dh-ocaml.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Mehdi Dogguy</a>, <a href="">Stéphane Glondu</a>, <a href="">Sylvain Le Gall</a>, <a href="">Stefano Zacchiroli</a>. **Enforcing Type-Safe Linking using Inter-Package Relationships**.  <em>In <a href="">Studia
560       Informatica Universalis</a>, Volume 9, Issue
561       1, pp. 129-157. Hermann
562       2011.</em>
563     [[!toggle id=id37 text="Abstract..."]] [[!toggleable id=id37 text="""
564     *Abstract:* Strongly-typed languages rely on link-time checks to ensure that type safety is not violated at the borders of compilation units. Such checks entail very fine-grained dependencies among compilation units, which are at odds with the implicit assumption of backward compatibility that is relied upon by common library packaging techniques adopted by FOSS (Free and Open Source Software) package-based distributions. As a consequence, package managers are often unable to prevent users to install a set of libraries which cannot be linked together. We discuss how to guarantee link-time compatibility using inter-package relationships; in doing so, we take into account real-life maintainability problems such as support for automatic package rebuild and manageability of ABI (Application Binary Interface) strings by humans. We present the dh_ocaml implementation of the proposed solution, which is currently in use in the Debian distribution to safely deploy more than 300 OCaml-related packages.
565     """]]
567 # <span title="national, peer-reviewed conferences and workshops">national, peer-reviewed conference and workshop procedings</span>
569  1. <a class="paper-download" href="benevol-2018-swh.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="benevol-2018-swh.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> Antoine Pietri, <a href="">Stefano Zacchiroli</a>. **Towards Universal Software Evolution Analysis**.  <em>
570         In proceedings of BENEVOL 2018: <a href="">The 17th
571         Belgium-Netherlands Software Evolution Workshop</a>, Delft,
572         Netherlands, December 2018.
573       </em>
574     [[!toggle id=id72 text="Abstract..."]] [[!toggleable id=id72 text="""
575     *Abstract:* Software evolution studies have mostly focused on individual software products, generally developed as Free/Open Source Software (FOSS) projects, and more sparingly on software collections like component and package ecosystems. We argue in this paper that the next step in this organic scale expansion is universal software evolution analysis, i.e., the study of software evolution at the scale of the whole body of publicly available software. We consider the case of Software Heritage, the largest existing archive of publicly available software source code artifacts (more than 5 B unique files archived and 1 B commits, coming from more than 80 M software projects). We propose research requirements that would allow to leverage the Software Heritage archive to study universal software evolution. We discuss the challenges that need to be overcome to address such requirements and outline a research roadmap to do so.
576     """]]
577  1. <a class="paper-download" href="jfla10-dh-ocaml.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="jfla10-dh-ocaml.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Mehdi Dogguy</a>, <a href="">Stéphane Glondu</a>, <a href="">Sylvain Le Gall</a>, <a href="">Stefano Zacchiroli</a>. **Enforcing Type-Safe Linking using Inter-Package Relationships**.  <em>In proceedings of JFLA 2010: <a href="">21st Journée Francophones des Langages
578       Applicatifs</a>, pp. 29-54. 30/01-02/02/2010 -
579       La Ciotat, France.</em>
580     [[!toggle id=id32 text="Abstract..."]] [[!toggleable id=id32 text="""
581     *Abstract:* Strongly-typed languages rely on link-time checks to ensure that type safety is not violated at the borders of compilation units. Such checks entail very fine-grained dependencies among compilation units, which are at odds with the implicit assumption of backward compatibility that is relied upon by common library packaging techniques adopted by FOSS (Free and Open Source Software) package-based distributions. As a consequence, package managers are often unable to prevent users to install a set of libraries which cannot be linked together. We discuss how to guarantee link-time compatibility using inter-package relationships; in doing so, we take into account real-life maintainability problems such as support for automatic package rebuild and manageability of ABI (Application Binary Interface) strings by humans. We present the dh_ocaml implementation of the proposed solution, which is currently in use in the Debian distribution to safely deploy more than 300 OCaml-related packages.
582     """]]
584 # <span title="official research reports of research institutions">technical reports</span>
586  1. <a class="paper-download" href="aeolus-blender-tr.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="aeolus-blender-tr.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Roberto Di Cosmo</a>, Antoine Eiche, <a href="">Jacopo Mauro</a>, <a href="">Gianluigi Zavattaro</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Jakub Zwolakowski</a>. **Automatic Deployment of Software Components in the Cloud with the Aeolus Blender**.  <em>
587         Inria <a href="">technical
588         report</a> 2015.
589       </em>
590     [[!toggle id=id63 text="Abstract..."]] [[!toggleable id=id63 text="""
591     *Abstract:* Cloud computing allows to build sophisticated software sys-tems on virtualized infrastructures at a fraction of the cost that was necessary just a few years ago. The deployment of such complex systems, though, is still a serious issue due to the need of deploying a large number of packages and services, their elaborated interdependencies, and the need to define the (ideally optimal) allocation of software compo-nents onto available computing resources. In this paper we present the Aeolus Blender (Blender in the following), a toolchain that automates the assembly and deployment of complex component-based software systems in the "cloud". By relying on a configuration optimizer and a deployment planner, Blender fully automates the deploy-ment of real-life cloud applications on OpenStack infrastruc-tures, by exploiting a knowledge base of software compo-nents defined in the Mandriva Armonic tool-suite. The final deployment is guaranteed to satisfy not only user require-ments and software dependencies, but also to be optimal with respect to the number of used virtual machines.
592     """]]
593  1. <a class="paper-download" href="zephyrus-tr.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="zephyrus-tr.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Roberto Di Cosmo</a>, <a href="">Michael Lienhardt</a>, <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Jakub Zwolakowski</a>. **Optimal Provisioning in the Cloud**.  <em>
594         <a href="">Aeolus
595         project</a> <a href="">technical
596         report</a>, 7 Juin 2013.
597       </em>
598     [[!toggle id=id48 text="Abstract..."]] [[!toggleable id=id48 text="""
599     *Abstract:* Complex distributed systems are classically assembled by deploying several existing software components to multiple servers. Building such systems is a challenging problem that requires a significant amount of problem solving as one must i) ensure that all inter-component dependencies are satisfied; ii) ensure that no conflicting components are deployed on the same machine; and iii) take into account replication and distribution to account for quality of service, or possible failure of some services. We propose a tool, Zephyrus, that automates to a great extent assembling complex distributed systems. Given i) a high level specification of the desired system architecture, ii) the set of available components and their requirements) and iii) the current state of the system, Zephyrus is able to generate a formal representation of the desired system, to place the components in an optimal manner on the available machines, and to interconnect them as needed.
600     """]]
601  1. <a class="paper-download" href="icalp2013-tr.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="icalp2013-tr.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Roberto Di Cosmo</a>, <a href="">Jacopo Mauro</a>, <a href="">Stefano Zacchiroli</a>, <a href="">Gianluigi Zavattaro</a>. **Component reconfiguration in the presence of conflicts**.  <em>
602         <a href="">Aeolus
603         project</a> <a href="">technical
604         report</a>, 22 Avril 2013.
605       </em>
606     [[!toggle id=id47 text="Abstract..."]] [[!toggleable id=id47 text="""
607     *Abstract:* Components are traditionally modeled as black-boxes equipped with interfaces that indicate provided/required ports and, often, also conflicts with other components that cannot coexist with them. In modern tools for automatic system management, components become grey-boxes that show relevant internal states and the possible actions that can be acted on the components to change such state during the deployment and reconfiguration phases. However, state-of-the-art tools in this field do not support a systematic management of conflicts. In this paper we investigate the impact of conflicts by precisely characterizing the increment of complexity on the reconfiguration problem.
608     """]]
609  1. <a class="paper-download" href="mancoosi-tr3.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="mancoosi-tr3.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Common Upgradeability Description Format (CUDF) 2.0**.  <em>
610         <a href="">Mancoosi project</a>
611         <a href="">technical
612         report 3</a>, 24 November 2009.
613       </em>
614     [[!toggle id=id66 text="Abstract..."]] [[!toggleable id=id66 text="""
615     *Abstract:* The solver competition which will be organized by Mancoosi relies on the standardized format for describing package upgrade scenarios. This document describes the Common Upgradeability Description Format (CUDF), the document format used to encode upgrade scenarios, abstracting over distribution-specific details. Solvers taking part in the competition will be fed with input in CUDF format. The format is not specific to Mancoosi and is meant to be generally useful to describe upgrade scenarios when abstraction over distribution-specific details is desired.
616     """]]
617  1. <a class="paper-download" href="strongdeps-tr.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="strongdeps-tr.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Pietro Abate</a>, Jaap Boender, <a href="">Roberto Di Cosmo</a>, <a href="">Stefano Zacchiroli</a>. **Strong Dependencies between Software Components**.  <em>
618         <a href="">Mancoosi project</a>
619         <a href="">technical
620         report 2</a>, 22 May 2009.
621       </em>
622     [[!toggle id=id27 text="Abstract..."]] [[!toggleable id=id27 text="""
623     *Abstract:* Component-based systems often describe context requirements in terms of explicit inter-component dependencies. Studying large instances of such systems, such as free and open source software (FOSS) distributions, in terms of declared dependencies between packages is appealing. It is however also misleading when the language to express dependencies is as expressive as boolean formulae, which is often the case. In such settings, a more appropriate notion of component dependency exists: strong dependency. This paper introduces such notion as a first step towards modeling semantic, rather then syntactic, inter-component relationships. Furthermore, a notion of component sensitivity is derived from strong dependencies, with applications to quality assurance and to the evaluation of upgrade risks. An empirical study of strong dependencies and sensitivity is presented, in the context of one of the largest, freely available, component-based system.
624     """]]
625  1. <a class="paper-download" href="mancoosi-d2.1.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="mancoosi-d2.1.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Davide Di Ruscio</a>, <a href="">Patrizio Pelliccione</a>, <a href="">Alfonso Pierantonio</a>, <a href="">Stefano Zacchiroli</a>. **Metamodel for Describing System Structure and State**.  <em>
626         <a href="">Mancoosi project</a>
627         deliverable,
628         <a href="">D2.1</a>,
629         work package 2. January 2009.
630       </em>
631     [[!toggle id=id25 text="Abstract..."]] [[!toggleable id=id25 text="""
632     *Abstract:* Today's software systems are very complex modular entities, made up of many interacting components that must be deployed and coexist in the same context. Modern operating systems provide the basic infrastructure for deploying and handling all the components that are used as the basic blocks for building more complex systems even though a generic and comprehensive support is far from being provided. In fact, in Free and Open Source Software (FOSS) systems, components evolve independently from each other and because of the huge amount of available components and their different project origins, it is not easy to manage the life cycle of a distribution. Users are in fact allowed to choose and install a wide variety of alternatives whose consistency cannot be checked a priori to their full extent. It is possible to easily make the system unusable by installing or removing some packages that "break" the consistency of what is installed in the system itself. This document proposes a model-driven approach to simulate system upgrades in advance and to detect predictable upgrade failures, possibly by notifying the user before the system is affected. The approach relies on an abstract representation of the systems and packages which are given in terms of models that are expressive enough to isolate inconsistent configurations (e.g., situations in which installed components rely on the presence of disappeared sub-components) that are currently not expressible as inter-package relationships.
633     """]]
634  1. <a class="paper-download" href="mancoosi-d5.1.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="mancoosi-d5.1.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Description of the CUDF Format**.  <em>
635         <a href="">Mancoosi project</a>
636         deliverable,
637         <a href="">D5.1</a>,
638         work package 5. November 2008.
639       </em>
640     [[!toggle id=id24 text="Abstract..."]] [[!toggleable id=id24 text="""
641     *Abstract:* This document contains several related specifications, taken together they describe the document formats related to the solver competition which will be organized by Mancoosi. In particular, this document describes: DUDF (Distribution Upgradeability Description Format), the document format to be used to submit upgrade problem instances from user machines to a (distribution-specific) database of upgrade problems; CUDF (Common Upgradeability Description Format), the document format used to encode upgrade problems, abstracting over distribution-specific details. Solvers taking part in the competition will be fed with input in CUDF format.
642     """]]
643  1. <a class="paper-download" href="flea.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="flea.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Luca Padovani</a>, <a href="">Stefano Zacchiroli</a>. **Stream Processing of XML Documents Made Easy with LALR(1) Parser Generators**.  <em>
644         <a href="">Technical
645         report UBLCS-2007-23</a>, September 2007,
646         <a href="">Department of Computer Science</a>, <a href="">University of Bologna</a>.
647       </em>
648     [[!toggle id=id17 text="Abstract..."]] [[!toggleable id=id17 text="""
649     *Abstract:* Because of their fully annotated structure, XML documents are normally believed to require a straightforward parsing phase. However, the standard APIs for accessing their content (the Document Object Model and the Simple API for XML) provide a programming interface that is very low-level and is thus inadequate for the recognition of any structure that is not isomorphic to its XML encoding. Even when the document undergoes validation, its unmarshalling into application-specific data using these APIs requires poorly maintainable, tedious-to-write, and possibly inefficient code. We describe a technique for the simultaneous parsing, validation, and unmarshalling of XML documents that combines a stream-oriented XML parser with a LALR(1) parser in order to guarantee efficient stream processing, expressive validation capabilities, and the possibility to associate user-provided actions with specific patterns occurring in the source documents.
650     """]]
651  1. <a class="paper-download" href="wiki-templating-tr.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="wiki-templating-tr.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Angelo Di Iorio</a>, <a href="">Fabio Vitali</a>, <a href="">Stefano Zacchiroli</a>. **Templating Wiki Content for Fun and Profit**.  <em>
652         <a href="">Technical
653         report UBLCS-2007-21</a>, August 2007,
654         <a href="">Department of Computer Science</a>, <a href="">University of Bologna</a>.
655       </em>
656     [[!toggle id=id16 text="Abstract..."]] [[!toggleable id=id16 text="""
657     *Abstract:* Content templating enables reuse of content structures between wiki pages. Such a feature is implemented in several mainstream wiki engines. Systematic study of its conceptual models and comparison of the available implementations are unfortunately missing in the wiki literature. In this paper we aim to fill this gap first analyzing template-related user needs, and then reviewing existing approaches at content templating. Our investigation shows that two models emerge, functional and creational templating, and that both have weakness failing to properly fit in "The Wiki Way". As a solution, we propose the adoption of creational templates enriched with light constraints, showing that such a solution has a low implementative footprint in state-of-the-art wiki engines, and that it has a synergy with semantic wikis.
658     """]]
660 # dissertations
662  1. <a class="paper-download" href="hdr-thesis.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="hdr-thesis.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Stefano Zacchiroli</a>. **Large-scale Modeling, Analysis, and Preservation of Free and Open Source Software**.  <em>
663         HDR (Habilitation à diriger des recherches) dissertation, defended
664         publicly on 27 November 2017, at Université Paris Diderot, France,
665         before a jury composed of: Ahmed Bouajjani, Carlo Ghezzi, Jesus M.
666         Gonzalez-Barahona, Roberto Di Cosmo, Jean-Bernard Stefani, Diomidis
667         Spinellis, Andreas Zeller.
668       </em>
669  1. <a class="paper-download" href="phd-thesis.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="phd-thesis.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Stefano Zacchiroli</a>. **User Interaction Widgets for Interactive Theorem Proving**.  <em>
670         Ph.D. dissertation, <a href="">Technical
671           report UBLCS-2007-10</a>, March 2007, <a href="">Department of Computer Science</a>, <a href="">University of Bologna</a> (advisor: <a href="">Andrea Asperti</a>; refereed
672         by: <a href="">Christoph
673           Benzmueller</a>, <a href="">Marino
674           Miculan</a>).
675       </em>
676     [[!toggle id=id12 text="Abstract..."]] [[!toggleable id=id12 text="""
677     *Abstract:* Matita (that means pencil in Italian) is a new interactive theorem prover under development at the University of Bologna. When compared with state-of-the-art proof assistants, Matita presents both traditional and innovative aspects. The underlying calculus of the system, namely the Calculus of (Co)Inductive Constructions (CIC for short), is well-known and is used as the basis of another mainstream proof assistant, Coq, with which Matita is to some extent compatible. In the same spirit of several other systems, proof authoring is conducted by the user as a goal directed proof search, using a script for storing textual commands for the system. In the tradition of LCF, the proof language of Matita is procedural and relies on tactic and tacticals to proceed toward proof completion. The interaction paradigm offered to the user is based on the script management technique at the basis of the popularity of the Proof General generic interface for interactive theorem provers: while editing a script the user can move forth the execution point to deliver commands to the system, or back to retract (or "undo") past commands. Matita has been developed from scratch in the past 8 years by several members of the Helm research group, this thesis author is one of such members. Matita is now a full-fledged proof assistant with a library of about 1.000 concepts. Several innovative solutions spun-off from this development effort. This thesis is about the design and implementation of some of those solutions, in particular those relevant for the topic of user interaction with theorem provers, and of which this thesis author was a major contributor. Joint work with other members of the research group is pointed out where needed. The main topics discussed in this thesis are briefly summarized below. Disambiguation. Most activities connected with interactive proving require the user to input mathematical formulae. Being mathematical notation ambiguous, parsing formulae typeset as mathematicians like to write down on paper is a challenging task; a challenge neglected by several theorem provers which usually prefer to fix an unambiguous input syntax. Exploiting features of the underlying calculus, Matita offers an efficient disambiguation engine which permit to type formulae in the familiar mathematical notation. Step-by-step tacticals. Tacticals are higher-order constructs used in proof scripts to combine tactics together. With tacticals scripts can be made shorter, readable, and more resilient to changes. Unfortunately they are de facto incompatible with state-of-the-art user interfaces based on script management. Such interfaces indeed do not permit to position the execution point inside complex tacticals, thus introducing a trade-off between the usefulness of structuring scripts and a tedious big step execution behavior during script replaying. In Matita we break this trade-off with tinycals: an alternative to a subset of LCF tacticals which can be evaluated in a more fine-grained manner. Extensible yet meaningful notation. Proof assistant users often face the need of creating new mathematical notation in order to ease the use of new concepts. The framework used in Matita for dealing with extensible notation both accounts for high quality bidimensional rendering of formulae (with the expressivity of MathML-Presentation) and provides meaningful notation, where presentational fragments are kept synchronized with semantic representation of terms. Using our approach interoperability with other systems can be achieved at the content level, and direct manipulation of formulae acting on their rendered forms is possible too. Publish/subscribe hints. Automation plays an important role in interactive proving as users like to delegate tedious proving sub-tasks to decision procedures or external reasoners. Exploiting the Web-friendliness of Matita we experimented with a broker and a network of web services (called tutors) which can try independently to complete open sub-goals of a proof, currently being authored in Matita. The user receives hints from the tutors on how to complete sub-goals and can interactively or automatically apply them to the current proof. Another innovative aspect of Matita, only marginally touched by this thesis, is the embedded content-based search engine Whelp which is exploited to various ends, from automatic theorem proving to avoiding duplicate work for the user. We also discuss the (potential) reusability in other systems of the widgets presented in this thesis and how we envisage the evolution of user interfaces for interactive theorem provers in the Web 2.0 era.
678     """]]
679  1. <a class="paper-download" href="master-thesis.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="master-thesis.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Stefano Zacchiroli</a>. **Web services per il supporto alla dimostrazione interattiva (Web services for interactive theorem proving)**.  <em>
680         Master thesis (Italian only), March 2003, <a href="">Department of Computer Science</a>, <a href="">University of Bologna</a> (advisor: <a href="">Andrea Asperti</a>; refereed
681         by: <a href="">Nadia Busi</a>).
682       </em>
685 # miscellanea
687  1. <a class="paper-download" href="debconf8-mancoosi.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="debconf8-mancoosi.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Ralf Treinen</a>, <a href="">Stefano Zacchiroli</a>. **Solving package dependencies: from EDOS to Mancoosi**.  <em>In proceedings of <a href="">DebConf8</a>: 9th annual conference
688       of the <a href="">Debian</a> project
689       developers. August 10-16, 2008, Mar del Plata,
690       Argentina.</em>
691     [[!toggle id=id21.1 text="Abstract..."]] [[!toggleable id=id21.1 text="""
692     *Abstract:* Mancoosi (Managing the Complexity of the Open Source Infrastructure) is an ongoing research project funded by the European Union for addressing some of the challenges related to the "upgrade problem" of interdependent software components of which Debian packages are prototypical examples. Mancoosi is the natural continuation of the EDOS project which has already contributed tools for distribution-wide quality assurance in Debian and other GNU/Linux distributions. The consortium behind the project consists of several European public and private research institutions as well as some commercial GNU/Linux distributions from Europe and South America. Debian is represented by a small group of Debian Developers who are working in the ranks of the involved universities to drive and integrate back achievements into Debian. This paper presents relevant results from EDOS in dependency management and gives an overview of the Mancoosi project and its objectives, with a particular focus on the prospective benefits for Debian.
693     """]]