publish preprints of MSR 2020 papers
authorStefano Zacchiroli <zack@upsilon.cc>
Wed, 15 Apr 2020 14:26:30 +0000 (16:26 +0200)
committerStefano Zacchiroli <zack@upsilon.cc>
Wed, 15 Apr 2020 14:26:30 +0000 (16:26 +0200)
research/publications.mdwn
research/publications/msr-2020-forks.pdf [new file with mode: 0644]
research/publications/msr-2020-topology.pdf [new file with mode: 0644]

index d22b66a..fabf156 100644 (file)
@@ -13,7 +13,7 @@ You might also be interested in my author profiles on
 
 # <span title="international, peer-reviewed journals">international, peer-reviewed journal articles</span>
 
- 1. <a class="bibtex-download" href="swh-provenance-emse.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="http://dx.doi.org/10.1007/s10664-020-09828-5" title="Document Object Identifier">doi&gt;</a></span> Guillaume Rousseau, <a href="http://www.dicosmo.org">Roberto Di Cosmo</a>, <a href="http://upsilon.cc/~zack">Stefano Zacchiroli</a>. **Software Provenance Tracking at the Scale of Public Source Code**.  <em>
+ 1. <a class="paper-download" href="swh-provenance-emse.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="swh-provenance-emse.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="http://dx.doi.org/10.1007/s10664-020-09828-5" title="Document Object Identifier">doi&gt;</a></span> Guillaume Rousseau, <a href="http://www.dicosmo.org">Roberto Di Cosmo</a>, <a href="http://upsilon.cc/~zack">Stefano Zacchiroli</a>. **Software Provenance Tracking at the Scale of Public Source Code**.  <em>
        To appear in <a href="http://link.springer.com/journal/10664">Empirical Software
        Engineering</a> 2020.
        ISSN 1382-3256, Springer.
@@ -202,7 +202,7 @@ You might also be interested in my author profiles on
 
 # <span title="international, peer-reviewed conferences">international, peer-reviewed conference proceedings</span>
 
- 1. <a class="bibtex-download" href="msr-2020-topology.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="http://dx.doi.org/10.1145/3379597.3387506" title="Document Object Identifier">doi&gt;</a></span> <a href="https://koin.fr/">Antoine Pietri</a>, Guillaume Rousseau, <a href="http://upsilon.cc/~zack">Stefano Zacchiroli</a>. **Determining the Intrinsic Structure of Public Software Development History**.  <em>
+ 1. <a class="paper-download" href="msr-2020-topology.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="msr-2020-topology.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="http://dx.doi.org/10.1145/3379597.3387506" title="Document Object Identifier">doi&gt;</a></span> <a href="https://koin.fr/">Antoine Pietri</a>, Guillaume Rousseau, <a href="http://upsilon.cc/~zack">Stefano Zacchiroli</a>. **Determining the Intrinsic Structure of Public Software Development History**.  <em>
        To appear in proceedings of <a href="http://2020.msrconf.org/">MSR 2020</a>: The 17th International
        Conference on Mining Software Repositories, May 2020,
        Seoul, South Korea. Co-located with <a href="https://conf.researchr.org/home/icse-2020">ICSE 2020</a>.
@@ -211,7 +211,7 @@ You might also be interested in my author profiles on
     [[!toggle id=id80 text="Abstract..."]] [[!toggleable id=id80 text="""
     *Abstract:* Background: Collaborative software development has produced a wealth of version control system (VCS) data that can now be analyzed in full. Little is known about the intrinsic structure of the entire corpus of publicly available VCS as an interconnected graph. Understanding its structure is needed to determine the best approach to analyze it in full and to avoid methodological pitfalls when doing so. Objective: We intend to determine the most salient network topology properties of public software development history as captured by VCS. We will explore: degree distributions, determining whether they are scale-free or not; distribution of connect component sizes; distribution of shortest path lengths. Method: We will use Software Heritage---which is the largest corpus of public VCS data---compress it using webgraph compression techniques, and analyze it in-memory using classic graph algorithms. Analyses will be performed both on the full graph and on relevant subgraphs. Limitations: The study is exploratory in nature; as such no hypotheses on the findings is stated at this time. Chosen graph algorithms are expected to scale to the corpus size, but it will need to be confirmed experimentally. External validity will depend on how representative Software Heritage is of the software commons.
     """]]
- 1. <a class="bibtex-download" href="msr-2020-forks.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="http://dx.doi.org/10.1145/3379597.3387450" title="Document Object Identifier">doi&gt;</a></span> <a href="https://koin.fr/">Antoine Pietri</a>, Guillaume Rousseau, <a href="http://upsilon.cc/~zack">Stefano Zacchiroli</a>. **Forking Without Clicking: on How to Identify Software Repository Forks**.  <em>
+ 1. <a class="paper-download" href="msr-2020-forks.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="msr-2020-forks.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="http://dx.doi.org/10.1145/3379597.3387450" title="Document Object Identifier">doi&gt;</a></span> <a href="https://koin.fr/">Antoine Pietri</a>, Guillaume Rousseau, <a href="http://upsilon.cc/~zack">Stefano Zacchiroli</a>. **Forking Without Clicking: on How to Identify Software Repository Forks**.  <em>
        To appear in proceedings of <a href="http://2020.msrconf.org/">MSR 2020</a>: The 17th International
        Conference on Mining Software Repositories, May 2020,
        Seoul, South Korea. Co-located with <a href="https://conf.researchr.org/home/icse-2020">ICSE 2020</a>.
diff --git a/research/publications/msr-2020-forks.pdf b/research/publications/msr-2020-forks.pdf
new file mode 100644 (file)
index 0000000..079d66d
Binary files /dev/null and b/research/publications/msr-2020-forks.pdf differ
diff --git a/research/publications/msr-2020-topology.pdf b/research/publications/msr-2020-topology.pdf
new file mode 100644 (file)
index 0000000..e667f08
Binary files /dev/null and b/research/publications/msr-2020-topology.pdf differ