papers: update biblio info and publish MSR 2020 Challenge preprint
authorStefano Zacchiroli <>
Thu, 29 Aug 2019 07:52:02 +0000 (09:52 +0200)
committerStefano Zacchiroli <>
Thu, 29 Aug 2019 07:52:02 +0000 (09:52 +0200)
research/publications/msr-2020-challenge.bib [new file with mode: 0644]
research/publications/msr-2020-challenge.pdf [new file with mode: 0644]

index 6519001..3f9591e 100644 (file)
@@ -139,9 +139,10 @@ You might also be interested in my author profiles on
       <a href="">Issue 10</a>.
       ISSN 2213-5316, 2017.</em>
  1. <a class="paper-download" href="jwe-wt-2014-editorial.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="jwe-wt-2014-editorial.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Angelo Di Iorio</a>, <a href="">Davide Rossi</a>, <a href="">Stefano Zacchiroli</a>. **Editorial**.  <em>In <a href="">Journal of Web
-      Engineering</a>, Volume 14, Number 1-2,
-      pp. 1-2.
-      ISSN 1540-9589, Rinton Press, 2014.</em>
+      Engineering</a>, Volume 14,
+      Number 1-2, pp. 1-2.
+      ISSN 1540-9589, Rinton Press,
+      March 2015.</em>
  1. <a class="paper-download" href="scp-wt-2012-editorial.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="scp-wt-2012-editorial.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Angelo Di Iorio</a>, <a href="">Davide Rossi</a>, <a href="">Stefano Zacchiroli</a>. **Web Technologies: Selected and extended papers from WT ACM SAC 2012**.  <em>In <a href="">Science
       of Computer Programming</a>, Volume 94,
       Part 1,
@@ -170,6 +171,15 @@ You might also be interested in my author profiles on
 # <span title="international, peer-reviewed conferences">international, peer-reviewed conference proceedings</span>
+ 1. <a class="paper-download" href="msr-2020-challenge.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="msr-2020-challenge.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <a href="">Antoine Pietri</a>, <a href="">Diomidis Spinellis</a>, <a href="">Stefano Zacchiroli</a>. **The Software Heritage Graph Dataset: Large-scale Analysis of Public Software Development History**.  <em>
+       To appear in proceedings of <a href="">MSR 2020</a>: The 17th International
+       Conference on Mining Software Repositories, May 2020,
+       Seoul, South Korea. Co-located with <a href="">ICSE 2020</a>.
+       IEEE 2020.
+      </em>
+    [[!toggle id=id75 text="Abstract..."]] [[!toggleable id=id75 text="""
+    *Abstract:* Software Heritage is the largest existing public archive of software source code and accompanying development history. It spans more than five billion unique source code files and one billion unique commits, coming from more than 80 million software projects. These software artifacts were retrieved from major collaborative development platforms (e.g., GitHub, GitLab) and package repositories (e.g., PyPI, Debian, NPM), and stored in a uniform representation linking together source code files, directories, commits, and full snapshots of version control systems (VCS) repositories as observed by Software Heritage during periodic crawls. This dataset is unique in terms of accessibility and scale, and allows to explore a number of research questions on the long tail of public software development, instead of solely focusing on "most starred" repositories as it often happens.
+    """]]
  1. <a class="paper-download" href="msr-2019-swh.pdf" title="download paper in PDF format">[.pdf]</a> <a class="bibtex-download" href="msr-2019-swh.bib" title="download bibliographic entry in BibTeX format">[.bib]</a> <span class="doi_logo"><a href="" title="Document Object Identifier">doi&gt;</a></span> <a href="">Antoine Pietri</a>, <a href="">Diomidis Spinellis</a>, <a href="">Stefano Zacchiroli</a>. **The Software Heritage Graph Dataset: Public software development under one roof**.  <em>
        In proceedings of <a href="">MSR
        2019</a>: The 16th International Conference on Mining Software
index bbd7dec..2907696 100644 (file)
@@ -3,7 +3,8 @@
   title = {Editorial},
   abstract = {},
   publisher = {Rinton Press},
-  year = {2014},
+  month = {March},
+  year = {2015},
   issn = {1540-9589},
   pages = {1-2},
   volume = {14},
diff --git a/research/publications/msr-2020-challenge.bib b/research/publications/msr-2020-challenge.bib
new file mode 100644 (file)
index 0000000..7a29b3c
--- /dev/null
@@ -0,0 +1,8 @@
+  author = {Antoine Pietri and Diomidis Spinellis and Stefano Zacchiroli},
+  title = {The Software Heritage Graph Dataset: Large-scale Analysis of Public Software Development History},
+  abstract = {Software Heritage is the largest existing public archive of software source code and accompanying development history. It spans more than five billion unique source code files and one billion unique commits, coming from more than 80 million software projects. These software artifacts were retrieved from major collaborative development platforms (e.g., GitHub, GitLab) and package repositories (e.g., PyPI, Debian, NPM), and stored in a uniform representation linking together source code files, directories, commits, and full snapshots of version control systems (VCS) repositories as observed by Software Heritage during periodic crawls. This dataset is unique in terms of accessibility and scale, and allows to explore a number of research questions on the long tail of public software development, instead of solely focusing on "most starred" repositories as it often happens.},
+  publisher = {IEEE},
+  year = {2020},
+  booktitle = {MSR 2020: The 17th International Conference on Mining Software Repositories},
diff --git a/research/publications/msr-2020-challenge.pdf b/research/publications/msr-2020-challenge.pdf
new file mode 100644 (file)
index 0000000..8d72b33
Binary files /dev/null and b/research/publications/msr-2020-challenge.pdf differ