1bc0f69c12f89277b68f5184ce98c03729a01eb4
[homepage.git] / teaching / internships / 01-swh-distributed-object-storage.mdwn
1 **Titre**: *Qui veut gagner des milliards (de fichiers source)?*
2
3 **Contexte**: projet de recherche de grande envergure ayant comme but la
4 récupération, l'organisation, et l'archivage à très long terme (siècles) de la
5 totalité du logiciel libre publiquement accessible via Internet.
6
7 **Description**: On souhaite concevoir, réaliser et tester en production un
8 système de stockage pour fichiers textuels de petite taille (typiquement: code
9 source) capable de stocker des milliards des fichiers, pour une occupation
10 totale de l'ordre de 100 téraoctets, sur plusieurs noeuds des stockage
11 géographiquement distribués. La synchronisation entre noeuds sera asynchrone,
12 et chaque noeud disposera d'un contrôle automatique d'intégrité capable de
13 réparer les fichiers corrompus (self-healing).
14
15 **Connaissances souhaitées** pour accéder au stage:
16
17 - algorithmique répartie
18 - Python
19 - PostgreSQL
20
21 **Établissement d'accueil**: [Inria Paris](http://www.inria.fr/centre/paris)
22
23 **Encadrants**:
24
25 - [Roberto Di Cosmo](http://www.dicosmo.org/)
26 - [Stefano Zacchiroli](http://upsilon.cc/~zack)
27
28 **Status**: disponible