C’est un événement : un article scientifique français accepté à la conférence SOSP 2021

Télécom SudParis

C’est un événement : un article scientifique français accepté à la conférence SOSP 2021 ! Il s’agit de « J-NVM: Off-heap Persistent Objects in Java » par Anatole Lefort et al. de l’équipe de SAMOVAR, dirigée par le Professeur Gaël Thomas à Télécom SudParis (TSP). C'est le 3e papier français en 50 ans.

 

30 ans après, un papier français est valorisé à la conférence SOSP

SOSP est la conférence phare de la communauté système internationale. C’est à SOSP qu’ont été introduites les grandes innovations marquantes en systèmes qui sont à la base de toutes les architectures modernes. Dans un décompte rapide des numéros précédents, nous retrouvons 24 papiers écrits par des lauréats du Prix Turing.

La conférence n’a lieu que tous les deux ans. Il s’agit du canal de publication le plus prestigieux en systèmes, sans sessions parallèles. Une publication à SOSP exige, à la fois créativité, mise en œuvre réelle et expérimentation, et rigueur dans l’écriture. Devant sa haute sélectivité, il y a une forte auto-censure à la soumission.

Le succès de l'équipe de chercheurs de Gaël Thomas est d’autant plus remarquable que la conférence est complètement monopolisée par les grandes universités américaines (et plus récemment asiatiques). Les papiers européens sont très rares, en provenance généralement des EPFL, ETHZ, Cambridge ou Microsoft Research. À notre connaissance, et si l'on exclut le collaborateur français occasionnel, il n’y a eu précédemment que deux papiers français depuis la création de SOSP en 1967 : Bétourné et al. en 1969, Abrossimov et al. en 1989.

"La communauté informatique française toute entière doit féliciter les auteurs à la hauteur de l’exploit." explique Alain Tchana, Professeur des Universités, ENS de Lyon.

Résumé de la contribution scientifique « J-NVM: Off-heap Persistent Objects in Java »

Java est un langage communément utilisé par les acteurs majeurs de l'internet pour mettre en œuvre des bases de données larges échelles et des grands systèmes d'analyse de données (Cassandra, Infinispan, Spark, Hadoop, Kafka, Flink, HBase etc...). Comme l'un des principaux goulots d'étranglement de ces systèmes est la vitesse d'accès au support de stockage, il est essentiel qu'ils puissent utiliser efficacement les mémoires persistantes : des supports de stockages quasiment aussi rapide que les mémoires volatiles et de l'ordre de 1000 fois plus rapides que les disques SATA SSD.

Malheureusement, utiliser efficacement les mémoires persistantes en Java est difficile. Java, comme de nombreux langages de haut niveau, gère automatiquement la libération de la mémoire avec un ramasse-miettes, et les algorithmes actuels sont totalement incapables de passer à l'échelle de ces mémoires avec leur 128GB à 1TB d'espace.

Dans leur travail, Lefort et al. proposent de revisiter la façon de concevoir les objets Java à l'ère des mémoires persistantes. Ils proposent un principe de découplage qui consiste à séparer la structure de données d'un objet persistant de l'objet volatile qui le représente dans le langage Java. À l'aide de ce principe de découplage, ils peuvent accéder à la mémoire persistante quasi à vitesse native tout en évitant d'augmenter la pression sur le ramasse-miettes puisque les structures de données sont stockées en dehors de la mémoire Java.

À partir de ce principe de découpage, Lefort et al. propose J-NVM, un système complet constitué d'un moteur d'exécution offrant des abstractions simples pour le programmeur, de bibliothèques offrant des structures de données classiques persistantes, et d'un générateur de code permettant de séparer automatiquement les structures de données des objets qui les représentent.

L'évaluation de leur système avec la base de donnée Infinispan, avec le banc d'essai TPC-B et avec des micro-évaluations montrent que J-NVM, comparé aux meilleures solutions de l'état de l'art, multiplie par au moins 10 les performances dans la plupart des cas, et que J-NVM permet d'accéder à la mémoire persistante avec des vitesses proches de la mémoire volatile (seulement 50% de ralentissement).

 

Article publié initialement sur  l'ASF  http://www.sigops-france.fr/2021/10/ArticleSosp et reproduit ici avec leur aimable autorisation.