Description

Paperpile gère des données à grande échelle, avec une base de plus de 250 millions d’articles académiques et un volume croissant de données utilisateurs accumulées depuis plus de dix ans. Vous interviendrez sur l’ensemble des systèmes qui ingèrent, traitent, stockent et distribuent ces données de manière fiable : création de pipelines, optimisation des recherches, gestion massive de PDF et mise à disposition d’API claires et performantes.

Profil recherché

  • Solide expérience en ingénierie backend, avec un historique de conception et d’exploitation de systèmes data intensifs en production.
  • Maîtrise du déploiement et de l’exploitation de services sur AWS.
  • Compétences dans la conception et la maintenance de pipelines d’ingestion de données issues de sources hétérogènes et complexes. À l’aise avec le web scraping et l’intégration de données tierces via API.
  • Connaissance de Node.js et TypeScript. Une expérience préalable en java ou python est un plus, mais vous devez être à l’aise dans cet environnement.
  • Exigence élevée sur la qualité des données : rigueur sur la justesse, la déduplication et la cohérence.
  • Bonne compréhension des systèmes de recherche en texte intégral, incluant stratégies d’indexation, ajustement de pertinence et optimisation des requêtes.
  • Expertise dans la création d’API REST fiables et performantes.

Atouts supplémentaires

  • Connaissance des formats et sources de données en publication académique (PubMed, Crossref, arXiv).
  • Expérience dans les pipelines de traitement PDF (extraction, transformation, stockage et distribution à grande échelle).
  • Pratique des traitements documentaires basés sur LLM ou pipelines ML pour extraire des données structurées à partir de textes non structurés.
  • Expérience en crawling et scraping web à grande échelle.

Rémunération

  • Salaire de base entre 60 000 et 90 000 €, selon votre expérience.
  • Programme de bonus et participation au capital.

    5 autres jobs qui pourrait t'intéresser:

    Meilleurs outils télétravail

    Obtiens 10x plus d'entretiens d'embauche grâce à l'automatisation des candidatures avec l'IA

    En fonction de tes critères de recherche, postule automatiquement jusqu'à 1 500 offres d'emploi chaque mois