Chargé(e) d'analyse de textes et données (H/F)
Detail de l'annonce :
Date Limite Candidature : vendredi 4 mars 2022
Assurez-vous que votre profil candidat soit correctement renseigné
avant de postuler. Les informations de votre profil complètent celles
associées à chaque candidature. Afin d’augmenter votre visibilité
sur notre Portail Emploi et ainsi permettre aux recruteurs de
consulter votre profil candidat, vous avez la possibilité de déposer
votre CV dans notre CVThèque en un clic !
INFORMATIONS GÉNÉRALES
Référence : UAR76-OLIDAS-050
Lieu de travail : VANDOEUVRE LES NANCY
Date de publication : vendredi 11 février 2022
Type de contrat : CDD Technique/Administratif
Durée du contrat : 12 mois
Date d'embauche prévue : 1 avril 2022
Quotité de travail : Temps complet
Rémunération : Entre 2130 et 2715 € bruts mensuels selon
expérience
Niveau d'études souhaité : Bac+3
Expérience souhaitée : Indifférent
MISSIONS
La/le chargé(e) d'analyse de données participe aux différentes
phases du cycle de vie des projets de fouille de texte et de données
: analyse, développement, qualification, intégration, dans le
respect du cahier des charges, des normes et des règles de sécurité
et de confidentialité. Il/elle participe à l'analyse et la
sélection des sources, à l'extraction des données, à leur
préparation en vue de leur traitement automatique. Il/elle réalise
et contribue à l'interprétation et à l'analyse des résultats
produits. Votre contribution bénéficiera à l'institut et plus
largement à la communauté de recherche française.
ACTIVITÉS
* Vous travaillerez avec une équipe mixte (fonctionnel, IT)
fonctionnant selon la méthode SCRUM, et vous contribuerez à analyser
des données textuelles à l'aide d'outils et méthodes de traitement
automatique du langage naturel (TAL).
* Vous participerez à la planification des cycles de développement,
préparation et sélection des sources, traitements des données ainsi
qu'à l'analyse des résultats (Analyse bibliométrique,
scientométrique, lexicométrique…).
* Vous participerez à la planification des cycles de développement
avec comme activités principales de :
* Sélectionner des sources de données en adéquation avec le
besoin,,
* Collecter, sélectionner et valider les données pertinentes pour
le projet,
* Identifier les besoins et la problématique d'analyse et de fouille
de textes du projet,
* Analyser les résultats obtenus et les présenter sous une forme
adaptée aux différents commanditaires
* Effectuer une veille sur les avancées techniques et scientifiques
du domaine.
* Vous interagissez avec le service ISTEX Textes & Corpus, pour
produire l'alimentation, l'enrichissement et l'usage de la base CorHAL
* Ponctuellement vous pouvez être amené à participer à des
conférences ainsi qu'à la rédaction d'articles scientifiques et à
des opérations de formation.
COMPÉTENCES
* Bonne compréhension des structures et des formats de données
* Compétences en bibliométrie / scientométrie
* Savoir manipuler des formats XML, JSON et leur transformation (XSL)
Souhaitées :
* Connaissances en analyse sémantique,
* Connaissances des méthodes de visualisation des données,
* Connaissances en IST (Information Scientifique et Technique)
* Connaissances des licences d'utilisation des données ouvertes
* Pratique des méthodes agiles (SCRUM),
* Expérience avec des outils de contrôle de version comme Git,
* Maîtrise de l'anglais lu et écrit.
* Savoir travailler en équipe
CONTEXTE DE TRAVAIL
L'Institut de l'information scientifique et technique (lnist), Unité
d'Appui à la Recherche (UAR76 ) du CNRS, facilite l'accès, l'analyse
et la fouille de l'information scientifique et valorise la production
scientifique (publications et données de recherche). Il siège,
depuis 1989, dans un bâtiment conçu par l'architecte Jean Nouvel
situé à Vandoeuvre Les Nancy (54500) et compte 156 collaborateurs.
Le ou la candidate intégrera le service Text & Data Mining qui
développe et intègre des outils et méthodes de fouille de textes
pour valoriser les données proposées par l'Institut (notamment
celles du fonds documentaire ISTEX et de la base CORHAL), mais
également pour répondre à des besoins en analyse de données
textuelles émanant du CNRS ou d'autres EPST.