The Swiss portal for the historical sciences

PySHS - Python pour les SHS

11. March 2021 to 27. April 2021 Add to calendar
Graduate Schools
Course

Cette série d’ateliers propose une initiation à la programmation à destination des chercheurs•ses en sciences humaines et sociales (SHS).

Python est un langage de programmation simple, libre, multi-plateforme, pédagogique, bénéficiant d'une communauté d'utilisateurs•rices croissante tant dans le domaine universitaire que le secteur privé. Avec la multiplication des données numériques en SHS, le recours à l'informatique devient indispensable tant pour la collecte, la mise en forme, ou le traitement des données.

Le langage Python permet à la fois de réaliser les traitements statistiques habituels des SHS tout en ouvrant aux nouveaux usages liés à l'automatisation des tâches informatiques, le traitement des grands corpus des humanités numériques ou encore la collecte de données sur les réseaux sociaux. L’apprentissage des bases de Python permet non seulement de renforcer sa culture informatique, ouvrant ce faisant la voie à de nouvelles stratégies d’analyses, mais aussi amène à envisager différemment le rapport aux données, la conceptualisation mais aussi la collaboration avec le partage du code et les enjeux de reproductibilité des analyses. Python participe, aux côtés d’autres logiciels et langages, à la construction du code libre et d’une recherche ouverte.

Cette série d’ateliers se concentre en priorité sur les usages du traitement des données en SHS. La progression est pensée pour permettre à tou•te•s de se former aux bases de programmation et de développer progressivement ses compétences. Complété avec de nombreux exemples de code et des études de cas concrets, chaque séance permet une familiarisation progressive à la programmation, au langage Python et à sa philosophie. Il suit le manuel compagnon http://pyshs.fr en insistant sur les aspects pratiques et les tours de main permettant de faire le lien entre une problématique et des résultats.

Programme des ateliers
NB: les séances ont lieu en ligne de 17h à 19h

  • 11.03 - module d'introduction: les bases de la programmation en Python
    Cette première séance propose d'aborder les raisons de faire du script scientifique pour manipuler des données et la pertinence d'utiliser Python. Nous aborderons l'usage du Notebook Jupyter, la structuration d'un script, la grammaire de Python et nous verrons les bases nécessaires pour faire du recodage de données stockées dans un fichier.
  • 25.03 - traitement de données basiques : la bibliothèque Pandas
    Cette séance propose de montrer tout l'intérêt de combiner l'usage d'un tableur comme Excel et la programmation Python grâce à la bibliothèque Pandas pour traiter les données. Nous verrons comment ouvrir un fichier tableur, manipuler les colonnes, faire des calculs et des représentations graphiques.
  • 15.04 - statistique descriptives et inférentielles
    Cette séance vise à faire le tour de la boîte à outils de statistiques classiques du chercheur en SHS, mais aussi les représentations graphiques. Moyenne, tableau croisé, corrélation, régression linéaire et diagrammes divers, l'objectif est de vous montrer que vous pouvez retrouver tous les traitements habituels, et intégrer ces traitements de manière fluide dans votre réflexion en gardant une trace des différentes étapes pour pouvoir les partager.
  • 29.04 - modèles avancés : régressions, clustering et prédiction
    Cette séance prolonge la séance sur les statistiques pour s'intéresser aux traitements plus avancés ainsi que leurs bibliothèques. Nous verrons comment réaliser une régression logistique et un clustering sur des données, mais aussi présenter les données pour les interpréter ensuite.
  • 13.05 - collecter les données sur internet et s’interfacer avec des API
    Cette séance se concentre sur l'utilisation de la programmation Python pour collecter des données sur internet. Dans de nombreux cas, des interfaces existent (des API) avec des bibliothèques dédiées (Wikipédia, Google Trends ou Twitter par exemple). Dans d'autres cas, il est nécessaire de collecter des pages internet et de les décomposer.
  • 27.05 - construire une carte
    Cette dernière séance présente l'existence de la bibliothèque GeoPandas qui permet de manipuler des données géographiques. Nous verrons comment associer des données à une carte et faire des opérations avec des dimensions géographiques.

Inscription
Les inscriptions se font pour l'ensemble du cycle à l'exception des modules spécifiques - à confirmer lors de la première séance d'introduction auprès des formateurs.

Merci de noter que les formations du PDEN sont destinées (en priorité) aux doctorant.e.s des universités romandes.

Formateurs

Emilien Schultz (emilien.schultz(at)ird.fr)
Émilien Schultz est chercheur post-doctorant en sociologie, actuellement associé au laboratoire CEPED (Paris) et SESSTIM (Marseille). Il mène des recherches sur les relations entre science et politique dans le cadre de collaborations interdisciplinaires, avec un intérêt pour les différentes méthodologies d’enquête. Il s’est progressivement convaincu de l’utilité de Python dans le traitement de ses données et souhaite participer au développement de la communauté Python SHS pour renforcer les outils existants. http://eschultz.fr

Matthias Bussonnier (Bussonniermatthias(at)gmail.com)
Core developer of @ipython and @jupyter , heavy Pythonista, mostly focusing on writing tools to move science forward. Matthias joined QuanSight after 2 years as a researcher facilitator at the University Of California Merced. Before that Matthias, was a postdoctoral scholar at BIDS working on Project Jupyter. He received his PhD in Biophysics at Institut Curie (Paris, France) after a training in fundamental Physics at ENS Cachan (France). Matthias worked on developing tools for modern computational research across disciplines, with an emphasis on high-level languages, literate computing, and reproducible research. In particular, Matthias has been a core developper of the IPython and Jupyter Project team since 2011 and worked on bringing real-time collaboration to scientific tools.

Organised by: 
Programme doctoral en études numériques (PDEN)

Venue

En ligne

Additional event information

Cost information

0.00 CHF

Registration information

Registration online