Ici vous trouverez le Portuguese Stress Lexicon, des scripts et des tutoriels sur une série de sujets, notamment l’analyse de données et la phonologie.


Données

PenelopeLe Portuguese Stress Lexicon est un projet développé durant mon doctorat. C’est un lexique complet contenant les non-verbes du portugais codés phonologiquement. Étant donné son format tidy data, le lexique peut être facilement analysé. Le Talian corpus project est un projet conjoint avec Natália B. Guzzo. Le Talian est une langue sous-étudiée du sud du Brésil. Notre objectif est de développer un corpus accessible pour que d’autres puissent l’utiliser dans leur recherche.

Général

Voici quelques scripts que j’ai développés avec R, ainsi que des informations sur les outils que j’utilise normalement (Méthode de travail). Ces scripts sont là pour complémenter les tutoriels R que j’ai développés au cours des années.

Méthodes de recherche en linguistique

Vous trouverez «Comment visualiser des voyelles avec R» ci-dessous. Il s’agit d’un bref tutoriel sur ggplot2 — peut-être l’extension la plus puissante pour visualiser des données. Vous trouverez aussi un tutoriel sur web scraping qui utilise des données du polonais comme exemple, et un tutoriel sur la syllabation avec Regex. Le script autoPraat : Automating Praat experiments combine de différents ensembles de données et génère des fichiers csv qui sont prêts pour l’analyse statistique (tidy data). Je l’ai utilisé plusieurs fois et il m’a permis d’économiser de nombreuses heures de travail. D’ailleurs, j’ai développé Data analysis using R durant mon doctorat à l’Université McGill. Depuis, beaucoup a changé. Bien que le tutoriel a été actualisé quelques fois, il a été remplacé par mon livre.

Si vous voulez apprendre R, ma première recommandation est R for data science, de Wikcham et Grolemund ; pour la statistique générale, Statistical Rethinking, de Richard McElreath (voyez les chaînes YouTube ci-dessous).

Shiny apps pour l’enseignement

L’objectif de ces logiciels est de rendre des concepts abstraits plus intuitifs. Je les utilise souvent dans mes cours de méthodes de recherche et de phonologie.

Préparation des documents

Ma recommandation pour les étudiants de 3e cycle est fréquemment d’apprendre LaTeX et BibTeX le plus tôt possible. Je reconnais, toutefois, que tout le monde ne veut pas les utiliser ; et tout le monde n’a pas besoin d’apprendre ce langage. J’utilise LaTeX depuis 2013, donc j’ai décidé d’inclure LaTeX et phonologie dans mon site web.

La vie dans les 2e et 3e cycles

Il y a beaucoup de choses à apprendre avant de commencer nos études aux 2e et 3e cycles. Plusieurs articles très utiles ont été écrits sur ce sujet, et je recommande fortement le livre ci-dessous.


Liens

Voici une liste des outils, sites web, livres, et projets développés par différents chercheurs. Les sujets vont de général à spécifique, mais le point central est évidemment la linguistique.

Portugais

Ma langue maternelle est le portugais (brésilien). Voici ses deux plus anciennes grammaires.


YouTube

Je suis abonné à trop de chaînes YouTube, donc j’ai beaucoup de recommandations. La liste ci-dessous est divisée selon les sujets qui m’intéressent.

Statistique

Langage & linguistique

Général



Copyright © 2022 Guilherme Duarte Garcia