Het Gesproken Corpus van de zuidelijk-Nederlandse Dialecten (GCND) is een taalkundig geannoteerd corpus dat gebaseerd is op een bestaande collectie van dialectopnames uit de jaren 60 en 70: Stemmen uit het Verleden , aangevuld met bestaande opnames van het Meertens Instituut en een aantal nieuwe opnames. Het corpus voorziet een met het geluid gealigneerde transcriptie in twee lagen (één dichter bij het dialect en één dichter bij de standaardtaal) die voorzien zijn van tags voor part-of-speech-tags en syntaxis. Het doel van het corpus is om grootschalig onderzoek naar syntactische bijzonderheden van de zuidelijk-Nederlandse dialecten mogelijk te maken.
Het GCND is een middelzwaar infrastructuurproject van het Fonds Wetenschappelijk Onderzoek – Vlaanderen (FWO).