Лекция "Корпусная лингвистика"
Лектор: Пиперски Александр Чедович к.ф.н., ведущий научный сотрудник учебно-научной лаборатории социолингвистики ФГБОУ ВО "Российский государственный гуманитарный университет". Автор книги "Конструирование языков: от эсперанто до дотракийского".
Одним из важнейших инструментов современной лингвистики являются языковые корпуса — большие оцифрованные собрания текстов, с помощью которых можно исследовать разные особенности языкового употребления. Современный русский язык представлен множеством легко доступных корпусов, которые позволяют узнать много интересных вещей о том, как реально функционирует язык, как он меняется и чем отличается от предписаний, которые мы находим в словарях и грамматиках.
1. Методы лингвистического исследования: интроспекция, эксперимент, наблюдение над реальностью — в свете противопоставления языка и речи.
2. Лингвистические корпуса как инструмент наблюдения над речевой реальностью.
3. История создания лингвистических корпусов русского языка.
4. Обзор основных существующих корпусов русского языка: Национальный корпус русского языка, ruTenTen, Araneum Russicum, Генеральный интернет-корпус русского языка и др.
5. Уровни разметки корпусов
6. Стандарты морфологической разметки для русского языка. Снятие омонимии.
7. Подсчёт частотности по корпусам. Частотные словари. Закон Ципфа.
8. Проблемы разработки интернет-корпусов
9. Примеры исследований современного русского языка на материале корпуса Araneum Russicum Maximum.
10. Примеры исследований региональной вариативности русского языка на материале Генерального интернет-корпуса русского языка.