Читать онлайн «Корпусная лингвистика»

Автор Богданова С.Ю.

Министерство образования и науки РФ
ФГБОУ ВПО «Иркутский государственный
лингвистический университет»


В. П.  Захаров, С. Ю.  Богданова


КОРПУСНАЯ ЛИНГВИСТИКА


Учебник

Рекомендован Учебно-методическим объединением по образованию в области лингвистики Министерства образования и науки Российской Федерации в качестве учебника для студентов, обучающихся по направлению подготовки бакалавров и магистров 035700 «Лингвистика»



Иркутск
ИГЛУ
2011
УДК 81’32
ББК 81. 1-923
З - 38

Рецензенты:
доктор филологических наук, ведущий научный сотрудник Института востоковедения РАН
С. А. Крылов,
доктор технических наук, профессор Санкт-Петербургского государственного университета
В. Ш. Рубашкин


Захаров В. П. , Богданова С. Ю.
З-38 Корпусная лингвистика: учебник для студентов направления «Лингвистика». 2-е изд. , перераб. и доп. – Иркутск: ИГЛУ, 2011. – 169 с.



Учебник знакомит с концепциями корпусной лингвистики, дает возможность освоить основы корпусных технологий, приобрести навыки работы с корпусами, определить место дисциплины и собственно корпусов в ряду информационных технологий. Учебник базируется на исследовательской и преподавательской деятельности авторов.
Предназначен для бакалавров, студентов, магистрантов и аспирантов филологических специальностей, а также для всех специалистов, занимаюихся корпусной проблематикой.

УДК 81’32
ББК 81. 1-923
ISBN 978-5-88267-316-0© Захаров В. П. , 2011© Богданова С. Ю. , 2011 © Иркутский государственный
лингвистический университет, 2011
ОГЛАВЛЕНИЕ
Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5ЧАСТЬ 1. Введение в корпусную лингвистику . . . . . 71. 1. Основные понятия корпусной лингвистики . . . . . . . . . . 71. 2. Направления в лингвистике, предвосхитившие появление корпусной лингвистики: от картотеки к корпусу . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 

111. 3. История создания лингвистических корпусов . . . . . . . . 151. 4. Основные характеристики корпусов . . . . . . . . . . . . . . . . 171. 4. 1. Репрезентативность корпусов . . . . . . . . . . . . . . . . . . . . . 171. 4. 2. Классификация корпусов по различным основаниям . . 201. 4. 3. Особые типы корпусов . . . . . . . . . . . . . . . . .
. . . . . . . . . . 251. 4. 3. 1. Параллельные корпусы . . . . . . . . . . . . . . . . . . . . . . . . . . . 251. 4. 3. 2. Корпусы устной речи . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28Вопросы для самоконтроля . . . . . . . . . . . . . . . . . . . . . . . 32ЧАСТЬ 2. Создание корпусов . . . . . . . . . . . . . . . . . . . . . . . . 332. 1. Предварительные работы по созданию корпуса . . . . . . 332. 1. 1. Проектирование и технологический процесс создания332. 1. 2. Отбор источников. Критерии отбора . . . . . . . . . . . . . . . 362. 1. 3. Основные процедуры обработки естественного языка: токенизация, лемматизация, стемминг, парсинг . . . . . . 
382. 2. Понятие разметки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422. 2. 1. Разметка.