Читать онлайн «Сочетаемость через призму корпусов»

Автор В. П. Захаров

Сочетаемость через призму корпусов Захаров В. Явное отражение это явление нашло в выделении устойчивых сочетаний, которые являются главным объектом фразеологии, и в соз- дании словарей устойчивых словосочетаний. В статье рассматрива- ются устойчивые сочетания разного типа и показываются способы их количественной оценки. Описаны эксперименты, в ходе которых на материале корпусов русского языка и инструментов корпусной лингвистики, таких как Sketch Engine и Google books Ngram Viewer, было показано, как с помощью корпусных методов можно расширить состав словарных статей в словарях устойчивых выражений и как можно количественно оценить употребительность и устойчивость сло- восочетаний в синхронии и диахронии. Ключевые слова: устойчивые словосочетания, фразеологизмы, кол- локации, словари сочетаемости, корпусы текстов, меры ассоциации, диахронические исследования Set Phrases: a View through Corpora Zakharov V. Syn- tagmatic relations bind together language units being in direct contact with each other. The combinatory ability of language units, collocatibility, is one of the linguistic syntagmatic laws. This phenomenon is the main ob- ject of the phraseology and lexicography. The article deals with set phrases of different types from the point of view of their numerical evaluation. Cor- pus linguistics understand set phrases as statistically determined unities. This approach is the basic point of different automatic ways to extract idi- oms as collocations.
The paper describes experiments which show how text corpora and corpus methods and tools such as association measures, word sketches, concordances can be used to expand the entries in existing dic- tionaries and how set phrases could be evaluated quantitatively. There are a small numbers of works on set phrases productivity during time periods because of small size of historical corpora. In this research examined set Zakharov V. P.  phrases usage was studied diachronically on the base of the big Google books Ngram Viewer Russian corpus counting billions of tokens. The study argues that diachronic productivity is best evaluated with a studying con- texts. Used corpus tools enable to do it. Ultimately, it is shown and main- tained that corpus linguistics methods and tools allow to create dictionaries of new type which have to include a larger amount of set phrases and col- locations than before. Key words: set phrases, idioms, collocations, collocation dictionaries, cor- pus, association measures, concordance, diachronical research Введение Один из популярных предметов в языкознании — это устойчивые слово- сочетания.