Books
Михаил Копотев

Введение в корпусную лингвистику

  • ibelyalovцитирует6 лет назад
    исходя из особенностей обработки таких единиц, их можно разделить на три группы:
    1. Контактные неомонимичные обороты
    К этой группе относятся единицы, в которых компоненты непосредственно располагаются друг за другом и однозначно образуют цельную единицу: составные числительные («тридцать три», «33»), единицы типа «потому что», «несмотря на».
    2. Контактные омонимичные обороты
    Эту, самую многочисленную, группу образуют единицы с контактным расположением компонентов, но омонимичные сочетанию двух (или более) слов, связанных синтаксически или даже не имеющих непосредственной синтаксической связи: в общем (ср. в общем вагоне), в прошлом (ср. в прошлом году) и т. д.
    3. Дистантные обороты (англ. skipgrams / concgrams)
    В эту группу входят единицы, компоненты которых располагаются (или могут располагаться) дистантно: читал бы, если … то.
  • Marina Ilyinykhцитирует8 лет назад
    Согласно данным Частотного словаря русского языка, изданного в 1977 году, в сотню самых частых слов входят существительное «товарищ» и прилагательное «советский».
  • ngomeniukцитирует3 года назад
    примером полного корпуса
  • ngomeniukцитирует3 года назад
    представительную, или репрезентативную, выборку (англ. representative sampling) — такой объем материала, увеличение которого уже почти никак не повлияет на распределение единиц
  • ngomeniukцитирует3 года назад
    разметки, или аннотации
  • ngomeniukцитирует3 года назад
    Необходимость работать с собственным корпусом (англ. DIY-corpus, do-it-yourself corpus) возникает по разным причинам: исследование языка конкретного автора или жанра, собранный в экспедициях собственный материал и т. д.
  • ngomeniukцитирует3 года назад
    какой степени можно опираться на корпус
  • ngomeniukцитирует3 года назад
    первом значении более технологична и предполагает совместную работу лингвистов и специалистов по компьютерным технологиям. Это не столько теоретическое направление лингвистики, сколько технология. Корпусная лингвистика во втором значении — дело лингвистов, в том числе и специалистов по статистической обработке языка
  • ngomeniukцитирует3 года назад
    Корпусная лингвистика — это лингвистика корпусов, то есть собраний текстов
  • ngomeniukцитирует3 года назад
    Рембрандта «Урок анатомии доктора Тульпа»,
fb2epub
Перетащите файлы сюда, не более 5 за один раз