Авторы
предыдущая
статья

следующая
статья

04.06.2014 | Ворчалки о языке / Колонка

Русский национальный

Корпус — это не просто большое собрание текстов. Это собрание сбалансированное

А вот и нет, совсем не про политику. Речь о том, что 29 апреля 2014 года исполнилось 10 лет Национальному корпусу русского языка. Я, кстати, и сама не знала, что день рождения у НКРЯ в один день с замечательнейшим лингвистом А.А.Зализняком. НКРЯ — «это информационно-справочная система, основанная на собрании русских текстов в электронной форме». Сейчас общий объем Корпуса — более 500 млн слов. Делает его блестящая команда лингвистов — специалистов по так называемой корпусной лингвистике, при участии разных организаций, прежде всего Яндекса и Института русского языка им. В.В.Вино­градова РАН. Отметим, что в мире корпусная лингвистика вообще сейчас бурно разви­вается, ср., например, один из образцовых корпусов — Британский национальный кор­пус (BNC)
Корпус — это не просто большое собрание текстов. Это собрание сбалансированное (тексты разного типа отобраны в определенной пропорции). При этом для конкретной задачи можно выбрать тексты того или иного жанра, времени и т.п. Например, можно за­дать такой подкорпус: поэтические тексты с автором — женщиной до 1950 года рожде­ния. Искать по массиву текстов можно определенную словоформу или сочетание слов, а также два или более слов, находящихся в тексте на указанном расстоянии друг от дру­га, а также можно задать не слово, а грамматическую форму (например, чтобы изучить модель управления глагола). И много еще чего можно делать. И разумеется, со всяче­ской статистикой.

Например, недавно я пыталась выяснить, как за последние 100 лет изменилось произ­ношение слова артель, и воспользовалась, в частности, МУРКО — мультимедийным кор­пусом, входящим в НКРЯ. Как же было здорово, нажав кнопку, моментально получить 17 отрывочков из фильмов, где это слово произносят! Замечательно, что Корпус все рас­тет и растет, а его поисковые инструменты все изощряются и изощряются. Собственно, все можно посмотреть на сайте НКРЯ — www.ruscorpora.ru.

С появлением НКРЯ жизнь лингвистов-русистов очень украсилась. То, на что у нас рань­ше уходили годы (выискивание примеров по текстам, сортировка пыльных карточек с вы­писанными контекстами), теперь достигается за несколько секунд и в гораздо большем объ­еме. А для лексикографов настала просто райская жизнь! Правда, замечу, что это привело и к появлению большого количества лингвистических работ, выполненных по принципу «на­ливай и пей»: прогоняешь какое-нибудь слово через Корпус — и готово дело. А там есть еще такая чудная кнопочка — «Показать распределение по годам». Нажимаешь — и выскакива­ет красивый график. И пожалуйста — научная статья: вот, мол, такое-то слово, в такие-то годы столько-то, вот столько-то процентов во множественном числе, а в таком-то жанре столько-то. Хочется спросить: «И?». В молодом поколении лингвистов многие убеждены, что это-то и есть настоящая наука, а, скажем, проводимый вручную тонкий семантический анализ — это так, пережитки прошлого. Ну да ничего, будем надеяться, что это детская болезнь и она пройдет.
Помимо собственно научной работы, Корпус еще изумителен тем, что теперь можно получать какие-то предварительные ответы на возникающие в ходе жизни лингвисти­ческие вопросы. Дело в том, что наш индивидуальный языковой опыт очень ограничен и обычно слабо отрефлектирован. И Корпус позволяет нам выйти за его пределы. При­веду несколько примеров из последнего времени.

Подруга-редактор спросила меня, насколько вообще допустимо тавтологическое со­четание денежные купюры. Этот очень легкий вопрос для Корпуса (денежный + купюра на расстоянии 1). Оказывается, такое встречается нечасто (48 вхождений при том, что само слово купюра зафиксировано 1430 раз), но в том числе и у хороших авторов: С.Довлатова, И.Грековой, В.Дудинцева, А.Азольского, Д.Рубиной и др. Ну а дальше — дальше каж­дый сам решает, достаточные ли это для него авторитеты.

Или вот в последнее время многие заметили, что помимо нормативного варианта в Дон­бассе и из Донбасса в литературной речи начал распространяться вариант на Донбассе и с Донбасса (понятное дело, региональное влияние). Тут надо заметить, что как раз в данном случае провести серьезное социолингвистическое исследование с привязкой к террито­риям НКРЯ (пока) возможности не дает. В прошлой колонке про поребрик я упоминала не­которые другие инструменты, которые можно тут использовать. Но Корпус позволяет бы­стро прикинуть, действительно ли раньше в литературной речи такого не встречалось. Как выражался В.С. Черномырдин, Сроду такого не было, и вот опять то же самое. Вообще-то этот вариант и раньше встречался — и у приличных авторов: Мои родители, которые всю жизнь зачем-то колесили по всем доступным им пространствам, привезли меня из Таджи­кистана в город Первомайск на Донбассе ; Бабка моя даже завидовала, что сестра успела походить в мехах и бриллиантах, пока она с мужем ра­ботала то в Карелии, то на Донбассе ; Так на Донбассе и остался на эту зиму: что-то там с железными дорогами . Но, конечно, довольно редко, в Донбассе во много раз чаще.

Интересно, что аналогичное с Донбасса попадается почаще, причем есть и довольно ста­рые примеры: Я вот мастер коксовых печей, с Донбасса, а приехал сюда — печей-то еще не построили, послали меня на работу в профорганизацию ; Я еще мог бы понять, если наша армия послана для демонстрации, чтобы любой це­ной оттянуть силы белых с Донбасса..

Я очень люблю пользоваться поэтическим корпусом НКРЯ для уточнения вопросов, связанных с ударением (слава русской силлабо-тонике!). Вот недавно по понятному по­воду в сети обсуждали стихотворение Демьяна Бедного 1923 года «Социал-траурным предателям»: В бессильном трауре немецкая столица, / Повсюду траурные лица. / Что ни процессия, то — вот она, гляди! - / Колонна социал-прохвостов впереди, / Предате­ли! Трусы! Забейте ватой уши / И трауром густым закройте зеркала: / Вы обнажили до­гола / Свой развращенный ум и слякотные души!

Многие обратили внимание на странное ударение трусы́ вместо тру́сы. Народ очень ве­селился, шутил, что, мол, с бельем все очень логично выходит - трусы́ обнажили догола свой развращенный ум. В общем, поэта каждый может обидеть, но Корпус говорит нам, что та­кой вариант был: Фелицы слава, слава Бога, / Который брани усмирил, / <...> Который оком лучезарным / Шутам, труса́м, неблагодарным / И праведным свой свет дарит; ; Что забывших про долг и про честь / Беглецов и предателей много / У несчастной их родины есть; / Что трусо́в малодушных не счесть; / Но что больше всего равнодушных, / Беззаботно насилью послушных .

Разумеется, это не ответ на вопрос, почему у Демьяна Бедного такое ударение: тут надо было бы подробнее смотреть диалекты, исследовать его язык, надо изучить исто­рию этого слова. Но мы можем сразу сказать, что не то чтобы тут поэт переставил уда­рение, чтобы слово влезло в стих, не станем дразнить его, как у Горького Настя Барона: «Не было этого! Ничего не было!» Я ужасно не люблю, когда в сети такие Насти авто­ритетно заявляют: так, мол, никогда не говорили, такого не бывает, да еще и объясняют почему. У меня всегда в таких случаях рука сама так и тянется к закладке «НКРЯ». Хо­рошо, что она есть. В общем, Happy birthday!

Источник: "Троицкий вариант", 06 мая 2014 года,








Рекомендованные материалы



Шаги командора

«Ряд» — как было сказано в одном из пресс-релизов — «российских деятелей культуры», каковых деятелей я не хочу здесь называть из исключительно санитарно-гигиенических соображений, обратились к правительству и мэрии Москвы с просьбой вернуть памятник Феликсу Дзержинскому на Лубянскую площадь в Москве.


Полицейская идиллия

Помните анекдот про двух приятелей, один из которых рассказывал другому о том, как он устроился на работу пожарным. «В целом я доволен! — говорил он. — Зарплата не очень большая, но по сравнению с предыдущей вполне нормальная. Обмундирование хорошее. Коллектив дружный. Начальство не вредное. Столовая вполне приличная. Одна только беда. Если вдруг где, не дай бог, пожар, то хоть увольняйся!»