Авторы
предыдущая
статья

следующая
статья

04.06.2014 | Ворчалки о языке / Колонка

Русский национальный

Корпус — это не просто большое собрание текстов. Это собрание сбалансированное

А вот и нет, совсем не про политику. Речь о том, что 29 апреля 2014 года исполнилось 10 лет Национальному корпусу русского языка. Я, кстати, и сама не знала, что день рождения у НКРЯ в один день с замечательнейшим лингвистом А.А.Зализняком. НКРЯ — «это информационно-справочная система, основанная на собрании русских текстов в электронной форме». Сейчас общий объем Корпуса — более 500 млн слов. Делает его блестящая команда лингвистов — специалистов по так называемой корпусной лингвистике, при участии разных организаций, прежде всего Яндекса и Института русского языка им. В.В.Вино­градова РАН. Отметим, что в мире корпусная лингвистика вообще сейчас бурно разви­вается, ср., например, один из образцовых корпусов — Британский национальный кор­пус (BNC)
Корпус — это не просто большое собрание текстов. Это собрание сбалансированное (тексты разного типа отобраны в определенной пропорции). При этом для конкретной задачи можно выбрать тексты того или иного жанра, времени и т.п. Например, можно за­дать такой подкорпус: поэтические тексты с автором — женщиной до 1950 года рожде­ния. Искать по массиву текстов можно определенную словоформу или сочетание слов, а также два или более слов, находящихся в тексте на указанном расстоянии друг от дру­га, а также можно задать не слово, а грамматическую форму (например, чтобы изучить модель управления глагола). И много еще чего можно делать. И разумеется, со всяче­ской статистикой.

Например, недавно я пыталась выяснить, как за последние 100 лет изменилось произ­ношение слова артель, и воспользовалась, в частности, МУРКО — мультимедийным кор­пусом, входящим в НКРЯ. Как же было здорово, нажав кнопку, моментально получить 17 отрывочков из фильмов, где это слово произносят! Замечательно, что Корпус все рас­тет и растет, а его поисковые инструменты все изощряются и изощряются. Собственно, все можно посмотреть на сайте НКРЯ — www.ruscorpora.ru.

С появлением НКРЯ жизнь лингвистов-русистов очень украсилась. То, на что у нас рань­ше уходили годы (выискивание примеров по текстам, сортировка пыльных карточек с вы­писанными контекстами), теперь достигается за несколько секунд и в гораздо большем объ­еме. А для лексикографов настала просто райская жизнь! Правда, замечу, что это привело и к появлению большого количества лингвистических работ, выполненных по принципу «на­ливай и пей»: прогоняешь какое-нибудь слово через Корпус — и готово дело. А там есть еще такая чудная кнопочка — «Показать распределение по годам». Нажимаешь — и выскакива­ет красивый график. И пожалуйста — научная статья: вот, мол, такое-то слово, в такие-то годы столько-то, вот столько-то процентов во множественном числе, а в таком-то жанре столько-то. Хочется спросить: «И?». В молодом поколении лингвистов многие убеждены, что это-то и есть настоящая наука, а, скажем, проводимый вручную тонкий семантический анализ — это так, пережитки прошлого. Ну да ничего, будем надеяться, что это детская болезнь и она пройдет.
Помимо собственно научной работы, Корпус еще изумителен тем, что теперь можно получать какие-то предварительные ответы на возникающие в ходе жизни лингвисти­ческие вопросы. Дело в том, что наш индивидуальный языковой опыт очень ограничен и обычно слабо отрефлектирован. И Корпус позволяет нам выйти за его пределы. При­веду несколько примеров из последнего времени.

Подруга-редактор спросила меня, насколько вообще допустимо тавтологическое со­четание денежные купюры. Этот очень легкий вопрос для Корпуса (денежный + купюра на расстоянии 1). Оказывается, такое встречается нечасто (48 вхождений при том, что само слово купюра зафиксировано 1430 раз), но в том числе и у хороших авторов: С.Довлатова, И.Грековой, В.Дудинцева, А.Азольского, Д.Рубиной и др. Ну а дальше — дальше каж­дый сам решает, достаточные ли это для него авторитеты.

Или вот в последнее время многие заметили, что помимо нормативного варианта в Дон­бассе и из Донбасса в литературной речи начал распространяться вариант на Донбассе и с Донбасса (понятное дело, региональное влияние). Тут надо заметить, что как раз в данном случае провести серьезное социолингвистическое исследование с привязкой к террито­риям НКРЯ (пока) возможности не дает. В прошлой колонке про поребрик я упоминала не­которые другие инструменты, которые можно тут использовать. Но Корпус позволяет бы­стро прикинуть, действительно ли раньше в литературной речи такого не встречалось. Как выражался В.С. Черномырдин, Сроду такого не было, и вот опять то же самое. Вообще-то этот вариант и раньше встречался — и у приличных авторов: Мои родители, которые всю жизнь зачем-то колесили по всем доступным им пространствам, привезли меня из Таджи­кистана в город Первомайск на Донбассе ; Бабка моя даже завидовала, что сестра успела походить в мехах и бриллиантах, пока она с мужем ра­ботала то в Карелии, то на Донбассе ; Так на Донбассе и остался на эту зиму: что-то там с железными дорогами . Но, конечно, довольно редко, в Донбассе во много раз чаще.

Интересно, что аналогичное с Донбасса попадается почаще, причем есть и довольно ста­рые примеры: Я вот мастер коксовых печей, с Донбасса, а приехал сюда — печей-то еще не построили, послали меня на работу в профорганизацию ; Я еще мог бы понять, если наша армия послана для демонстрации, чтобы любой це­ной оттянуть силы белых с Донбасса..

Я очень люблю пользоваться поэтическим корпусом НКРЯ для уточнения вопросов, связанных с ударением (слава русской силлабо-тонике!). Вот недавно по понятному по­воду в сети обсуждали стихотворение Демьяна Бедного 1923 года «Социал-траурным предателям»: В бессильном трауре немецкая столица, / Повсюду траурные лица. / Что ни процессия, то — вот она, гляди! - / Колонна социал-прохвостов впереди, / Предате­ли! Трусы! Забейте ватой уши / И трауром густым закройте зеркала: / Вы обнажили до­гола / Свой развращенный ум и слякотные души!

Многие обратили внимание на странное ударение трусы́ вместо тру́сы. Народ очень ве­селился, шутил, что, мол, с бельем все очень логично выходит - трусы́ обнажили догола свой развращенный ум. В общем, поэта каждый может обидеть, но Корпус говорит нам, что та­кой вариант был: Фелицы слава, слава Бога, / Который брани усмирил, / <...> Который оком лучезарным / Шутам, труса́м, неблагодарным / И праведным свой свет дарит; ; Что забывших про долг и про честь / Беглецов и предателей много / У несчастной их родины есть; / Что трусо́в малодушных не счесть; / Но что больше всего равнодушных, / Беззаботно насилью послушных .

Разумеется, это не ответ на вопрос, почему у Демьяна Бедного такое ударение: тут надо было бы подробнее смотреть диалекты, исследовать его язык, надо изучить исто­рию этого слова. Но мы можем сразу сказать, что не то чтобы тут поэт переставил уда­рение, чтобы слово влезло в стих, не станем дразнить его, как у Горького Настя Барона: «Не было этого! Ничего не было!» Я ужасно не люблю, когда в сети такие Насти авто­ритетно заявляют: так, мол, никогда не говорили, такого не бывает, да еще и объясняют почему. У меня всегда в таких случаях рука сама так и тянется к закладке «НКРЯ». Хо­рошо, что она есть. В общем, Happy birthday!

Источник: "Троицкий вариант", 06 мая 2014 года,








Рекомендованные материалы



Поэтика отказа

Отличало «нас» от «них» не наличие или отсутствие «хорошего слуха», а принципиально различные представления о гигиене социально-культурных отношений. Грубо говоря, кому-то удавалось «принюхиваться», а кто-то либо не желал, либо органически не мог, даже если бы и захотел.


«У» и «при»

Они присвоили себе чужие победы и достижения. Они присвоили себе космос и победу. Победу — особенно. Причем из всех четырех годов самой страшной войны им пригодились вовсе не первые два ее года, не катастрофическое отступление до Волги, не миллионы пленных, не массовое истребление людей на оккупированных территориях, не Ленинградская блокада, не бомбежки городов. Они взяли себе праздничный салют и знамя над Рейхстагом.