А вот и нет, совсем не про политику. Речь о том, что 29 апреля 2014 года исполнилось 10 лет Национальному корпусу русского языка. Я, кстати, и сама не знала, что день рождения у НКРЯ в один день с замечательнейшим лингвистом А.А.Зализняком. НКРЯ — «это информационно-справочная система, основанная на собрании русских текстов в электронной форме». Сейчас общий объем Корпуса — более 500 млн слов. Делает его блестящая команда лингвистов — специалистов по так называемой корпусной лингвистике, при участии разных организаций, прежде всего Яндекса и Института русского языка им. В.В.Виноградова РАН. Отметим, что в мире корпусная лингвистика вообще сейчас бурно развивается, ср., например, один из образцовых корпусов —
Британский национальный корпус (BNC)
Корпус — это не просто большое собрание текстов. Это собрание сбалансированное (тексты разного типа отобраны в определенной пропорции). При этом для конкретной задачи можно выбрать тексты того или иного жанра, времени и т.п. Например, можно задать такой подкорпус: поэтические тексты с автором — женщиной до 1950 года рождения. Искать по массиву текстов можно определенную словоформу или сочетание слов, а также два или более слов, находящихся в тексте на указанном расстоянии друг от друга, а также можно задать не слово, а грамматическую форму (например, чтобы изучить модель управления глагола). И много еще чего можно делать. И разумеется, со всяческой статистикой.
Например, недавно я пыталась выяснить, как за последние 100 лет изменилось произношение слова
артель, и воспользовалась, в частности, МУРКО — мультимедийным корпусом, входящим в НКРЯ. Как же было здорово, нажав кнопку, моментально получить 17 отрывочков из фильмов, где это слово произносят! Замечательно, что Корпус все растет и растет, а его поисковые инструменты все изощряются и изощряются. Собственно, все можно посмотреть на сайте НКРЯ —
www.ruscorpora.ru.
С появлением НКРЯ жизнь лингвистов-русистов очень украсилась. То, на что у нас раньше уходили годы (выискивание примеров по текстам, сортировка пыльных карточек с выписанными контекстами), теперь достигается за несколько секунд и в гораздо большем объеме. А для лексикографов настала просто райская жизнь! Правда, замечу, что это привело и к появлению большого количества лингвистических работ, выполненных по принципу «наливай и пей»: прогоняешь какое-нибудь слово через Корпус — и готово дело. А там есть еще такая чудная кнопочка — «Показать распределение по годам». Нажимаешь — и выскакивает красивый график. И пожалуйста — научная статья: вот, мол, такое-то слово, в такие-то годы столько-то, вот столько-то процентов во множественном числе, а в таком-то жанре столько-то. Хочется спросить: «И?». В молодом поколении лингвистов многие убеждены, что это-то и есть настоящая наука, а, скажем, проводимый вручную тонкий семантический анализ — это так, пережитки прошлого. Ну да ничего, будем надеяться, что это детская болезнь и она пройдет.
Помимо собственно научной работы, Корпус еще изумителен тем, что теперь можно получать какие-то предварительные ответы на возникающие в ходе жизни лингвистические вопросы. Дело в том, что наш индивидуальный языковой опыт очень ограничен и обычно слабо отрефлектирован. И Корпус позволяет нам выйти за его пределы. Приведу несколько примеров из последнего времени.
Подруга-редактор спросила меня, насколько вообще допустимо тавтологическое сочетание
денежные купюры. Этот очень легкий вопрос для Корпуса
(денежный +
купюра на расстоянии 1). Оказывается, такое встречается нечасто (48 вхождений при том, что само слово купюра зафиксировано 1430 раз), но в том числе и у хороших авторов: С.Довлатова, И.Грековой, В.Дудинцева, А.Азольского, Д.Рубиной и др. Ну а дальше — дальше каждый сам решает, достаточные ли это для него авторитеты.
Или вот в последнее время многие заметили, что помимо нормативного варианта
в Донбассе и
из Донбасса в литературной речи начал распространяться вариант
на Донбассе и
с Донбасса (понятное дело, региональное влияние). Тут надо заметить, что как раз в данном случае провести серьезное социолингвистическое исследование с привязкой к территориям НКРЯ (пока) возможности не дает. В прошлой колонке про
поребрик я упоминала некоторые другие инструменты, которые можно тут использовать. Но Корпус позволяет быстро прикинуть, действительно ли раньше в литературной речи такого не встречалось. Как выражался В.С. Черномырдин,
Сроду такого не было, и вот опять то же самое. Вообще-то этот вариант и раньше встречался — и у приличных авторов:
Мои родители, которые всю жизнь зачем-то колесили по всем доступным им пространствам, привезли меня из Таджикистана в город Первомайск на Донбассе ;
Бабка моя даже завидовала, что сестра успела походить в мехах и бриллиантах, пока она с мужем работала то в Карелии, то на Донбассе ;
Так на Донбассе и остался на эту зиму: что-то там с железными дорогами . Но, конечно, довольно редко,
в Донбассе во много раз чаще.
Интересно, что аналогичное
с Донбасса попадается почаще, причем есть и довольно старые примеры:
Я вот мастер коксовых печей, с Донбасса, а приехал сюда — печей-то еще не построили, послали меня на работу в профорганизацию ;
Я еще мог бы понять, если наша армия послана для демонстрации, чтобы любой ценой оттянуть силы белых с Донбасса..
Я очень люблю пользоваться поэтическим корпусом НКРЯ для уточнения вопросов, связанных с ударением (слава русской силлабо-тонике!). Вот недавно по понятному поводу в сети обсуждали стихотворение Демьяна Бедного 1923 года «Социал-траурным предателям»:
В бессильном трауре немецкая столица, / Повсюду траурные лица. / Что ни процессия, то — вот она, гляди! -
/ Колонна социал-прохвостов впереди, / Предатели! Трусы! Забейте ватой уши / И трауром густым закройте зеркала: / Вы обнажили догола / Свой развращенный ум и слякотные души!
Многие обратили внимание на странное ударение
трусы́ вместо
тру́сы. Народ очень веселился, шутил, что, мол,
с бельем все очень логично выходит -
трусы́ обнажили догола свой развращенный ум. В общем, поэта каждый может обидеть, но Корпус говорит нам, что такой вариант был:
Фелицы слава, слава Бога, / Который брани усмирил, / <...> Который оком лучезарным / Шутам, труса́м, неблагодарным / И праведным свой свет дарит; ;
Что забывших про долг и про честь / Беглецов и предателей много / У несчастной их родины есть; / Что трусо́в малодушных не счесть; / Но что больше всего равнодушных, / Беззаботно насилью послушных .
Разумеется, это не ответ на вопрос, почему у Демьяна Бедного такое ударение: тут надо было бы подробнее смотреть диалекты, исследовать его язык, надо изучить историю этого слова. Но мы можем сразу сказать, что не то чтобы тут поэт переставил ударение, чтобы слово влезло в стих, не станем дразнить его, как у Горького Настя Барона: «Не было этого! Ничего не было!» Я ужасно не люблю, когда в сети такие Насти авторитетно заявляют: так, мол, никогда не говорили, такого не бывает, да еще и объясняют почему. У меня всегда в таких случаях рука сама так и тянется к закладке «НКРЯ». Хорошо, что она есть. В общем, Happy birthday!
Источник:
"Троицкий вариант", 06 мая 2014 года,