Из опыта составления частотного словаря вводно-модальных единиц

Актуальность составления частотных словарей для разных исследовательских задач достаточно очевидна. На базе частотных словарей формируется особая ветвь стилистической лингвистики, предмет изучения которой составляет лингвистическая и стилистическая интерпретация слов в языке и тексте. Однако до настоящего времени материалы лексикостатистики остаются скудными. Так, до сих пор нет ни одного большого частотного словаря русского языка, объем выборки которого превышал бы 400—500 тыс. словоупотреблений.

Значительное расширение базы лексикостатистики возможно только за счет автоматизации обработки текстов. Вместе с тем большой диапазон приложений частотных словарей требует специализации каждого из них. В настоящем словаре статистика и автоматизация стоят на службе интересов русской лексикографии. Это обстоятельство определяет и отбор источников словаря, и выбор единицы счета, и методы обработки текста. В Википедии, свободной энциклопедии, частотный словарь (или частотный список) понимается как «набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости». Существует несколько методик составления частотного словаря.

Он может быть составлен с учетом частоты, алфавита (тогда для каждого слова будет указана его частота), групп слов (например, первая тысяча наиболее частотных слов, за ней вторая и т. п.), типичности (слова, частотные для большинства текстов), и т. д. Вслед за Л.Н. Засориной мы понимаем под частотным словарем вид словаря, в котором приводятся числовые характеристики употребительности слов (словоформ, словосочетаний) какого-либо языка, в том числе языка писателя, какого-либо произведения. Обычно в качестве характеристики употребительности используется частота встречаемости слова в тексте определенного объема.

По мнению данного исследователя, сейчас остается открытой одна из чрезвычайно важных задач лексикологии — выяснение границ живой лексической системы современного русского языка. Мы не имеем отчетливых представлений об общей системе лексического состава языка, хотя предположение о наличии в ней общеупотребительного и периферического слоя само по себе кажется очевидным.

«Частотный словарь русского языка» составлялся, в первую очередь, для определения границ активного словарного состава. Одной из важных целей словаря являлось представление живого словоупотребления образованного человека наших дней. Одним из самых существенных недостатков словаря является выбранный материал с установленными хронологическими рамками, которые охватывают лишь эпоху от произведений Ленина и Горького до 60-х годов 20го века, соответственно, некоторые слова (например, «товарищ» или «советский») утратили свою частотность употребления. Погрешностью можно считать отсутствие правил анализа таких служебных слов, как модальные, что в рамках данного исследования является наиболее важным и актуальным. Работа над частотным словарем выдвигает особые требования к отбору источников. Объем выборки, как бы он ни был велик, оказывается ограниченным. В связи с этим должны решаться вопросы о жанровых, хронологических и авторских границах текстов-источников. Составители опубликованных частотных словарей руководствовались различными системами жанров. Частотные словари русского языка созданы преимущественно по текстам художественной литературы. Как утверждает Л.Н. Засорина, «решение вопроса об источниках словаря опиралось преимущественно не на статистические критерии». В числе главных таких критериев были приняты функционально-речевые признаки, авторское мастерство, значимость произведения для развития литературной нормы. В связи с этим поставлена задача выявить частотную характеристику вводно-модальных единиц в текстах романов Дж. Оруэлла и представить ее в виде словаря. В рамках изучаемой проблемы важно рассмотреть самый ранний («Фунты лиха в Париже и Лондоне», 1933) и самый поздний роман («1984», 1949) для анализа динамики развития образа автора и лирического героя.

Если говорить об общем количестве вводно-модальных единиц, встречающихся в каждом романе, то в первом романе Дж. Оруэлла анализируемых единиц насчитывается 267, а в последнем – 330. Нужно отметить, что различается употребление вводно-модальных единиц. Если в «Фунты лиха в Париже и Лондоне» преобладают единицы, выражающие уверенность говорящего, то в «1984» использование единиц, выражающих неуверенность говорящего, превалирует. Это, безусловно, связано с содержаниями самих романов. Если в первом произведение лирический герой чувствует себя уверенно, никогда не отчаивается по жизни, зная, что всегда устроится, найдет свое место, то в «1984» герой абсолютно неуверенный в происходящем вокруг него человек. Перспективой исследования является составление статистических подсчетов, процентного соотношения вводно-модальных единиц, а также подробный анализ оригиналов произведения и создание аналогичного словаря единиц английского языка.

Источник:  журнал «Актуальные проблемы гуманитарных и естественных наук»

Ссылка на основную публикацию
Adblock detector