Словари не успевают за пользователями Фейсбука

Материал из Викиновостей, свободного источника новостей

13 августа 2014 года

Символ одобрения в социальной сети, связанный с неологизмами «лайкать» и «лайкнуть».
В этой статье упоминается Фонд Викимедиа, какой-либо из его проектов или люди, имеющие к ним отношение. Викиновости — один из проектов Фонда Викимедиа.

На летней конференции Диалог’2014 учёные сообщили о том, что обнаружили в постах пользователей Фейсбука 168 новых слов, не зафиксированных ещё традиционными словарями, а также поделились своими наблюдениями и гипотезами о современном словообразовании в этой социальной сети.

Российские лингвисты Муравьёв Н. А., Панченко А. И. и Объедков С. А. изучили огромный объём текстов на русском языке, генерируемых пользователями Фейсбука. Было проанализировано более 573 миллионов сообщений почти 3,2 млн пользователей за 20062013 годы.

Общая статистика исследованного корпуса выглядит следующим образом:

Параметры Значение
Количество анонимизированных пользователей 3 190 813
Язык Русский
Количество постов 426 089 762
Количество комментариев 147 140 265
Количество текстов (посты и комментарии) 573 230 027
Количество словоформ в постах 20 775 837 467
Количество словоформ в комментариях 2 759 777 659
Количество словоформ (посты и комментарии) 23 535 615 126
Средняя длина поста, словоформ 49
Средняя длина комментария, словоформ 19

Чтобы устранить связанное с машинной обработкой «зашумление», учёные вручную отфильтровали 10 тысяч наиболее частотных слов, в результате чего к рассмотрению не были приняты нерусские и неверно лемматизированные слова, слова с ошибками, имена собственные (географические названия, имена, фамилии, названия организаций), сниженная лексика.

Учёные приводят список «несловарных» слов, оказавшихся среди наиболее частотных в полученном после автоматической обработки словаре и отсеянных на этапе ручной фильтрации: ть, нибыть, гый, санкт, що, ул, пр, нью, грн, ца, рожение, т.д, від, україни, вебинара, дтпа, кя, свый, плэйкастый, сегода, др, бй, квна, т.е, кг, млма, гр, бо, який, ра, ка, т.к, бть, чи, ск, холти.

Таким образом были выявлены и сведены в таблицу 168 популярных неологизмов, которых нет ещё в словарях, однако они уже вовсю употребляются пользователями сети (гиперссылки ведут на статьи в Русском Викисловаре):

Неологизм Тип заимствования Тип словообразования Модель словообразования
сексодром Англицизм
айпад, айфон, алерт, байк, бейдж, билдер, блоггинг, брейн, брендинг, вау, виджет, девелопер, демотиватор, дресс, инфо, кавер, караванер, клаб, корпоратив, комент, коммент, коучинг, лайт, лайф, мем, ноут, паблик, перфоманс, плиз, праймериз, принт, продакшн, промо, райдер, ребрендинг, рекрутинг, репост, ретвит, реферал, ритейл, ритейлер, роутер, сиквел, скайп, скрин, сорри, стайл, стор, твитер, твиттер, тизер, трекер, треш, трэш, фейк, форсайт, фреш, фэшн, хайп, холдем, чарт, шутер Англицизм Исх 1 корень
битрейт, бумбокс, геймплей, дабстеп, дедлайн, инфомаркетинг, клипарт, копирайтинг, никнейм, оффлайн, плагин, плейлист, плэйкаст, подкаст, рингтон, стартапер, топфейс, фейсбук, флешмоб, флэшмоб, фолловер, форекс, фрилансер, фэйсбук, хардкор, ютуб, ютюб Англицизм Исх 2 корня
декупаж Галлицизм
жжот, капец, мульт, мда, медвед, пипец, ппц, секстиль Исконное
госуслуга Исконное Композит ST-ST[1]
единорос Исконное Композит ST-о-ST
всечь Исконное Префикс в-ST
нафиг, нахер, нахрен Исконное Префикс на-ST
предзаказ Исконное Префикс пред-ST
заценить Исконное Префикс+суффикс за-ST-и
офигевать Исконное Префикс+суффикс о-ST-ева
прокремлёвский Исконное Префикс+суффикс про-ST-ск
бухарь Исконное Суффикс ST-арь
улыбизм Исконное Суффикс ST-изм
приколист Исконное Суффикс ST-ист
личка, печенька, ржака Исконное Суффикс ST-к
ржачный, улётный Исконное Суффикс ST-н
херня Исконное Суффикс ST-нь
пристройство Исконное Суффикс ST-ств
ржач Исконное Суффикс ST-ч
адчайший Исконное Суффикс ST-ч-айш
днюха Исконное Суффикс ST-юх
вкусняшка Исконное Суффикс ST-яшк
евроинтеграция, инфографика, инфопродукт, телепроект, фотопроект, фотостудия, видеорепортаж Из заимств. корней Композит ST-ST
аудиокнига, вконтакт, мультиварка, нардеп, фотолента, фотоотчёт, фотопамять, фотоподборка, фотоприкол, фотошкола Смешанное Композит ST-ST
лохотрон, файлообменник Смешанное Композит ST-о-ST
перепост Смешанное Префикс пере-ST
предстарт Смешанное Префикс пред-ST
забанить, запостить Смешанное Префикс+суффикс за-ST-и
зацикливаться Смешанное Префикс+суффикс за-ST-ива
перепостить Смешанное Префикс+суффикс пере-ST-и
лайкать Смешанное Суффикс ST-а
культурить, постить, твитить Смешанное Суффикс ST-и
анимировать Смешанное Суффикс ST-ирова
аватарка, гифка, флешка Смешанное Суффикс ST-к
реферальный Смешанное Суффикс ST-н
планшетник, цитатник Смешанное Суффикс ST-ник
имхонуть, лайкнуть Смешанное Суффикс ST-ну
брендовый, драйвовый Смешанное Суффикс ST-ов
форумок Смешанное Суффикс ST-ок
суперский Смешанное Суффикс ST-ск
позитивчик Смешанное Суффикс ST-чик
креативщик Смешанное Суффикс ST-щик

Исследователи обнаружили, что основной активный поток заимствований идёт из английского языка (англицизмов больше всего). Заимствованные неологизмы по большей части являются существительными. Наиболее энергичное словообразование происходит в таких областях, как торговля и «мультимедиа- и интернет-технологии» (что такое «мультимедиа-технологии» авторы публикации не разъясняют).

Изучение неологизмов и заимствованных слов позволяет понять, каким образом языки воздействуют друг на друга и как происходит проникновение слов одного языка в другой.


Примечания[править]

Источники[править]

Комментарии[править]

Викиновости и Wikimedia Foundation не несут ответственности за любые материалы и точки зрения, находящиеся на странице и в разделе комментариев.