Главная Редколлегия Публикации Библиотека Библиография Персоналии Бизнес Проекты Ссылки

В рамках проекта Хранитель слов мы
открываем рубрику - Из жизни слов

[ХРАНИТЕЛЬ СЛОВ>>]

Анонс

Слово - основная единица текста. Слово возникает в тексте, развивается в нем, исчезает из него, мигрирут внутри пространства текстов. Тексты датируются и локализуются по словам, для которых, как нам кажется, мы установили место и время появления.

Первое появление слова, развитие у него нового значения, изменение написания слова - все это важнейшая текстологическая информация, которой мы, увы, обладаем в очень незначительной степени. Даже сейчас, когда мы имеем в своем распоряжении большие корпуса текстов в электронном виде, а в Интернете мимо нас ползут "Новостные Ленты" любой тематики и жанра, мы практически не используем эту почти готовую информацию для анализа жизни слов, пополнения и уточнения словарей. Причина не только в трудоемкости такого рода исследований и очевидных недостатках автоматических средств анализа текстов, но и в неумении применять адекватные методы сбора и оценки именно такой информации, отсутствии привычки к анализу и мониторингу лексических потоков (междисциплинарная проблема).

Так или иначе, раз теперь имеется такая возможность, пора начинать регулярно отслеживать и фиксировать жизнь слов, в интересах не только текстологов, но и лингвистов, информационщиков, всех, ищущих в Интернете. Полезно делиться этой информацией, организовав что-то вроде регулярной (сначала раз в месяц) "ЛЕНТЫ НОВОСТЕЙ" из жизни слов.

Такая лента могла бы иметь, например, следующие основные разделы:

  • "самые частые слова месяца" (о ком чаще всего, о чем чаще всего, как чаще всего, где чаще всего);
  • "знакомьтесь - новое слово , берегитесь - новое значение";
  • "это Наши трудности" (ошибки, варианты);
  • "самый употребительный синоним";
  • "Кто же автор СЛОВА?" (сеанс c разоблачениями и выдачей патентов);
  • "Ваша частичка Англии вредная для вашего здоровья" (загадки для тех кто не ездит в МЕТРО)
  • и т.п.

С помощью системы автоматического анализа текстов, разработанной и используемой нами, можно решать не только эти задачи, но и, например, задачи контентанализа. Можно отслеживать активизацию целых семантических групп лексики и получать на этой основе, например, динамику степени тревожности, некий "социальный барометр" по газетным текстам, или субъективную оценку "инвестиционного климата" по публичным высказываниям отобранной группы ораторов, или…

Надеемся, что в результате всей этой работы сможет возникнуть электронная лексикологическая служба, регулярно обрабатывающая потоки текстов, фиксирующая и анализирующая на этой основе новые слова и значения, отслеживающая динамические характеристики отдельных слов и групп слов, вариантов написания и т.д. Такая служба много кому нужна практически, но и кроме "низких" резонов, она поможет всем нам узнать что-то новое о реальной жизни слов, которая сейчас проходит перед нами, а может быть и об этой жизни вообще.

 

Все права защищены согласно российскому и международному законодательству. Copyright © 1999 - 2007 ООО "Лингвистические компьютерные системы ЛКС". Авторские права на публикации принадлежат авторам статей. Ни один фрагмент сайта не может быть использован без предварительного разрешения правообладателя. Ссылка на сайт обязательна.
Сайт создан и поддерживается