Лаборатория основана профессором Московского университета Поликарповым Анатолием Анатольевичем в 1992 году.

Краткая предыстория лаборатории

В 1981 г. в лаборатории прикладной лингвистики филологического факультета МГУ под руководством А.А.Поликарпова создается группа общей и прикладной лексикологии. Ее достижения за период с 1981 по 1992 гг. :


— разработка теоретических оснований системного (в т.ч. системно-квантитативного) анализа языка [Поликарпов, 1981; 1981а; 1984; 1986a; 1986b; 1987; 1988; 1989; 1990; 1991; Борода, Поликарпов, 1984; 1987; 1988; Boroda, Polikarpov, 1988; Каримова, 1989; 1990; Каримова, Поликарпов, 1988; 1989; Крылов, Поликарпов, 1990; Поликарпов, Тулдава, 1989; Савчук, 1990; 1992];

— проведение серии исследований по системной организации лексики, в т.ч. в форме создания и анализа корпусов текстов и словарных БД [Поликарпов, 1981; 1987; 1988; 1989; 1990; 1991; 1992; Поликарпова, Поликарпов, 1986; Поликарпов, Бушуева, 1985; 1988; 1988a; Сафронова, 1986; Обухова, 1986; Поликарпов, Крюкова, 1988; Борода, Поликарпов, 1984; 1988b; Boroda, Polikarpov, 1988; Колодяжная, Поликарпов, Хотько,1986; Колодяжная, Поликарпов, 1992; Малов, 1988; Каримова, 1989; 1990; Карапетянц, Обухова, Поликарпов, 1988; Долинский, 1988; 1990; Ахмеджанов и др., 1989; Каримова, Поликарпов, 1989; 1990; Савчук, 1990; Курлов, Поликарпов, 1991; Кустова, Поликарпов, 1991];

— анализ принципов и оснований прикладной лингвистики [Златоустова и др., 1989; Поликарпов, 1989; 1990; Поликарпов, Тулдава, 1990a];

— разработка и реализация начального варианта автоматизированной лексикографической системы [Поликарпов, Федотов, 1986];

— разработка методик сбора и анализа ошибок иностранцев в русской речи (серия работ 1985-1991 гг. по государственному заказу — руководитель А.А.Поликарпов, отв. исполнитель О.В.Кукушкина);

— активное участие лаборатории в создании и организации работы общесоюзной межвузовской проблемной группы «Текст как объект междисциплинарных исследований» (совместно с Тартуским университетом и Тбилиской консерваторией; в т.ч., проведение общесоюзных конференций и семинаров [KASOT-1986; PLAAT, 1988; APKL, 1990; EVKMIY, 1991; Борода, Долинский, 1986; Борода, Поликарпов, 1988b; Поликарпов, Тулдава, 1990b]).

В 1992 г. на базе группы общей и прикладной лексикологии на филологическом факультете была создана лаборатория общей и компьютерной лексикологии и лексикографии.

Основные направления работы лаборатории с 1992 г. по настоящее время

Теоретические разработки и исследования естественного языка:

1) Модель эволюции лексической системы языка и её экспериментальная проверка [Поликарпов, 1988; 1990; 1991; 1991a;1993; 1994; 1994a; 1995; 1995a; 1996; 1997; 1998; 2000; 2000а; 2001];
2) Анализ проблем глоттохронологии [Капитан, 1995; Капитан, Поликарпов — в печати];
3) Типология единиц лексической системы (Поликарпов, 1988; 1989);
4) Анализ лингвотипологических особенностей лексики китайского языка[Обухова, 1986; Карапетянц, Обухова, Поликарпов, 1987];
5) Анализ жанрово-стилистических характеристик лексики и морфемики русского языка [Савчук, 1994; Виноградова и др., 2001; Поликарпов и др., 2001 — в печати];
6) Анализ системной организации толкового словаря [Поликарпов, Курлов, 1994; Колодяжная, Поликарпов, 1994];
7) Анализ системных характеристик лексической синонимии русского языка [Покровская, 1997];
8) Анализ характеристик знания лексики русского языка его носителями [Савчук, 1997];
9) Анализ морфемно-словообразовательной подсистемы языка [Богданов, Крюкова, Поликарпов, 1998; Поликарпов, 2000; Богданов, 2001];
10) Разработка и реализация модели автоматического анализа русской морфологии [О.В.Кукушкина];
11) Разработка и проверка модели порождения ошибок в русских текстах [Кукушкина, 1998];
12) Анализ константных и личностных характеристик текста [Хмелёв, 2000; Кукушкина, Поликарпов, Хмелёв, 2001; Kukushkina, Polikarpov, Khmelev, 2001];
13) Анализ данных ассоциативных экспериментов с лексикой русского языка [Долинский, 1993].

Создание и исследование текстовых корпусов русского языка. Создание и исследование текстовых корпусов текстов является одним из основных направлений деятельности лаборатории.

— Компьютерный корпус русских газет конца ХХ-ого века [Виноградова, Кукушкина, Поликарпов, Савчук, 2001]. Этот корпус был создан в 1999 году и развивается и исследуется в настоящее время по грантам РФФИ. Корпус предназначен для анализа лингвистических особенностей (лексика, морфемика, морфология, словообразование, синтаксис, фразеология, стилистика) современного газетного языка

— Корпус русских литературно-художественных текстов XIX-ого-XX-ого вв. Этот корпус является результатом длительной работы по сбору литературно-художественных текстов. Его объем — около 150-ти Мб, число авторов — более 100, число текстов — более 300. Основой его был корпус Д.В. Хмелева [Хмелев, 2000]. В пополнении корпуса принял участие А.А. Смирнов. Корпус используется для многоаспектных текстологических исследований, в первую очередь, для исследования лингвистических проблем спорного авторства [Хмелев, 2000; Кукушкина, Поликарпов, Хмелев, 2001; Kukushkina, Polikarpov, Khmelev, 2001].

— Другие корпуса. Кроме корпуса газетных текстов и корпуса русских литературно-художественных текстов в разное время нами создавались и исследовались корпуса русских рассказов, психологических самоописаний, сочинений иностранцев на русском языке, параллельных текстов на русском и английском языках.

Создание и исследование словарных баз данных. Это направление тоже относится к числу основных в деятельности лаборатории. В разное время были созданы базы данных по ряду существующих словарей, а также были созданы оригинальные словари. Ниже приводится список этих баз данных с комментариями об оригинальности словаря и руководителе разработки.

— Грамматический словарь русского языка (на основе словаря А.А. Зализняка, 1977) (рук.- О.В. Кукушкина) [Кукушкина, 1997]
— Словарь синонимов русского языка (на основе словаря А.П. Евгеньевой, 1975) (рук.- А.А. Поликарпов) — Большой словарь лексических и корневых омонимов русского языка (оригинальный словарь О.С. Ахмановой и Н.П. Колесникова) (рук.- А.А. Поликарпов)
— Словарь русских идиоматических фразеологизмов (Random House, 1995) (рук.- О.В. Кукушкина)
— Словарь грамматических фразеологизмов (на основе словаря Р.П. Рогожниковой) (рук.- О.В. Кукушкина)
— Словарь антонимов русского языка (на основе словаря Р.М. Львова) (рук.- А.А. Поликарпов)
— Сводный словник русских словарей и энциклопедий (на основе словаря Р.П. Рогожниковой и др. словарей) (рук.- А.А. Поликарпов)
Словарь новых слов и значений русского языка (на основе словаря Н.З. Котеловой, 1984) (рук.- А.А. Поликарпов) [Поликарпов 2000]
— Словарь новых слов и значений английского языка (на основе словаря компании Лонгман, 1990) (рук.- А.А. Поликарпов)
— Словарь-тезаурус 10 тыс. более употребительных слов русского языка (оригинальный, автор — О.В. Кукушкина)
— Комплексный частотный словарь лексики современой русской прозы (оригинальный, автор — Ю.К. Крылов)
— Семантический частотный словарь пушкинской лексики (на основе «Словаря языка А.С. Пушкина») (рук.- А.А. Поликарпов)
— Словарь синонимов, антонимов и семантически соотнесенных слов английского языка (на основе Webster’s New Dictionary of Synonyms, 1973) (рук.- А.А. Поликарпов)
— Хронологический морфемно-словообразовательный словарь русского языка (рук.- А.А. Поликарпов);
— Частотный словарь газетной лексики и фразеологии современного русского языка (рук.- А.А. Поликарпов, О.В. Кукушкина);
— Параметрический словарь древнерусского языка (рук.- А.А.Поликарпов);
— Параметрический словарь лексики славянских языков на основе «Этимологического словаря славянских языков» О.Н.Трубачёва (рук.- А.А.Поликарпов).

Создание программных комплексов. В течение ряда лет в лаборатории ведется работа по созданию инструментов автоматического и автоматизированного анализа текстов и словарей русского, английского и других языков. Среди них выделяется Система ДикТУМ-1 как наиболее комплексный инструмент лингвистического анализа.

1. Система ДикТУМ-1 — универсальная система для манипулирования текстовыми и словарными данными, их анализа, ведения лексикографических работ (руководитель разработки — А.А.Поликарпов) [Kukushkina, Polikarpov, 1996] более полная информация >>

2. Морфо-Анализатор — подсистема автоматического морфологического анализа лексики русского языка в текстах (автор — О.В. Кукушкина);

3. СегмМорф — подсистема автоматического морфемного анализа русских словоформ (авторы — О.В. Кукушкина, А.А. Поликарпов)

4. Линтез — подсистема семантической маркировки единиц русского текста и его смыслового анализа (авторы — О.В. Кукушкина, А.А. Поликарпов);

5. ПсиАн — подсистема семантико-психологического анализа текста (автор О.В.Кукушкина)

  1. Линтез — подсисистема отбора ключевой лексики и словосочетаний из русских текстов и автоматического построения тезауруса текста (автор — О.В. Кукушкина);

7. Жанр — подсистема комплексного автоматического квантитативно-стилистического анализа текста (авторы — О.В. Кукушкина, А.А. Поликарпов).