Способы раскрытия темы. Публичные выступления. Тема "о чём это произведение?" это «круг проблем»

Способы раскрытия темы. Публичные выступления. Тема

Г.Ю. Гришечкина

СПОСОБЫ РАСКРЫТИЯ ТЕРМИНА В НАУЧНО-ПОПУЛЯРНОМ ТЕКСТЕ

В статье рассматриваются различные определения дефиниций терминов, различные виды дефиниций и варианты ввода в текст терминов в научно-популярном лингвистическом тексте.

Ключевые слова: дефиниции, термин, терминоведение, лексика, стиль, контекст, реципиент, речекоммуникативный акт, научно-популярный текст.

Дефиниция и близкие понятия.

Научно-популярный стиль (как подстиль научного стиля) занимает определенное место в системе функциональных стилей литературного языка. Отличительной его особенностью является определенный способ описания научного материала, а именно, способ и стиль подачи терминов, способы его раскрытия.

Термин - это слово или словосочетание, которое обозначает специальный предмет или научное понятие, отражая сконцентрированную информацию об основных его свойствах и месте в определенной терминосистеме через дефиницию.

Разговор о дефиниции следует начать с разграничения близких понятий: дефиниция, определение, описание, семантизация.

Начнем с наиболее общего термина - се-мантизация. В самом широком смысле семанти-зация - это раскрытие и описание значения. Се-мантизация слова - это представление семантической структуры слова, его значения. Семантиза-ция дает ту необходимую информацию о слове, которая позволяет правильно его употреблять. Исходя из разного объема понятия в конкретных случаях, семантизация понимается либо широко, как осмысление, обнаружение смысла, либо более узко, как совокупность способов раскрытия значения. В зависимости от способа семантизации различают основную и дополнительную семанти-зацию. К основной семантизации мы относим дефиницию или определение, дополнительная се-мантизация включает те дополнительные средства, которые часто сопровождают дефиницию.

Определение понятия в самом широком смысле есть логическая операция, в процессе которой раскрывается содержание понятия. Содержание понятия - это совокупность отличительных признаков понятия, ядром которого являются существенные признаки. В процессе логической операции определения объем понятия раскрывается с помощью его деления на видовые понятия

при построении классификационных схем понятий. Результатом данной логической операции является дефиниция. В узком смысле определение есть результат мыслительной и языковой деятельности, по форме - двучленная языковая структура, состоящая из левой (определяемой) и правой (определяющей) частей, соединенных связующими элементами, указывающими на эквивалентность этих частей в акте коммуникации, структура которого возникает как результат неодинаковой компетенции адресанта и адресата по отношению к определяемому и нацелена на адекватное понимание сообщения.

Очевидно, что в узком смысле слово «определение» является синонимом слова «дефиниция», которая по форме также является фразой, структура и способ построения которой заданы, исходя из требований логики. Вслед за В.Д. Таба-наковой, мы будем употреблять слово «определение» как однозначный логический термин в качестве синонима слова «дефиниция» [Табанакова 1999]. Поддерживая точку зрения В.Д. Табанако-вой, считаем целесообразным использовать термин «описание» в прямом смысле, когда вслед за определением более подробно описываются существенные и дополнительные признаки понятия. Другими словами, описание дополняет определение, являясь одним из приемов выражения информации о термине, наряду с определением. Таким образом, описание можно считать средством дополнительной семантизации. Говоря о дополнительной семантизации, к ее средствам, кроме описания, можно отнести экземплификацию, иллюстрацию, схему, формулу, сведения о возникновении или применении термина и другие приемы.

Дефиниция - это уникальное логическое и языковое явление, в котором язык и мышление взаимодействуют, совершенствуя друг друга. Дефиницию можно назвать своеобразным «мостом взаимопонимания», поскольку она связывает старое знание с новым, участвует в передаче опыта

от поколения к поколению, помогает общению специалистов всех областей знаний, способствует эффективности и успешности когнитивной деятельности человека.

Как любое языковое явление, дефиниция имеет определенную форму и содержание. Как форма, так и содержание дефиниции обусловлены закономерностями мышления и языка, на котором происходит мыслительный процесс.

Логический словарь-справочник Н.И. Кондакова дает следующую информацию о дефиниции: «Дефиниция - предложение, описывающее существенные и отличительные признаки предметов или раскрывающее значение соответствующего термина. Часто в дефиниции дается указание на ближайший род, в который входит данный предмет, и на видовое отличие этого предмета от всех остальных видов, составляющих род. Дефиниция не охватывает предмета всесторонне и с исчерпывающей полнотой, не раскрывает все богатство содержания понятия. Но во всех случаях, когда надо кратко, сжато охарактеризовать сущность того или иного предмета, установить его четкую границу, неизбежно прибегают к дефиниции. Первое требование, предъявляемое к любой дефиниции, заключается в том, чтобы она была объективной, то есть отображающей природу самого предмета, вытекающей из развития самого определяемого предмета. Подлинная дефиниция должна отображать объективную реальность» [Кондаков 1971: 141].

Как показывает определение, данное в Лингвистической энциклопедии , дефиниция всегда связана с конкретным термином и раскрывает значение понятия, обозначенного этим термином, через описание отличительных признаков этого понятия. От такой краткой характеристики дефиниции перейдем к более детализированной. По форме дефиниция может быть одной коммуникативной репликой, представленной последовательностью знаковых единиц, объединенных смысловой связью и представляющих единое целое. Поддерживая точку зрения З.И. Комаровой, признаем одну коммуникативную реплику минимально протяженным текстом [Комарова 1997: 54] и, разделяя мнение Э.М. Медниковой, признаем дефиницию кратким по протяженности конвенционально эллиптированным текстом [Медникова 1988: 3]. Терминологическая дефиниция представляет собой семанти-зацию термина через минимальный текст, в котором объект познания (термин) и взаимоотношения коммуникантов объективируются в вербаль-

ной форме. Кроме того, не менее важно то, что в дефиниции отражается процесс речемыслитель-ный, содержащий в себе два таких основных компонента как человеческая рефлексия (имманентное свойство «отображения» действительности, сознательное отслеживание и анализ собственной мысли) и создание сообщения с определенной коммуникативной нагрузкой и функцией.

Поскольку текст дефиниции представляет собой прагматический речекоммуникативный акт, степень информативности такого текста должна быть очень высокой, а синтаксическая структура -жестко логичной, так как в тексте дефиниции происходит фиксирование термина. Таким образом, дефиниция - это краткий терминофикси-рующий текст (термин В.М. Лейчика). С логической точки зрения дефиниция двучастна - она состоит из определяемого понятия (дефиниендум), представленного термином, и определяющего понятия (дефиниенс). Это горизонтальная структура текста дефиниции, его линейное развертывание. В семантическом плане, по содержанию, дефиниция не является равной научному понятию, которое она дефинирует, а лишь приближается к нему. Семантическая структура дефиниции строится из классификационных семантических признаков, универсальных для терминов разных предметных областей и детерминированных большей частью видом понятийной категории, поэтому данной структуре присущи такие характеристики, как большая унифицированность и стандартизиро-ванность. Метаязык дефиниции характеризуется большей или меньшей терминированностью в зависимости от вида и категории понятия, причем в его грамматическом составе прослеживается использование всех основных знаменательных и служебных частей речи [Лейчик 2007: 63-67].

Следует отметить, что в логике и термино-ведении существует ряд требований к дефиниции. Логика требует соблюдения следующих правил:

1. Дефиниция должна быть точной, не содержащей двусмысленностей и четко отграничивающей определяемое понятие от однотипных и сходных понятий. Для соответствия этому требованию необходимо, чтобы дефиниция одержала только существенные признаки понятия. С этой целью понятие определяется через ближайший род и видовое отличие. Видовым отличием должен быть признак или группа признаков, свойственных только данному понятию и отсутствующих в других понятиях, относящихся к тому же роду.

2. Дефиниция должна быть соразмерной понятию, то есть не слишком широкой и не слиш-

ком узкой. В данном случае объемы определяемого слова и понятия, посредством которого определяется искомое понятие, должны совпадать, быть одинаковы, соответственны.

3. Дефиниция не должна содержать логического круга, то есть понятие не должно определяться посредством такого понятия, которое само становится ясным только посредством определяемого понятия.

4. Дефиниция не должна быть логически противоречивой, когда перечисленные в дефиниции признаки исключают друг друга. Такое определение ничего не определяет, логическое противоречие разрушает мысль.

5. Дефиниция не должна быть отрицательной, то есть она не должна состоять из перечня признаков, отсутствующих у понятия, так как такой перечень не раскрывает содержание понятия. Данное правило вытекает из основной задачи определения. Цель определения заключается в том, чтобы ответить на вопрос, чем же является данный предмет, отображаемый в понятии, а для этого необходимо в утвердительной форме перечислить его существенные признаки. Отрицательные определения не указывают существенных признаков предмета. Они лишь выражают такие признаки, которые не принадлежат данному предмету, и ничего не говорят о том, какие признаки присущи ему. Однако когда не представляется возможным найти существенные признаки или когда именно отрицания четко отграничивают данное понятие от других, то отрицательные определения могут использоваться в качестве вспомогательных [Кондаков 1971: 467-468].

Терминоведение добавляет ряд требований к правилам создания дефиниций, принятым в логике. Суть их сводится к следующему:

Когда определение дается соподчиненным (выделенным по одному основанию деления) понятиям, в качестве видового признака в дефинициях требуется указывать один и тот же признак (признаки);

Типы и инструментарий дефиниции.

Дефиниции (определения) различаются по содержанию, используют разные способы интерпретации значений терминов, разные методы формулирования, поэтому существуют разные типы дефиниций. В логике проводится различие между номинальными и реальными дефинициями. В частности, Д.П. Горский пишет, что деление определений на номинальные и реальные связано, прежде всего, с ответом на вопрос о том, что определяется: значение ли, смысл термина, или

сам предмет [Горский 1974]. Таким образом, номинальные определения понимаются как отнесение имен к вещам, как формулирование значения термина; реальные определения рассматриваются как определения, посредством которых решается вопрос о спецификации, об однозначном отличии интересующего нас объекта среди объектов соответствующей предметной области. Если мы обратимся к англоязычной литературе, то найдем там подобное разграничение номинальных и реальных определений .

Описанное выше противопоставление можно наблюдать и в лингвистике, которая проводит антитезу энциклопедическое - филологическое. В основе данной антитезы лежит различие объектов описания: энциклопедическое определение описывает научное понятие, филологическое -языковое значение. Первое из названных определений дает обстоятельную характеристику самого явления действительности, отображая его существенные признаки. Второе, то есть филологическое определение, объясняет значение слова, имени или термина.

Номинальные дефиниции можно рассматривать в связи со словами как элементами языка, тогда как реальные дефиниции связаны со свойствами предметов действительности - однотипным понятиям следует давать однотипные дефиниции (с однотипной синтаксической структурой и лексическим наполнением), чтобы не вызвать представления о неоднородности этих понятий;

Следует учитывать, что один объект действительности может рассматриваться в рамках разных областей знания и, следовательно, принадлежать к разным системам понятий, что приводит к необходимости различных дефиниций;

Развитие науки влечет за собой изменение понятий, что, в свою очередь, требует соответствия дефиниции современному уровню знания;

Чтобы дефиниция была понятной и четкой, в ней рекомендуется использовать только хорошо известные и однозначно понимаемые термины и термины, определенные в данной системе дефиниций;

Дефиниция должна быть краткой, состоять из одного логически законченного предложения и не содержать избыточной информации;

Дефиниция не должна быть тавтологичной; если в термине содержатся все необходимые и достаточные признаки понятия, можно обойтись без дефиниции.

терминов варьируется от дефиниции к дефиниции. Данный факт объясняет существование различных типов дефиниций, богатство инструментария которых заслуживает отдельного рассмотрения.

Терминологическая лексика дает возможность точно, четко и экономно излагать содержание данного предмета и обеспечивает правильное понимание существа трактуемого вопроса.

В специальной литературе термины несут основную семантическую нагрузку, занимая главное место среди прочих общелитературных и служебных слов.

В структурном отношении все термины можно классифицировать следующим образом: простые термины типа: лексема, аналогия. Словосочетания, компоненты которых находятся в атрибутивной связи, т.е. один из компонентов определяет другой: страдательный залог. Нередко атрибутивный элемент сам выражен словосочетанием, представляющим собой семантическое единство. Это единство орфографически часто выражается написанием через дефис: тема-рематическое членение.

Аббревиатура, т.е. полные или частичные буквенные сокращения словосочетаний: ССЦ -сложное синтаксическое целое.

Поскольку характерной чертой термина является четкость семантических границ, он обладает значительно большей самостоятельностью по отношению к контексту, чем обычные слова.

Зависимость значения термина от контекста возникает лишь при наличии в нем полисемии, т.е. если в данной области знания за термином закреплено более одного значения.

Если в научной литературе широко используется узкоспециальная терминология, то в научно-популярной литературе преимущество отдается общеупотребительной научной лексике. Это способствует тому, чтобы широкий круг читателей, даже не специалистов, смог без особых затруднений воспринять представленную в книге информацию. Если же автор научно-популярного произведения вводит в изложение специальный термин из той или иной области науки, он обязательно сопровождает его определениями, объяснениями, а иногда историческими справками и историческими предпосылками возникновения того или иного термина. В научной литературе такая практика не является распространенной, так как она предназначена для определенного круга читателей - специалистов в данной области, которые не нуждаются в объяснении того или иного термина.

Описательные или дескриптивные определения содержат перечисление семантических признаков определяемого понятия. По способу описания различаются два типа этих определений - описательный классический и собственно описательный. В случае описательного классического типа термин определяется путем идентификации с использованием номинативных (назывных) слов и последующей конкретизации. Номинативное слово обычно имеет более широкую семантику, чем определяемое слово и отражает качественную определенность предмета. Существует модификация (разновидность) данного типа определений - генетические определения, в которых указывается на способ образования, возникновения денотата.

Что касается собственно описательного способа толкования, то он, по Д.И. Арбатскому, заключается в том, что вся необходимая информация выражается описательной частью, которая вводится в определение указательными словами то, что; тот, кто; тот, который; всякий, кто; такой, чтобы и т. д. или глаголами-связками быть, являться, становиться. Номинативное слово, указательное слово или глагол-связка выполняют функцию идентификатора, относя определяемое слово к лексико-семантическому множеству, тем самым, создавая смысловую опору для формирования понятия. Описательная часть состоит из конкретизаторов, которые позволяют раскрыть структуру лексического значения, глубже понять сущность определений. Количество конкретиза-торов (универсальных признаков) в основе лекси-ко-семантической системы языка, которые могут лечь в основу определений, ограничено. Исследователи выделяют от 20 до 25 признаков (Д.И. Арбатский [Арбатский 1977] и др.): назначение, структура, действие, место, функция, способ, объект, количество, цель, форма, состояние, время, семантический субъект, условие, результат, происхождение, следствие, интенсивность проявления признака, цвет, лицо, движение как перемещение в пространстве, причина, запах, вкус, указание на сферу употребления.

Релятивные определения (термин З.И. Комаровой [Комарова 1991]) не содержат прямого раскрытия содержания понятия, выраженного определяемым словом, не дают непосредственной характеристики значения денотата. Данные определения толкуют значения слов через отношения к другим словам.

Сюжет - последовательное изложение событий, ставших предметом внимания рассказчика (Наровчатов С. С.).

Фабула раскрывает эти события в частностях и в деталях и дает им мотивировку (Наровчатов С. С.).

Сюжет - это структурная сетка архитектоники, то фабула - пружина композиции (Наровчатов С. С.).

Язык - нечто вроде цветных очков: наденешь их, и все цвета меняются, красное кажется черным, синее - лиловым... Какие очки, таков и мир, который мы через них видим. (Стер-нин И. А.).

Как следует из названия, синонимические определения заключаются в указании синонима или синонимов определяемого термина.

Причастия спрягаемого глагола, иначе говоря, отглагольные прилагательные... (Успенский Л.В.).

Официально-деловой стиль - это язык официального и делового общения, язык, на котором пишут официальные и деловые документы... (Беднарская Л.Д.).

Антонимические определения схожи с перечислительными и синонимическими, поскольку также дают значение толкуемого слова не прямым раскрытием содержания этого значения, а через указание на объем антонима.

Фонема - это не любой звук а звук, различающий смысл слова (Беднарская Л.Д.).

Конечно, звуки речи - это не герань и не стул. Однако в природе они существуют, и не менее реально, чем такие явления, как гром, скрип, стук, грохот (Сахарный Л.В.).

Использование деривационных определений обусловлено наличием у многих специальных слов производящей и производной основ, между которыми существуют различные типы семантической зависимости.

Отсылочно-логические определения показывают логические отношения между определяемым словом и понятием, обозначаемым производящим словом. Они просты и кратки.

Так, фонетика изучает звуки речи и интонацию, лексикология - словарный состав

языка, его лексику, грамматика - устройство слова (морфологию) и предложения (синтаксис) (Стернин И. А.).

Комбинированные определения могут содержать два-три различных типа определений, например, описательное и синонимическое; описательное, отсылочное и синонимическое; родовидовую дефиницию и синонимическое определение и т.д. Очевидно, что используются они для более полного раскрытия значения терминов.

От первобытной живописи рисуночное письмо отличалось прежде всего своим информационным служебным характером. Отсюда схематизм изображений живых предметов, животных, людей в этом письме. Сейчас принято называть его пиктографическим, и мы в дальнейшем будем придерживаться этого термина (Наровчатов С.С.).

Выбор того или иного типа зависит как от определяемого понятия или знаний о нем, так и от цели использования конкретной дефиниции. Дефиниция имеет в своем распоряжении богатый инструментарий, которым она оперирует в словарях и текстах разных отраслей знания. Критерии выбора конкретной дефиниции в любой ситуации зависят от цели использования этой дефиниции.

В монографиях авторы гораздо чаще вводят в изложение «узкие», специальные термины, такие, как: синкретизм, парцеляция, инверсия, антитеза, омоформы, орфоэпия и т.д. При этом авторы дают ясное определение того, что эти термины обозначают, приводят примеры, которые служат дополнительным объяснением, а иногда дают исторические справки:

1) «Слитность звука с движением, так называемый синкретизм, является тоже признаком глубокой древности».

2) «К концу низшей ступени дикости появляется тот строй речи, который в науке называется первичным, аморфным (то есть первичным бесформенным) строем. Слово здесь не подвергается никаким изменениям, не имеет никаких приставок или окончаний, оно равно еще одному зву-кослогу - корню, выражающему цельное, нерас-члененное внутри себя понятие».

3) «...парцеляция (отрыв придаточного предложения от главного в составе сложноподчиненной конструкции и оформление его как отдельного предложения): «Пути намечены. Прежде всего это дальнейшие развитие экономической реформы, включение в орбиту ее действия работников аппарата главков и министерств»».

4) «В следующем столетии появляется переходная форма письма - бустрофедон. Название

это состоит из двух греческих слов, в переводе означающих бык и поворот. Как бык при вспашке поля идет сначала в одну сторону, а потом поворачивает обратно, так и в бустрофедоне первая строка начинается справа налево, следующая как бы поворачивается в обратную сторону, слева направо, третья снова справа налево и т.д.».

5) «В Нидерландах к концу второй мировой войны множество детей голодало. Пришлось им ехать в чужие страны, туда, где их могли бы прокормить. К счастью, во многих странах семьи готовы были дать беженцам и пищу и кров, однако не все семьи могли выразить, как горячо они сочувствуют маленьким нидерландцам и как хотят им помочь. Не все ведь умеют говорить по-нидерландски. Но были среди беженцев ребята, которых это не смущало. Кроме своего родного, они говорили на языке, который называется эсперанто, и они поехали в такие датские и швейцарские семьи, где тоже говорили на эсперанто. Эсперанто - это искусственно созданный язык. Он возник не сам по себе. Его изобрел человек, который решил, что всем людям в разных странах нужен простой, доступный способ говорить друг с другом».

Из примеров видно, что авторы, вводя в изложение термины, которые не известны широкому кругу читателей, всегда сопровождают их не только определениями, но и дополнительными описаниями явления, которое обозначается термином (пример 2), примерами (примеры 3, 4), историческими справками (пример 5). Таким образом, в научно-популярных текстах используются описательные определения (дефиниции) терминов.

В монографиях С.С. Наровчатого и И.А. Стер-нина авторы гораздо чаще вводят в изложение «узкие», специальные термины, такие, как:

Сопоставительное языкознание (изучение двух или нескольких языков в сравнении друг с другом) (Наровчатов С.С.).

Общее языкознание изучает природу, сущность, происхождение языка, проблемы выделения основных единиц языка и общих законов их развития (Стернин И. А.).

Прикладное языкознание (изучение языка с целью применения полученных результатов в различных сферах человеческой деятельности - технике, медицине, психологии и др.) (Наровчатов С.С.).

Фоносемантика изучает восприятие человеком тех или иных звуков речи и впечатления, производимые теми или иными звуками на человека, и т.д. (Наровчатов С.С.).

Существует лингвистика историческая, изучающая историческое развитие того

или иного языка, т.е. как изменялся язык в процессе развития, и лингвистика, изучающая языки в их современном состоянии или в какой-нибудь конкретный момент их развития (Наровчатов С.С.).

Архитектоника - это наука о приложении математики и механики к зодчеству (Наровчатов С.С.).

Частное языкознание всесторонне изучает какой-либо один конкретный язык - русский, немецкий, французский и другие: в его задачу входит описание звукового состава, лексики и грамматики этого языка, а также его истории (Стернин И.А.).

Завязке может предшествовать экспозиция, рассказ об обстановке, в которой предстоит действовать героям (Наровчатов С.С.).

Кульминация - высшая точка его напряжения, которое выражается в решающем столкновении противоположных сил повествования (Наровчатов С.С.).

За кульминацией следует развязка, в которой объясняется исход события, положенного в основу произведения (Наровчатов С.С.).

Эпилог сообщает о судьбе действующих лиц, получающей завершение иногда много спустя после окончания действия (Наровчатов С. С.).

Образ - это конкретная и в то же время обобщенная картина человеческой жизни, созданная при помощи вымысла и имеющая эстетическое значение (Наровчатов С.С.).

Психолингвистика изучает психическую сторону языкового общения; эта наука существует на стыке лингвистики и психологии (Наровчатов С.С.).

Любопытно возникновение эвфемизмов и табуизмов (от слова табу - запрет) - слов или выражений, заменяющих грубые, непристойные слова или такие, которые по каким-либо причинам произносить нельзя. У далеких наших предков такими словами были названия животных, с которыми, как считалось, они состояли в кровном родстве (Наровчатов С. С.).

Лингвистика - древняя наука, зародившаяся задолго до н. э. Предполагают, что наука о языке была еще у древних египтян и шумеров - жителей Месопотамии. У этих народов в III-II тысячелетиях до н. э. уже была развита письменность (Стернин И.А.).

Очевидно, что в отличие от научной литературы, в научно-популярных произведениях термины вводятся в изложение исключительно для популяризации научного знания. А виды дефиниций терминов в научно-популярной литературе, как видно из примеров, могут служить дополнительным источником интересной для читателя информации. Ясные и наглядные, благодаря примерам, описаниям и историческим справкам, дефиниции терминов позволяют читателю в доступной и увлекательной форме получать новые знания из какой либо области науки, в нашем случае из области языкознания.

Простота и ясность в научно-популярном издании тесным образом связана с использованием терминологии. В составе терминологической лексики можно выделить несколько «слоев», различающихся сферой употребления, содержанием понятия, особенностями обозначаемого объекта. Это деление отражается в разграничении общенаучных терминов, составляющих понятийный фонд науки в целом, и специальных, закрепленных за определенными областями знаний. Терминологическая лексика необычайно информативна, потому ее использование является необходимым условием лаконичности, точности изложения.

Требования, которые предъявляют к терминологии популярных произведений, зависят от образовательных и возрастных особенностей реципиентов, но в основном используется общеупотребительная, хорошо известная адресату терминология, которой автор может свободно оперировать как ме-таматериалом развернутого объяснения.

Не требуют специальных способов введения в НПЛТ (научно-популярном лингвистическом тексте) такие термины, которые как для подготовленного, так и для неподготовленного читателя семантически ясны в силу прозрачности их внутренней формы, в силу особенностей своей словообразовательной и сочетаемостной структуры: приставочный, суффиксальный, безаффикс-ный и т. д. способы образования слов; архаизмы, историзмы, неологизмы; продуктивные и непродуктивные суффиксы; вводные слова, инфинитивные предложения и т.д., хотя далеко не всеми авторами НПЛТ учитывается тот факт, что «понимание семантики термина по его внутренней форме удается не каждому, ибо нет людей с одинаковой лингвистической подготовленностью и лингвистической ассоциативностью, Не каждый склонен к осознанному (или неосознанному) этимологизированию слов» [Коготкова 1984: 73].

Тот факт, что научно-популярная литература знакомит с новыми достижениями науки, а

также расширяет и углубляет знания в очерченных ею областях, объясняет неизбежность использования авторами узкоспециальных терминов. «По отношению же к узкоспециальным выражениям, - предупреждает Э.А. Лазаревич, -нужна величайшая осторожность: термин сообщают, если он обозначает основное понятие, ... и заменяют синонимическими обозначениями из обиходного словаря во всех других случаях. При этом всегда учитывается образовательный уровень читателя» [Лазаревич 1984: 320].

Соотношение в НПЛТ терминологии, нейтральных, разговорно-обиходных слов и других слоев лексики позволяет говорить о совмещении в них таких противоположных стилевых черт, как объективность и субъективность, логичность и эмоциональность, однако их специфическими чертами остаются точность раскрытия научных понятий, конкретность, а также образность толкований и разъяснений терминов, что обнаруживает единство эмоционально-чувственного восприятия действительности и логического познания.

Практика популяризации науки накопила большой арсенал различных средств, приемов и способов раскрытия содержания непонятных и малопонятных слов, в том числе и терминов, и ученые-популяризаторы, пользуясь такого рода способами и приемами, проявляя мастерство, делают содержание научно-популярных произведений не только понятным, но и увлекательным.

Вопрос о способах введения терминов в научно-популярный текст и замещение его другими языковыми единицами особенно актуален для этого вида литературы и находится в прямой зависимости от читательского назначения изданий. Э.А. Лазаревич считает, что читателей научно-популярной литературы можно разделить на четыре группы в зависимости от общеобразовательного уровня (неподготовленные (1 и 2 группы) и подготовленные (3 и 4 группы). В научно-популярных текстах, адресованных неподготовленному читателю, содержание терминов чаще всего дается описательно и напряженность изложения (количество терминов в единице текста) обычно невысока (1 группа). Более подготовленный читатель (2 группа) способен адекватно воспринимать тексты с большим количеством специальных слов, где общенаучные термины уже не объясняются, но узкоспециальные термины, обозначающие основные понятия, комментируются, и их количество остается небольшим. Именно эти две группы читателей (школьники среднего и старшего возраста) составляют ведущую адресатную проекцию большинства НПЛТ.

Подготовленные читатели (3 и 4 группы) -это специалисты смежного или иного профиля, специально иногда изучающие научно-популярную литературу. В литературе такой адресации встречается большое количество узкоспециальных терминов, хотя объяснению подлежат только те из них, которые вводят новое понятие.

Во всех типах НПТ (научно-популярного текста), адресованных, однако, в большей степени неподготовленному читателю, важна последовательность ввода терминов, которая, строясь на системности терминологии, позволяет реципиенту получить не отрывочные научные сведения, а целостную картину излагаемой научной проблемы и разобраться во взаимосвязях между научными понятиями. В НПЛТ объем терминов, представленный в такой последовательности, обычно не превышает предела воспринимаемости адресатом научной информации, и реципиент имеет возможность осмыслить, усвоить, запомнить термины, чтобы в дальнейшем вместе с автором текста оперировать ими. Способствует этому как подробное разъяснение терминов, так и привлечение образных средств.

Введение термина в текст и его правильное объяснение является чрезвычайно важным для НПЛТ, в силу того, что здесь терминологическая проекция имеет подчеркнуто отвлеченный характер. Стоящие за термином понятия нельзя рассмотреть, услышать, увидеть, осязать, как многие, например, естественнонаучные. Правильно ввести лингвистический термин значит не только назвать его, ввести термин необходимо так, чтобы адресат правильно понимал его содержание. Правильно истолкованный и понятый термит облегчает усвоение текста и, следовательно, поддерживает интерес к научной проблематике. Важную роль в подаче термина играет та часть текста, которая непосредственно предшествует введению термина - так называемый контекст введения термина, подготавливающий адресата к восприятию и пониманию специального слова.

Запоминать бессмысленное нагромождение составных частей куда труднее, чем уложить в памяти какой-нибудь организованный ряд - вещей, понятий, слов. Неважно, по какому принципу организованы предметы. Нужно только, чтобы чувствовалась упорядоченность. На этом и построена мнемоника - искусство запоминать всевозможные совокупности (Успенский Л.В.).

Подводя читателей к термину «мнемоника», Л.В. Успенский показывает, почему упорядоченные совокупности запоминать легче, нежели бессмысленные нагромождения каких-либо состав-

ных частей, и предлагает приемы, облегчающие запоминание беспорядочных последовательностей. Обращает на себя внимание, что ввод термина в данном микротексте подытоживает, резюмирует изложение, выступая как завершающий аккорд, мнемонически более выигрышный, нежели стандартная ситуация, когда с термина начинается микротекст.

Для НПЛТ, как показал материал, не обязательно введение терминов с помощью строгих дефиниций. Кстати, для таких случаев в научной литературе существуют шесть логических правил ознакомления с понятиями: указание, объяснение, описание, характеристика, сравнение, различение [Кондаков 1971: 477], которые характерны для НПЛТ и которые можно объединить в одном универсальном понятии - объяснение.

Приемы объяснения терминов в НПЛТ встречаются двух видов: 1) термин - объяснение (прямое определение) и 2) объяснение - термин (инверсионное определение). Наблюдения над НПЛТ показывают, что если автор делает акцент на термине, после чего многократно использует этот термин в ближайшем изложении, то предпочтение отдается прямому определению.

Нетрудно заметить, что связь термина и его объяснения имеет различное лексическое выражение (наука - [без «это»], называется, мы будем понимать, речь идет о..., это...).

Инверсионное определение термина, заостряющее внимание адресата не на самом термине, а на выражаемом им понятии, его содержании в текстах НПЛТ, по нашим данным, несколько реже.

Многочисленны случаи смешанного типа объяснения специальных слов, когда содержание их раскрывается и в постпозиции к термину, сразу же после его введения, и продолжается после включения термина в текст. В анализируемых нами монографиях имеет место изобразительное описание (репродуктивный регистр).

Л.В. Успенский оперирует, преимущественно, неспециальными терминами, которые не нуждаются в объяснении, но в то же время являются терминами языкознания. Это такие термины, как: приставка, суффикс, окончание, существительное, род, число, падеж и т.д. При этом дефиниции данным терминам практически не дается, за исключением очень немногих:

«причастия спрягаемого глагола, иначе говоря, отглагольные прилагательные...» (Успенский Л.В.).

В тех достаточно редких случаях, где у читателя могут возникнуть проблемы с пониманием термина, автор использует объяснение и примеры.

Дефиниции терминов позволяют читателю в доступной и увлекательной форме получать новые знания, из какой либо области науки, в нашем случае, из области языкознания.

Подытоживая анализ терминов в НПЛТ, подчеркнем еще одну немаловажную методологическую основу производства «терминосодер-жащих» отрывков текста. В введении к своей монографии «Лексическая и синтаксическая объективация знания в словообразовательном контексте» М.С. Малеева поднимает интересный и актуальнейший вопрос об интуиции лингвиста, о распространившейся боязни интуитивизма - вплоть до отказа исследования семантики, при изучении которой интуитивные методы использовались менее всего [Малеева 1983: 8]. Нам представляется, что НПЛТ открывает широчайшие возможности как развития интуиции исследователя, так и приложения интуитивно найденных форм описания общеизвестного в языке, но в этом плане «терминологическая составляющая» НПЛТ, к сожалению, пока еще дает в целом не столь выразительный материал, какой следовало бы ожидать от пера профессиональных стилистов (в частности, почти не используются пояснительные резервы окказионального словообразования, невелико разнообразие эпитетов внутри контекста, окружающего новый для читателя термин).

Список литературы

Арбатский Д.И. Толкования значений слов: Семантические определения. Ижевск: Удмуртия, 1977.

Горский Д.П. Определение: Логико-методологические проблемы. М.: Мысль, 1974.

Коготкова Т. С. Профессионально-терминологическая лексика в газете (способы раскрытия и введения в текст) // Терминология и культура речи. М.: Наука, 1984. С. 58-92.

Комарова З.И. Метаязыковой текст словарной дефиниции в коммуникативном аспекте //

Художественный текст: структура, семантика, прагматика. Екатеринбург, 1997. С. 1-56.

Комарова З.И. Семантическая структура специального слова и ее лексикографическое описание. Свердловск: Изд-во Урал. ун-та. 1991.

Лазаревич Э.А. С веком наравне. Популяризация науки в России. М.: Книга, 1984.

Лейчик В.М. Терминоведение: предмет, методы, структура. 3 изд. М.: Изд-во ЛКИ, 2007.

Логический словарь-справочник / Н.И. Кондаков. М., 1971.

Малеева М.С. Лексическая и синтаксическая объективация знания в словообразовательном контексте. Воронеж: Изд-во Воронеж. гос. ун-та, 1983.

Медникова Э.М. Специфичный текст: словарная статья в двуязычном словаре // Синтагматика слова, словосочетания и предложения. Волгоград, 1988. С. 3-9.

Табанакова В.Д. Идеографическое описание научной терминологии: моногр. Тюмень: Изд-во Тюмен. гос. ун-та, 1999.

Fetzer J.H. Aspects of the theory of definition // Definitions and definability: Philosophical perspectives. Dordrecht/Boston/London: Kluwer Academic Publishers, 1991. P. 3-17.

The Linguistics Encyclopedia / Anderson J.M. L. and N. Y.: Routledge, 1991.

Список источников

Беднарская Л.Д. Интересно о русском языке. Орел: Изд. Соц. образов. центра, 1995.

Леонтьев А.А. Путешествие по карте языков мира. М.: Просвещение, 1981.

Наровчатов С.С. Необычное литературоведение. М.: ТЕРРА-Книжный клуб, 2003.

Сахарный Л.В. Как устроен наш язык. Книга для учащихся старших классов. М.: Просвещение, 1978.

Стернин И.А. Что такое лингвистика? Воронеж: Изд-во Воронеж. ун-та, 1987.

Успенский Л.В. Слово о словах. Л.: Лениз-дат, 1982.

G.Yu. Grishetchkina

WAYS OF DISCLOSING THE TERM IN THE POPULAR-SCIENTIFIC TEXT

In the article various definitions of terms, various kinds of definitions and variants of inputting terms in the popular-scientific linguistic texts are examined.

Key words: definition, concepts, the term, terms conducting, lexicon, style, a context, the recipient, speech and communicative act, the popular-scientific text.

Вступление (написано по методике НЛП: SCORE )

S Преподаватели естественно-научных дисциплин часто сталкиваются с тем, что студенты, имея даже достаточный объём знаний для хорошего и отличного ответа, тем не менее, не всегда умеют своими знаниями распорядиться и дают ответ низкого качества [S ymptom, Problem - симптом, текущее состояние, проблема ].

C И в основе их неудач лежит неумение правильно построить свой ответ [C ause - причина ].

O Поэтому, мы считаем важным, чтобы студенты усвоили правильный оптимальный план построения своего устного или письменного ответа [O utcomes - желаемый результат, желаемое состояние ].

R Об этом и говорится в данной работе, которая должна помочь студентам правильно построить ответ при самых разных видах учебной деятельности [R esourse - ресурс, средство для решения проблемы ].

E Результатом будет повышение качества ответов и высокая оценка [E ffect - результаты, последствия ]!

Отличники тем и отличаются от остальных студентов, что умеют структурировать свой ответ, т.е. строить его по определённому плану, по определённым правилам. Это означает, что у них мышление структурировано примерно так же, как и у преподавателя. Такой тип мышления называется дискурсивным , он отличается последовательностью и логической связанностью отдельных этапов рассмотрения изучаемого явления. Преподаватель такие ответы хорошо понимает и с удовольствием ставит за такой упорядоченный ответ высшую оценку. А хорошистам и троечникам остаётся лишь гадать: почему они знали вроде бы не меньше, чем отличники, а получили не такую высокую оценку?.. ((

Так как же следовало бы им построить свой ответ, чтобы ответить не хуже отличников и получить высший балл?

А вот как...

Порядок рассмотрения учебной темы или вопроса в естественно-научных дисциплинах

1. Введение

"Для чего это нужно знать?" "Почему это важно?" В последнее время такой "пиар" для любой темы приобретает всё большую популярность. Научным языком это назывеется "актуальность". Такое введение помогает привлечь внимание к теме того, кто вас слушает. Только одного я не рекомендую: делать введение в виде наивно-детской фразы, типа: "С давних времён человек мечтал узнать, как..." Таким дурацким способом "пиарят" свой ответ только троечники. ((Не следует также раздувать своё введение. В подобных случаях преподаватель начинает подозревать, что студент не знает ответа по-существу и просто тянет время, пытаясь "наболтать" что-то вместо ответа.

Последуем принципу Рене Декарта, который гласит: «Определяйте значение слов» .

Определение - это краткое афористичное объяснение термина. Мы даём определение тому понятию, о котором в дальнейшем пойдёт речь. Высшее образование среди всего прочего приучает студента давать каждому термину и каждому понятию определение. Это - важное умение, которое характеризует ваши умственные "академические" способности и показывает вас с самой лучшей стороны. И помните, что лучшее определение - это то, которое дал этому понятию ваш преподаватель!

Нет нужды заучивать наизусть все нужные вам определения. Их можно прекрасно составлять самому, если вы знаете или видите соответствующие учебные материалы по данному понятию.

Как правило, включает в себя несколько частей:

1. Принадлежность к системе более высокого порядка (систематическое положение).

2. Строение - самые важные черты или составные части.
3. Функции - самые главные характеристики и выполняемые действия.
4. Предназначение - для чего служит, какие задачи выполняет или какие цели достигает.

С помощью этого плана можно вполне успешно построить своё собственное определение понятия, о котором вы рассказываете.
Пример использования этого плана для определения понятия "система органов":
Система органов - это совокупность органов [строение ], совместно выполняющих общую функцию [функции ] по поддержанию одной из сторон жизнедеятельности [предназначение ] организма [система более высокого порядка ].

Рис. 1. Структура определения понятия (термина). © 2017 Сазонов В.Ф..

3. Сущность

Объясняем кратко сущность явления. Иногда это может совпадать с определением. Бывает, что для дополнительного пояснения сущности явления достаточно добавить к определению буквально одно или два предложения. Умение выделить существенные детали и отличить их от несущественных - это важная способность отличников учёбы. Сложность заключается в том, что эту способность приходится включать заранее: ещё во время домашней подготовке к ответу, когда вы читаете учебник. Ценная особенность хороших лекций заключается как раз в том, что преподаватель-лектор выделяет из обширного учебного материала наиболее существенные моменты, подчёркивает их специально для студентов и фактически показывает, как это следует делать, как следует работать с учебником. Хороший преподаватель даёт студентам не только знания, но и метод их извлечения! И на экзамене студент должен показать, что научился этому. К сожалению, многие недалёкие студенты во время ответа утопают в несущественных деталях, но забывают сказать главное... ((Не берите с них пример! Выделяйте главное в каждом вопросе ещё во время подготовки к экзамену!

4. Анализ

Анализируем, почему это именно так.

5. Заключение

Повторяем объяснение в концентрированном виде.

(При достаточно бойком ответе преподаватель может остановить такого ловко отвечающего студента и предложить перейти к следующему вопросу.)

6. Общее

Даём более пространную общую схему явления или процесса.

7. Новое

Выделяем в данном явлении нечто новое по сравнению с прежним в истории его развития.

8. Основное (при недостатке времени ограничиваются только этим разделом)

Делаем основной рассказ о конкретных особенностях предмета исследования или предмета обсуждения. Это - самая большая и самая главная часть вашего ответа. Предыдущие три раздела принято давать более кратко (если только это не самостоятельный вопрос), а можно вообще пропустить при недостатке времени.

Главное - объяснить механизм действия, т.е. дать последовательное описание процесса.

Механизм действия - это объяснение того, как именно происходит дейсттвие.

Считается, что описание механизмов действия - это самое трудное в физиологии.

В физиологии, как и в большинстве биологических наук, принят следующий порядок объяснения.

Порядок объяснения темы в естественных науках

1) определение понятия (что это?)

2) систематическое положение, классификация (в какую систему более высокого порядка входит? на каком уровне?)

*) см. пункт 13 ниже, его часто размещают здесь

3) строение, структура (из каких систем или элементов более низкого порядка состоит? как это устроено? из чего это состоит?)

4) свойства (что может делать? какие отличительные особенности имеет?)

5) функции (что делает?)

6) механизм действия (как делает? каким образом действует?)

7) предназначение / значение для организма (какую пользу приносит? для чего нужно?)

8) многообразие проявлений данного явления (какие варианты существуют?)

9) аналогии, сходства и различия с другими предметами или явлениями (с чем сходно? чем отличается? каковы особенности?)

11) примеры (привести несколько конкретных наглядных примеров)

12) интересные факты по данной теме (рассказать интересные факты)

13) исторические сведения (как это развивалось на протяжении времени?): это может быть как историческая справка о развитии идеи и её создателей, так и эпохальная история развития предмета изучения (филогенез), а также индивидуальное возрастное развитие (онтогенез) в процессе созревания

14) заключение (кратко и концентрировано повторить самое главное из сказанного).

Во многих смежных цисциплинах (например, медицине) принят другой порядок:

1. Симптомы (внешние проявления).

2. Причины (истоки и/или внутренние механизмы).

3. Диагностика (подтверждение предположений).

5. Прогноз.

7. Важное

Выделяем и подчёркиваем наиболее важное.

(Это особенно ценят и любят преподаватели!)

8. Выводы

Делаем краткие обобщающие выводы.

9. Финал

Даём завершающее пояснение. Теперь вполне уместно спросить преподавателя, можно ли перейти к следующему вопросу.

Основное требование к сочинению – раскрыть тему.

Раскрыть тему в сочинении – это значит:

последовательно проанализировать данный текст под углом определенной проблемы;

развернуто и логически связанно ответить на поставленный вопрос.

Для того чтобы раскрыть тему, сочинение должно опираться на 3 основания:

оно должно начинаться с постановки вопроса или проблемы (во вступлении);

завершаться ответом на вопрос или итоговым выводом (в заключении);

движение же от вопроса к ответу, от постановки проблемы к выводу должно определяться основной мыслью сочинения – идеей, исходящей из его темы (в основной части).

Чтобы лучше понять тему, нужно выявить ключевое слово (слова) или понятие в ней. Например, в теме: «Евгений Онегин» - энциклопедия русской жизни» - главное, ключевое слово – «энциклопедия».

Почему В.Г. Белинский назвал роман Пушкина энциклопедией русской жизни? (Пушкин сумел отразить в своем произведении быт, традиции, нравы, образ жизни русского дворянства 1-ой трети 19 века).

О чем мы узнаем из этого произведения? (О воспитании дворян как в столице, так и в провинции, о распорядке дня «молодого повесы», о столичной моде, об интерьере, о круге чтения, о репертуаре театров, о верованиях, праздниках, обрядах народа, о дуэлях, о моральных устоях и т.п.)

Например, в теме: «Война и мир» - роман-эпопея» или «Жанровые особенности романа Л.Н. Толстого Война и мир»» ключевые слова – «роман-эпопея» и «жанровые особенности».

Жанр «Войны и мира» - роман-эпопея. И это необходимо доказать в своей работе. Для романа-эпопеи как жанра характерны следующие особенности:

изображение исторических событий

большое количество действующих лиц и сюжетных линий

показ различных социальных слоев

протяженность во времени.

Пишущий должен показать и доказать, что «Война и мир» - это роман-эпопея, опираясь на примеры из текста.

Тема "о чём это произведение?" это «круг проблем»

ПРЕДСТАВЛЕНИЕ О ЦЕЛЯХ СОЧИНЕНИЯ

В сочинении невозможно раскрыть все аспекты темы, поэтому стоит остановиться только на одном, самом простом тезисе (утверждении) и подборе аргументов (доказательств) к этому тезису.

ЦЕЛЬ СОЧИНЕНИЯ:

Доказать, аргументировать единственный простой и ясный тезис (утверждение) в рамках темы сочинения.

ФОРМУЛА СОЧИНЕНИЯ:

Сочинение - это тезис и его аргументация.

ЧТО ПОЛУЧИТСЯ В ИТОГЕ?

Целенаправленная интеллектуальная деятельность, приведшая к результату - выводу.

ВЕРНЫЙ ПОХОД: СОЧИНЕНИЕ=ТЕЗИС+АРГУМЕНТ

Идея "чему учит это произведение?"

Идея художественного произведения – это главная мысль, обобщающая смысловое, образное, эмоциональное содержание художественного произведения.

Идея текста это главная мысль произведения, которая волнует автора. То для чего текст создан. Проблема, о которой автор хочет говорить.

Идея --какую цель, какие проблемы что хотел выразить, показать автор в этом произведении.

Идея – это ради чего я снимаю – духовный посыл.

Сущность понятий «тема», «идея», «сверхзадача», «сверх сверхзадача», «сквозное действие»

Тема (гр. – положенное в основу) – круг жизненных явлений, событий и проблем, положенных в основу художественного произведения. Определение темы полностью зависит от индивидуальности режиссера и его мировоззрения. Тема является важным компонентом действенного анализа в работе режиссера над пьесой и спектаклем.

Идея (гр. – мысль) – основная, главная мысль; замысел, определяющий содержание произведения. Мысль, намерения, план, отношения. Актер должен иметь свою “индивидуальную идею” (выражение Михаила Чехова) в работе над ролью.

Сверхзадача – (К.С.Станиславский) – основная, главная, всеобъемлющая цель, притягивающая к себе все без исключения события, задачи, действия, вызывающая творческое стремление двигателей психической жизни. Это то, ради чего я, как режиссер, ставлю спектакль, что хочу изменить в сознании зрителя, какие чувства и мысли хочу вызвать в нем. Индивидуальная идея режиссера и актера.

Сверх-сверхзадача – в контексте всей системы и всей артистической жизни Станиславского – это не отдельная идея, не мысль, не идеологическая конструкция. Это глубочайшая внутренняя потребность художника, идя "от себя", сообщить миру самое сокровенное. Сверхзадача не предшествует творческому акту, а выявляется в нем самом. Репетируя и затем творя на сцене, артист осваивает сверхзадачу роли, познает другого как самого себя, действует в предлагаемых обстоятельствах, мобилизуя опыт сознания и сверхсознания. Переживай, проживая роль, он испытывает чувства особого рода: изображаемого лица и художника, оценивающего свое творчество.

Сквозное действие (К.С.Станиславский) – это та реальная, конкретная борьба, которая происходит в пьесе. В результате чего утверждается сверхзадача. Сквозное действие – это путь, по которому режиссер, актер идут к своей цели в спектакле, роли. Стремление к сверхзадаче должно быть сплошным, непрерывным, проходящим через всю пьесу. Все характеры, мизансцены должны лежать на линии сквозного действия. Каждое сквозное действие имеет свое контрсквозное действие. Сверхзадача – хотение. Сквозное действие – стремление. Выполнение его – действие.

Переходя к вопросу о способах раскрытия содержания текстов в процессе свертывания, следует иметь в виду, что развитие этих способов в 60-70-е годы шло в основном в двух направлениях.

Одно из них, традиционно развиваемое библиографией, пре­дусматривало поиски более совершенных способов «ручного» (интеллектуального) свертывания. В русле этого направления воз­никли анкетные (или аспектные) методы реферирования и анноти­рования, предусматривающие членение первоисточника на опре­деленные содержательные аспекты типа: цель работы, методы и конкретные результаты, выводы, рекомендации, область приме­нения, место и время проведения исследований и т. п. На основе

аннотация почти никогда не рассматривается как самостоятельный вторич­ный документ, а лишь как важнейшая часть библиографической записи, дополняющая библиографическое описание темы сведениями, которые необ­ходимы в пособии именно данного назначения. В этих условиях аннотация вовсе но всегда раскрывает (полностью) содержание документа (например, в указателях произведений того или иного автора, классиков художествен­ной литературы и др.). Наличие в ней тех пли иных элементов связано с ви­дом пособия (рекомендательное или научно-вспомогательное) и его целями, а также с принципами отбора материала и структурой пособия. Однако та­кой подход нисколько не противоречит высказанному нами мнению, что аннотация должна, обеспечить такое представление. Мы рассматриваем анно­тацию с точки зрения дедуктивно построенной «идеальной» модели, которая постоянно находится под влиянием факторов внешней среды, ее «деформи­рующих». К таким именно факторам и относятся вид пособия, его целевое и читательское назначение, принципы отбора и многое другое. Вопрос за­ключается не в том, всегда ли должна аннотация полноценно осведомлять о существовании произведений печати, а в том, насколько реальная аннота­ция адекватна «деформирующим» ее факторам.

такого членения предложены многочисленные аспектные сетки как универсального и отраслевого характера, так и рассчитаны на различные типы и виды документов (подробнее об этом см. в 2.2.4.). В некоторых методиках, основанных на использовании аспектных сеток, указывается важность тех или иных аспектов для включения их во вторичный документ, иногда - примерный уровень свертывания. Иными словами, были сделаны попытки созда­ния моделей вторичных документов для различных отраслей зна­ния .

Применение анкетных методов свертывания в определенной степени повысило качество вторичных документов. Положенный в их основу принцип анализа первоисточников оказался плодотворным и для разработки более совершенных формализованных методик свертывания (см., например: ).


Недостатком этих методов является, с одной стороны, неиз­менное обращение в них к интуиции референта с требованием вы­делить в первоисточнике «существенную информацию» - без ука­зания, что такое существенная информация и как ее выделять, с другой - стремление сделать методики (и сетки) как можно более детальными. Последнее па практике наталкивается па постоянное сопротивление референтов: слишком детальные методики значи­тельно усложняют процесс реферирования. В этой связи уместно привести мнение Д. Г. Лахути, который обращал внимание на то, что ручное индексирование с его потенциальными преимуществами в плане точности и глубины анализа текста возможно разве что в лабораторных условиях, тогда как в реальной ситуации оно яв­ляется сильно упрощенным алгоритмическим процессом, только выполняемым людьми, т. е. устройствами, плохо приспособленными для алгоритмической работы .

Другое направление в свертывании, развиваемое в эти годы преимущественно в сфере информатики, предусматривает разработку формализованных методов анализа содержания документов. В основе этого направления лежат попытки изыскания в плане выражения текстов (в его лексике, грамматике, логической структуре и т. п.) элементов, через которые можно было бы выразить план содержания данного текста, т. е. его семантику. Важность развития формализованных методов объясняется тем, что они открывают перспективы широкого внедрения в процессы аналитико-синтетической переработки информации электронно-вычислительной техники, а это дает возможность перевести некоторые виды свертывания «на рельсы» машинной технологии со свойственными ей преимуществами и недостатками.

С этой целью в информатике и библиографии предлагаются более «жесткие» алгоритмы (избирательное свертывание текстов), где для каждого типа и жанра документа предлагается своя процедура свертывания. В результате достигается не только большая последовательность, но и экономичность свертывания в том смысле, что в «свертке» отражаются те элементы формальной и содержательной структуры исходного Текста, которые играют активную роль в процессе информационного поиска .

Параллельно с разработкой алгоритмов, регламентирующих деятельность человека в процессах свертывания, велась и ведется работа по автоматизации индексирования, реферирования и аннотирования. Работы в первом направлении вышли на уровень «промышленной эксплуатации» уже в 1970 г., когда впервые в мире во ВНИИ Информэлектро был применен метод пословного автоматического индексирования. Что же касается исследований по автоматизации реферирования и аннотирования, которые ведутся с переменным успехом уже более 20 лет, то здесь методики носят пре­имущественно экспериментальный характер.

3.3. ЛОГИКО-ГРАММАТИЧЕСКИЙ (ФОРМАЛИЗОВАННЫЙ) ПОДХОД К РАЗЛИЧЕНИЮ АННОТАЦИЙ И РЕФЕРАТОВ

К числу постоянно «тлеющих» проблем аннотирования и реферирования относится также проблема различения аннотаций и рефератов. Интуитивно все вроде бы достаточно четко различают эти виды вторичных документов: в одних, мол, что, в других - о чем. Но когда дело доходит до отнесения конкретного вторичного документа к тому или иному виду, единомыслие далеко не всегда наблюдается. Не случайно даже в инструкциях для референтов в качестве примера реферата приводятся иногда реферативные аннотации (см.: ).

Или, к примеру, к какой разновидности вторичных документов следует отнести такие записи?

Патентуется состав проявителя для электрографии. Для уменьшения степени загрязнения чувствительного элемента тонером предлагается добавлять в проявитель непигментированные частицы в количестве до 10% по весу. Предлагаются различные вещества для использования в качестве добавки.

В работе на основе изучения функционирования ИПС НШБНЕБ (Япония) делается вывод, что специалист, осуществляющий поиск, должен обладать знаниями об управлении конкретной базой данных в определенной ИПС.

Ультразвуковая сварочная установка снабжена контрольным устройством, которое обнаруживает негодные сварки и другие механические неисправности в самой установке.

Даже опытные библиографы, которым показывались эти взятые наугад из реферативных журналов вторичные документы, не давали сразу однозначного ответа. Но в практике встречаются не столь элементарные примеры. Неразличение этих видов вторичных документов при формировании вторичных потоков снижает уровень информативности этих потоков, а следовательно, и качество информационного обслуживания.

Предлагаемый здесь логико-грамматический подход к исследованию вторичного потока с точки зрения выделения в нем аннотаций, рефератов и реферативных аннотаций основывается на совместном дополнении методов логического и грамматического анализов текстов.

Логический (содержательный) анализ предполагает выделение в предложении субъекта мысли (5) и предиката мысли (Р), а на уровне текста - текстового субъекта и текстового предиката.

Пример аннотативной фразы:

Описываются основные принципы построения Десятичной классификации Дьюи (ДК), ее эволюция, преимущества, недостатки.

Пример реферативной фразы:

Основным преимуществом системы РАМ-2 является возможность до­полнения сведений путем съемки новых данных на свободные участки микро­фиши.

Здесь в качестве предиката мысли выступает часть фразы, начинающаяся с глагола является.

В качестве текстового субъекта часто могут выступать заголовки, подзаголовки текста и т. п., тогда весь следующий за заголовком текст можно рассматривать как текстовой предикат. Так, аннотативная фраза, отражающая тему того или иного содержательного аспекта документа, также может фигурировать как текстовой субъект, а описание соответствующего аспекта в первоисточнике - как текстовой предикат.

Аннотативные фразы относятся к метаинформации, большая часть реферативных фраз - к «собственно» информации.

Грамматический (формальный) анализ вторичного документа предполагает рассмотрение его с точки зрения синтаксической структуры и используемых лексических средств. Так, аннотации включают в себя преимущественно фразы в виде простых или сложных эллиптических предложений, имеющих, как правило, инверсную форму. В эллипс обычно включается субъект действия страдательного (пассивного) оборота, выраженного дополнением в творительном падеже: [Автором]. . . исследовались особенности структуры . . . В данном примере субъект действия взят в квадратные скобки. Поскольку для таких фраз характерна форма страдательного оборота, сказуемое, как правило, выражено глаголом в возвратной форме (рассматривается, обсуждается, исследуется и т. п.) или пассивной глагольной формой единственного или множественного числа (рассмотрен, исследован, обсужден и т. д.). При этом фраза всегда имеет инверсную форму.

Примером типичной аннотации может служить вторичный документ:

Рассматривается автоматизированная информационная система (АЙС) Каунасского политехнического института. Приводятся задачи учебного комплекса, решаемые на первом этапе создания АИС, и используемая методика их формализации.

Данный текст составляют фразы, которые с точки зрения и логического и грамматического анализа относятся к числу аннотативных (и соответственно метаинформативных).

Иногда аннотации состоят из последовательности назывных (номинативных) предложений без оборотов типа рассматриваются, описываются и т. п. Например:

Социальные основы и функции семейного домоводства. Анализ социологических и экономических аспектов домашнего хозяйства современной семьи (на примере ФРГ).

Здесь мы также имеем дело с аннотативными фразами, поскольку в них отсутствует предикатная часть, однако аннотации, состоящие из подобных предложений, явление довольно редкое.

В аннотациях встречаются также фразы, являющиеся по форме реферативными (S+Р), но по сути несущие в себе метаинформацию. Это фразы-сообщения о содержании или назначении книг, повестки дня конференций и т. п. Например:

Рецензируемый указатель предназначен для тех, кто занимается историей изобразительного и прикладного искусства.

Список, включающий около 175 работ с небольшими аннотациями, содержит разделы: общие работы; кооперированная и централизованная (системно-машинная) обработка; каталоги и их разработка. . .

Рефераты в отличие от аннотаций включают в себя реферативные (информативные) фразы, которые являются в принципе многоформными, т. е. могут быть выражены (при наличии S и Р) любой грамматической формой, употребляющейся в языке научно-технической литературы. Например:

Центральная библиотека должна быть оснащена современной вычислительной техникой с видеотерминалами, установленными в лабораториях. С помощью центральной ЭВМ реализуется ведение информационного массива, выдаются ответы па разовые запросы, осуществляется обслуживание в режиме ИРИ и управление работой библиотеки. (Из реферата 5И 136, РЖ «Информатика», 1977).

Однако в рефератах, как и в аннотациях, нередко сталкиваемся с фразами, внешне схожими с аннотативными, т. е. начинающимися с возвратных глаголов, имеющими инверсную форму и т. п. Например: Оказывается, что неразличение всех омонимов в ИПЯ увеличит средний шум системы примерно на 0.1(на 10%).

Более внимательный грамматический анализ этой (и подобных ой) фразы показывает, что в данном случае мы имеем дело с эллиптическим сложно-подчиненным предложением, придаточная часть которого начинается обычно с союза что и содержит в себе как подлежащее, так и сказуемое. Для данной фразы, кроме того, характерно наличие как субъекта, так и предиката мысли (соответственно: неразличение всех омонимов и увеличит средний шум системы примерно на 0.1 (на 10%)).

Однако далеко не все сложно-подчиненные предложения (или предложения с причастным оборотом) относятся к разряду реферативных, так как не содержат в себе логического предиката мысли. К реферативным будут относиться те фразы, в которых придаточное (чаще всего определительное) предложение или причастный оборот раскрывает сущность, состав, устройство, принцип действия и т. п. субъекта в главном предложении (т. е. «предикатирует» субъект). Так, из двух сложно-подчиненных предложений Исследовались шумы в зависимости от частоты в рабочих точках, соответствующих режиму возникновения плазмы, Описывается конструкция 4-зондовой микроголовки, в которой для изоляции зондов использовалась стеклянная соломка-трубочка лишь второе может быть отнесено к реферативным (информативным), поскольку в нем, в его придаточной части, раскрывается особенность конструкции, т. е. субъект мысли (конструкция 4-зондовой микрголовки). В первой фразе причастный оборот относится к второ­степенному члену предложения в рабочих точках, не являющемуся субъектом мысли.

Описанный выше пофразный логико-грамматический анализ, однако, не всегда бывает достаточным для различения вторичных документов, так как не учитывает такого явления, как сложное синтаксическое целое (ССЦ). Некоторые аннотативные и реферативные фразы во вторичном документе существуют не изолиро­ванно, а образуют столь тесное структурно-смысловое единство, что должны рассматриваться как единые микроконтексты - ССЦ, и которых аннотативные фразы (А) не имеют самостоятельного значения, а либо предваряют, либо заключают реферативные (Р), т. е. сопряжены (термин, предложенный Д. Г. Лахути) с ними.

Сопряженные фразы образуют такие контексты, в реферативной части которых нечто утверждается (раскрывается) о том, что сказано в аинотативной фразе. Встречаются различные случаи сопряженности, в том числе и многоступенчатые. Наиболее частые случаи сопряжения типа А-Р и Р-А. 10 Например:

А-Р: Описывается опыт координатного индексирования книг с целью предметизации. Содержание книг описывается несколькими предметными рубриками из классификации Библиотеки конгресса, рассматриваемыми как унитермы.

Р-А: Информационно-логическая система осуществляет сбор, хранение и переработку информации с генерированием некоторой новой информации на базе логической обработки исходной. Рассматриваются мероприятия, необходимые для внедрения системы.

Сопряженность можно рассматривать как частный случай «нанизывания», по терминологии И. П. Севбо , при котором про­стые предложения объединяются в сложные и далее в ССЦ (микро-контексты) на основе общности смысловых элементов, отражающих семантическую близость

10 Сопряженные фразы относятся, как правило, к одному и тому же содержательному (смысловому) аспекту текста документа.

сопряженных фраз. Сопряженные фразы считаются в целом информативными и потому рассматриваются в качестве структурного элемента реферата.

Учет сопряженностей значительно влияет на результаты анализа вторичного потока. Так, экспериментальное опробование данного метода на массиве 200 вторичных документов по электротехнике (из РЖ ВИНИТИ) показало, что без учета сопряженности фраз в данном потоке оказалось 107 аннотаций, 30 рефератов 63 реферативные аннотации, с учетом сопряженности соответственно 107, 56 и 37.

Логико-грамматический анализ, несмотря на кажущуюся его сложность, при приобретении некоторых практических навыков позволяет облегчить процедуру различения основных составляющих вторичного потока в соответствии с их функциональным назначением, при этом к числу аннотаций относятся документы, состоящие из аннотативных фраз и метаинформативных реферативных; к числу рефератов – документы, включающие реферативные фразы и сопряженные реферативно-аннотативные; наконец. К числу реферативных аннотаций – документы, содержащие хотя бы одну реферативную (информативную) или не сопряженную аннотативную фразу.

Примерно аналогичный - «темо-ремный» (коммуникативный) - подход к различению вторичных документов изложен в работе . Правда, автор различает не аннотации и рефераты» как в нашем случае, а индикативные и информативные рефераты (подход, характерный для практики некоторых зарубежных и отечественных реферативных служб), но это вопрос лишь «терминологической симпатии». Главное, под индикативными рефератам автор «имплицитно» подразумевает аннотации, под информативными рефератами - просто рефераты, а под индикативно-информативными рефератами - реферативные аннотации.

Речь идет о том, что одно и то же содержание может быть в ряде случаев выражено как одним, так и несколькими высказываниями (смотря по тому, что понимает под основным предметом высказывания референт). Так, например, при реферировании одного и того же документа референт А изложил его содержание с помощью, высказывания Описан операциональный усилитель с дифференциальным входным и 2-тактным выходным каскадами, 11 а референт Ц; использовал два высказывания: Описан операционный усилитель. Усилитель имеет дифференциальный входной и 2-тактный выходной каскады. Первый референт должен быть признан индикативным (т.е. аннотацией), а второй – информативным (т.е. рефератом) – случай сопряженности типа А – Р. Такое расхождение при одном и том же денотате автор объясняет различным подходом двух референтов к определению границ темы. Для референта А в качестве основного предмета, описываемого в первичном документе, выступал операционный усилитель с дифференциальным входным и 2-тактным выходным каскадами, для референта Б предметом описания был операционный усилитель.

Следует согласиться с автором, что существующая некоторая субъективность в определении понятия «тема текста» «не превышает той доли субъективности, которая свойственна процедуре определения типа реферата, основанной на чисто смысловых критериях».

К сожалению, нельзя согласиться с рядом других утверждений автора . Так, например, неправильным, на наш взгляд, является мнение, что в тексте типа В статье рассматриваются усилители постоянного тока на полевых триодах элемент В статье является темой, а рассматриваются усилители – ремой. В данном случае весь указанный текс есть тема (это чистая, в нашей терминологии, метаинформация).

Далее. В качестве лексических признаков для формализованного различения индикативных фраз автор предлагает набор сказуемых, который приводит списком в приложении: анализируется, доказывается, указывается и т. д. - всего 53 подобных лексических признака. Эти признаки действительно «указуют» на индикативность (аннотативность) фразы, но только в том случае, если за ним не следует союз что. В противном случае, как уже об этом говорилось нами выше (см. пример на с. 84), мы имеем дело не с аннотативной, а с реферативной фразой.

3.4. ПРОБЛЕМЫ ФОРМАЛИЗОВАННОГО (АВТОМАТИЗИРОВАННОГО) РЕФЕРИРОВАНИЯ

В данной главе под формализованным реферированием (автоматическим сжатием, машинным экстрагированием, квазиреферированием и т. п.) будем понимать различные виды свертывания (аннотирование, реферирование, фрагментирование), кроме индексирования и библиографического описания.

Наличие весьма обстоятельных обзоров по проблеме автоматического реферирования избавляет нас от необходимости брать на себя в какой-то мере эту нелегкую задачу.

Пока еще не установилась четкая классификация методов фомализованного свертывания. В работе приводится некоторый перечень таких классификаций, который, конечно, не исчерпывав их многообразия: «Так, В. Е. Берзон 14 различает следующие методы автоматического свертывания текста: 1) статистические, 2) позиционные, 3) дескрипторные, 4) анкетные, 5) методы ассоциаций, 6) семантические, 7) синтаксические и 8) методы, основанные на исследовании структуры связного текста. Севбо , кроме статистических и синтаксических методов, выделяет также подход, основанный на применении информационно-логических языков. В исчерпывающем обзоре работ американских исследований В. П. Леонов делит совокупность приемов на статистические, логико-математические и лингвистические методы. Ту же совокупность методов оценки значимости фрагментов текста (слов, словосочетаний, фраз, предложений, абзацев и т. п.) Р. Уиллис классифицирует на статистические, семантико-синтаксические и текстуальные».

Своеобразную классификацию методов автоматического реферирования предлагает . Автор выделяет четыре группы: 1) методы, основанные на выборе из текста первичного документа существенной информации, руководствуясь «некоторым описанием» семантической структуры первичного документа (в частности, аспектные методы реферирования); 2) методы, в которых существенная информация выбирается на основе «памяти о требованиях к реферату» (допустим, обусловленных требованиями инструкции по реферированию); 3) методы, в которых моделируется память о достигнутом уровне в конкретной предметной области (метод Стяжкина-Певзнера ); 4) методы, моделирующие память об информационных потребностях. Последняя группа методов - пока область чисто гипотетических рассуждений.

Нам, исходя из наших задач, больше импонирует классификация С. И. Гиндина , который разделяет методы автоматического реферирования (в его терминологии, фрагментирования) на статистические (или частотные), индикаторные и позиционные. Кратко охарактеризуем их.

Родоначальником статистических методов считается X. П. Лун, который явился основоположником автоматического реферирования. В 1958 г. им был получен первый машинный реферат и опубликована статья «The automatic creation of literature abstracts», в которой была изложена идея 18 рассматриваемого нами метода и на которую обычно ссылаются при изложении этого метода.

Согласно Луну, основное смысловое содержание реферируе­мого источника (статьи) можно представить в виде перечня (сово­купности) предложений, наиболее значимых для данного доку­мента, т. е. содержащих наиболее существенную информацию. Значимыми предложениями при этом считаются те, которые содер­жат в своем составе «скопления» значимых для данного документа слов. Значимость слов в свою очередь определяется частотой их встречаемости в документе: чем чаще встречается то или иное слово, тем оно значительнее. Лун пишет: «Следовательно, в каком бы месте ни обнаружилось крупнейшее скопление различных частных (для данной статьи) слов в теснейшей близости друг к другу, очень велика вероятность того, что передаваемая в данном месте инфор­мация в наибольшей степени характеризует содержание данной статьи» (цит. по: ).

Вскоре, однако, обнаружилось, что между «высотой» ранга того или иного слова в тексте и уровнем информативности 18 пред­ложения, содержащего скопления таких «высокоранговых» слов, четкой корреляции нет: предложения, содержащие важную для данного документа информацию, могут при использовании этого метода и не «выйти» в реферат и наоборот. Однако сама идея при­влекла внимание многих исследователей как в нашей стране, так и за рубежом и вызвала к жизни целый ряд модификаций, в которых недостатки исходного метода были в большей или меньшей степени компенсированы (методы В. А. Освалда; В. Швайсхаймера; В. А. Аграева, В. В. Бородина и Ю. В. Глебского; В. А. Пурто и др.).

Позиционные методы реферирования используют в ка­честве диагностического признака, позволяющего идентифициро­вать наиболее значимые для реферата предложения первоисточ­ника, позицию, место этого предложения (предложений) в тексте.

Сторонники позиционных методов реферирования утверждают, что наиболее значимые, информативные, предложения (субтексты) располагаются в начале ж (или) конце документа, раздела, абзаца и т. п. Так, в считалось, что основное содержание первичного документа будет отражать реферат, состоящий из начальных фраз всех абзацев. На высокую информативность первого, второго и последнего предложения обращается внимание в работах . В статье указывается, что «наиболее существенные идеи высказываются в конце статьи», что «первичному до­кументу свойственна рамочная структура, так как в смыс­ловом отношении он образует законченное целое». При этом сто­ронники позиционных методов пытаются теоретически обосновать семиотическую и психологическую выделенность (значимость) начала и конца текста (субтекста).

С. И. Гиндин , в интерпретации которого здесь излагаются основные идеи позиционных методов, на основе анализа различных точек зрения, как весьма оптимистичных, так и крайне пёссимистичных относительно эффективности этих методов, достаточно резонно, что согласуется с результатами и наших исследований, заключает: «Семиотические и психологические закономерности. . . лишь благоприятствуют композиционному выделению и особой семантической нагруженности начала и конца текста, создают возможности такого выделения, но отнюдь не предписывают его. Воспользуется ли этой возможностью автор текста или

нет, заранее знать нельзя. . .» (с. 67). И далее: «В эпоху научно-технической революции и внедрения автоматизированных систем обработки информации роль сознательного контроля при построении научно-технических текстов, вообще говоря, возрастает, поэтому можно надеяться, что умелое пользование композиционными потенциями „особых точек" текста станет в какой-то мере элементом сознательно воспитываемой культуры речи» (с. 69).

А пока - это область добрых пожеланий авторам писать так чтобы сторонникам позиционных методов было бы удобно создавать «высокоинформативные рефераты». Тем не менее, несмотря на некоторую ироничность нашего заключения, известная истинна в рассуждениях «позиционистов» есть, и в ряде случаев их доводами пренебрегать нельзя. Но вот в каких случаях? Думается, что прежде всего в тех, когда эти в позиции находящиеся фразы идентифицированы тем или иным индикатором.

Индикаторные методы основаны на предположении что значимость предложений можно определять на основе некоторых элементов-индикаторов. В качестве индикаторов предлагается использовать свойства как внутренней структуры текста (синтаксические индикаторы), так и отдельных слов и словосочетаний (лексические индикаторы).

Исследования в области синтаксических индикаторов пока не обнаружили устойчивой связи между видом синтаксической структуры и ее значимостью.

Большей популярностью среди сторонников индикаторных методов реферирования пользуются лексические индикаторы. Выявилось, что некоторые слова (и словосочетания), входящие в предложение, «достаточно четко характеризуют смысл и функцию предложения в целом. .. и в то же время достаточно употребительны чтобы позволить с помощью сравнительно небольшого списка элементов обрабатывать широкий круг текстов» . Одной из самых ранних отечественных работ, как сообщает , в которых использован метод лексических индикаторов, является . Для формализации процесса индексирования этим автором предложена процедура извлечения их текстов некоторого множества «индикативных фраз», отражающих основное содержание текста, из которых затем должны выбираться ключевые слова. К числу лексических индикаторов, позволяющих извлекать предложения из текста, относились такие слова и словосочетания, как поэтому, основные задачи исследования, анализируется, излагается и т. д. В работе для выделения информативных фраз из статей использовались уже упорядоченные «аспектные дескрипторы», которые обозначали аспект рассмотрения предмета статьи независимо от принадлежности ее к той или иной отрасли знания. Здесь, так же как и в случае , выделение предложений предназначалось, однако, не для составления рефератов, а для последующего индексирования.

За рубежом, согласно , индикаторный метод был применен одним из первых X. П. Эдмундсоном, 17 в исследованиях которого использовался словарь индикаторов, включающий систему «словарей» - словарь поощрений, словарь клейм и словарь нехарактерных слов (подробнее см. или описание в работе ).

В настоящее время большинство методов автоматического реферирования включает в себя элементы различных направлений -статистического, позиционного, индикаторного. Есть методы, которые не укладываются в перечисленные направления, например метод Стяжкина-Певзнера , метод, использующий правила рансформационной грамматики (например, ), и др.

Излагаемый ниже метод автоматического реферирования также нельзя отнести к чисто индикаторным, хотя это направление в нем выражено достаточно четко. В основе предлагаемого метода лежит мысль, совпадающая с мнением о том, что «на современном этапе исследований наиболее перспективным направлением авто­матического реферирования является разработка специальных словарей для выявления ключевых предложений и системы семан­тических отношений в исходном тексте».

3.5. ФОРМАЛИЗОВАННОЕ РЕФЕРИРОВАНИЕ МЕТОДОМ МЕТАИНФОРМАТИВНОГО СВЕРТЫВАНИЯ

Идея рассматриваемого здесь метода «метаинформативного свертывания» зародилась в процессе разработки способов оценки качества реферирования литературы электротехнического профиля. 18 В ходе сопоставительного анализа 200 пар первичных (и вторичных документов с целью определения их относительной информативности обратило на себя внимание следующее.

1.Некоторые фразы (предложения) первичных документов (анализировались статьи и описания к авторским свидетельствам) обладают достаточно высокой степенью «темоназывания» (метаиформативности), и их совокупность может в ряде случаев характеризовать содержание как документа в целом, так и отдельных его частей. 1

2. Указанные фразы - иногда дословно, иногда с несущественой перефразировкой - в значительном числе случаев, видимо интуитивно переносятся референтами из первичных документов во вторичные в процессе реферирования. Так, оказалось, что из 200 документов такие перенесенные фразы содержались в 146, причем всего таких фраз насчитывалось 193 (это около 25% всех фраз вторичных документов). Лишь 54 реферата не содержали фраз, взятых из первоисточников; все эти вторичные документы оказались авторефератами, что свидетельствует, видимо, о несколько ином «механизме» написания рефератов авторами, нежели референтами: первые осмысляют содержание своей работы на высоком уровне обобщения и перефразирования.

3. Такие «темоназывные» фразы в большинстве случаев либо Iпредваряют тексты (фрагменты текста), либо их заключают (результируют).

4. Более детальный анализ этих фраз показал, что большинства из них идентифицируется определенными словами и словосочетаниями («словесными клише»), перечень которых достаточно ограничен. Так возникла гипотеза использовать указанные словесными клише (маркеры) для формализованного экстрагирования темоназывных предложений с целью получения квазирефератов.

Легко видеть, что сама идея на таком уровне не отличается особой оригинальностью: так, о темоопределяющих предложениях, расположенных или «очень близко к началу документа» (либо абзаца) или «очень близко к его концу», писал в свое время Эдмундсон , а о способах индикации фраз, отражающих основное содержание текста, сообщала в упомянутой уже выше работе Г. А. Лаврентьева. Таким образом, рассматриваемый здесь способ квази! реферирования, названный нами методом метаинформативного свертывания, является по преимуществу индикаторным, но содержит в себе элементы и позиционных методов.

Вскоре, однако, выяснилось, что словесными клише (маркерами) можно идентифицировать не только предваряющие и заключающие фразы (которые преимущественно метаинформативны) но и целый ряд других предложений первоисточника, информативных по своему характеру. Практически все содержательные аспекты (точнее, некоторые фразы этих аспектов), приведенные нам] в 2.2.4 - Известный вариант решения (ИВР), Оценка известной варианта (ОцИВР), Постановка проблемы (ПП), Целевая установка (ЦУ), Предлагаемый вариант решения (ПВР), Оценка 1 особенности предлагаемого варианта (ОцПВР, ОсПВР), Результаты (Р), Выводы (В) и Рекомендации (Рек.), идентифицируются указанными маркерами. Поскольку экстрагируемые на основе данного метода фразы носят вне контекста первичного документа не только и не столько метаинформативный (аннотативный), сколько информативный (реферативный) характер, среди участников описы­ваемой разработки возникли разногласия: стоит ли вообще называть этот способ квазиреферирования «методом метаинформативного свертывания». Автор данной работы считает, что обозначение этого метода как метода метаинформативного носит в некотором смысле принципиальный характер (принципиальный с точки зрения общего контекста данной работы).

Как уже указывалось, экстрагируемые по данному методу фразы можно разделить на два вида - информативные и метаинформативные. Информативные выражают содержательную часть текста - фактические сведения или концептуальное их осмысление (последнее особенно в ОцИВР, ОсПВР, ОцПВР, В), метаинформативные фразы характеризуют тему документа в целом или от­дельных его фрагментов (содержательных аспектов). Совокупность метаинформативиых фраз (см. раздел 3.3) образует вторичный до­кумент типа аннотации, а информативных фраз - реферат. Ка­залось бы на первый взгляд, поскольку по данному методу экстра­гируется обычно больше половины информативных, а не метаинформативных фраз, то и название метода в целом как метаинформативного должно вызывать обоснованные сомнения. Но это только на первый взгляд.

Прежде всего, как упоминалось выше, деление на информативное и метаинформативное до известной степени условно, поскольку в некоторых случаях невозможно различать информацию и метаин-формацию без учета потребительской ситуации. Кроме того, как мы говорили, в каждой информации есть доля метаинформации и наоборот. Но не это главное.

Если рассматривать каждый содержательный аспект в качестве некоторого суперсинтаксического целого (чаще всего СФЕ), то экстрагируемые по данному методу фразы, как правило, являются автосемаитической (субъектной) частью данного с ССЦ (а отсюда и метаинформативной его частью). Предикатная (синсемантичная) часть ССЦ преимущественно не экстрагируется, а именно она-то и обладает наибольшей информативностью. Таким образом, хотя взятые вне контекста первичного документа экстрагируемые фразы в большинстве своем носят характер информативных фраз, на са­мом деле они в значительной степени метаинформативны, поскольку характеризуют тему фрагмента (содержательного аспекта, ССЦ и документа в целом), т. е. создают у потребителя информации некоторое представление о содержании первичного документа и определяют характер его решения относительно целесообразности об­ращения к первоисточнику (при этом, конечно, не исключаются, в порядке казуистики, случаи, когда экстрагированные фразы смогут удовлетворить потребность того или иного специалиста без необходимости обращения к первичному документу). Вот почему, несмотря на внешнюю информативность ряда экстрагируемых фраз, метод в целом рассматривается автором как метаинформативный.

Существует, правда, возможность повышения «уровня» информативности экстрагируемых фраз за счет одновременного извлечения с ними фраз уточняющих, детализирующих, связанных друг с другом коннекторами, т. е. за счет «наращивания» маркированной фразы. . . Но об этом ниже. И это уже, пожалуй, область не столько реферирования, сколько фрагментирования текстов (информативного свертывания).

Для практической реализации идеи, заложенной в описывае­мом здесь методе квазиреферирования (в «ручном» и «машинном» вариантах), были разработаны два «инструментария» - лексиче­ский аппарат экстрагирования и методика экстрагирования (алго­ритмы) .

Лексический аппарат - список словесных клише - состоит из трех подсписков - маркеров, индикаторов и коннекторов. По­нятие «маркер» во многом сходно с таким явлением языка научной литературы, как «стандарт» - «словосочетание, структурно закрепленное речевой практикой в результате многократного использования с одним и тем же, четко фиксированным смыслом» . Отличительная черта маркера - его связь с опреде­ленным содержательным аспектом. Отсюда можно дать такое опре­деление: маркер - это словесное клише (слово, словосочетание), однозначно обозначающее (идентифицирующее) тот или иной ас­пект первичного документа. Например, аспект Целевая установка достаточно часто и точно характеризуется маркерами Цель. . ., Целью. . .является , аспект Предлагаемый вариант решения - маркерами Предлагаемый. . .основан, В работе предлагается. . ., аспект Особенность предлагаемого варианта решения - Особенностью. . .является, Особенность. . .заключается и т. п.

Как правило, маркеры состоят из двух частей - ядерного слова и лексического сопровождения. Каждое ядерное слово и лексическое сопровождение могут иметь свой класс синонимии (условной эквивалентности). Ядерные слова, встречающиеся в тексте без за­фиксированного в словаре лексического сопровождения, маркера не образуют, т. е. являются лжемаркерами.

В результате анализа массива первичных документов были вы­явлены и систематизированы маркеры для различных аспектов в виде специального словаря. (Всего в нем маркеров, лексических сопровождений и их синонимов на данном этапе около 600). Этот словарь и является основным инструментом формализованного реферирования. В словаре в алфавитном порядке перечислены ядерные элементы маркеров (символ я.), лексические сопровожде­ния ядра (л. с), их синонимы (с.) и отсылки от синонимов к ядер­ным словам (см.). В качестве примера приведены отдельные фраг­менты алфавитной части словаря (а. означает аспект, прописными буквами выделены ядерные элементы):

Обычно в качестве ядерного элемента выступает так называе­мое характеристическое слово - слово, характеризующее, отра­жающее сущность смыслового аспекта. Однако в некоторых слу­чаях такая «характеристичность» не всегда явно проступает. В этих случаях ядерным словом считается то, на которое в данном аспекте «работает» несколько лексических сопровождений

В отличие от маркеров индикаторы не привязаны жестко к определенному аспекту (содержанию первичного документа): они указывают предложения, которым автор придает особое значение (следует подчеркнуть, необходимо отметить, важно обратить

внимание и т. д.).

Коннекторы, как уже упоминалось выше (см. 2.2.2), лексиче­ские единицы, указывающие на связь маркированного предложения с предыдущем или последующим, Коннекторы, указывающие на связь с предыдущим предложением, так называемые анафорические коннекторы типа указанный, такой, этот, упомянутый и т. п., были названы нами «коннекторы типа X», указывающие на связь с последующим предложением - в частности, например, следовательно, кроме того и т. д. -«коннекторы типа У»

Как уже упоминалось, эксперимент по формализованному реферированию проводился в двух вариантах: сначала в «ручном», затем в машинном. В «ручном» варианте первичные документы экстрагировались участниками эксперимента по формализованной методике, в машинном - использовалась машинная база ЦНИИ Информэлектро.

Методика «ручного» экстрагирования исходила из некоторых допущений и включала в себя следующие положения.

Допущения:

1. Процедуру экстрагирования фраз должен выполнять сотрудник информационной службы, хорошо владеющий методикой; метаинформативного свертывания, но обладающий самыми общими познаниями в той или иной тематической области. По этой причине процедура свертывания предусматривает одноразовое прочтение текста документа (без глубокого осмысления его содержания) и выписывание метаинформативных (и частично информативных) фраз на основе заданного в словаре перечня маркеров и индикаторов. Иными словами, предложенный метод предусматривает минимальную интеллектуальную переработку информации, что должно значительно ускорить и удешевить процесс реферирования.

2. Полученная в результате экстрагирования «заготовка» для реферата, состоящая из отдельных фраз, подлежит - на соответствующем участке технологического процесса - постредактированию специалистом данной отрасли знания (в общем случае без обращения к первоисточнику). Постредактирование должно включать: выяснение осмысленности полученной заготовки, стилистическое редактирование - устранение лексических повторов, лишних слов и словесных оборотов, включение необходимых связок для улучшения «читабельности» реферата-экстракта, а также исключение смысловых повторов, например когда в конечных результатах повторяются результаты промежуточные.

В случае, если полученная заготовка с точки зрения специалиста осуществляющего постредактирование, не способна выполнять аннотативные фукции вторичного документа, первоисточник направляется на участок интеллектуального реферирования.

3. Полученный в результате экстрагирования вторичный документ в принципе должен быть хуже реферата, созданного квалифицированным специалистом на основе чисто интеллектуального метода, но достаточно информативным для выполнения им своих функций.

4. Полученный в результате экстрагирования вторичный документ может выполнять несколько функций, прежде всего поисковую, т. е. служить основой для индексирования документов, вводимых в информационно-поисковые системы. В этом случае заготовка используется без постредактирования. Помимо поисковых, реферат-экстракт может выполнять (в зависимости от качества заготовки и решаемых в процессе свертывания задач) также аннотативные и реферативные функции. В этих случаях заготовка подлежит постредактированию, в процессе которого соответственно формируют справочную либо реферативную аннотацию, иногда и реферат. Таким образом, приступая к постредактированию заготовки, специалист должен, исходя из целевой установки и характера содержащихся в заготовке фраз, формировать вторичный документ в виде либо аннотации, либо реферата. Положения:

1.Референт бегло просматривает текст документа и, руководствуясь словарем маркеров и индикаторов, выписывает на особом бланке предложения, содержащие эти клише. Предложения с индикаторами выписываются только в том случае, когда референт считает, что одних маркированных предложений недостаточно.

2.Если маркированное предложение включает в себя коннекторы-заместители типа эти, такие, подобные, поставленные, вышеприведенные и т. п., антецеденты которых находятся вне пределов предложения (например, В настоящей работе предлагается более строгое решение поставленной задачи), то делается «шаг назад» и выписывается предыдущее предложение. В этом случае в реферат-экстракт включаются два предложения.

3.Если после маркированного предложения идет уточняющая фраза, содержащая коннекторы-уточнители так, например, при этом, в частности, в том числе, следующий и т. д., и если референт считает его содержательно недостаточно информативным, то делается «шаг вперед» и выписывается фраза с коннектором. И в этом случае в реферат-экстракт включаются два предложения - с маркером и коннектором.

Как видно из описания методики, строго формализованным в описываемом эксперименте было только употребление маркеров; употребление индикаторов и коннекторов в значительной мере регулировалось содержательными соображениями реферирующего.

По описанной выше методике было проэкстрагировано 250 статей по электротехнике (150) и информатике (100). 19 Всего получено 222 экстракта, однако все они нуждались в постредактировании с целью устранения лексических и смысловых повторов, лишних слов и оборотов, включения необходимых связок между фразами и пр. Поэтому мы назвали такие экстракты заготовками. Постредактированию были подвергнуты 40 случайным образом выбранных заготовок по электротехнике. Оказалось, что постредактирование осуществляется достаточно единообразно и требует в среднем более 5-7 мин на каждую заготовку. Сопоставление получений вторичных документов по объему показало, что средний объем «ручных» заготовок составляет 123 слова (9-11 предложении постредактированного реферата-экстракта - 57.6 слова (4-6 предложений); объем рефератов этих же документов из РЖ - 45.5 слова (3-4 предложения). По полноте отражения аспектов рефераты-экстракты не уступают рефератам РЖ ВИНИТИ «Электротехника и энергетика» (в среднем по 1.6 аспекта).

Роль коннекторов и индикаторов в описываемом эксперименте

оценивалась при анализе 75 произвольным образом выбранных

рефератов-экстрактов по электротехнике. 20 Анализ этих документов показал, что объем реферата-экстракта, содержащего индикаторы и коннекторы, увеличивается в среднем на 1.6 предложения. Всего было экстрагировано из этих документов 825 предложений, т. е. в среднем на документ около 11 предложений, наимень­шее число фраз 2, наибольшее - 28; из них маркированных предложений было 698, извлеченных с помощью коннекторов, т. е. процедурой «шаг назад» и «шаг вперед», - 63 (37 и 26 соответственно), а с помощью индикаторов - 64. Таким образом, на долю коннекторов и индикаторов приходится примерно 16% всех экстрагированных фраз. При этом, как выяснилось, большинство индикаторов (прежде всего типа таким образом, которые встретились в 80% случаев) позволяет экстрагировать фразы, относящиеся к аспектам Предлагаемый вариант решения и Выводы, т. е. к наиболее важным аспектам в содержательной структуре первоисточника.

Для оценки устойчивости методики формализованного реферирования был поставлен контрольный эксперимент по проверке однозначности выбора фраз из первичных документов тремя референтами. Анализу подверглись 30 статей по электротехнике, на которые было составлено 90 рефератов-экстрактов. Для каждого реферата-экстракта подсчитывался коэффициент пересечения, т. е. отношение числа совпадающих предложений, отобранных каждым референтом, к числу предложений эталонного реферата-экстракта. Результаты эксперимента показали, что этот коэффициент пересечения по всем документам у трех референтов довольно высок- 88-90%.

«Ручной» вариант эксперимента рассматривался как первый шаг в направлении алгоритмизации процедуры реферирования, с последующим переходом к машинному варианту. Однако «ручной» вариант имеет самостоятельное значение в качестве метода алгоритмизованного интеллектуального реферирования. Использование маркеров, как показали исследования сотрудника нашего коллектива Н. И. Гендиной , значительно облегчает и убыстряет процедуру интеллектуального реферирования, позволяет выполнять ее не специалистом той или иной области знания, а квалифицированным библиографом, владеющим техникой реферирования. Получаемые на основе описываемого «полуавтоматизированного» метода рефераты сравнимы по качеству с рефератами из РЖ, но подготавливались в три раза быстрее, чем принято по нормам для реферирования (согласно нормам время на реферирование одной статьи на русском языке составляет 1 час).

Методика машинного экстрагирования предусматривала проведение эксперимента в два этапа - с учетом только маркеров и с учетом как маркеров; так коннекторов и индикаторов, а также так называемого машинного постредактирования. Машинному экстрагированию на первом этапе подвергалось 150 первоисточников. Методика машинного экстрагирования на последующих этапах эксперимента предполагает реализацию двух «алгоритмов», двух групп требований к программному обеспечению квазиреферирования: «алгоритма А» - опознания фраз в тексте и «алгоритма В» - машинного постредактирования полученного экстракта.

«Алгоритм А» должен предусматривать экстрагирование из текстов фраз, содержащих все маркеры (где 1 - 3 - семантические блоки: 1 - введение, 2 - основное содержание, 3 - заключение), все коннекторы и все индикаторы, последние неза­висимо от их места в тексте.

В случае «алгоритма А» предварительно производится нумерация фраз в тексте и индикация подзаголовков, подписей под рисунками, заглавий таблиц. Каждая экстрагируемая фраза выпечатывается со своим номером. Маркеры, коннекторы и индикаторы задаются списком. Коннекторы работают следующим образом: 1) если маркированная фраза 21 содержит коннектор типа Х, делается «шаг назад» и выпечатывается предыдущая фраза; 2) если в предыдущей фразе содержится снова коннектор типа X, делается еще «шаг назад» и выпечатывается вторая предыдущая фраза; 3) если в предыдущей фразе содержится снова коннектор типа X, делается еще «шаг назад» и выпечатывается третья предыдущая фраза; 4) если следующая за маркированной фразой содержит коннектор типа У, делается «шаг вперед» и выпечатывается последующая фраза; 5) если следующая за последующей фразой содержит коннектор типа У, делается еще «шаг вперед» и выпечатывается вторая последующая фраза.

Наряду с маркированными, индикаторными и коннекторными фразами выпечатываются все подзаголовки и три (если они есть) последующие фразы после маркированной маркерами блока а. 3 .

Таким образом, «алгоритм А» предполагает экстрагирование «на полноту» - по максимуму.

В случае «алгоритма В» предусматривается введение ограничения на «алгоритм А» с целью повышения точности экстрагирования. Это, как уже указывалось, алгоритм машинного постредактирования. 22 Этот «алгоритм» предполагает: 1) исключение из предписания маркеров либо а 1 , либо а 2 и а 3 , либо а 1 и а 2 ; 2) исключение из предписания условия: если маркированные фразы относятся к блоку а 3 , то выпечатываются три последующие фразы; 3) введение в предписание условия: если немаркированные фраз содержат индикаторы, то на печать выводятся индикаторные фраз первых двух или последних двух абзацев; 4) введение в предписание условия: если в тексте встречается индикатор типа Приложение, то последующий за ним текст экстрагированию не подвергается; 5) введение в предписание условия: если в тексте ветречаются предложения, набранные петитом, то данные предложения экстрагированию не подвергаются; 6) введение в предписание условия: если индикаторные предложения следуют за предложениями, маркированными маркерами а 3 , то маркированные фразы на печать не выводятся; 7) введение в предписание условия если маркер X встречается в фразе с допольнительным лексическим сопровождением У (типа на рис., в табл., на графике и т. п.) то данное предложение на печать не выводится (см. с. 130). -

Заключая рассмотрение предварительных результатов автоматического реферирования в «ручном» и машинном вариантах по описанному выше методу, необходимо отметить следующее.!

1. Недостатком данного метода является его нестопроцентная работоспособность. В лучшем случае поддается экстрагированию 90 - 95% статей. Можно искусственно создать статью, которую машина «не заметит». Однако особенность научной речи (ее логика, лексика, фразеология и др.) такова, что она содержит в себе широкий спектр метаинформативных единиц, позволяющих в большинстве случаев через форму (функциональные единицы) «выйти» на содержание документа и отразить его сущность в некотором наборе предложений.

2. «Пока еще не построена полностью формальная система правил, позволяющих проводить морфологический, синтаксический и семантический анализ произвольных естественных текстов. По данной причине в настоящее время вряд ли можно обойтись без участия человека, и это ставит проблему оптимального распределения работы между людьми и машиной при выполнении смыслового анализа естественных текстов» , т. е. включение в технологическую цепочку подготовки рефератов редактора, осуществляющего оценку качества машинной заготовки и ее постредактирование, а также референтов, обеспечивающих интеллектуальное реферирование источников, «не поддавшихся» автоматизированному свертыванию.

Для сравнения приводятся примеры квазирефератов (машинных экстрактов), полученных «ручным» и машинным способами, в сопоставлении с рефератами из РЖ ВИНИТИ (пример 1, 2).

На основе полученной по относительно полному 23 предписанию (алгоритму) заготовки реферат-экстракта можно составить несколько вторичных документов различной степени свернутости (как, впрочем, и несколько рефератов на основе интеллектуального реферирования первоисточника, рефератов, отличных от опубликованного в РЖ). Достаточно информативной, по нашему мнению, будет реферативная аннотация, составленная только на основе трех предложений (5, 6, 45-е) (что может быть предусмотрено алгоритмом машинного постредактирования):

Излагаются результаты работы по созданию оптимальной рецептуры эпоксидно-полиэфирного лака ПЭ-970, изготовляемого на основе эпоксид­ной смолы и трифункциональной эфирокислоты - триадппината триметилолпропана. Высокие электрические и механические свойства лака обеспечивают получение гибких, эластичных лент, пригодных для термореактивной изоляции высоковольтных электрических машин напряжением до 6 кВ.

Эту реферативную аннотацию можно при желании развертывать путем включения в нее дополнительных предложений из заготовки.

Сравним, однако, полученную заготовку с рефератом из РЖ.

1. Заготовка включает 16 предложений, реферат из РЖ - 8. Если исключить 4 экстрагированных предложения, относящихся к называемому нами блоку 1 (ИВР), который практически не отражается в реферативном потоке РЖ, то объем заготовки сократится до 12 предложений. Являются ли оставшиеся 4 предложения (по сравнению с 8 в реферате из РЖ) избыточными (шумовыми); судить трудно, так как они содержат существенную информацию.

2. Из 8 предложений реферата РЖ только 2 (2-е и 7-е) отсутствуют в заготовке, при этом 7-е предложение носит фактографи­ческий характер. Сведения из остальных 6 предложений реферата РЖ на большем или меньшем уровне перефразирования мы нахо­дим в заготовке реферата-экстрата. Таким образом, рассматри­ваемые рефераты вполне сравнимы. 24 Однако, как уже указывалось, сопоставлять между собой рефераты одного и того же документа - процедура достаточно рискованная, поскольку слишком велик здесь прагматический момент, тем более сложно сопоставлять рефераты и квазирефераты. Четкими объективными критериями этой процедуры мы пока не располагаем. Более реальным является сопоставление между собой аннотаций (естественно, так на один и тот же документ), так как аннотацию (в отличие от реферата) можно рассматривать как более или менее изоморфную модель первичного документа.