. Некоторые способы изучения и моделирования организации научного знания
Некоторые способы изучения и моделирования организации научного знания

Некоторые способы изучения и моделирования организации научного знания

Аннотация: Настоящая статья посвящена рассмотрению наиболее популярных на сегодняшний день форм структурирования знания (семантическое поле, графосемантическое моделирование, фрейм, матрица, семантическая сеть, онтология, экспертная система), изучению и сравнению разнообразия их построения, предоставляемых возможностей. Анализируемые в работе модели насчитывают как общие, так и различные стороны, которые, в первую очередь, проявляются в решаемых ими задачах. Основным вектором исследования стало рассмотрение данных моделей через призму их применимости для структурирования научного знания. Поставленные задачи решались с помощью метода дефиниционного анализа, сравнения, приемов обобщения и интерпретации полученных данных, благодаря которым были определены преимущества и недостатки рассматриваемых моделей. Сравнительный анализ и дедуктивный подход исследования позволили установить, что одной из наиболее удачных моделей для изучения системности и характера связей между единицами терминосистемы является терминологическая сеть. Данное заключение и предложенная аргументация во многом объясняют обращение авторов к терминологической сети как модели представления научного знания в процессе дальнейшей исследовательской работы.

Ключевые слова: термин, научное знание, модель представления знания, семантическое поле, графосемантическое моделирование, фрейм, матрица, семантическая сеть, онтология, экспертная система

Публикация выполнена в рамках реализации проекта "Разработка лингвистических принципов проектирования и создание экспертной системы представления элементов научного знания на основе конструирования терминологических семантических сетей" по проектной части государственного задания Министерства образования и науки РФ на 2017-2019 гг." (№34.3234.2017/ПЧ)

Abstract: The given article is devoted to some most popular modern forms of knowledge structuring (semantic field, grafosemantic modeling, frame, matrix, semantic network, ontology, expert system). The authors of the article analyse the variety of their constructions and the opportunities they give. The analyzed models have some common and different features in their main tasks. The basic methods of the research include methods of generalization and interpretation of obtained data, comparison and definitional analysis which determined the advantages and the disadvantages of the analyzed models. Comparative analysis and deductive approach provided insight into one of the most successful models of scientific knowledge structuring - terminological network – that ensures the study of system link between the terms. This conclusion and the offered evidence demonstrate why the authors regularly use the terminological network as the model of scientific knowledge representation in their research.

matrix, frame, grafosemantic modeling, semantic field, knowledge representation model, scientific knowledge, term, semantic network, ontology, expert system

Значительный объем существующего знания и его непрерывное расширение в разных научных областях, необходимость в быстром извлечении и обработке данных предопределили важность упорядочивания и моделирования элементов научной картины мира, поиск и разработку методов работы со специализированной информацией. Различные способы и модели представления знания, как научного, так и обыденного, характеризуются разнообразием построения, возможностей и спецификой решаемых задач.

Исследователи выделяют различные их классификации. Как отмечает М. А. Камынина, в самом общем виде последние могут быть разделены на два класса – теоретические, к которым исследователь, например, относит семантические сети, фреймовые модели и др., и эмпирические, например, формальные грамматики; нейронные сети занимают в понимании М. А. Камыниной промежуточное положение (подробнее см. [29, с. 59-68] ). «В основе построения эмпирических моделей лежит изучение принципов организации человеческой памяти и моделирования механизмов решения задач человеком. К группе теоретических моделей относятся механизмы представления знаний, достаточно строго описывающие объекты и ситуации, однозначно гарантирующие чёткость процесса принятия решений, однако требующие значительных затрат ресурсов и времени» [29, с. 60] .

Т. А. Гаврилова, Н. В. Гулякина разделяют методы структурирования знаний на визуальные и символьные [17] . «Символьные методы опираются на математическое, либо текстовое, либо табличное описание знаний, и чаще применяются в хорошо структурированных предметных областях». В слабоструктурированных предметных областях «имеется большая вариация методов, обусловленная сложной спецификой знаний каждой из областей, оттого предлагающей свои методы и подходы» [17] .

Настоящая работа посвящена рассмотрению некоторых форм представления знания через призму их применимости для структурирования научного знания.

1. Семантическое поле

Представление о существовании в языке определенного количества семантических групп, в которые могут быть определены все лексические единицы языка, обсуждалось еще в лингвистических трудах XIX в., например, в работах М. М. Покровского (1868/69–1942) [75] . Однако наибольший резонанс данная теория получила с появлением работ Й. Трира и впоследствии была дополнена и развита следующими поколениями лингвистов (см. Г. С. Щур [53] , Ю. Д. Апресян [4] , В. Г. Гак [19] , Л. М. Васильев [14] , Ю. Н. Караулов [31] , А. В. Бондарко [13] и др.).

Под семантическим полем Ю. С. Маслов понимает некоторое «множество лексических единиц, точнее – их значений, связанных с одним и тем же фрагментом действительности» [37, с. 96] . Объясняя определение семантического поля, предложенное З. К. Тарлановым (1988) [50] , И. Н. Рубцов под полем понимает «совокупность значений слов», что сближает данную им трактовку с определением Ю. С. Маслова. Однако по И. Н. Рубцову значения объединены «общностью определенной понятийной сферы языка» (подробнее см. [44] ). И. Н. Рубцов также подчеркивает, что причастность лексических значений к конкретному полю определяется их общими семантическими, структурными и функциональными свойствами. Данный факт отражен и в определении семантического поля, данном В. П. Абрамовым, который добавляет, что единицы поля связаны различного рода повторяющимися регулярными отношениями и могут быть дифференцированы стилистически, а саму совокупность значений слов понимает как лексико-семантическую категорию [1, с. 67-68] .

Попытка реализации данного способа систематизации на различном языковом материале привела к дифференциации семантических полей на несколько типов: мотивационные поля, грамматико-лексические поля, фразео-семантические поля, вариационные поля, лексико-семантические поля (подробнее о типах полей см. [33, c. 173-178] ). Особое место в этой классификации занимает терминологическое поле, поскольку данная модель объединяет специальные наименования профессиональной сферы деятельности [27] . Как отмечает А. В. Суперанская, «терминологическое поле – это искусственно очерченная и специально охраняемая от посторонних проникновений область существования термина, внутри которой он обладает всеми характеризующими его признаками, отличающими термин-слово от обычных слов» [48] . В этом определении понятие «терминологическое поле» сближается с понятием «терминология». Как модель систематизации терминологического аппарата и репрезентируемого им научного знания, терминологическое поле включает общие с другими типами полей структурные элементы: ядро и периферию. При этом иногда также выделяют ядерную область, а периферия подразделяется на ближнюю и дальнюю. В зависимости от признаков, положенных в основу стратификации языкового материала, и решаемых задач данные структурные элементы получают разное наполнение.

Е. В. Иванова, рассматривая подъязык аффинажного производства в виде терминологического поля, к ядру относит сам термин аффинаж , к ядерной зоне – его производные и термины-словосочетания, в составе которых он или его словообразовательные варианты используются в качестве терминоэлементов; к ближней периферии – видовые термины к гиперонимам из ядерной зоны и наименования готовой продукции аффинажного производства; к дальней периферии исследователь относит терминологические микрополя, такие как «наименования сырья» (подробнее см. [27] ).

Понятийный принцип положен в основу построения терминологического поля компетенция М. Г. Заседателевой. Основываясь на понятийной организации терминологического поля, автором было произведено деление поля на макрополя (например, субъект, объект, цель, результат ), в каждое из которых были помещены термины, характеризующие определенное понятие. Макрополя на основе дефиниционного анализа ключевого для каждого макрополя термина поделены на субполя (например, уровни формирования компетенций, контроль ), которые, в свою очередь, после проведенного семантического анализа, были разделены на микрополя (в частности, в макрополе объект микрополями считаются – иностранный язык, диалог культур, культура ) (подробнее см. [26] ). Таким образом, терминологическое поле компетенция отражает логически последовательную иерархию связей между терминами по принципу МАКРОПОЛЯ à СУБПОЛЯ à МИКРОПОЛЯ.

Следовательно, в основу распределения терминов по областям терминополя могут быть положены весьма разные критерии и выделяемые признаки, исходя из авторской интенции и предпочтений. Терминологическое поле делает возможным систематизацию терминологических единиц по группам в соответствии с определенными признаками или яркостью их проявления. В этой связи данная модель позволяет рассмотреть именно определенную общность терминов, а не отдельно взятую единицу и ее положение относительно определенного круга смежных терминов, напрямую связанных с ней понятийными связями. По этой причине, как справедливо отмечает М. Х. Попов, отдельный термин в составе терминополя не имеет строго определенного места и лишь входит в его состав [41] .

Итак, элементы, обладающие сходным смысловым наполнением, объединяются в группы и образуют семантические поля, которые, в свою очередь, могут являться составляющими графосемантической модели.

2. Графосемантическое моделирование

«Графосемантическое моделирование (автором которого является К.И. Белоусов) представляет собой метод графической экспликации структурных связей между семантическими компонентами одного множества» [7, c. 40] . Как объясняют К. И. Белоусов и Н. Л. Зелянская, настоящий метод «позволяет представить набор данных (выборку, целостность) в виде системы, в которой каждый из компонентов имеет четкую иерархическую и топологическую определенность по отношению к другим компонентам и всей системе в целом, … что позволяет интерпретировать каждый компонент системы» [7, c. 40] . Наличие связей между компонентами является основным условием для построения графа и возможности использования описываемого метода. «Характер связей может заметно различаться: они либо обусловливаются специфическими особенностями целого, либо реконструируются с помощью статистической обработки и интерпретации результатов» [6, c. 63] .

К. И. Белоусов, Н. Л. Зелянская предлагают следующий пошаговый алгоритм проведения графосемантического моделирования: проведение компонентного анализа определений термина с целью «выявления сущностных черт термина» [6, c. 44] ; проведение полевого анализа (на основании выделенных компонентов); обнаружение основных связей между полями в пределах выборки определений; графическая экспликация результатов анализа; интерпретация полученной модели [6] . К. И. Белоусов отмечает, что «данный метод имеет широкое поле приложения». В частности, метод использован автором в процессе изучения принципов семантической организации текста, при исследовании функционирования системы литературоведческих категорий в рецептивных пространствах учительского и филологического микросоциумов, в лингвомаркетологии для анализа языковой презентации продукта с целью выявления системы перспективных и неперспективных наименований [7, c. 41] .

Анализируя концепт «Водка», К. И. Белоусов и Н. Л. Зелянская исследуют наименования данного товара, выделяют смысловые компоненты, входящие в название продукта, на основании которых выявляют наиболее частотные смысловые поля, образуемые компонентами, и определяют валентность полей. «Смысловые компоненты, сформировавшие поля, представляют собой закономерные и регулярно воспроизводимые ассоциативные реакции на предложенные словесные комплексы» [7, c. 45] . Заметим, что в предложенной исследователями модели отмечается только наличие связи без указания ее специфики.

В отличие от графа определенного концепта, основными составляющими которого выступают семантические поля, компоненты значений, входящих в эти поля, связи между компонентами, семантический граф текста состоит из собственно лексем, употребляемых в данном тексте. Лексемы образуют структуры, в каждой из которой присутствует ядро, к которому стремятся все компоненты структуры. Среди исчисленных структур выделяется доминантная структура. Компоненты построенного учеными графа связаны между собой или семантической связью, или ассоциативной связью, что определяется анализом ответов, полученных от опрашиваемых информантов. Графосемантическая модель, предложенная в исследовании К. И. Белоусова, Д. А. Ичкинеевой, строится на устойчивой семантической связи между элементами текста. Ученые подчеркивают, что «статистически значимые презентанты интерпретационных стратегий информантов, представленные в виде графосемантической модели, отражают доминантные смыслообразовательные тенденции в тексте, а потому обладают интерпретационной силой универсального характера» [8, c. 37-38] .

Метод графосемантического моделирования используется и для модельного представления терминов, в частности в работе Л. Г. Романовой, посвященной анализу термина ПЕРЕВОД (подробнее см. [43] ). Следуя пошаговому алгоритму проведения графосемантического моделирования, предложенному К. И. Белоусовым, Н. Л. Зелянской и упомянутому выше, Л. Г. Романова из дефиниций термина ПЕРЕВОД , используя компонентный анализ, выявляет понятийные компоненты-единицы. Исчисленные понятийные компоненты-единицы благодаря полевому анализу группируются в понятийные поля (в частности, текст, речь, процессуальность, передача, средства ), и строится граф. По сути, графосемантическая модель темина представляет собой набор понятийных полей описываемого термина с отражением наличия и степени проявления связей между полями, т. е. их валентности [43] .

Следовательно, результатом графосемантического моделирования является не определение места термина в соотношении со смежными терминами, их взаимосвязи и отношений между ними, а анализ понятийных областей термина.

«В инженерии знаний фреймом называется структура для описания стереотипной ситуации, состоящая из характеристик этой ситуации, называемых слотами, и их значений» [30, c. 24] . «Фреймы являются структурами представления знаний о некотором фрагменте внеязыковой действительности, и в качестве таковых они не даны нам в непосредственное ощущение и должны быть реконструированы в ходе анализа языкового материала» [9, c. 20] . Как отмечает Е. Г. Беляевская, «наиболее часто цитируемой является точка зрения Ч. Филлмора, который определял фрейм как «любую систему концептов, связанных между собой таким образом, что для того, чтобы понять любой из концептов, необходимо знать всю систему, в которую он входит»» [56, c. 111, цит. по 9, c. 18] . Данное определение представляется особенно значимым в отношении научного знания, которое конструируется и носит системный характер.

От всех прочих моделей фреймы отличаются особенностями их построения. Элементами фреймовой структуры являются базовые и опорные концепты, субфреймы, слоты, подслоты, ярусы и терминалы. Как отмечает Т. А. Сытникова, «выявление элементов фреймовой структуры терминосистемы опирается на определение основных концептов данной предметной области, в совокупности составляющих ядро терминосистемы и ее концептосферу» [49, c. 255] . При этом сама структура фрейма иерархична и может содержать субфреймы в свою очередь делимые на слоты, расположенные на разных ярусах такой классификации. Содержание опорных и базовых концептов раскрывается посредством единиц терминологической лексики, которые заполняют слоты модели. При этом, «фрейм любой терминосистемы можно рассматривать в качестве своеобразной иерархической лестницы субфреймов, что позволяет вывести нижестоящий фрейм из вышестоящего» [2] . В этой связи обращает внимание точка зрения Т. А. Сытниковой, что терминологические единицы терминосистемы могут одновременно относиться к разным базовым концептам [49] . Как отмечают Л. М. Аллафи, Ф. А. Тугушева и А. О. Балкарова, построение фрейма позволяет установить составные части науки, их иерархическую структуру, а также выявить средства языковой объективации фреймового представления области специального знания [2] . Иерархическая структура предполагает наличие родовидовых отношений, которые, согласно И. Б. Тихоновой, «успешно выявляются в процессе построения фреймовой структуры терминосистемы» [51, c. 179] .

Также следует отметить, что в качестве опорных концептов, субфреймов или слотов не всегда выступают именно терминологические единицы. Так, Л. В. Ивина, анализируя терминологию венчурного финансирования, в качестве опорных концептов выделяет «организация венчурного бизнеса», «динамика процесса инвестирования», «процесс реализации проекта» и др. [28] . Рассматривая фрейм «Нефтепереработка», И. Б. Тихонова указывает на существование таких слотов, как «Процессы нефтепереработки», «Нефтеперерабатывающее оборудование», «Вещества, участвующие в процессе нефтепереработки», «Характеристики процессов, оборудования и веществ», «Методы и приемы нефтепереработки», которые, по мнению исследователя, «включают в себя другие фреймы, подфреймы и слоты более низкого уровня» [51] . При этом у разных исследователей могут наблюдаться отличия в построении фрейма терминосистемы, представленности тех или иных элементов (наличие или отсутствие субфреймов, подслотов, терминалов), их организации в иерархической структуре, ими могут вводиться новые элементы структуры в рамках собственного авторского подхода. Например, Л.В. Ивина использует оба понятия опорный концепт и базовый концепт в отношении «субъектов инвестирования», «объектов финансирования» [28] . Как отмечает О. В. Гусельникова, «в ходе анализа работ, в которых используется категория фрейма, были выделены вариации фреймовой структуры, которые демонстрируют различные взгляды исследователей на терминологический аппарат категории фрейма и его смысловое наполнение» [22, c. 146] .

Одним из методов моделирования, пришедших в лингвистику из смежных наук, а именно математики, считается матричный подход, который «предполагает стандартизацию исследовательских процедур и представления материала» [21, c. 63] . Термин «матрица» применительно к лингвистическим исследованиям использовался в работе уже 1935 г. (G. K. Zipf «The Psycho-Biology of Language: An Introduction to Dynamic Philology» [73, p. 282, 303, 307] ), на что ссылаются и С. В. Гринев-Гриневич, Э. А. Сорокина, указывая, что «в конце XX в. появился матричный подход к инвентаризации и представлению лингвистических методов исследований» [21, c. 63] .

В общем видении под матрицей понимается таблица, состоящая из совокупности столбцов и строк, пересечения которых образуют ячейки, заполняемые в процессе лингвистического исследования определенными значениями или элементами знания. На высокую эвристическую ценность в анализе материала при помощи матриц указывала И. В. Арнольд [5] . Матрица, где значение каждой строки представляет определенный языковой знак, а значения столбцов эксплицируют набор признаков, формирует индивидуальную карту для каждого языкового знака на основе представленности тех или иных свойств, что удобно не только для их сопоставления (например, представленное в матричной форме разграничение типов специальных лексических единиц [20, c. 47] ), но также автоматической обработки и извлечении знания, как это, например, применяется при распознавании буквенных символов, написанных разными шрифтами [47, c. 553] . Как и поле, матрица сообщает информацию о признаках анализируемых объектов, однако в отличие от данной модели представления знания, она также показывает и различия, существующие у объектов, которые могли бы быть отнесены к одной области полевой структуры.

Несколько отличным видится понятие когнитивной матрицы, которое было впервые применено Р. Лэнекером «для описания конфигурации знания, служащей основанием значения языковой единицы» [60, c. 147, подробнее см. 12] . Построение когнитивной матрицы является результатом когнитивно-матричного анализа. Сегодня концепция этого метода анализа активно развивается в работах Н. Н. Болдырева, согласно которому, «когнитивно-матричный анализ, направлен на выявление и описание системы когнитивных контекстов или концептуальных областей, лежащих в основе формирования значений языковых единиц» [12] .

Когнитивная матрица трактуется как «система взаимосвязанных когнитивных контекстов или областей концептуализации объекта, которая не предполагает их одновременное иерархическое ассоциирование с тем или иным словом или концептом» [10, с. 47] , как совокупность доменов одновременно предполагаемых концептом (например, домены физические объекты, живые организмы, агенты волеизъявления и др. для концепта ЧЕЛОВЕК) [46] . Н. Н. Болдырев выделяет два структурных типа когнитивной матрицы – общий и частный. «Когнитивная матрица общего типа представлена словами, передающими многоаспектное знание, что вызвано необходимостью передать такое строение сложного концепта (концептуальной структуры), существенной чертой которого является интегративность и, в то же время, опциональность его элементов. Концепты организованы в виде массива данных, для которого наличие той или иной ячейки является факультативным, но наличие хотя бы двух ячеек – обязательным. Частная когнитивная матрица представляет собой систему осмысления конкретного элемента (ядра) в разных когнитивных контекстах» [12, 10] . Н. Н. Болдырев, В. В. Алпатов указывают, что знания, отражаемые когнитивной матрицей, «нельзя отнести к числу стереотипных знаний, ассоциированных с определенной языковой формой» [12, с. 6] . Когнитивная матрица может строиться по полевому принципу, где ядром является объект мысли, а периферию образуют когнитивные контексты [12, с. 6-7] , как области осмысления характеристик ядра [42] . Когнитивные контексты в структуре когнитивной матрицы «представлены в виде набора ее компонентов» [12, с. 7] , «их невозможно свести к определенным типам и общим закономерностям», они сами «могут представлять собой многокомпонентные матрицы, например: нравы, традиции, обычаи, ценности – в отношении культуры» [12, с. 6] .

Н. Н. Болдырев отмечает следующие существенные отличия между когнитивной матрицей и другими типами когнитивного контекста, в частности, - фреймом [11] . Иерархически организованная структура, которой является фрейм, состоит из обязательных и факультативных компонентов. В когнитивной матрице иерархичность отсутствует, а компоненты «открывают доступ к разным концептуальным областям, ни одна из которых не является строго обязательной или доминирующей по отношению к другим» [11] . Фрейм представляет собой «единый когнитивный контекст, целостную структуру», передает «стереотипное знание о ситуации, ассоциированное с определенным концептом». Когнитивная матрица, отражая «единый сложный концепт», демонстрируя «знания о разных аспектах одного явления», является все же «системой разных когнитивных контекстов» [11] . Ученый отмечает, что «матричный формат обнаруживают единицы знания с нежесткой структурой», т.е. любой из компонентов частной матрицы может быть необязательным, но все они «в той или иной мере непременно служат осмыслению ядра» [12, с. 4] .

Демонстрируя графические отличия построения фрейма и когнитивной матрицы, Н. Н. Болдырев и В. В. Алпатов предлагают следующие базовые схемы двух описываемых способов представления знаний, отражающие принцип взаимосвязи компонентов.

Фрейм и частная когнитивная матрица [12, с. 8]

Наличие семантических отношений между составляющими структуры сближает фрейм с такими моделями организации научного знания, как семантическая сеть и онтология. При этом между ними прослеживаются несколько существенных отличий.

5. Семантические сети

Необходимость упорядочивания знаний определенной предметной области, переход к искусственному интеллекту и машинной обработке данных требуют наличия эффективных, ёмких, легко читаемых и редактируемых форм записи знаний. Сетевая модель знаний является наиболее общим способом представления знаний, отвечающим перечисленным критериям. Семантическая сеть – это система знаний, имеющая определенный смысл в виде целостного образа сети, узлы которой соответствуют понятиям и объектам, а дуги – отношениям между понятиями и объектами [52] . Иными словами, как модель организации знания сеть служит для отображения семантики предметной области в виде понятий (вершин сети) и отношений между понятиями (дуг, которые соединяют эти вершины). Именно последние и являются основными элементами такой сетевой структуры.

«Древнейшая известная семантическая сеть была создана в III в. н. э. греческим философом Порфирием в его комментариях к «Категориям» Аристотеля» [59] . Впервые семантические сети были применены в работах Сильвио Чеккато (1961) [54] , Ричарда Риченса (1956) [68] , Маргарет Мастерман (1961) [63] для определения типов концептов и структур отношений в системах машинного перевода [59] .

С. М. Вороной, А. С. Калинин, К. С. Охрименко отмечают следующий пошаговый порядок построения семантической сети на основе текстовых документов определенной предметной области: анализ разнородных данных из корпуса источников, извлечение концептов, извлечение семантических связей между ними, объединение этих элементов в семантическую сеть. Анализируя данный метод, ученые уточняют, что «на этапе извлечения концептов происходит выделение ключевых слов, выделение ключевых словосочетаний и группирование словосочетаний». Группирование ключевых слов также предполагает «нормализацию, фильтрацию на основе лингвистической информации (удаление стоп слов, имен собственных, чисел, дат, всего остального кроме существительных и прилагательных), ранжирование слов-кандидатов с использованием статистической информации» [16, с. 171] .

Заметим, что семантические сети широко используются для моделирования как обыденного (например, анализ рассказа А. П. Чехова «Дама с собачкой» с построением семантической сети рассказа в работе Т. В. Ефимовой «Анализ художественного текста с применением семантической сети» [25] ), так и научного знания. В последнем случае такие сети называются терминологическими, поскольку вершинами являются термины [36] , репрезентирующие понятия определенной области научного или профессионального знания. Отношения в данном случае показывают особенности взаимодействия конкретных элементов научного знания, что позволяет выделить ограниченный круг напрямую связанных смежных терминов и, таким образом, установить место термина в терминосистеме относительно других терминологических единиц.

Корпус отношений в обычной семантической сети может быть весьма разнообразным, например, связи типа часть – целое, функциональные связи (определяются глаголами типа «производит», «влияет» и др.), количественные отношения (больше, меньше, равно), временные отношения (раньше, позже, в течение …), связи типа «и», «или», «не» и др. [18] , но не все они являются прототипичными или значимыми для экспликации взаимодействия именно элементов научного знания. Стоит отметить, что при построении терминологических сетей спецификация отношений приводится не всегда или лишь небольшого их количества, например, родовидовых [45] (что сближает такой формат с фреймовой структурой), «это есть» (предполагает родовидовое отношение и отношение включения во множество) и «относится к», которое объединяет любые другие типы отношений [35] . Наша концепция построения терминологической сети предполагает обязательную дифференциацию и спецификацию типов отношений между понятиями, а также классификацию вершин на категории, поскольку, как показали исследования (подробнее см. [34, 61] ), для разных категорий понятий характерны и продуктивны разные типы отношений. Использование данных принципов построения терминологической сети позволяет не только установить круг смежных понятий, но также изучить характер системности, исходя из специфики элемента научного знания. В этой связи, одним из отличий, например, от фреймовой структуры является то, что терминологическая сеть в качестве составляющих включает только терминологическую лексику, предполагает равнозначный статус вершин, а не иерархичность как принципиальную основу, при этом, родовидовое отношение являются одним из определенных прототипичных связей, установленных между научными понятиями (например, термины категорий Локус, Характеристика могут не иметь ни гиперонима, ни гипонимов, репрезентируемыми терминами, однако обязательно связаны с терминами других категорий разными типами отношений). Построение такой модели не только позволяет детально изучить системность каждого отдельного термина в его взаимосвязи со смежными специализированными единицами, проанализировав характер таких отношений, но также выявить особенности организации и взаимодействия понятий разных типов и может быть использовано при разработке дефиниций терминологической лексики.

Возрастание роли компьютерных технологий, необходимость обработки и хранения значительных объемов в сети обусловили переход к машинным базам знаний с возможностью автоматической обработки. Как отмечают Б. В. Добров, Н. В. Лукашевич, М. Н. Синицын, В. Н. Шапкин, «в настоящее время перспективы организации более качественного, содержательного информационного поиска в сети Интернет связываются с разработкой онтологий» [24, с. 70] .

Изначально онтология – раздел философии, учение о бытии, термин введен немецким философом Р. Гоклениусом (1613) [74] . Наиболее общим и самым цитируемым определением онтологии по отношению к компьютерным наукам является определение Т. Грубера [подробнее см. 65, с. 3], согласно которому «онтология – это точная спецификация концептуализации» [57] . С течением времени понимание «онтологии» продолжало развиваться и трансформироваться ( [69],[72],[58] и др.) (подробнее см. [65],[24] ).

В самом общем виде, принципы построения семантических сетей и онтологий во многом схожи, что нередко приводит к отождествлению данных моделей представления знания. Как и сети, онтологии представляют собой «систему понятий некоторой предметной области, которая представляется как набор сущностей, соединенных различными отношениями» [38] . N. F. Noy, D. L. McGuinness называют «онтологией» формальное явное описание набора концептов внутри домена (классов (иногда именуемых концептами)), свойств и признаков каждого концепта (слотов (ролей или свойств)), и ограничений, наложенных на слоты (фацетов (ограничений ролей)) [67] , что сближает такое толкование с пониманием терминологической семантической сети. Ю.С. Верхотурова все же особенно выделяет статус родовидовых отношений, отмечая, что «онтология – это иерархически структурированное множество классов, описывающих предметную область, которое может быть использовано как основа для базы знаний» [15, c. 32] . Согласно классификации методов структурирования знаний, предложенной Т. А. Гавриловой, Н. В. Гулякиной и отраженной в начале настоящей работы, семантические сети представляют собой сетевой метод, в отличие от онтологий, являющихся иерархическим концептуальным методом [17, c. 16] .

Схожую точку зрения выражают Л. В. Найханова, Н. Н. Аюшеева, Н. Б. Хаптахаева, говоря о том, что «онтология предметной области представляется в виде иерархии, в корне которой находится терминосистема, а в узлах – номенклатура» [39, c. 51] , видимо, говоря об узлах как об элементах нижних ветвей иерархии. Согласно точке зрения И. В. Антонова, «онтология представляет собой иерархию понятий, характеризующих предметный мир, объекты которого соответствуют преимущественно понятиям нижних уровней онтологии, а промежуточный и верхний ее уровни представляют, как правило, абстракции различной степени обобщения» [3, c. 339] . N. F. Noy, D. L. McGuinness подчеркивают, что основным отношением в онтологии является родовидовое отношение между элементами, и отмечают наличие принципа наследования подклассами свойств класса, к которому они относятся [67] . Метод построения онтологии основывается и на знаниях, извлеченных из тезауруса, и на знаниях, извлеченных из корпуса текстов в полуавтоматическом режиме [66, c. 123] .

В сформированных N. F. Noy, D. L. McGuinness фундаментальных правилах построения онтологий отмечено, что 1) не существует единственно правильного способа моделирования предметной области; 2) развитие онтологии – интерактивный процесс; 3) концепты в онтологии должны быть близки к объектам (физическим или логическим) и отношениям в анализируемой предметной области. Вероятнее всего, это существительные (объекты) или глаголы (отношения) в предложениях, которые описывают данную предметную область [67] .

Состав онтологии представляется несколько более детализированным, чем фрейма и несколько более сложным, чем терминологической сети, поскольку в онтологию входят не только понятия, передаваемые терминами, но и знание, репрезентируемое нетерминологической лексикой. Структурными элементами онтологии являются: классы (понятия, которые могут содержать в себе другие классы и экземпляры), экземпляры (нижнеуровневые компоненты онтологий), атрибуты (признаки или информация об объекте, состоит из имени и значения) и отношения (зависимости между объектами формирующими классы и экземпляры. Заметим, что атрибуты, которые, например, передают информацию о свойствах объекта, выраженные терминами, в терминологической сети представляли бы собой независимые вершины.

A.-B. M. Salem, M. Alfonse отмечают, что онтология предназначена для рассуждения об особенностях домена и может быть использована для определения или обозначения домена, тогда как все семантические сети являются декларативными графическими представлениями [70, c. 769] . Демонстрируя данное различие, авторы, вероятно, стремятся подчеркнуть, что семантические сети являются контекстно независимыми в отличие от онтологий.

Объясняя принципы построения онтологий, демонстрируя построение онтологии концепта «Вино», N. F. Noy, D. L. McGuinness предлагают следующую пошаговую инструкцию:1) определение классов иерархии; 2) определение свойств / характеристик классов – слотов: для концепта «Вино», например, это цвет, вкус, содержание сахара, экстрактивность, производитель, местность, виноград и др.; 3) определение ограничений для слотов, которыми по Noy, McGuinness являются: мощность (количество элементов) слота, тип значения слота (строка, число, булевое / логическое значение слотов, нумерованные слоты, слоты-экземпляры), домен и диапазон значений слота (подробнее см. [67] ).

Нередко принципы построения онтологии весьма субъективны и находятся в тесной корреляции с областью научного знания, где выделяются весьма специфичные отношения, семантически значимые именно для данной сферы, которые не могут быть использованы для построения онтологии другой области. Такая детализация и использование знания, передаваемого терминами и нетерминами, нередко приводит к тому, что онтологии одной и той же области, составленные разными исследователями, могут существенно различаться. Конечно, существуют специальные программы для объединения онтологий, однако такой процесс нередко порождает большое количество ошибок из-за несоответствия иерархичности структур и элементов знания, которые могут иметь разный формат и статус, что отчасти проистекает из субъективных представлений. В терминологических сетях, которые включают только терминологическую лексику, встраивание новой вершины предполагает установление ее связей с уже существующими. Следует все же отметить, что использование знания передаваемого не только терминами, но и нетерминологической лексикой делает структуру онтологии более сложной, которая включает больший объем систематизированной информации.

7. Экспертные системы

Модели системного представления знания могут быть использованы для разработки специального программного обеспечения. «Экспертная система – это программа для компьютера, которая оперирует со знаниями в определенной предметной области с целью выработки рекомендаций или решения проблем» [23, c. 12] . Т. А. Гаврилова, В. Ф. Хорошевский определяют экспертные системы как «сложные программные комплексы, аккумулирующие знания специалистов в конкретных предметных областях и тиражирующие этот эмпирический опыт для консультаций менее квалифицированных пользователей» [18, c. 39] . Первыми подобными программами стали системы DENDRAL (автор – Edward Feigenbaum [55] ) и MYCIN (автор – Edward Shortliffe [71] ). Последняя, по словам Аллена Ньюэлла, явилась «прадедушкой экспертных систем» ( [64] цит. по [62, c. 211] ).

Характерной особенностью экспертной системы является наличие базы знаний. Описывая экспертные системы, Т. А. Гаврилова, В. Ф. Хорошевский указывают, что ядром экспертной системы является база знаний – «совокупность знаний предметной области, записанная на машинный носитель в форме, понятной эксперту и пользователю (обычно на некотором языке, приближенном к естественному)» [18, c. 40] . Наиболее общими методами представления знаний в экспертных системах являются: правила (когда часть правила ЕСЛИ удовлетворяет фактам, то действия, указанные в части ТО, выполняются), семантические сети и фреймы [32, c. 8-9] . Следовательно, такие способы представления знаний как фреймы и семантические сети могут служить основой для создания более сложных прикладных программ.

Однако наряду с наглядностью представления, простотой реализации, максимально полным теоретическим обоснованием модели, внушительным пределом применимости, экспертные системы обладают рядом недостатков: элементы знаний могут вступать в противоречие друг с другом, неоправданная громоздкость выражения системы знаний, сложность поиска и вывода решения, проблематичная обработка и оценка целостного образа знаний [40, c. 81-82] .

Способы и методы представления знаний, отраженные в настоящей работе, являются лишь частью существующих на сегодняшний день методов и программ, направленных на систематизацию знаний, задача которых – упростить и ускорить работу пользователя со значительным объемом материала как обыденного, так и научного. Рассмотрение общности терминов, систематизацию терминологических единиц по группам в соответствии с определенными признаками или яркостью их проявления, общности функций и комбинации лексико-синтаксических признаков обеспечивают семантические (терминологические) поля. При этом соотношение термина со смежными терминами и связи между ними в семантических (терминологических) полях не отражаются.

Поля, в свою очередь, могут явиться компонентами графов, которые отражают анализ понятийных областей термина и представляют собой набор понятийных полей, в которые попадает термин, с отражением связей между ними. Графы могут быть дополнены и компонентами значений, входящих в эти поля и связями между компонентами.

Еще одной иерархичной системой, структурирующей данные определенной предметной области, является фрейм. Применительно к терминологической системе, фреймовое представление, обладая лестничным строением и предполагая наличие родовидовых отношений, отражает область специального знания. Отметим, что фрейм характеризует единый когнитивный контекст, что отличает его от более сложной по наполнению матрицы.

Структурирование знаний в виде матрицы нацелено также на анализ строения концепта, его признаков, предметных областей его реализации. В отличие от фрейма, в матричной структуре задействован не единый когнитивный контекст, а система контекстов. Как и граф, матрица может строиться по полевому принципу. Идентично полю, матрица отражает признаки анализируемых объектов и, более того, отнесены к одной области полевой структуры. Все эти особенности делают матрицу более пригодной для описания концепта, но не отвечает запросам, необходимым для анализа понятия, терминов.

Место термина в определенной терминосистеме определяется в процессе построения семантической (терминологической) сети, которая, как и онтология, демонстрирует системные отношения между компонентами, что делает терминологическую сеть наиболее удачной моделью структурирования научного знания. Онтология представляется же более обширной (с привлечением нетерминологической лексики) и контекстно зависимой.

Экспертные системы, также рассмотренные в настоящей работе, представляют собой не просто метод представления знаний, но и программу, которая с помощью структурированных экспертом и инженером знаний определенной предметной области помогает найти решение ряда проблем по запросу пользователя.

Описываемые в работе модели структурирования знаний насчитывают как общие, так и различные стороны, которые, в первую очередь, проявляются в структурных элементах моделей и решаемых ими задачах. Таким образом, данные методы структурирования знаний обладают значительной областью применения, могут быть использованы для быстрого извлечения необходимых связей, при вычислительной обработке данных, автоматического извлечения знаний из текстов, интеллектуализации информационного поиска.

📎📎📎📎📎📎📎📎📎📎