Информатика в семи томах




НазваниеИнформатика в семи томах
страница8/44
Дата30.08.2012
Размер6.34 Mb.
ТипДокументы
1   ...   4   5   6   7   8   9   10   11   ...   44

5.2.2. Наименование понятия. Определения термина связаны с многообразием конкретных его характеристик и связей с другими терминами. Два вида определения понятия (для человека и для Интеллсист) дополняются третьим видом - логической связью данного понятия с другими понятиями. Именно логические связи терминов доопределяют каждый термин, участвующий в связи, более точно, это чаще всего оказывается весомее автономного определения термина (понятия). Если первых два вида определения понятия только очерчивают его границы или указывают факты этого понятия, то третий вид определения составляет основу знаний, используемых для разрешения запросов пользователя.


Также разнообразны структуры самих определений. Структура определения понятия разрешает задачу раскрытия его содержания и смысла понятия. Важно отметить, что любая структура определения состоит из логических связей определяемого понятия с уже определенными понятиями (требование ясности определения). Только через определенные понятия можно определить новое понятие. Все определения можно расклассифицировать по структуре на явные и неявные определения. Явные определения состоят из описаний отношений между определяемым понятием, с одной стороны, и логическими связями между определяющими понятиями, с другой стороны. Явными определениями являются описательные (путем показа) и интенсиональные определения. Неявные определения понятия - это такие определения, в которых описываются определенные отношения между уже определенными понятиями, используемыми в некотором контексте определенных понятий. К неявным определениям относятся остальные определения: контекстные, концептуальные, аксиоматические, операциональные (генетические) и индуктивные. Некоторые из перечисленных структур неявных определений могут быть представлены как явные.


Говорят, что об определениях никогда или почти никогда не спорят. Это подтверждается тем обстоятельством, что как бы не определялось понятие, его определение годится для пополнения БЗ, если оно не противоречит другим понятиям. Более того, можно высказать такую «смелую» мысль: определение любого понятия можно представить в любом оформлении и любым способом, но так, чтобы полнота знаний не понесла ущерба от неполноты определений. Однако никоим образом нельзя допускать глобального противоречия между определениями, в то время как локальное противоречие является допустимым. Определение одного понятия может корректироваться определением другого понятия.


Можно выделять сорта понятий и соответствующих им определения. Сортами понятий являются: собирательные, единичные, конкретные, общие, абстрактные, деятельные и синтезированные сорта. Эти наименования сортов понятий говорят сами за себя, они соответствуют видам знаний в информатике. Причем надо отметить, что обычно не допускается определение понятия через само себя или другое понятие, которое определяется через него. Кажущийся порочный круг разрывается путем применения и использование в определении частных случаев значений определяемого понятия или только ссылок на определяемое понятие. Это напоминает использование рекурсии, для которой указана отправная точка начала рекурсии. Например, правильным будет понятие умножение, которое можно определить через умножение и сложение так, чтобы частные случаи умножения на 0 или 1 также входили в определение вместе с правилами перехода к следующим числам. Другой правильный пример. Для определения термина «список» используется запись с полями: значение элемента списка и ссылка на то же понятие списка.


Определения понятий можно конструировать, а в соответствии со способом конструирования классифицировать их следующим образом. Определение можно строить через отношение (как логический прием), которое указывает на соотношение данного понятия с другими понятиями. Определение можно строить через противоположности данного понятия с другими понятиями. Определение можно строить через абстракцию как равенство, в котором устанавливается отношение для свойств определяемого и изучаемого множества. Примеры будут приведены в тексте.


Классическими методами построения определений являются два следующих в некотором смысле полярных метода. Первый базируется на том, что определение опирается на более общее понятие и его определение, а в самом определении указывается те ограничения, которые характеризуют определяемое понятие. Второй метод базируется на том, что определение понятия конструируется на основе перечисления частных значений определяемой вещи. Такие два общих метода и используются обычно, несмотря на то, что имеется большое число других (промежуточных относительно указанных) методов построения определений. Указанные два метода являются фундаментальными и основополагающими.


Следует вспомнить, что на точность системы определений и терминологии вообще влияет их классификация, она важна в любой области знаний. Определение определения не может представить полную характеристику этого понятия, поэтому необходимо воспользоваться классификацией определений как дополнительной информацией об этом понятии. Такое положение (определение определения) в равной мере относится и к другим определениям других понятий.


Естественным образом каждое понятие имеет свое наименование, которое формируется из символов (не обязательно графического типа). В ЕЯ наименование понятия составляется из букв национального алфавита (или в отдельности из знаков). Наименование - это слово или совокупность слов ЕЯ (или отдельный знак). Понятию соответствует наименование термина. В ЯПП наименования могут формироваться из слов, лексем и других знаков. Например, в языках программирования наименованием понятия является идентификатор, состоящий из букв, цифр и, возможно, из некоторых других символов. В химическом языке понятие может приобретать формы химических формул.


Важный вопрос при построении нового понятия заключается в выборе или построении нового наименования понятия, его термина. Проблемы построения термина изучены достаточно широко в машинной лингвистике. Поэтому не уделяется дополнительного внимания раскрытию смысла, форм, методов построения термина. Нам необходимо иметь в виду, что машинный анализ терминов выдвигает ряд требований к способам формирования самих терминов. Словосочетание, формирующее термин, должно состоять из слов, не совпадающих со словами других грамматических категорий. Например, идентификатор операнда не должен совпадать с идентификатором операции. Терманды формируются из наименований предметов, а термации - из наименований действий. В информатике допускается смешение наименований. Термандом может быть глагол, а термацией - наименование предмета.


В соответствии с правилами СеГ наименование понятия (термин) строится из слов, лексем и знаков. Одно слово или один знак могут представлять понятие. Например, «раздел запроса» - термин понятия, используемый в качестве заголовка последовательности утверждений, составляющих задачу для Интеллсист и требующих ответа. «+» - знак операции сложения различных типов данных и величин таких типов. Два слова могут представить понятие. «для каждого» - это термин операции проверки последовательности утверждений на истинность относительно набора значений величины, которая помещается вслед за этим термином. Два знака могут представить понятие. => - это обозначение понятия следовать в логических выражениях. Более двух слов, двух знаков или композиции слов и знаков также могут представить понятие. «А + В» - обозначение понятие, которое необходимо исследовать по каким-либо признакам. Практика описания знаний в каждой области знаний или в каждой профессии всегда опирается на установившийся лексикон из терминов, наименований понятий. Поэтому и не возникает сложных проблем с методами или способами построения наименований. Проблемы не возникают еще в силу того, что термины чаще всего черпаются из ЕЯ.


Имеются только две главные проблемы относительно выбора наименований. Одна проблема возникает при обозначении двух различных понятий одинаковыми терминами. Коллизии такого сорта либо обнаруживаются автоматически при анализе текстов знаний или запросов самой Интеллсист, либо разрешаются в результате сравнения профилей, они должны быть различными для одинаковых наименований. Окончательное решение о переименовании одного из понятий за пользователем или знаниеведом. Другая проблема возникает при обозначении понятия несколькими терминами. Разрешение проблемы является простым делом. Один термин выбирается ведущим или идентификатором, а остальные синонимами этого термина. Может оказаться так, что некоторый термин не является синонимом, тогда его необходимо описать как новый термин другого понятия. Так или иначе, но Интеллсист в большинстве случаев эти проблемы разрешает автоматически по подсказке пользователя.


5.3. Структура определения


С формальной точки зрения каждое определение формализуется логическим выражением, которое считается истинным. Такие выражения называются прикладными аксиомами (отличными от аксиом классической, неклассической или формальной логик). Форма аксиом может быть произвольной и зависит от используемых логических операций, арности логики и принятых стандартных обозначений (терминов) для понятий. Например, некоторое определение может быть представлено в форме равенства А = Ф(..В..), что представляет также логическое выражение, прикладную аксиому. С формальной точки зрения этим о структуре определения все сказано. Возможны бесконечные интерпретации (выражения) указанного формализма. Чаще всего интерпретация использует ЕЯ или некоторый ФЯ. Примеры этому будут рассмотрены в дальнейшем. А пока ограничимся только такими заметками относительно структуры определения.


Если принять данный тезис о структуре определения, то ясными становятся некоторые проблемы концептуальной информатики. Для обучения машины понятиям необходимо иметь подходящий формальный логический язык предикатов и транслятор ЕЯ или ЯПП на выбранный ФЯ. Проблема построения новых понятий также может быть автоматизирована путем формирования логических выражений и применения транслятора ФЯ на ЕЯ или ЯПП. Во втором случае точнее будет сказать: не создание транслятора, а создание синтезатора фраз ЕЯ. Интеллсист выполняет работу по созданию или уточнению понятий. Результат ее работы - это альтернативы совместных уточнений определений.


Структура определения зависит от контекста его нахождения, от конструкции самого определения, от характеристик определяемого объекта, от языка описания определения, от параметров-характеристик определяемого объекта и др. Основные структуры зафиксированы в языке Лейбниц, они располагаются в разделах, в которых определяются новый термин предмета или действия. Если термин подразумевается и явно не дается, то его определение составляется по произвольной структуре в виде последовательностей фраз или утверждений (или таблиц).


В информатике важно указать на допустимые структуры определений, что сделано в языке Лейбниц. Они существенно зависят от множества допустимых значений определяемого понятия, от начального значения. Все структуры определений формально и точно определены в ЯПП. Записи таких определений воспринимаются и используются в формулировках знаний и запросов для Интеллсист. Каждый ФЯ полностью определяет понятия, которые участвуют в решениях задач.


Обобщенная структура определения внутри Интеллсист включает следующие компоненты: специально выделенный новый термин, возможное определение для пользователей, тип понятия (множество допустимых его значений) и возможное начальное значение. Структура определения универсальна в том смысле, что каждый новый термин определяется только по указанной схеме. В этом можно убедиться после анализа ФЯ Лейбниц.


5.4. Теория и классы определений


В концептуальной информатике, как и в любой другой научной дисциплине, имеется два подхода к исследованию, в частности, теории определений: теоретический и практический. Некоторые практические результаты концептуальной информатики описаны, например в [Тыугу84], на уровне известного понятия концептуального программирования. Теоретические результаты в настоящее время отсутствуют или находятся в начальной стадии исследования. Предлагается схема для построения теории определений понятий. Она вытекает естественным образом из логики информатики и правил СеГ. Также предлагается схема для построения практической концептуальной информатики средствами языка Лейбниц. Теория определений еще не сформировалась в конечном виде, поэтому она рассматривается на описательном уровне. Прагматика определений базируется на интуиции исследователя, реализации программ и на критериях отбора определений. Таковы две проблемы для их рассмотрения в данной главе.


В соответствии с ИЛ (т. 5) определение представляет собой совокупность аксиом некоторого сорта, из которых должны вытекать все свойства определяемого объекта и контекста его применения. Поэтому теория определений опирается на исчисление ИЛ в части, касающейся определяемого объекта. Главными проблемами теории являются поиск и разрешение противоречий как внутри определения, так и в контексте с другими объектами, определение независимости прикладных аксиом между собой и с другими аксиомами и полнота определений. Таким образом, для теории определений важны проблемы экологической чистоты самих определений.


Что касается проблемы прагматики концептуальной информатики, то здесь можно сказать о накопленном богатом практическом опыте по отбору понятий и их определений с помощью критериев качества. Некоторые из них рассматриваются в данной главе. Кроме этого, имеющийся материал позволяет выдвинуть ряд проблем, которые могут заинтересовать исследователя и стимулировать его подвиги в построении формализма теории определений. Итак, некоторые основы теории определений можно обнаружить при чтении этой главы. В ней даются классы определений для понятий, используемых в записях знаний и запросов.


5.5. Классы определений


Существует значительное число типов определений понятий. Некоторый набор определений был кратко рассмотрен выше (см. 3.4). Здесь рассматриваются семь классов, которые выдерживают принятую в теории познания идею от знака до системы. Классификация может подвергаться любой критике, способствующей развитию теории определений. Более того, отметим, что в соответствии с законами информатики все определения имеют одинаковый эффект по точности передачи смысла понятия. Каждое понятие можно определить каждым из семи способов, все определения по смыслу будут идентичными. Рассмотрим их последовательно.


5.5.1. Описательное определение


Самым простым и распространенным определением понятия является описательное определение. Его именуют еще и экстенсиональным. Такие определения содержатся почти во всех естественнонаучных дисциплинах. Обычно для создания описательных определений используются тексты ЕЯ. В последнее время в связи с проникновением информатики в естественные науки начинается использование формальных различных средств и методов представления знаний таких наук. Каждая наука использует более всего не ЕЯ, а язык профессии. Постепенно ЯПП обогащается формальными средствами. Знание и изучение средств ЯПП важно для интенсификации проникновения информатики в конкретную науку. Для полной формализации сообщений на языке профессии (на ЯПП) необходима системная программа, именуемая транслятором ЯПП на ФЯ.


Построение транслятора ЯПП способствует передачи описательных определений в разряд аксиоматических и формальному анализу этого сорта знаний. Описательное определение не имеет фиксированной структуры (скорее всего оно является бесструктурным), а точнее сказать, оно может принимать виды всех структур по правилам СеГ. С точки зрения машинного анализа описательные определения являются самыми сложными. Можно указать на многие примеры, имеющиеся в данном тексте, которые представляют собой описательные определения. Данное здесь определение описательного определения является также описательным. Большое число понятий информатики описательно определено в Приложении 1.


Рассмотрим кратко пример описательного определения с ответом на вопрос: что можно отнести к понятию информатики? Прежде всего, к информатике относятся вопросы применения ВМ, которое связано в современных условиях с различными видами, методами и приемами программирования. Применение ВМ осуществляется в результате взаимодействия человека с ВМ. Система человек-ВМ призвана автоматизировать вычисления с числами, текстами, массивами, записями, программами и знаниями, представленными в форме фреймов, семантических сетей и формул. Тексты обычно содержат знания и запросы на решение задач, которые также могут обрабатываться на ВМ. Вычисления задаются машине в виде, например, последовательности операторов над данными. Интеллсист является программой обработки знаний и запросов. Автоматизация базируется на методах обработки информации (или сообщений), применение которых подразумевает преобразование исходных данных в выходные данные. Этот процесс преобразования представляет собой модель части реального мира, которая также вводится в систему человек-ВМ на некотором декларативном, алгоритмическом или другом языке. Если под понятие знание отнести тексты, числа, массивы и записи, то работа Интеллсист сводится к обработке знаний, а это самая важная работа для человека. Вся описанная деятельность составляет сущность информатической работы по преобразованию информации, представляющей наши знания, для получения нового знания. Все это определяет информатику.


Так выглядит описательное определение информатики. Оно используется чаще других определений, если рассмотреть полный набор наук. Формализации такие определения поддаются в том случае, когда они представлены на СеГ конкретного ЕЯ.


5.5.2. Контекстное определение


Вторым сортом определения является контекстное определение. Оно существенно отличается от описательного определения. Знания, представленные текстами, выражениями и таблицами, используют именно контекстные определения. Поток сведений конкретной области знания состоит из определений различных величин и операций с указанием связей между ними. Каждый абзац текста представляет законченную мысль (содержательно) и связи величин и операций, которые и являются контекстным определением величины, операции или величин и операций через связь их с известными величинами и операциями. Для простоты под контекстом будем понимать весь текст, в котором используется понятие через вхождение термина независимо от того, как входит термин, он определяется или используется в тексте.


Итак, контекстное определение включает связи с другими известными понятиями, а определяемое понятие дается в контексте этих известных понятий. Предмет, явление или процесс становятся определенными, если их понятия использованы в связи с некоторым набором известных понятий через использования их терминов. Контекстное определение - это такое определение, которое строится на основе знания связи определяемого понятия с контекстом, в котором оно употребляется. Контекстное определение раскрывает содержание и сущность понятия путем указания его связей с другими понятиями. Причем всегда имеются трудности в точном указании того понятия, которое в данном тексте определяется, поскольку другой текст, где возможно определяется другое понятие с помощью контекстного определения. В другом тексте уже определенное понятие также доопределяется и может быть даже наравне с определяемым понятием. Контекстное определение понятия может быть дано на протяжении всего текста, а не отдельного абзаца.


Контекст по своему существу определяет некоторый (возможно частичный, как в результатах работы Интеллсист) смысл понятия. Контекстное определение можно именовать смысловым определением. Такие определения имеют широкое распространение в практике фиксации знания. Например, первая фраза этого раздела представляет собой контекстное определение. Вторая фраза этого абзаца есть остенсиональное определение. Совокупность всех абзацев данного раздела есть контекстное определение контекстного определения. Это же можно распространить на весьма многие понятия. Может создаться впечатление, что почти все определения понятий являются контекстными, если понятие используется.


Синонимами контекстного определения являются взаимосвязанные определения, семантические определения и некоторые другие аналогичные определения. Контекстные определения образуют кластер, в котором находятся все синонимические наименования определений. Их можно классифицировать по некоторому родовому признаку.


Чаще всего в литературе не выделяются формальные определения вещей или их свойств. Однако читателю всегда ясны используемые понятия в силу того обстоятельства, что эти определения черпаются из всего текста, по контексту. Нашим примером контекстного определения является определение понятия ПРОГРАММИРОВАНИЕ. Его невозможно определить одной или несколькими фразами, только контекст может дать представление о программировании. В таком же положении находится определение понятия информатики, несмотря на то, что имеется и точное краткое определение этого понятия: во-первых, определение одного и того же понятия может быть представлено любым сортом определения; во-вторых, весь текст под названием «Информатика» посвящен определению информатики.


Контекстные определения почти всегда являются неполными. И действительно, для К понятий можно рассматривать К! (факториал) связей. Чтобы полностью определить понятие, необходимо задать тексты в объеме К!. Практически реализовать это бывает чрезвычайно трудно. С другой стороны, для решения задачи некоторые связи не нужны. Заметим, что ненужных связей по количеству оценивается числом почти равным К!. Именно поэтому большинство практически полезных задач все же решаются точно или приближенно. Когда же некоторая связь отсутствует, то задача не поддается быстрому решению или вообще она считается неразрешимой. Из-за отсутствия знаний относительно связей операций сложения и возведения в степень трудной оказалась историческая проблема Ферма о целочисленных решениях уравнения X**n + Y**n = Z**n относительно X, Y и Z при n>2.


Интеллсист «чувствует» недостаток контекстных определений. Если в результате логического вывода ответа на запрос не получены альтернативы совместных фактов, то до построения программы Интеллсист сформулирует явные или косвенные вопросы относительно определения некоторых операций или связей набора операций. При получении ответов на вопросы знания будут пополнены для решения данной задачи, они могут оказаться достаточными для получения альтернативы совместных фактов.


5.5.3. Остенсиональное определение


Самым простым определением понятия является остенсиональное определение, состоящее из явного перечисления составляющих понятие терминов предметов, явлений или процессов. Такие определения содержат весь объем понятия и являются вербальными или словесными. Простейшим примером остенсионального определения является определение метапонятия в языке Лейбниц. Оно состоит из перечня терминов понятий, который и определяет метапонятие. Имеется несколько сортов конструкций простых определений. Наиболее распространенными являются следующие сорта (кластер остенсиональных определений).


Первый сорт - это определение через класс объектов, указанных в самом определении (определение метапонятия). При этом необходимо помнить, что рекурсивное определение не допустимо, а точнее сказать, если определение содержит рекурсию, то оно не является остенсиональным. В перечислении объектов нельзя употреблять непосредственно сам определяемый объект. В качестве примера можно дать определение сортов определений. Имеется семь сортов определений: описательное (экстенсиональное), контекстное, концептуальное (остенсиональное), интенсиональное, аксиоматическое, операциональное, индуктивное, а другие типы определений являются вариантами или синонимами указанных.


Второй сорт - это определение через образцы, по которым можно восстановить полный объем понятия. Например, в определении N из-за невозможности явного перечисления всех целых чисел натуральный ряд определяется по образцам целых чисел, составляющих начало натурального ряда. N = 1, 2, 3,.. Предполагается, что такие определения «достраиваются» автоматически по образцам. И опять, рекурсивные определения в данном случае являются недопустимыми.


Третий сорт - это определение, построенное на основе имеющегося определения с добавлением новых значений понятия или отдельных образцов объектов. Например, определение понятия словаря можно дать через перечисление всех видов словарей. Интеллсист содержит в БЗ словари из слов, терминов, строк, комментариев и чисел. Определение фактической части БЗ для пользователя можно ограничить таким перечислением словарей. Рекурсивные определения такого типа также является недопустимым.


Четвертый сорт - это определение, включающее перечисление всех значений термина. В качестве примера возьмем определение понятия цвет радуги. Цвет радуги - это красный, оранжевый, желтый, зеленый, голубой, синий и фиолетовый цвета. Как обычно, рекурсия недопустима.


Пятый сорт - это определение (остенсиональное) по непосредственному указанию на сами предметы, явления или процессы, которые обозначаются определяемым термином. Например, Интеллсист можно определить как программный комплекс, состоящий из программ интерфейса (меню), транслятора смешанных вычислений, МЛВ, МАВ и синтезатора программ.


Каждый сорт остенсионального определения отличается незавершенностью, поскольку в них не содержатся связи с другими понятиями (кроме тех, которые включены в определение) или операциями, которые в остенсиональном определении вообще отсутствуют. Определение набора операций состоит из имен операций. Остенсиональное определение связывает понятие только с вещами, термины которых явно указаны в определении. Для конкретных нужд остенсиональное определение является достаточным, в то время как для других проблем оно не годится для успешного их разрешения.


Имеется одно общее замечание. Многие определения трудно отнести к тому или иному сорту или даже классу, поскольку они несут оттенок свойств от всех сортов и классов определений, они являются смешанными.


5.5.4. Интенсиональное определение


Интенсиональное определение характеризуется следующими атрибутами. Оно должно содержать:

  • описание свойств, характеристик предмета, явления или процесса, выделяющих определяемое в сравнении с другими предметами, явлениями или процессами соответственно;

  • пояснение смысла термина указанием правил выделения его среди прочего;

  • указание ближайшего понятия и отличительных признаков по сравнению с другими определениями других понятий.

Таково синтетическое определение понятия интенсионального определения. Понятие - это некоторое семейство подмножеств универсума. Действительно, пусть формально, но это утверждение можно пояснить следующим образом. Признаки, которые позволяют выделять понятие, имеют значения, которые характеризуют данное понятие и принадлежат к некоторому множеству значений, или образуют полное множество значений данного признака. Таких множеств, связанных с данным понятием, несколько, а именно столько, сколько признаков характеризует данное понятие. Они образуют семейство множеств значений признаков.


К интенсиональному виду определений относится реальное определение. Реальное определение - это такое определение, которое отображает существенные признаки, свойства и характеристики предмета, явления или процесса с целью формирования отличий от других предметов, явлений или процессов. Как видно из этого определения главной частью содержания определения является указание на набор существенных отличительных признаков исследуемой вещи. К интенсиональному виду определений относятся собирательное определение и представительное определение. Все они являются сортами или синонимными определениями, друг друга напоминающими и содержательно не отличающимися. Они образуют кластер интенсионального определения понятий. Их формулировка и анализ важны для более полного раскрытия сущности интенсионального определения.


В качестве примера можно сослаться на определение понятия в ЯПП. В разделе 5.3 указана структура определения понятия, которая включает атрибуты интенсионального определения: для каждого понятия указывается в определении термин, характеристики, пояснение смысла (определение для пользователя) и отличия от определений других понятий.


5.5.5. Аксиоматическое определение


Аксиоматические определения являются фундаментальными. Это следует из существа самого понятия, определение которого строится из суждений (логических выражений). В информатике принято, что любое высказывание, содержащее новое знание, является прикладной аксиомой, определяющей величину (или константу), операцию или их комбинации. Эта посылка позволяет определить аксиоматическое определение. Кратко оно определяется так. Аксиоматическим определением называется (конъюнктивная) совокупность утверждений, содержащих определяемое и определяющие понятия в этих утверждениях. При формулировках таких определений на ЕЯ будет возникать определенная трудность, связанная с распознаванием терминов, входящих в утверждения. Использование же ЯПП не будет вызывать трудностей распознавания терминов, но будут трудности формализации, которые могут породить ошибки. Уже упоминалось, что каждое определение можно вполне именовать аксиоматическим определением. Можно выделить критерий для разделения чисто аксиоматических и «неаксиоматических» определений, критерий содержится в определении понятия аксиоматического определения.


Любой ФЯ, включающий метод конструирования определений, вполне определяет и использует аксиоматическое определение. Можно рассмотреть пример метаязыка, определяющего ФЯ программирования, например, в форме Бэкуса-Наура или языка Марков. Любые синтаксические определения так или иначе связаны с введением аксиоматических определений некоторых текстовых конструкций. Классическим примером аксиоматических определений являются также аксиомы ИЛ.


Некоторые формы аксиоматических определений образуют кластер. Например, абстрактное определение, формальное определение, логические исчисления, формальные грамматики - все такие определения относятся к аксиоматическим определениям, они формируют кластеры. Полную классификацию можно построить только в результате всесторонних и глубоких исследований концептуальной информатики совместно со специальными разделами лингвистики. Если к сорту определений подходить не строго, то формулировка определения любого сорта представляет собой аксиому и, следовательно, оно является аксиоматическим. Может быть в силу этих обстоятельств аксиоматические определения именуются фундаментальными.


Однако можно рассматривать аксиоматические определения строго, тогда можно сформулировать критерий выделения из всех сортов определений именно аксиоматические. Таким идеальным критерием является использование всех определяемых понятий в формулировке определения данного понятия. Данная совокупность аксиоматических определений полностью определяет используемые в них понятия. В таком случае говорят о построении исчислений некоторой теории, в состав которого входит данная совокупность аксиоматических определений. Если некоторое исчисление не содержит аксиому, связывающую величины или операции, то оно теоретически будет не полным. С увеличением объема знаний (при построении недостающих аксиом) теория, построенная на базе нового исчисления, может стать классически полной. Это утверждение верно и для определения полноты знаний относительно запросов пользователей.


Практика представления знаний не довольствуется только аксиоматическими определениями, более того, практика стремится избегать использования их в силу большой сложности построения. Пренебрежение аксиоматическими определениями не наносит ущерба для БЗ и запросов пользователя. При этом ввод знаний с помощью других сортов определений может лишь привести к вводу избыточного знания, которые, скорее всего, не будут обнаружены пользователем или знаниеведом.


Аксиоматические определения предназначены главным образом для представления знаний в Интеллсист. Все знания представляются обычно для человека на ЕЯ, который расчленяется на ЯПП путем выделения профессионального лексикона, создания СеГ и подсоединением формальных или формализованных языков. В конечном счете, фразы ЯПП преобразуются транслятором в логические формулы внутреннего языка Лейбниц для формирования БЗ из отдельных аксиом, которые являются аксиомами либо предметной области (для термандов), либо проблемной области (для термаций). Представленные таким образом знания используются для вывода ответов на запросы пользователей по заданной терминологии конкретной области знания.


К аксиоматическим определениям относятся все формальные определения. Записи выражений из формальных определений можно трактовать как аксиомы об операциях, константах и величинах. К настоящему времени построено огромное число формальных методов, которые содержат формальные определения понятий для разнообразных применений. Формализм, являясь абстракцией, обобщением, помогает установить закономерности при изучении вещей различной природы. В деле построения определений многие полезные результаты можно почерпнуть из рассмотрения формальных методов и описаний.


5.5.6. Операциональное определение


Операциональное определение задает правила, которые указывают, что необходимо сделать для построения понятия, что с этим понятием можно сделать или какими операциями можно воспользоваться для синтеза определяемого понятия. Операциональное определение, как и другие классы определений, образуют кластер, в который входят сорта определений, данные ниже.


Алгоритмическое определение (аналогичное данному выше определению) связано с понятиями алгоритма или программы - конкретного предписания о способе получения нового понятия (выраженного результатом выполнения предписания), оперирования с понятием или синтеза его определения. Такие определения ближе других расположены к информатике. Действительно, каждая запись алгоритма или программы может рассматриваться как средство определения некоторого понятия. Например, программа вычисления корней полинома определяет значение корня или ошибки в задании полинома. Алгоритмы или программы - это представление алгоритмического знания, которое определяет новый смысл понятия по значению, получаемому после выполнения или реализации алгоритма или программы.


В кластер операциональнох определений входит и генетическое определение, которое предписывает правила порождения предмета, явления или процесса, указывает на их происхождение в некоторой классификации или систематике. Такие определения подразумевают действия по формированию понятия или его определения. Ближе всех других к операциональному определению находится номинальное определение, которое является предписанием требований, какими должны быть определяемые объекты, только при реализации предписаний можно определить объект. Также близким является дескриптивное определение. Деятельное определение также входит в кластер алгоритмических определений, но оно предполагает больший упор в определении на физические перемещения или преобразования. Аналогичных определений можно построить достаточно много, они будут образовывать подкластер алгоритмических или операциональных определений.


Любой вариант (элемент кластера) алгоритмического определения предполагает выполнение ряда операций следующего сорта:

  • как сделать предмет, явление или процесс, какие действия необходимы для формирования определяемого объекта;

  • как оперировать некоторым исходным материалом и что получится в результате выполнения операций на этом материале для того, чтобы получилась определяемый объект;

  • что делает предмет, явление или процесс и что получается в результате его деятельности, какой объект или какая сущность объекта;

  • что делается с предметом, явлением или процессом после применения операций из некоторого набора при получении определяемого предмета, явления или процесса;

  • способ создания или синтеза предмета, явления или процесса, которые определяются.

Применяемые в розницу или комплексно эти операции должны привести к формированию понятия и его определения.


5.5.7. Индуктивное определение


Индуктивное определение - это такое определение, которое позволяет отталкиваться от некоторых исходных понятий путем применения некоторых логических операций и строить новое определение нового понятия таким образом, что в процессе построения можно использовать данное понятие рекурсивно или ссылочно (явно или неявно). Индуктивные определения являются наиболее сложными, они чаще всего встречаются в ФЯ, например, в языках программирования или представления знаний.


Определение идентификатора в языках программирования рекурсивно и содержит индукцию. Это определение наиболее распространено, на его базе или по аналогии с ним строятся другие определения. Рекурсия используется тогда, когда отпадает необходимость во введении ограничений на размеры предмета построения или реализации понятия. Длина идентификатора не определена заведомо, пока его не построил программист при составлении программы, поэтому определение идентификатора рекурсивно. Практика всегда подсказывает момент остановки рекурсивного процесса определения понятия.


Примеров рекурсивных определений в формализме чрезвычайно много, они являются экономными и эффективными в применениях. Однако, они сложны для построения и использования, так как при этом работает принцип внутреннего умолчания, который затрудняет понимание определения. Рекурсивные определения предполагают раскрытие рекурсии с помощью памяти магазинного типа. Для устного анализа рекурсивных определений возникают сложности запоминания глубинных состояний анализируемого определения.


Важная особенность индуктивного определения заключена в том, что оно обобщает все предыдущие сорта определений. Если рассмотреть некоторый сорт определения и в определяющую часть поместить определяемое понятие, то осуществляется переход к индуктивному определению (включение в определение рекурсии).


Индуктивное определение строится обычно для тех объектов, которые имеют бесконечное число значений определяемого объекта. Например, ФЯ определяют бесконечные словари, хотя практическое использование словарей приводит к словарям с конечным набором слов или терминов. Именно это обстоятельство вынуждает прибегать к индуктивным определениям. Почти любой формализм (а он всегда связан с ФЯ) предполагает использование индуктивных определений понятий.


Следует помнить одно важное ограничение на индуктивные определения: каждое индуктивное определение должно содержать «начальную точку» или частный случай определяемого понятия. Например, слово есть последовательность букв, т.е. слово получается из слова приписыванием к нему еще одной буквы. Процесс приписывания букв бесконечен. По этому определению нельзя определить слово. В этом определении пропущена «начальная точка»: словом является любая буква. Теперь рекурсивное определение становится правильным. Без «начальной точки» определение является неправильным, оно может привести к ошибочным решениям в задачах, использующих неправильное определение.


5.6. Теория определений в алгоритмах


Большое число задач с применением теории определений возникает в прикладных науках и, в частности, внутри самой информатики. Здесь будет представлена задача автоматизации составления словаря из слов, а также терминологического словаря по произвольным текстам на ЕЯ.


Интеллсист содержит словарь из стандартных слов. Новые слова появляются в результате анализа записей знаний или запросов пользователя, в которых определяются новые термины. Словарь пополняется автоматически, он служит лишь кодировочной таблицей для слов. Интеллсист содержит терминологический словарь из стандартных терминов СеГ, в который вводятся новые термины только по указанию пользователя или из БЗ. Терминологический словарь является основой лексикона, в котором собираются все характеристики терминов.


Особое место занимает первичный анализ произвольных текстов, при котором создаются потенциальные словари. Первичные тексты могут быть проанализированы программами «Сборки» одного из разделов меню инструментария. О теоретической части в программах «Сборки» здесь и будет рассказано.


Новый еще не подвергнутый анализу текст можно рассматривать с различных точек зрения. Пользователя текста интересует его смысловой анализ. Оставим в стороне вопросы статистического анализа текста, которым часто интересовалась и интересуется лингвистика, и перейдем к смысловому анализу текста. Выделим ряд особенностей или требований к анализу текстов. Во-первых, если считать, что смысл текстов полностью определяется смыслом составных частей - терминов, то смысловой анализ текстов - это его терминологический анализ. Во-вторых, каждый термин должен входить в текст, по крайней мере, дважды: первое вхождение определяющее, второе - использующее. Не лишено смысла требование трех и более вхождений термина в текст. Многократные вхождения термина подчеркивают его важность. В третьих, в «незнакомом» тексте состав терминов неизвестен, он может состоять из слов, знаков, чисел и других компонентов. Задание требований о составе терминов может быть бессмысленным. В четвертых, число составных частей термина также считается неизвестным, поэтому невозможно выставить требование на размер термина. Наконец, в пятых, исходные тексты можно считать случайными функциями. Они случайным образом зависят от вхождений слов, знаков, чисел и др. Все перечисленные особенности или требования приводят к мысли, что тексты в начальной стадии изучения (системой) необходимо подвергнуть корреляционному анализу.


Понятие корреляционного анализа случайной функции известно и широко используется. Для случайной функции F(X) корреляционная функция вычисляется так:


К(j):= (1/N) * sum(i, 1, N, F(i) * F(i - j)),


sum - суммирование по i от 1 до N, j - изменяется от 1 до N, F - анализируемый текст из слов и знаков, * - операция сравнения слов и знаков, выдающая 0 при несовпадении их и 1 в противном случае. В качестве F используется одно слово или один знак, а также некоторое число подряд стоящих слов и знаков (по заказу пользователя). В результате анализа составляется словарь терминов заданной длины и частоты использования также не ниже заданного числа. Среди терминов могут быть случайные слова, поскольку начальный текст знания весьма избыточен. По предварительным оценкам избыточность текстов оценивается числами 80-90% всего текста. Действительно, в учебниках или пособиях содержится много вспомогательного материала, который с точки зрения знаний либо уже учтен во встроенных знаниях, либо содержится в используемой БЗ, либо выражаются самые общие знания, которые конкретизуются в запросах. Окончательное решение о составе словаря ложится на пользователя. Сформированные в результате корреляционного анализа словари могут использоваться через инструментарий для формирования знаний, анкет, шаблонов или запросов. Таков алгоритм автоматического составления чернового или начального терминологического словаря.


Корреляционный анализ реализован как программа с параметрами: заданное число элементов термина (слово, знак, лексема), число, выражающее самое низкое требование на повторяемость, и число, выражающее самое низкое требование на повторяемость при передаче словаря на печать. Практически программа запускается несколько раз для того, чтобы подобрать ее параметры или задать условия анализа. Время работы программы зависит от числа компонент термина. Например, на IBM 386 текст размером 7 Мб при составлении словаря из терминов с пятью компонентами программа анализа работала примерно один час. Не всякие повторяющиеся композиции элементов текста могут быть терминами. Из числа терминов целесообразно исключить последовательности слов, чисел, символов, строк, знаков, которые не выполняют требованиям, заданные пользователем. Среди требований могут быть такими:

  • соблюдать парность скобок ( и ), [ и ], { и } или « и », использование в термине одной из скобок недопустимо;

  • недопустимо использование парных скобок, написанных в термине наоборот, например, нельзя использовать в термине последовательности: )(, ][, }{ или »«;

  • в терминах не используются графические знаки;

  • длинные последовательности знаков обычно не используются, а точнее так - в термине не допускается использовать больше, чем задано пользователем число элементов;

  • допускается использовать только грамматически правильные многозначия, например одну, две и три точки (подчеркиваний или тире);

  • недопустимы последовательности из однобуквенных слов (разрядка);

  • недопустимы, например, три знака с одним словом.


Словари могут быть составлены неправильно, если не будут учтены правила СиГ хотя бы для окончаний слов. Два термина «белый аист» и «белому аисту» будут различными, тогда подсчет числа использования термина «белый аист» будет неверным. В алгоритмы корреляционного анализа вложены правила, по которым указанные два термина отождествляются. В терминологический словарь потенциально попадает термин «бел_ый аист», что обеспечивает отождествление его с термином «бел_ому аист_у». Статистика использования не будет испорчена. Сложнее учитывать правила СиГ относительно вариации суффиксов. Их также можно учесть.


Алгоритмическими проблемами являются следующие проблемы. Пока неясно как определять синонимы. В терминологический словарь попадают (или нет) синонимы терминов, которые можно распознать только с помощью контекста. Анализ контекста проблематичен. Пока неясно как обнаруживать сами определения терминов. По-видимому, опять на помощь может прийти контекст использования данного термина. Пока неясно как определять избыточную часть текста знаний. Отчасти эту проблему можно решать, используя сведения из стандартных словарей. Некоторые результаты определения избыточности могут быть получены после сравнения получаемого терминологического словаря и имеющегося лексикона. Это только три проблемы из большого числа не только алгоритмических проблем, но и принципиальных проблем теории определений.


5.7. Концептуальная информатика как теория


Итак, рассмотрены некоторые вопросы теории определений: критерии для построения правильных определений, основы теории имени и значения, структуры и классы определений. Совокупность определений, методов, приемов и алгоритмов является принадлежностью новой дисциплины, которую можно именовать концептуальной информатикой. После достаточного накопления знаний по этой дисциплине можно говорить об определении понятия концептуальной информатики. Из написанного материала следует, что она имеет:

  • предмет для изучения - это формирование или поиск терминов и их определений,

  • назначение – это терминологический анализ знания,

  • цели - автоматизация построения словарей и атрибутов элементов словарей,

  • задачи - это создание алгоритмов обработки текстов по смыслу,

  • области применения - это информатика в общем смысле слова,

  • проблемы - это выявленные противоречия как внутри дисциплины, так и вне нее, при сопоставлении в уже сформировавшейся лингвистике.


Пока можно говорить лишь о теории концептуальной информатики, которая сразу же находит применение в разработках ЭС, ПС, СИИ и Интеллсист. Конечно, эта теория применяется в разработках лексиконов и применялась ранее при статистическом анализе текстов, для автоматизированных средств написания рефератов и при составлении терминологических словарей вручную.





1   ...   4   5   6   7   8   9   10   11   ...   44

Похожие:

Информатика в семи томах iconСобрание сочинений в семи томах 3 «Собрание сочинений в семи томах»: Время; 2008
Собрание сочинений М. М. Зощенко — самое полное издание прозы одного из крупнейших писателей-новаторов XX века. В него входят практически...
Информатика в семи томах iconИнформатика в семи томах
Излагаемые методы частично модифицированы по сравнению с их оригинальным изложением для их ориентирования и усиления при использовании...
Информатика в семи томах iconИнформатика в семи томах
Определяются логические лексемы, фундаментальные операции, правила преобразования логических уравнений, а также металогика для обоснования...
Информатика в семи томах iconВ семи томах том Информатика смысла Машинная лингвистика
Семантическая и распознающая грамматики связаны между собой как алгоритм и средства его реализации. Основой для контроля правильности...
Информатика в семи томах iconВ семи томах том Основы информатики (Введение в информатику)
Вм на основе своих общих и профессиональных знаний без привлечения программистов для решения задач, для разрешения вопросов или проблем...
Информатика в семи томах iconВ семи томах том Представление знаний (Структуры данных)
Приводимые примеры служат фрагментами прототипов записей знаний и запросов, предназначенных для создателей заданий и запросов к базе...
Информатика в семи томах iconРавительство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том V уфа гилем 2010
Российская академия наук Уфимский научный центр ■ Институт истории, языка и литературы
Информатика в семи томах iconЬство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том VI москва восточная литература 2011
Российская академия наук Уфимский научный центр Институт истории, языка и литературы
Информатика в семи томах iconВ семи томах том Интеллектуальные системы (Системы решения проблем)
Интеллсист, их структуры и технологии работы с инструментарием составляют центральную часть тома. Оценка возможностей Интеллсист...
Информатика в семи томах iconСтихотворения М. И. Цветаевой печатаются в основном по двум изданиям
Стихотворений (главным образом ранних, относящихся к 10-м годам) печатается по изданию: М. Цветаева. Неизданное: Стихи. Театр. Проза....
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница