Информатика в семи томах




НазваниеИнформатика в семи томах
страница3/44
Дата30.08.2012
Размер6.34 Mb.
ТипДокументы
1   2   3   4   5   6   7   8   9   ...   44
Глава 2. Передача знания средствами языка


Конечно, вначале знания свойственны человеку. Однако человек научился передавать свои знания вначале другому человеку, а затем и ВМ. В первые ВМ знания передавались в форме программ, они составили алгоритмическое знание. Передача алгоритмических знаний является специальной деятельностью человека, которая привела к появлению новой специальности - программирование. Программирование является уделом небольшого числа населения (от 0.3% до 3%), поэтому пользователь ВМ вынужден покупать программный продукт. Число ВМ возрастает экспоненциально в последние годы, имеющейся армии программистов стало недостаточным для удовлетворения всех запросов пользователей. Имеются и другие причины (см. т.1), которые поставили задачу привлечения самих пользователей к решению своих задач без программистов. Все эти и другие факторы были достаточно подробно обсуждены. Здесь разговор пойдет об обосновании возможности работы на ВМ без программистов или самостоятельно. А точнее, с точки зрения концептуальной информатики рассмотрим важный вопрос о концепциях синтаксиса, семантики и прагматики, сопоставления понятий языка и смысла и о применении этих концепций при обработке знаний. Определения этих понятий даны в Приложении 1.


2.1. Концепция синтаксиса языков


Синтаксис любого языка охватывает обширный круг вопросов по изучению и применению правил образования слов (более обще – лексем и имен терминов) и предложений, составленных из слов, лексем и знаков. Понятие синтаксиса используется в равной мере при построении ЕЯ и ФЯ. Совокупность синтаксических правил ЕЯ значительно емче совокупности синтаксических правил ФЯ. Это объясняется весьма важным обстоятельством. ЕЯ передает не только знания (в чистом виде), но и эмоциональную информацию, и дополнительные сопутствующие сведения, которые, скорее всего, относятся к разряду знаний о знании конкретного человека, написавшего текст на ЕЯ. Для ФЯ подобная информация не используется, она является второстепенной и устраняется при формализации знаний. Исключением является случай построения ФЯ для анализа эмоциональной информации. Именно в силу таких обстоятельств каждая книга содержит знаний от 5% до 15% объема книги, полезных для их ввода в Интеллсист по специальности, которую провозглашает книга.


В описании любого языка синтаксис является центральной частью для конструирования текстов. Он определяет все конструкции, допустимые в языке. Определение конструкций осуществляется по правилам синтаксиса. Для ЕЯ правила построения задаются описательно по типу «делай так» или «правильно будет так». Объем описания велик, поскольку в ЕЯ имеется большое количество исключений из правил и пояснительных примеров. Для ФЯ правила построения задаются формальными грамматиками чаще порождающего и реже распознающего типа. Использование порождающих грамматик для описания ЕЯ малопродуктивно в задачах распознавания правильности написания текстов, несмотря на то, что сами порождающие грамматики возникли из желания формализовать ЕЯ [Хомский61]. Объем описания грамматик ФЯ невелик, он оценивается несколькими сотнями компактных записей правил. Запись грамматики можно осуществить средствами языка Марков, который представлен в томе 2. Объем описания грамматик ЕЯ с помощью формализма оценивается несколькими тысячами не очень компактных записей правил. Формализация знаний допускает игнорирование большого числа правил синтаксиса ЕЯ без какой-либо потери знаний. Например, изменение по падежам термина «белый аист» будет обозначать по смыслу белого аиста. В исключительных случаях для терминов необходимо вводить синонимы, поскольку изменения слов по падежам изменяет основу слов. Например, слова «колечко» и «колечек» имеют одинаковый смысл в данном применении. Слово «колечек» является синонимом для термина «колечко», если множественное число не играет никакой самостоятельной роли.


Самым примечательным свойством синтаксиса является тот факт, что он вводит все грамматические понятия (грамматические категории), на которые ориентируются все системы обработки знаний, в особенности системы перевода текстов на другой язык. Грамматические категории являются метапонятиями в языке. Для русского языка целевым метапонятием является «русский язык», для языка программирования - «программа». Другими словами, грамматические категории являются наименованиями подъязыков. Например, именами подъязыков ЕЯ являются «глагол», «падеж», «окончания» или «число». Знание метапонятий важно не только в учебных целях, но и с целью манипуляций с текстами при грамматическом разборе и переводе их на другой язык.


Первая практическая польза синтаксиса состоит в том, чтобы анализировать тексты с целью поиска в них синтаксических ошибок. Интеллсист обнаруживает 13 классов ошибок, среди которых имеется класс синтаксических ошибок. Поскольку все правила конструирования текстов известны, программы анализа текстов осуществляют автоматический поиск всех синтаксических ошибок. Это важное обстоятельство для подтверждения правильности текстов. Все правила синтаксиса описывают строгий порядок в написании любых частей текста, нарушение правил должно обнаруживаться в первую очередь, что обеспечивает недопущение текстов в дальнейшую обработку. Синтаксические ошибки, и это правильно, позволяют обнаруживать некоторые смысловые ошибки, но только косвенно. Например, в тексте имеется фраза вида «запись (или таблица( имеют поля» содержит синтаксическую ошибку в использовании скобок. Правильной будет фраза «запись (или таблица) имеют поля». Кажущаяся простота синтаксических ошибок становится сложной, поскольку только размеры фраз определяют простоту или сложность ошибки. Простых ошибок не бывает, описки могут стоить дороже глубокой смысловой ошибки.


Знание синтаксиса важно при освоении любого языка. С помощью синтаксиса осуществляется обучение языку. Описательное представление синтаксиса обычно устраивает пользователя. Однако имеется один важный способ представления синтаксиса, который именуется синтаксической диаграммой, в соответствии с распознающей грамматикой (см. т.2), такие диаграммы именуются графами языков. Граф языка имеет определенную обозримость и более всего приспособлен для ускорения обучения языку. В этом можно убедиться при анализе графа языка Лейбниц.


Имеется еще одно важное свойство синтаксиса, которое состоит в том, что с его помощью частично определяется смысл текстов. Конечно, полностью полагаться только на синтаксис для установления полного смысла текстов нецелесообразно [Логический98, Минский79, Хомский96]. Семантические сети отражают синтаксис и строятся благодаря известному смыслу объектов, они не пригодны для установления смысла. Многие программы используют графовые конструкции для указания взаимосвязей слов, словосочетаний и предложений, построенных по правилам синтаксиса, но они также не разрешают проблемы вычисления смысла текстов. Поэтому синтаксис используется для конструктивного анализа текстов и для определения грамматического смысла конструкции, он почти не используются для вычисления передаваемого текстом смысла. Например, условное предложение позволяет частично определить смысл высказывания как следование, но из синтаксического анализа никак нельзя определить смысл всего предложения. Это обстоятельство и привело к построению СеГ, элементы которой включаются в стандартную часть любого лексикона.


Правила синтаксиса полностью используются для построения грамматических анализаторов текстов. В этом главная заслуга синтаксиса перед информатикой. Все трансляторы построены по синтаксису языка для обнаружения ошибок и для подготовки сведений о применении правил вычисления смысла, которые применяются затем независимо от той или иной синтаксической конструкции. Например, вначале по правилам синтаксиса определяется правильность записи формулы А + В, затем применяются правила интерпретации операции сложения для получения смысла этой формулы без привлечения правил синтаксиса.


Последнее свойство концепции синтаксиса состоит в том, что метапонятия (грамматические категории) образуют систему (в частности терминологический словарь имен подъязыков), полностью характеризующую конструктивную структуру данного языка. Словарь метапонятий определяет совокупность подпрограмм осмысления или перевода текстов на другой язык.


2.2. Концепция семантики языков


Семантика любого языка охватывает обширный круг вопросов по изучению и применению правил выявления или вычисления смысла (или значения) текстов. Она определяет смысл исходных элементов языка (слов, словосочетаний или терминов). На основе этого определяется смысл любой синтаксически правильной конструкции. При определении смысла текста весьма важную роль играет контекст каждого слова, термина и предложения. ФЯ обычно в описаниях семантики учитывают главным образом контекст использования конструкций, определяемых синтаксически. Понятие семантики используется в равной мере при построении ФЯ и ЕЯ (меньше). Совокупность семантических правил для ЯПП (они составляют СеГ) значительно емче совокупности семантических правил ФЯ. Ведь они определяют контекстные условия применения синтаксических конструкций и правила получения значений фраз. Это объясняется весьма важным обстоятельством, аналогичным обстоятельствам, оговоренным для синтаксиса. ЕЯ передает не только знания (в чистом виде), но и эмоциональную информацию, и дополнительные сопутствующие сведения, которые относятся к разряду знаний о знании конкретного человека, написавшего текст на ЕЯ. Семантика определяет смысл текстов или его частей (фраз). В этом главное предназначение концепции семантики.


Описание семантики является второй составной частью описания языка. Семантику иногда сводят к методу прямой интерпретации ЕЯ в некоторой модели [Логический98]. Другой метод состоит в переводе текстов ЕЯ на ФЯ и применении правил интерпретации ФЯ. С формальной точки зрения это правильно. Более того, развитие второго метода полностью используется в СеГ. Для ЕЯ семантика в большей части отсутствует, поэтому грамматика ЕЯ названа синтаксической. Для Интеллсист построена новая грамматика, которая названа семантической. СеГ сформулирована с помощью совокупности правил для вычисления смысла текстов. Исходным элементом СеГ является смысл термина или (самосмысл) лексемы, если она не является частью термина. Композициям терминов и лексем предписывается правило вычисления смысла. И так далее, рекурсивно определяется смысл всего текста до завершения вычислений смысла всего текста. Процесс вычисления смысла напоминает процесс вычисления значения формулы. При этом операциями выступают все термина всего текста, включая, например знаки препинания.


СеГ рассматривает все грамматические категории, относящиеся к синтаксису. Их немного, значительно меньше, чем в СиГ. Главными из них являются типы данных, состоящие из лексем. На втором месте находятся понятия терманд и термация, которые обладают (или временно не обладают) значениями или смыслом. На третьем месте находятся понятия фразы и абзацы, которые имеют вычисленный смысл, Наконец, на четвертом месте находятся разделы ЯПП, которые отражены в голове меню инструментария ИП. Всего СеГ вводит около 100 категорий, что обеспечивает поддержку ЕЯ для передачи Интеллсист с его помощью знаний и запросов и Интеллсист для вычисления смысла текстов.


Практическая польза семантики состоит в том, чтобы при анализе текста обеспечить поиск в нем семантических ошибок. Поскольку все правила вычисления смысла текстов известны, программы анализа текстов осуществляют автоматический поиск всех семантических ошибок. Это важное обстоятельство для подтверждения смысловой правильности текстов. Все правила семантики (как и синтаксиса) описывают строгий порядок в написании любых частей текста для сохранения смысла, нарушение правил должно обнаруживаться в первую очередь, что обеспечивает недопущение текстов в дальнейшую обработку. Семантические ошибки, и это, по-видимому, правильно, позволяют обнаруживать, в частности, смысловые ошибки. Например, в тексте имеется фраза вида «А грамм сложить с В лет» содержит семантическую ошибку в использовании типов данных и операции сложения для этих типов. Правильной будет фраза «А грамм сложить с В килограмм». Число разделов семантических ошибок меньше числа разделов синтаксических, но конкретных обнаруживаемых семантических ошибок больше.


Семантика играет важнейшую роль в обучении пользователя не только потому, что она содержит правила вычисления смысла текстов, но главным образом потому, что изучение основных правил СеГ обеспечивает самоконтроль пользователя при формировании и применении осмысливаемых текстов. После осмысления текстов можно приступать к его обработке и формированию результатов обработки.


Для обработки текстов используются порождающие и распознающие грамматики со средствами их применения - МГР. Центральным языковым средством выражения и предметом обработки знаний является термин. Термин является именем понятия, которое является центральным объектом концептуальной информатики. Из терминов строятся самых разнообразные тексты, которые перерабатываются в Интеллсист. Множество последовательностей терминов образует язык, предназначенный для передачи знаний в системах человек-человек и человек-ВМ. Язык является главным средством передачи знаний. Кроме этого, знания могут передаваться, например таблицами данных, которые являются частью знаний или набором фактического материала.


2.3. Язык как средство передачи знаний


Итак, с помощью языка передаются осмысливаемые знания, как об этом подробно говорилось в томе 2. Каждый текст, передающий смысл должен состоять из терминов понятий. Теперь же рассмотрим это положение с другой точки зрения. Каждый знак может явиться понятием, поэтому последовательность знаков может выражать или представлять знание. Совокупность последовательностей знаков составляет язык передачи знаний. Этот способ передачи знания используется редко. Каждое слово может явиться понятием, поэтому последовательность слов может также выражать или представлять знание. Совокупность последовательностей слов и знаков составляет язык передачи знаний. Этот способ передачи знания считается важным и основным в СиГ. В СеГ используются знаки, слова и лексемы для передачи знаний. Такой подход к представлению знаний является неудовлетворительным, о чем уже неоднократно говорилось. Суть нового подхода к проблеме передачи знания изложена в томе 2.


Каждый термин обозначает или именует понятие, поэтому последовательность терминов может выражать или представлять знание. Условное «может» использовано для осторожности, связанной с возможностью внесения ошибок, при наличии которых смысл, передаваемый последовательностью терминов, становится неопределенным. Кроме этого, произвольный текст может быть бессмысленным, если он является исходным материалом для обработки. Текст любой публикации является исходным для составления терминологического словаря и для создания БЗ после редактирования. Совокупность последовательностей терминов определяет язык, который и рассматривается как средство передачи знания. Отметим, что любой ФЯ или ЕЯ служит для передачи знания. Язык Паскаль передает алгоритмическое знание, все уверены, что любой ЕЯ передает знания любого вида.


Такие рассуждения и назначение СеГ позволяют прийти к выводу, что основой любого языка является понятие, которое обозначается или именуется термином, а термин (напоминание) состоит из слова, знака, числа, символа, строки или из комбинации перечисленных объектов. СеГ определяет термин так, что все указанные способы формирования языков из последовательностей знаков или слов учитываются при определении термина и языка из последовательностей терминов. Образно можно сказать, что любой язык формируется из последовательностей понятий, а если считать, что любая последовательность понятий есть новое понятие, то язык можно определить как множество последовательностей понятий. Такая абстракция оказывается не очень удобной для восприятия смысла текстов. Поэтому образное определение языка остается только для размышлений.


Практически важно выделить из всего сказанного только тот факт, что центральным объектом любого языка является понятие (если хотите - концепция). Следовательно, концептуальная информатика занимает важное место в практической информатике и имеет набор проблем различных уровней и ориентации. Подробный разбор всех аспектов концепции понятия важно для практики формирования осмысливаемых текстов. Подтверждающие примеры не будут рассматриваться здесь, они приводятся везде по мере необходимости иллюстрации того или иного положения.


Следующее замечание можно считать важным. До сих пор разговор идет о последовательностях символов или знаков, которые определяют язык. Но ведь имеются геометрический или предметный языки, которые также служат средством передачи знания. Изображение картины или предмета соответственно выражают «имя» геометрического или предметного понятия, а текст (описание изображения картины или предмета) выражают смысл этого понятия. В соответствии с часто упоминаемой договоренность такие языки пока остаются за пределами рассмотрения информатики в новом определении. Некоторые соображения относительно графической информатики представлены в томе 4.


2.4. Концепция прагматики языков


Концепция прагматики языка (как синтактики и семантики) также содержится в любых ЕЯ и ФЯ. Если роль прагматики ЕЯ весьма незначительна, то ее роль в ФЯ существенна из-за ограниченных возможностей ВМ. Прагматика языка определяется теоретически как раздел семантики, в котором изучаются отношения субъектов, воспринимающих какую-либо знаковую систему или выражающих отношение к самой знаковой системе. Она определяется практически как совокупность правил, ограничивающих количественно использование той или иной конструкции языка. Практика вбирает в себя из теоретического толкования прагматики только такие или главным образом ограничивающие правила.


Грамматики ЕЯ или ФЯ обычно содержат три важные стороны: синтактику, семантику и прагматику. Поэтому рассмотрение прагматики также важно для концептуальной информатики, как введение и изучение других сторон грамматики. Для ФЯ важно использовать прагматику в реализации контроля за правильность выполнения ограничений, предписанных правилами грамматики. Концепция прагматики может использоваться шире и не ограничиваться только контрольной функцией. Например, Интеллсист предписывает ограничение в числе элементов термина, но кроме этого прагматика предписывает правила выбора самих элементов термина и в особенности терминов-синонимов. Если два абстрактных термина «А А» и «А А А» (два и три однобуквенных слов А) использовать во фразе «А А А А А», то точная идентификация терминов не может быть получена. Интеллсист определит, что фраза состоит из терминов «А А А» и «А А», в то время как пользователь подразумевал другой порядок использования терминов во фразе: «А А» и «А А А». Такие коллизии хотя и редки, но все-таки возможны. Прагматика определяет (на интуитивном уровне) правила, запрещающие использование таких терминов, которые приводят к подобным коллизиям. Все количественные ограничения легко учитываются и проверяются.


Концепция прагматики важна для обучения пользователя основам ЯПП. Несмотря на то, что ЯПП является частью ЕЯ, СеГ предписывает правила использования операций и их синонимов в соответствии с таблицами, полученными в результате анализа ЕЯ (и приведенными в Приложении 3 т.2.). Однако надо учитывать индивидуальность в восприятии операций пользователем. Например, операция «или» во фразе «А или Б» некоторыми пользователями может восприниматься как «исключающее или», которое может быть выражено фразами «либо А, либо Б» или «А не равно Б» (синонимически: А xor Б). СеГ предписывает этой операции смысл логического «или», что необходимо знать каждому пользователю, что означает А = истина, Б = истина или оба А = истина и Б = истина. Этот пример иллюстрирует важность и необходимость изучения некоторых разделов СеГ для передачи в Интеллсист правильно осмысливаемых знаний. Практические сведения содержатся в томе 4.


Приведенный пример показывает, что прагматические правила (как и прагматика в целом) могут существенно влиять на определение смысла фраз или текстов. Прагматика СеГ, которая в формальном описании языка Лейбниц представлена как «Ограничение синтаксиса». В точном смысле термина это не прагматика, хотя текст такого раздела в большинстве своем содержит прагматические правила. В процессе практического обучения за партой или при запуске своих запросов к Интеллсист содержанием таких разделов пренебрегать нельзя.


Обучение пользователя может происходить при запуске на трансляцию запросов или при вводе порции знаний. Интеллсист обеспечивает обнаружение и локализацию ошибок в своем процессе грамматического разбора входного текста. Именно так программная система учитывает разделы «Ограничение синтаксиса», Интеллсист обнаруживает неправильное использование сказанного в разделе и понуждает пользователя руководствоваться их содержанием. Совокупность разделов «Ограничение синтаксиса» образует или дополняет систему понятий языка в части его прагматики.


2.5. Соотношение языка и знаний


В теоретических исследованиях языков (вообще в лингвистике) весьма часто рассматривается тема соотношения языка и знания. Считается очевидным, что язык предназначен для передачи и сохранения знаний. Но как эти знания передаются с помощью языка? Для разработки Интеллсист полезно уточнение этого вопроса. Стоит задача извлечения знания из текстов, представленных на некотором языке. ФЯ заведомо служит точной передачи знаний, например алгоритмического знания. Здесь глобальных проблем язык-знание не возникает. Важно лишь передать знания без ошибок. Проблема язык-знание усложняется при использовании ЕЯ. Поэтому для Интеллсист было принято решение разработки СеГ в рамках и для ЯПП.


Имеются многочисленные попытки извлекать знания с помощью СиГ. Об этом говорилось достаточно подробно в томе 2. Все попытки рушились, поскольку считали, что слово является носителем элементарного знания. Исследования показали, что носителем элементарного знания является термин с его текущим значением (факт, выражаемый парой <имя, значение>). Слово только тогда представляет элементарное знание, когда оно является термином. Ошибки в попытках применения СиГ заключены в следующем: использовались слова и знаки препинания для передачи смысла. СеГ ориентируется на следующее: термин вместо слова является носителем элементарного знания, знак, число, символ, строка и слово в составе термина могут нести исходное элементарное знание, все термины подразделяются на терманды и термации, тексты должны состоять из последовательностей точно определенных терминов. Этот перечень дан для напоминания основных положений в разрешении проблем язык-знание. Он определяет и соотношение языка и знания.


После рассмотрения СеГ русского языка, который непрерывно пополняется и распространяется на другие ЕЯ, можно говорить о завершенности формирования Интеллсист на основе знаний. Так же реализован инструментарий Интеллсист. Он предусматривает все простые и сложные работы по преобразованию текстов, представленных на ЯПП, в знания, которые внутренне представлены на языке Лейбниц с многочисленными вспомогательными таблицами.


Соотношение язык и знание рассматривается и разрешается при использовании СеГ - правил вычисления смысла текстов. Идеи формирования СеГ распространяются и на другие области представления знаний. Примерами являются представления геометрического и предметного знания. Важно при этом определить сущность понятия, которое представляется именем и значением. В этом и только в этом случае обработка знаний становится достижимой и понятной.


2.6. Передача смысла текстами


Если текст выражен на ЯПП, то с помощью лексикона и БЗ будет вычислен смысл этого текста. Может быть мало, а может быть чрезвычайно, неожиданным является представление смысла значениями для терминов. Так уж исторически сложились исследования, в соответствии с которыми каждое понятие представлено его именем (термином) и значением, заданным лексемой или вычисляемый в процессе логического вывода. Тексты, составленные из термандов и термаций, подвергаются вычислениям или интерпретации, в которых выполняются термации над значениями термандов так, что в результате получаются новые значения для понятий, представленных вычисляемыми фразами. Этот процесс рекурсивен и завершается после получения значения (смысла) всего текста.


Понятие значения определяется широко. Ими могут быть не только лексемы, включая слова, но и композиции лексем, определяющие агрегаты массивов, записей и таблиц, выражения для функций и процедур или некоторых величин и даже понятия, представленными терминами с или без значения. Такие возможности представления смысла обеспечивают все разнообразие знаний, которые используются специалистами. Это важные положения должны стать привычными для пользователя, несмотря на то, что на интуитивном уровне ему они ясны или подразумеваемы. Если интуитивного уровня недостаточно, то необходимо воспользоваться изучением основ ЯПП, чтобы обеспечить себе квалифицированные формулировки знаний и запросов для Интеллсист.


Применение ЯПП у специалистов не будет вызывать серьезных осложнений, поскольку он ориентирован на лексикон их специальности. Логически правильная формулировка знаний и запросов может даваться легко при использовании подсказок, меню инструментария, опыта работы с Интеллсист и документации по своей специальности. Интересно отметить, что известные информационно-поисковые системы внешне создают впечатление интеллектуальности, так как они «понимают» вопросы пользователя, написанные и составленные на ЕЯ. Однако эти системы реализуют поиск по ключевым словам, а не по смыслу вопроса. Именно поэтому такие системы находят большое число документов, или ответов на вопросы, среди которых могут оказаться и полезные. Использование всего ЕЯ никогда не принесет больших положительных результатов даже с помощью набора словаря ключевых слов. Только вычисление смысла вопросов и сопоставление полученного смысла со смыслом текстов в базе или хранилище документов позволит находить требуемые документы и ранжировать их по смысловому рейтингу.


Итак. Передача смысла текстами возможна только при использовании СеГ, лексикона и БЗ, ориентированных на данную специальность. Можно говорить о приближенном смысле текстов, тогда область поиска может расшириться для поиска документов. Интеллсист не работает с приближенным смыслом текстов, она ориентирована только на определяемый в процессе логического вывода смысл (на вычисление смысла) понятий, фраз и текстов.


В заключение следует обратить внимание на то, что для вычисления смысла текстов необходимо иметь полное представление о понятии как таковом. Важно установить, что такое понятие, как оно определяется, для чего и как формируются представляющие его термины, какие значения может принимать понятие. Далее все эти вопросы будут рассмотрены подробно. Информатика смысла занимается этими проблемами для установления точных определений понятий и применения определений в практическом использовании Интеллсист, построении лексиконов и БЗ.


2.7. Системы обработки знаний


Интеллсист является системой обработки знаний. Система выполняет следующие операции: сбор знаний в лексиконе и БЗ, всесторонний контроль над правильностью представления знаний, полная или частичная автоматизированная формализация знаний, накопление фактического материала, определение смысла текстов, логический вывод результатов выполнения заданий, обнаружение ошибок или выдачу результатов - нового знания. Большинство известных систем обработки знаний (типа ЭС, ПС или интеллектуальных или интеллектуализированных систем) являются программами, ориентированными на реализацию указанных операций. Так можно сказать и о системах, которые выполняют одну или несколько указанных операций. В т.7 подобные вопросы оценки интеллектуальности рассматриваются подробно. Здесь дается фиксация проблем, связанных с обработкой знаний в системах.


Сбор знаний для Интеллсист сопровождается грамматическим разбором текстов всех уровней (лексический, синтаксический, семантический и прагматический). Такой сбор знаний существенно отличается от простого ввода текстов и созданием «удобных» хранилищ для них. Грамматический разбор текстов предназначен для вычисления смысла текста или для определения противоречий внутри текста. После попытки вычисления смысла определяются условия, при которых текст имеет смысл истины. Он определяет некоторый уровень интеллектуальности всей системы.


Интеллсист реализует обнаружение хотя бы одной ошибки из числа 13-ти классов ошибок, что также определяет следующий уровень интеллектуальности системы. Большинство классов ошибок обнаруживаются в программных системах. Но Интеллсист обнаруживает такие классы ошибок, как локальная и глобальная непротиворечивость знаний, независимость знаний и полнота знаний. В этом одно из главных достоинств Интеллсист - производить отладку знаний.


Интеллсист способствует полной формализации знаний даже в том случае, если некоторые понятия вначале не полностью определены. Формализация знаний состоит в точном и полном описании понятий. Практически это делается с помощью меню инструментария и справочной подсистемы. Формализация знаний состоит в переводе текстов на ФЯ. Это делается с помощью транслятора ЯПП на язык Лейбниц. Формализация знаний состоит в составлении и использовании лексикона и БЗ, что обеспечивается МЛВ и МАВ. Формализация знаний состоит в логическом выводе результата решения заданий пользователя, что также обеспечивает МЛВ и МАВ. Формализация знаний состоит также в получении нового знания, выражаемого альтернативами совместных фактов, удовлетворяющих исходному заданию.


Накопление фактического материала можно осуществлять через БД с помощью СУБД. Едва ли стоит серьезно учитывать в этой проблеме накопление фактов путем сообщения величинам их начальных значений или ввода массивов и записей данных перед реализацией вычислений. Интеллсист ориентирована на использование СУБД, что позволяет рассматривать задания, связанные с обработкой емких материалов по фактам, представленным в табличной форме.


Целью работы Интеллсист является получение новых фактов или программ для динамического вычисления новых фактов. Формализация знаний и накопление фактического материала определяют уровень интеллектуальности системы. Этим утверждением завершается рассмотрение систем обработки знаний и главы об основных понятиях информатики. Рассмотрим другой метод реализации системы обработки знаний, который ждет своей реализации.


1. Применения СиГ (смысл по графу связи). Попытки выявления и применение знаний только по СиГ в целом не лишены оснований, хотя любые попытки в ограничении только ее средствами приводит к неуспеху. Применение СиГ возможно в решениях задач, когда смысл текста имеет интуитивный характер. Можно сказать так: формирование и поиск интуитивного смысла может быть реализовано только средствами СиГ. Здесь кратко рассмотрим постановку одной проблемы концептуальной информатики: применения СиГ. Несколько подробнее о ней сказано в т.4, разделе 5.5.1, где рассматривается теория веры.


Накопление знаний в рассматриваемом случае осуществляется методом ведение беседы для выяснения сути происходящего. Беседа фиксируется в памяти в форме вопрос-ответ. Рассуждение с вопросами и ответами предназначено для установления гипотезы, поиска ответов на вопросы или научной истины. Представление элементарного знания имеет форму <текст, граф>. Под текстом понимается слово, знак, лексема или комбинация этих объектов. Под графом понимается граф связи слов, лексем и знаков препинания.


Любая грамматика передает знания (т.2). Этот тезис является здесь основным, его и попробуем установить. Теперь рассмотрим СиГ для определения возможностей вычисления приближенного смысла. Задачи с установлением правоты текстов возникают часто:

  • обоснование гипотез,

  • поиск ответа на вопросы,

  • выяснение обстоятельств, в которых проявляется события,

  • исследование результатов деяний,

  • построение хода рассуждений по заданной теме и др.

Возможно, что некоторые сведения из СеГ будут использоваться в процессах применения СиГ, поскольку эти две грамматики обслуживают один и тот же язык, один и тот же лексический состав языка.


Прежде необходимо выяснить вопрос переноса знаний с помощью СиГ. СиГ, напомним, определяется алфавитом, правилами построения слов и предложений. Возьмем в качестве догмы следующее положение: каждое предложение может быть истинным или ложным, допустимым или не допустимым, оно может иметь любую квалификацию, которую определяет сам пользователь. Таким образом (важное обстоятельство) закон исключенного третьего не действует вообще. Вообще же, операции алгебры логики не учитываются явно. При этом важно согласованность слов и предложений, непротиворечивость утверждений, полнота и независимость совокупности предложений. Проблема определения понятия знание усложняется. Тем не менее, понятия знание необходимо установить, иначе невозможно разрешать какие-либо жизненно важные проблемы (вопросы, запросы, задачи, гипотезы и др.). Потенциальное применение связано со многими областями деятельности человека:

  • ведение следствия или суда (юриспруденция),

  • начальный научный поиск свойств вещей, закономерностей или классификаций,

  • оценка значимости произведений искусства и литературы,

везде, где текстуально документируются содержательные факты и утверждения.


Ранее была высказана мысль о том, что передача знаний с квалификацией их значениями лжи и истины с помощью СиГ невозможна. Но с помощью СиГ можно передавать знания с квалификацией, которая известна только пользователю, а не системе обработки знаний. СиГ не декларирует понятие логического смысла фраз или предложений. Однако СиГ можно использовать для разрешения вопросов и гипотез, не требующих знания лжи или истины (теория веры).


Подойти к понятию знание с указанных позиций можно только с пониманием сущности правил СиГ. Любое правило СиГ определяет, какие знаки, цифры, буквы (символы) образуют слова и предложения, а также их разделители (с помощью операции соединения). В основе представления знаний на базе СиГ лежит операция соединения лексических элементов таких, как слово, число, строка и знаки препинания. Любое предложение является единицей языка. Оно формализуется простым линейным графом, в узлах которого помещаются лексические элементы, а дуга символизирует операцию соединения. Весь текст тогда представляется совокупностью графов. Теперь можно перейти к формальному определению знания. Знания - это текст, используемый как имя данного, и представляющий его граф, являющийся смыслом текста. Под БЗ понимается совокупность элементарного знания, проверенная по всевозможным критериям грамматической правильности, непротиворечивости, независимости и полноты.


Общее определение понятия знание не исключает наличие БД с фактическими материалами. Понятие факта для СиГ можно было бы расширить за счет того, что каждая пара (текст, граф) также можно понимать как факт. Но тогда дело применения нового определения знания на основе СиГ было бы чрезвычайно затруднено, поскольку теория фактов строго не определяется.


2. Постановка цели. Интуитивно понятие цели известно в случае изучения и обработки знаний, извлекаемых из текстов, которые составлены по правилам СиГ. При обработке знаний на основе СиГ возникают различные цели. Рассмотрим лишь несколько из них. Всеобщее применение СиГ невозможно, хотя и имеются попытки разрешить эту проблему (например [Хомский96]). СиГ целесообразно использовать для разрешения или синтеза вопросов в диалогах человека с ВМ. Разрешение вопроса или гипотезы может привести к постановке новых целей или подцелей, которые продолжают диалог в системе человек-ВМ до некоторого конечного результата.


В представлении знаний парой (текст, граф) достаточно хорошо известно по описанию СиГ понятие текста. Действительно, граф в применениях СиГ состоит из множества вершин или узлов и множества пар (или дуг) из двух узлов. Кроме этого, каждая компонента графа интерпретируется или нагружается следующими атрибутами. Узлу соответствует лексический элемент, а дуге - операция соединения лексических элементов. Узлу при кодировании соответствует:

  1. номер лексического элемента,

  2. код признака или квалификации лексического элемента (слово, знак, лексема, табличный элемент и др.),

  3. код конца слова, если лексический элемент является словом,

  4. ссылка на кластер слов, если узлу соответствует не одно слово,

  5. ссылка на продолжение или конец графа (код дуги),

  6. номер семантического преобразования, связанного с этим графом.

Эта нагрузка графа необходима для эффективной обработки знаний. Вся совокупность графов содержательно подразделяется на стандартные и диалоговые графы. Графы, представленные полной совокупностью, технически сложны для обработки и не всегда интерпретируемы как представления знания. Поэтому крайне необходимы средства для обобщения графов. Над графами определяются операции.


3. Классы графов представления текстов. Графами представляются многие объекты информатики. В т.2 подробно рассматривался граф языка. Построение графов приведет к формированию графа языка конкретного диалога. Это один из главных тезисов применения СиГ.


4. БД для хранения знаний, представленных по СиГ. Знания, внутренне представленные на ФЯ, хранятся аналогично тому, как они хранятся в представлениях по СеГ. Здесь следует отметить отличия в составе файлов, поскольку в представлениях знаний преобладают факты. Поэтому достаточно средств СУБД сохранения словарей из слов с пометкой о составе синонимов, выписок из беседы для использования их при проработке всех версий, исходных (и стандартные) знаний и др. Структура БД включает в себя наименование класса данных (автомобиль, дом, улица и т.п.) и столбцов таблиц, являющихся самостоятельной разработкой, исходя из реалий применения.


5. Заключительные замечания. Имеется еще достаточное число способов представления знаний парами (имя, значение). Об этом говорилось ранее. Для каждого способа следует рассматривать аналогичные разделы концептуальной информатики, по которым устанавливается метод внешнего и внутреннего представления, цели и задачи применения, алгоритмы обработки, внешнее представление результатов, применение имеющихся Интеллсист и др.


1   2   3   4   5   6   7   8   9   ...   44

Похожие:

Информатика в семи томах iconСобрание сочинений в семи томах 3 «Собрание сочинений в семи томах»: Время; 2008
Собрание сочинений М. М. Зощенко — самое полное издание прозы одного из крупнейших писателей-новаторов XX века. В него входят практически...
Информатика в семи томах iconИнформатика в семи томах
Излагаемые методы частично модифицированы по сравнению с их оригинальным изложением для их ориентирования и усиления при использовании...
Информатика в семи томах iconИнформатика в семи томах
Определяются логические лексемы, фундаментальные операции, правила преобразования логических уравнений, а также металогика для обоснования...
Информатика в семи томах iconВ семи томах том Информатика смысла Машинная лингвистика
Семантическая и распознающая грамматики связаны между собой как алгоритм и средства его реализации. Основой для контроля правильности...
Информатика в семи томах iconВ семи томах том Основы информатики (Введение в информатику)
Вм на основе своих общих и профессиональных знаний без привлечения программистов для решения задач, для разрешения вопросов или проблем...
Информатика в семи томах iconВ семи томах том Представление знаний (Структуры данных)
Приводимые примеры служат фрагментами прототипов записей знаний и запросов, предназначенных для создателей заданий и запросов к базе...
Информатика в семи томах iconРавительство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том V уфа гилем 2010
Российская академия наук Уфимский научный центр ■ Институт истории, языка и литературы
Информатика в семи томах iconЬство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том VI москва восточная литература 2011
Российская академия наук Уфимский научный центр Институт истории, языка и литературы
Информатика в семи томах iconВ семи томах том Интеллектуальные системы (Системы решения проблем)
Интеллсист, их структуры и технологии работы с инструментарием составляют центральную часть тома. Оценка возможностей Интеллсист...
Информатика в семи томах iconСтихотворения М. И. Цветаевой печатаются в основном по двум изданиям
Стихотворений (главным образом ранних, относящихся к 10-м годам) печатается по изданию: М. Цветаева. Неизданное: Стихи. Театр. Проза....
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница