В семи томах том Информатика смысла Машинная лингвистика




НазваниеВ семи томах том Информатика смысла Машинная лингвистика
страница7/33
Дата29.11.2012
Размер4.61 Mb.
ТипДокументы
1   2   3   4   5   6   7   8   9   10   ...   33

2.1. Проблемы информатики смысла


Понятие смысла до сих пор точно не определено. Поэтому наименование раздела содержит слово «проблемы». Вполне возможно, что понятие смысла известно каждому на интуитивном уровне. Для Интеллсист, работающей на представлениях знаний, этого недостаточно. Необходимо точное определение понятия смысла, позволяющее ВМ вычислять смысл текстов. Именно с этой целью определяется СеГ.


2.1.1. Основания для новой грамматики. В истории развития средств и методов программирования все время наблюдалась естественная тенденция постепенного приближения к средствам ЕЯ при вводе любых знаний в память ВМ. Наступил критический момент, который вызван экспоненциальным ростом числа пользователей ВМ и сохранением числа программистов для обслуживания пользователей. Для Интеллсист необходимы средства передачи знаний в том виде, в каком с ними встречается человек. Это значит, что ВМ необходимо передавать информацию (сообщения) в форме текстов, таблиц, массивов, структур и формул. При этом различные объекты именуются не только словами, но и комбинациями слов, цифр, графических символов. Пока не затрагивается проблема передачи знаний графическими средствами: графиком, чертежом, рисунком или реальной картинкой. Информатика изображений еще ждет своего исследования и выработки средств передачи, анализа и синтеза смысла таких объектов. Информатика изображений сейчас реализуется с помощью текстов, таблиц, массивов, структур и формул.


Первым основанием для СеГ явилась необходимость передачи ВМ сообщений в том виде, в котором их воспринимает человек, на его ЕЯ или той части ЕЯ, которую он использует в своей практической деятельности. Это основание подтверждается накопленным опытом работы с ВМ и связано с разнообразием решаемых с их помощью задач. На базе одних и тех же знаний человек решает многочисленные задачи, которые не укладываются в технологическую схему построения программ и современного использования ВМ. Но каждое требование пользователя вынуждает программиста составлять новые программы или непрерывно улучшать имеющиеся программы. Знание должно определять всю совокупность возможных постановок и решений задач в пределах рассмотренной совокупности знаний. Отсюда следует, что грамматика ЕЯ должна обслужить любые области знаний. СиГ не обеспечивает пользователя необходимыми средствами.


Вторым основанием является проблема формирования языковых основ для представления знаний. При этом главным критерием формирования языков является минимальный отход от средств передачи знаний на ЕЯ и обеспечение минимальных потерь знаний. Методом разрешения проблемы явилось сопоставление ЕЯ и ФЯ после формирования основных принципов понимания или осмысления текстов ЕЯ.


Третье основание зиждется на постепенном освоении понятия смысл текстов, таблиц, массивов, структур и формул. Если данная ниже СеГ русского языка позволяет раскрывать смысл таких объектов, то проблема передачи знаний для Интеллсист будет более чем на половину разрешена. Другая половина проблемы находится в области использования осмысленных знаний для получения ответов на запросы пользователя. Центральная идея построения СеГ заключена в том, что тексты и другие объекты составляются из известных Интеллсист понятий. Их последовательность и призвана передавать знания и запросы для Интеллсист.


Четвертым основанием является пополнение грамматики русского языка понятиями, которые используются не только в профессиональных специальных языках, но и повсеместно, но они совершенно отсутствуют в СиГ. Эти пополнения являются положительной частичной критикой современной грамматики. Грамотность текстов состоит, в частности, из грамотного написания объектов, которые используются всеми и независимо от специальности автора текста, но которые никак не прописаны в СиГ.


Пятое основание лежит в правильности и точности понимания смысла текстов, представленных на ЕЯ. Смысл текста составляется из смысла понятий, фактов, утверждений о фактах и правил построения новых фактов из известных фактов. Смысл текста по существу определяет знание. Интуиция человека работает всегда, это помогает ему часто обходиться без определения слов или фраз. В таких ситуациях человек использует обширный контекст (головы или библиотеки). Интуиция у Интеллсист может появиться только при сообщении ей лексикона понятий, может быть на первых порах даже и не определенных.


Шестым основанием является способ раскрытия структуры любого понятия. Имеющиеся терминологические словари или словари русского языка дают только весьма общее представление и варианты представлений о понятиях, поименованными словами или сочетаниями слов. Такая информация не конкретна и обычно доопределяется контекстом использования понятия. Проблема анализа контекста важна и будет решена при существенном увеличении объемов памяти ВМ. Структура любого понятия должна представляться полно и только возможно частично неопределенно так, что вводимый в Интеллсист текст вместе с ее библиотеками должен быть достаточным контекстом для доопределения понятия.


И седьмое основание. Критика текстов ЕЯ сводится к тому, что некоторые примерные фразы объявляются недопустимыми в силу авторского непонимания некоторых понятий. Авторы критических замечаний приводят традиционные примеры правильного и ошибочного написания предложений, а некоторые говорят о невозможности фразы. К цитируемым примерам относятся предложения: правильно - «Я наблюдал как прощаются друзья.» и неправильно - «Я слышал прощание.». Вторая фраза является правильной в СеГ, если выполнены ее правила и условия применения фразы. Если условно говорить о синтаксическом и семантическом русском языке, порождаемых соответствующими грамматиками, то синтаксический русский язык шире по составу фраз семантического русского языка в силу использования в нем большого контекста для понимания слов. Но сопоставление языков по передаваемому для Интеллсист смыслу приводит к обратному соотношению объемов языков. Речь (а также предметное или графическое общение) является самым широким по объему языком, поскольку смысл речи передается с учетом обстановки и с нарушением правил СиГ русского языка. Здесь нет касательства с такими формами общения. Еще о примере: автору стихотворения прощается второе предложение, и оно становится осмысленным и правильным. Пример поэтической фразы весьма очевиден. Но такие предложения можно наблюдать в текстах многих других профессий. Подобная критика нами не воспринимается, а используется при создании СеГ.


Обоснованием для СеГ, в частности, является ИЛ, излагаемая в томе 5 и реализованная в программах Интеллсист (см. том 7), фундаментальные знания и системные библиотеки словарей. Цель рассмотрения СеГ состоит в указании средств, с помощью которых можно увидеть, почувствовать и передать смысл различных текстов.


Создание и применение Интеллсист требует понимания смысла текстов, поскольку Интеллсист работает на основе знаний, получаемых от специалистов (от кухарки до академика). Знание можно получить только после осмысления текста. Важным обстоятельством является факт, что кроме словесных текстов знания передаются в виде чисел, символов, дат, таблиц, записей, функций и программ. СиГ не содержит правил построения таких объектов для передачи знаний. Поэтому каждая группа создателей программ для ВМ самостоятельно вводит свои грамматические правила, которые неизвестны другим пользователям даже той же специальности. Важно описать СеГ, поставляющую правила представления таких объектов. Только использование СеГ позволит применять Интеллсист каждому специалисту, формировать знания и запросы (вопросы, задачи, задания или проблемы), которые будут поняты и разрешены Интеллсист.


2.1.2. Основной тезис для построения СеГ. Основной тезис и основные аксиомы для построения СеГ представляются следующим образом. Исходный смысл содержится только в термине, который может быть составлен и из одного слова. Каждое слово не несет смысла, если оно не является термином. По правилам СеГ можно определить смысл каждой последовательности терминов (фразы), если не нарушены ее правила. Смысл всего текста состоит в том, чтобы быть истиной. Если текст имеет смысл лжи, то он содержит некоторое противоречие. Таково требование для каждого текста и требование Интеллсист к фразам, передающим знание ВМ.


В процессе построения правил СеГ необходимо определить объекты (в частности, слова) и понятие о знании. Определение объектов является скорее техническим делом. А вот определение знания требует некоторого усилия для преодоления классического (или общеупотребительного) понимания этого термина. При этом надо учитывать, что определение знания обычно формировалось человеком для человека, умеющего интуитивно осмысливать или понимать каждое понятие. Теперь определение знания надо построить так, чтобы возникло понимание определения системой (можно пока воспринимать термин «понимание компьютером» или «понимание системой» в кавычках). Заметим, что после формирования «нового» определения знания, станет ясным, что оно годится и для человека, иначе он не приобретет возможность общения с ВМ.


Итак, главная цель описания СеГ состоит в определении сущности алгоритма для понимания текстов расширенного русского языка по правилам этой грамматики. Другой язык может рассматриваться по аналогии с русским языком, для него также может быть построена СеГ на основе универсальной грамматики, внутреннего представления текстов в Интеллсист, на базе языка Лейбниц.


В основе разрешения вопросов или проблем в деятельности человека лежат знания. Каждый факт, рассуждения о фактах или правила вывода новых фактов выражают знания. В общении между людьми знания выражаются на каком-либо ЕЯ. Для разрешения вопросов или проблем с помощью ВМ необходимо иметь средства для представления знаний. Сегодня в большинстве случаев применение информатики связано с представлением знания программами, пиктограммами, таблицами, диалоговыми фразами или рисунками. Эти средства имеют определенный уровень интеллектуальности и, конечно же, используются в Интеллсист. Для обучения ВМ чаще всего используются процедурные представления, имеющие вполне определенные недостатки (см. т.7), компенсируемые многократным автоматизируемым составлением программ. Существуют формальные и специальные или формализованные языки представления знаний [Брябрин81, Восилюс80, Гришин82, Дюбуа90, Кирсанов82, Клещев82, Кондрашина89, Коэн75, Минский79, Осуга89, Предстинт80, Хельбиг80], которые должен знать пользователь помимо своего профессионального языка. Будем использовать ту часть ЕЯ, которая ориентирована на пользователя, являющегося специалистом в некоторой области знаний.


Представление знаний в памяти Интеллсист требует понимания того, что знания, передаваемые текстами ЕЯ, разложимы на элементы, которыми может оперировать Интеллсист. Элементарным знанием является пара <имя понятия, смысл-значение>, представляющая простой факт. Имя изображается термином, а значение имеет двоякую форму представления: внутренняя форма, которую можно понять только при анализе кодов в ячейках памяти Интеллсист, и внешняя форма, которая выражается лексемами. В примере “погода холодная” термин погода - имя, а термин холодная - значение. Логическая связь или отношения (композиция) фактов образует простое знание - часть законченной мысли, представленная фразой. Внешнее представление простого знания выражается формулами, а внутреннее представляется альтернативами совместных элементарных знаний. Простое знание служит для представления некоторой законченной мысли. В примере “погода холодная и идет дождь” использованы два факта и логическая связка “и”. Логическая совокупность (композиция) простого знания, обычно представляемая набором предложений ЕЯ, называется абзацем, который выражает законченную мысль. Отдельная законченная (формулировкой) мысль называется прикладной аксиомой, в которой пользователь уверен, что она является истиной. Прикладная аксиома определяет некоторый предмет, его свойства, явление или действия с предметами. Совокупность прикладных аксиом определяет БЗ. При анализе всего введенного в память Интеллсист знания прикладная аксиома может войти в противоречие с ранее введенными аксиомами, тогда Интеллсист обнаружит факт противоречия, а пользователь решает, как выйти из такой ситуации. Важно автоматически обнаружить такие противоречия и локализовать.


В БЗ для Интеллсист заведомо введены фундаментальные знания (они обычно содержатся в книгах и учебниках школы или вуза), а затем вводятся конкретные знания, содержащиеся в запросах на разрешение вопросов или проблем. Запросы пользователь формирует сам, включая дополнительные знания, касающиеся данной проблемы. В БЗ накапливаются две вещи: понятия, в которых пользователь выражает профессиональные базовые знания, и прикладные аксиомы, логически связывающие понятия. Эти два главных атрибута представления знаний рассматриваются ниже подробно.


Понимание текстов связано с определением терминов. Вообще же понимать текст необходимо для передачи не только знания, но и команд или вопросов (задач, проблем или заданий). Понимание команд также считается необходимым для общения с ВМ, как и понимание рассудительных текстов. А понимание вопросов относится к пониманию запросов к знаниям. Вопросы могут передавать знания и задание на логическое извлечение знания из хранилища - из БЗ. Большая часть терминов определяется в БЗ. Пользователь в своем запросе может ввести свои термины для решения частных задач.


Имеется и некоторая сложность понимания СеГ, которая вызвана тем обстоятельством, что в ней вводятся понятия, которые широко используются специалистами различных направлений. Однако вводимые понятия обобщены так, что они являются легко познаваемыми. Лексическое расширение СеГ по сравнению с СиГ будет общепонятным. А введение новых грамматических категорий постепенно поясняется в Информатике или в инструментарии Интеллсист.


2.1.3. Отладка знаний и язык. Поиск противоречий между элементами знания содержится в проблеме отладки БЗ (одна из сторон экологии знания), которая состоит в определении локальной или глобальной непротиворечивости, независимости и полноты конкретных знаний. Проблема отладки разрешается следующим образом. При последовательном вводе знаний по абзацам каждый раз решается логическое уравнение (пусть пока не смущает читателя этот термин, см. т.5), по его решению определяются свойства БЗ и вводимого дополнения к БЗ. По дополнению можно судить о непротиворечивости и/или независимости добавляемого знания. Не следует сбрасывать со счетов традиционные методы отладки знаний. К ним относятся: установление грамматической правильности фраз ЯПП и использования понятий, контроль над точным выполнением количественных ограничений, алгоритмическая, системная и концептуальная отладки. Все эти методы, как обычно, имеют программную реализацию и осуществляются автоматически. Смысловая отладка знания в Интеллсист по существу реализуются автоматически или с участием пользователя на этапе ввода знаний для внесения изменений в соответствии с СеГ. Отладка знаний именуется еще исследованием по экологии знаний [Красилов97б].


Экология знаний предполагает чистоту знаний. Знания могут быть засорены повторами или противоречиями. Повторы фактов или утверждений о фактах легко устраняются, они никогда не изменят базового или пользовательского знания. На них следует обращать внимание только для того, чтобы с какой-либо точки зрения охарактеризовать источник знания, что относится к области эмоциональных исследований, на повторы следует обращать внимание еще для того, чтобы рассмотреть знания с позиции «не содержатся ли в текстах описки или даже ошибки». Искажение хорошего текста может породить повторение, которое будет обязательно проигнорировано в Интеллсист при использовании знаний. Конечно же, важнее проблема поиска противоречий. Интеллсист автоматически находит локальные или глобальные противоречия. Локальные противоречия возникают часто, они могут быть и полезными для «чистки» знания. Глобальные противоречия требуют существенного пересмотра знаний и принятия решений человеком относительно дополнительного или имеющегося знания. В полной мере к экологии знаний можно отнести проблему его полноты. Достаточно ли знаний ВМ для решения им заданий? Этот вопрос разрешается только после попытки решить задание. Если решение состоит из новых (или известных) фактов, то знание полно, иначе оно требует пополнения, поскольку решение содержит утверждения о фактах. Интеллсист подскажет, в какой части такое пополнение необходимо осуществить.


Проблемы использования различных видов знания чрезвычайно важны. Они должны учитываться в языке знаний (в ЯПП). Уже упоминалось, что в современных ВМ используется алгоритмическое (процедурное) знание, обычно представленное программами. Кроме этого вида знаний имеются:

  • лингвосемиотические знания (описательные, плохо формализуемые),

  • семантические знания (или языковые, реализуемые через трансляторы ФЯ),

  • концептуальные знания (понятийные, используемые в системах программирования вручную),

  • фактографические знания (данные из базы, используемые через системы управления БД - СУБД),

  • теоретические знания (или логические, используемые также вручную или через систему управления БЗ - СУБЗ)

  • кибернетические знания (технологические, конструкторские или системные), которые учитываются (или не учитываются) в процессах разрешения организационных или конструкторских проблем.

Из перечисления видов знаний (подробнее см. т.1) видно, что многие виды знаний не используются в программировании автоматически и чаще всего только косвенно учитываются при построении алгоритмов. СеГ (как и СиГ) предусматривает использование всех видов знаний.


Сложность использования всех видов знания вызвана тем, что применение процедур ручного перехода от представлений различных видов знания к алгоритмическому виду приводит к потере части знания. Например, программисту было задано решить задачу об устойчивости двух фирм. Имеется некоторое понимание у программиста о методе решения этой задачи, поэтому он проявляет инициативу и решает задачу подходящим образом, не задумываясь над огромными материалами о деятельности фирм. Другой подход состоит в том, чтобы для Интеллсист сообщить все знания всех видов и сформулировать ему задание в пользовательской постановке. Кроме этого надо заметить, что знания могут быть представлены не только символами, но и графически или предметно. Знаниями, представленными графически, сегодня занимаются плотно и успешно. Хуже обстоит дело с предметным знанием. Еще слабы программы, анализирующие видеозаписи, они не извлекают в полной мере все знания, которые заложены в картинках. Можно утверждать, что имеется огромная перспектива использования знаний, представленных графически или предметно после освоения знаний, представленных символами.


Языки знаний определяют способ хранения знаний в памяти ВМ. Построенная СУБЗ для Интеллсист отличается от СУБД объектами и способами представления взаимосвязь фактов в отличие от способов представления таблиц. Конечно, СУБД используется для хранения данных первичных или новых фактов, но не для представлений знания. Так как операции со знаниями существенно отличаются от операций над таблицами, СУБД не может использоваться для этого эффективно. СУБЗ Интеллсист обеспечивает быстродействие логического вывода с реальной скоростью 500 - 5000 операций логического вывода в секунду (в зависимости от мощности ВМ), поскольку система учитывает связи фактов, а СУБД учитывает сами факты, имеющие только косвенные связи. СУБД может обеспечить быстродействие Интеллсист в 10 - 100 операций в секунду (под операцией здесь понимается один шаг логического вывода решения логического уравнения или применение одного правила СеГ). Правила СеГ диктуют такой подход к хранению знаний.


Для передачи знаний в память Интеллсист необходимо определить понятие смысла текстов, чтобы передавать осмысленные знания. Смысл в толковых словарях определяется несколькими вариантами:

смысл - это внутреннее содержание, значение чего-либо, постигаемое разумом;

смысл - это цель, разумное основание;

смысл - это то же, что и разум (понять смысл чего-либо; слово в прямом и переносном смысле; в этом нет смысла; жизнь получила новый смысл; иметь здравый смысл; в подлинном значении слова).

Действительно, разностороннее определение понятия смысла важно, поскольку человек находится в различных сферах деятельности и требует разного толкования этого понятия. По нашей традиции дадим 7 определений понятия смысл.

1   2   3   4   5   6   7   8   9   10   ...   33

Похожие:

В семи томах том Информатика смысла Машинная лингвистика iconСобрание сочинений в семи томах 3 «Собрание сочинений в семи томах»: Время; 2008
Собрание сочинений М. М. Зощенко — самое полное издание прозы одного из крупнейших писателей-новаторов XX века. В него входят практически...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика в семи томах
Излагаемые методы частично модифицированы по сравнению с их оригинальным изложением для их ориентирования и усиления при использовании...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика в семи томах
Определяются логические лексемы, фундаментальные операции, правила преобразования логических уравнений, а также металогика для обоснования...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика в семи томах
Словарь поможет пользователям Интеллсист и разработчикам машинных систем разнообразного назначения в написании отчетов, руководств...
В семи томах том Информатика смысла Машинная лингвистика iconВ семи томах том Основы информатики (Введение в информатику)
Вм на основе своих общих и профессиональных знаний без привлечения программистов для решения задач, для разрешения вопросов или проблем...
В семи томах том Информатика смысла Машинная лингвистика iconВ семи томах том Представление знаний (Структуры данных)
Приводимые примеры служат фрагментами прототипов записей знаний и запросов, предназначенных для создателей заданий и запросов к базе...
В семи томах том Информатика смысла Машинная лингвистика iconРавительство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том V уфа гилем 2010
Российская академия наук Уфимский научный центр ■ Институт истории, языка и литературы
В семи томах том Информатика смысла Машинная лингвистика iconЬство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том VI москва восточная литература 2011
Российская академия наук Уфимский научный центр Институт истории, языка и литературы
В семи томах том Информатика смысла Машинная лингвистика iconВ семи томах том Интеллектуальные системы (Системы решения проблем)
Интеллсист, их структуры и технологии работы с инструментарием составляют центральную часть тома. Оценка возможностей Интеллсист...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика и вычислительная техника” и специальностей 220100 “Вычислительные машины, комплексы, системы и сети” и 021800 “Теоретическая и прикладная лингвистика” Ульяновск 2003
Методические указания к выполнению лабораторных работ по программированию для студентов направления 552800 “Информатика и вычислительная...
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница