Информатика в семи томах




НазваниеИнформатика в семи томах
страница6/24
Дата27.11.2012
Размер3.16 Mb.
ТипДокументы
1   2   3   4   5   6   7   8   9   ...   24
Глава 2. Инженерия знаний (знаниеведение)


Прежде всего (первое) перед каждым пользователем стоят цели решения задач или заданий информатическими средствами. Каждая работа, связанная с достижением такой цели, требует знаний и умений. Второе - каждое задание может относиться к одному из классов заданий. Их классификация может быть осуществлена по различным признакам, например так, как сделано ранее. Здесь принято рассматривать семь видов знаний, семь классов задач и семь координат классификационного пространства Интеллсист. Обработкой знаний занимаются все. ВМ используется для ускорения процессов обработки знаний. Любая обработка основана на знаниях. Отсюда следует, что важным делом информатики является знание о знании. Практическая часть информатики состоит в создании автоматизированных или автоматических методов обработки знаний. Всякая деятельность в этом направлении именуется в информатике инженерией знания. В главе рассматриваются начальные основы инженерии знаний. В т.7 кратко рассматриваются проблемы знаниелогии.


Деятельность человека в информатике в помощь прямому пользователю ВМ именуется знаниеведением. Роль и деятельность знаниеведа рассматривается также в т.7. Здесь же создаются предпосылки для подхода к описанию такой деятельности.


2.1. Отладка знаний


Отладка знаний являет новую парадигму в информатике. ЭС во многом проигрывает только из-за того, что в таких системах отсутствуют средства отладки знаний. Доверие к ЭС в последнее время резко упало. Как только знаниеориентированная система приобретет свойства автоматического обнаружения ошибок в представлениях знаний, она будет популярна в применениях. Интеллсист обладает такими свойствами. Вначале рассмотрим понятие отладки знаний.


Источники ошибок бывают самые разнообразные. Причины большинства ошибок известны. Примерами причин появления ошибок могут быть такие: пропуск или подмена знаков, описки, которые чаще всего бывают случайными, теоретические «заблуждения», разрушения или искажения представлений знания, порождение новых ошибок при неправильном исправлении ранее обнаруженных ошибок.


Поиск, локализация, квалификация и исправление ошибок в представлениях знаний всегда были важной работой, она определяет процедуру отладки знаний. Обычно выделяют ошибки следующих 13 классов: 8 классов учитываются во многих программных системах (к ним относятся синтаксические, лингвистические, концептуальные, семантические, прагматические, формульные, системные и предметные), новыми для автоматизации являются 5 классов ошибок (к ним относятся смысловые, локальные противоречия, глобальные противоречия, независимость и полнота знаний). Чтобы знания были осмысливаемы, необходимо обнаруживать смысловые ошибки, вызванные нарушением правил СеГ или СиГ. Каждый человек говорит истинами независимо от того, что само высказывание может содержать модальности или отдельные ложные утверждения. Например, истинными будут высказывания: «возможно пойдет дождь» или «он говорит неправду». Важно, чтобы в контексте БЗ или запроса были обнаружены противоречия. Локальные противоречия могут оказаться менее ответственными, они могут «подчищать» знания, реже они могут оказываться существенными, что потребует тщательного разбора всех сведений, которые рождают локальные противоречия. Самыми существенными являются глобальные противоречия. При их наличии разрешение запроса невозможно. Поиск противоречий является сложным делом. Поэтому надо иметь аппарат автоматического обнаружения противоречий. Независимость знаний, наличие явных или завуалированных «повторов» частей текстов, должна обеспечить сокращение знакового и текстового объема знаний. Исключение избыточности в текстах не менее важно, чем обнаружение других классов ошибок, оно также должно быть автоматическим. Зависимость знаний более всего характеризует их источник. Наконец, обнаружение полноты знаний является важным для гарантии получения окончательных результатов, состоящих из новых фактов.


Смысловые ошибки во многом аналогичны синтаксическим, лингвистическим, концептуальным, семантическим, прагматическим и формульным ошибкам в совокупности. Отличия состоят в том, что правила формирования текстов знаний и запросов не фиксированы, они определяются самими записями знаний и запросов. По технике автоматизации поиска смысловых ошибок имеется значительная, а иногда и полная, аналогия с перечисленными выше ошибками. Заметим, что первые 8 классов ошибок не рассматриваются подробно в силу их большой известности. О них кратко уже упоминалось ранее. По тем же причинам не рассматриваются и смысловые ошибки. Если текст правильно передает смысл, то в нем не содержатся смысловые ошибки. Результатом такой отладки знаний будет грамматически корректный текст с точки зрения правил СеГ.


Локальные противоречия выявляются тогда, когда часть текста противоречит части знаний в базе. Простой пример с локальным противоречием выглядит так: «я пойду в кино или в театр и одновременно я пойду в кино или не пойду в театр». В результате логического вывода получится ответ: «я пойду в кино». Локальные противоречия обнаруживаются в результате внутреннего логического анализа текстов, осуществляемого в процессе логического вывода при вводе знаний или при разрешении запроса. Практические примеры могут и не содержать такие простые и явные противоречия. При этом после логического вывода объем БЗ уменьшится. Для Интеллсист уменьшение объема БЗ будет сигналом для появления локального противоречия. Результатом такой отладки знаний будет «чистый» текст.


Глобальные противоречия выявляются тогда, когда вводимый абзац полностью противоречит знаниям из БЗ. В Интеллсист такие ошибки (хотя и редко) обнаружатся в результате обнуления размера БЗ. В результате Интеллсист выдаст сообщение о том, что результат ложен. Глобальные противоречия обнаруживаются при полном логическом анализе всех текстов, осуществляемого также в процессе логического вывода при вводе знаний или при разрешении запроса. Результатом такой отладки знаний будут получены корректная БЗ или корректный запрос.


Независимость знаний обнаруживается при наличии локальных или глобальных повторов в текстах по смыслу или при непосредственном совпадении фрагментов текста. Независимость знаний есть результат логического сопоставления смыслов двух предложений или абзацев. Результатом такой отладки знаний будет «очищенный» от явных или неявных повторов текст.


Полнота знания выявляется при разрешении запросов тогда, когда результат логического вывода не состоит из фактов, а из выражение, смысл которых не всегда ясен. Полнота знания выявляется после реализации логического вывода как результат применения метода решения логического уравнения. Знание в БЗ и запросе будет полным, если в результате получаются только альтернативы совместных новых фактов. При этом надо заметить, что получение единственного решения, а не альтернативных решений, характеризует знания как абсолютно полными. Получение альтернативных решений может оцениваться положительно. Все зависит от требований к заданию. В математике высоко ценится факт единственности решения. Здесь требуется абсолютная полнота. Практические задачи могут предполагать альтернативные ответы Интеллсист, так как выбор окончательного решения зависит от человека. Знание не полно, если в ответе содержатся утверждения о фактах. Такие результаты могут быть полезными при производстве аналитических выкладок и выявлении характеристик нового понятия. Такие результаты получаются на ранних стадиях проектирования. Наконец, такие результаты полезны при автоматическом создании программ. Полнота знаний выявится после ввода исходных данных и получения итоговых результатов счета по синтезированной программе.


Таким образом, под отладкой знаний понимаются процессы поиска, локализации, квалификации и исправления ошибок 13 классов. В этих процессах сложным является квалификация ошибки в условиях их автоматического обнаружения. Чаще всего Интеллсист помогает выполнению этих процессов. Первую обнаруживаемую ошибку следует исследовать сразу после обнаружения. Если пропустить первую ошибку, то последующие могут оказаться порожденными, идентификация которых будет почти невозможной. Ошибки следует разбирать непосредственно после ее появления.


Работа по отладке знаний относится к инженерии знаний. Она является весьма ответственной и выполняться в первую очередь. Процесс отладки знаний лучше всего осуществлять по мере накопления знаний. Автоматический поиск ошибок (даже незначительных) не требует больших затрат по времени. При этом необходимо помнить крылатую оценку, что позднее обнаружение ошибки или обнаружение их на этапах сопровождения знаний стоит в несколько сот раз дороже, чем обнаружение ошибок на этапах проектирования [Боэм85].


2.2. Этапы создания объекта


Здесь увеличивается число этапов создания любого объекта по сравнению с тем, что предлагается в монографии [Боэм85]. Имеются и другие предложения по членению процесса создания некоторого изделия на этапы. Хорошим критерием правильности членения процесса на этапы является равномерность распределения относительных затрат на выполнение этапа. Примерное распределение затрат на производство программного изделия по этапам представлено в таблице. Большие затраты на сопровождение связаны с внесением изменений из-за ошибок и развитием, маркетингом, рекламой и др.


Этап работ

Доля затрат в %

Проектирование программного изделия

10

Разработка программного изделия

40

Сопровождение программного изделия

50

В связи с внедрением ВМ доли затрат переливаются из нижних рядов таблицы в верхние.


Этап является средством постановки промежуточных целей для эффективного достижения общей цели создания изделия. ИП меняет состав этапов, они должны учитывать процессы формирования исходных идей. В обработках знаний необходимо рассматривать следующие этапы: изобретание, проектирование, разработка и сопровождение. Три этапа создания программного изделия расширяются до четырех этапов создания любого изделия. Всегда уделялось мало времени и материальных затрат на выработку идей и эксперименты в связи с новыми идеями. При создании материальных объектов изобретание связано с затратами, на которые трудно пойти. Если исследования идей ведется с помощью информатики, то затраты существенно сокращаются. Этот факт установлен после реализации первых программных моделей и проведения исследований с их помощью. Остальные этапы не вызывают сомнений. В современной информатике следует рассматривать новое разделение процессов обработки знаний с другими оценками долей затрат. Оно представлено в таблице.


Этап работ

Доля затрат в %

Изобретание изделия

10

Проектирование изделия

30

Разработка изделия

30

Сопровождение изделия

30

Затраты на разработку и сопровождение БЗ сокращается существенно, поскольку БЗ подвергаются всесторонней автоматической отладке. По сравнению с программами БЗ не является кодом, который требует больших затрат на поиск ошибок и модернизацию.


Совокупность этапов образует жизненный цикл изделия или объекта. Этапы могут подразделяться на составные части. Жизненный цикл любого изделия можно представить графически в виде зависимости числа изделий от времени его полного существования. Примеры таких графиков представлены ниже. Если конечным продуктом является знание, то к процессам разработки инструментария ИП, Интеллсист, БЗ или запросов следует применять членение жизненного цикла на четыре этапа.


Имеется общий закон вещей. Он состоит в том, что число каждой вещи изменяется в соответствии с графиками. Рассмотрим систему координат, вдоль оси абсцисс которой располагается масштаб времени (например, года), а вдоль оси ординат - количество данной вещи или числа потребителей (N). Вначале данной вещи не было. Некоторой дате соответствует N=0. Начинается развитие вещи: конечно, возникает идея о вещи, строятся экспериментальный образец (N=1) и опытное производство. Затем наступает бум (если имеется спрос на эту вещь): налаживается серийное производство и общее потребление. Вот здесь для N наблюдается экспоненциальный рост (в этом месте работает первый закон информатики, см. т.7, для каждой конкретной единицы измерения объема знаний). Средняя часть графика с названием «насыщение вещью» подразумевает общее потребление, осмысление вещи (или фактическая оценка ценности вещи) и появление новых идей. Значения N стабилизируются, начиная постепенное падение (уменьшение) значения N. Наконец, последняя часть графика


Рис. Жизненный цикл изделия.

(самая продолжительная по времени) именуется «старением» и включает последовательные шаги: падение спроса, переоценку вещи и появление музейного экспоната. В зависимости от назначения вещи «хвост» графика либо спадает до нуля, либо останавливается на уровне пропорциональности численности потребителей (со спадом за пределами графика). График 1 представляет появление идеи, которая не нашла своего воплощения в жизни, график 2 является характерным для подавляющего числа объектов, а график 3 - относится к объектам, которые не могут в обозримом будущем исчезнуть из употребления (к таким объектам относятся, например, ложки, посуда, одежда). Знание не является исторической вещью, поэтому спад объема знаний может быть только при замене одного способа хранения другим. Бум для знаний приводит к новым методам сжатия представлений знания. Знание особая вещь, его объем выражается в различные годы различными единицами. Развитие средств познания способствует смене единицы измерения такой «вещи» как знание.





2.3. Фазы процесса поиска нового знания


Теперь ограничимся такими изделиями как инструментарий ИП, Интеллсист, БЗ или запросы. Каждый этап имеет протяженность по времени и остается достаточно емким. Следуя рекомендациям работы [Боэм85] предлагается расчленить каждый этап на фазы, характеризующиеся однородной деятельностью разработчика. Фазами являются процессы, которые представлены ниже в таблице вместе с относительными затратами.


Фаза работ

Доля затрат в %

Планирование знаний и процессов обработки, выработка требований к представлениям знаний и данных.

10

Техническое проектирование процессов создания, разработки и сопровождения.

20

Выбор средств представления знаний и данных в виде, пригодным для ввода в Интеллсист.

50

Комплексирование всего материала из частей, отладка и испытание знаний.

20
1   2   3   4   5   6   7   8   9   ...   24

Похожие:

Информатика в семи томах iconСобрание сочинений в семи томах 3 «Собрание сочинений в семи томах»: Время; 2008
Собрание сочинений М. М. Зощенко — самое полное издание прозы одного из крупнейших писателей-новаторов XX века. В него входят практически...
Информатика в семи томах iconИнформатика в семи томах
Определяются логические лексемы, фундаментальные операции, правила преобразования логических уравнений, а также металогика для обоснования...
Информатика в семи томах iconИнформатика в семи томах
Словарь поможет пользователям Интеллсист и разработчикам машинных систем разнообразного назначения в написании отчетов, руководств...
Информатика в семи томах iconВ семи томах том Информатика смысла Машинная лингвистика
Семантическая и распознающая грамматики связаны между собой как алгоритм и средства его реализации. Основой для контроля правильности...
Информатика в семи томах iconВ семи томах том Основы информатики (Введение в информатику)
Вм на основе своих общих и профессиональных знаний без привлечения программистов для решения задач, для разрешения вопросов или проблем...
Информатика в семи томах iconВ семи томах том Представление знаний (Структуры данных)
Приводимые примеры служат фрагментами прототипов записей знаний и запросов, предназначенных для создателей заданий и запросов к базе...
Информатика в семи томах iconРавительство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том V уфа гилем 2010
Российская академия наук Уфимский научный центр ■ Институт истории, языка и литературы
Информатика в семи томах iconЬство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том VI москва восточная литература 2011
Российская академия наук Уфимский научный центр Институт истории, языка и литературы
Информатика в семи томах iconВ семи томах том Интеллектуальные системы (Системы решения проблем)
Интеллсист, их структуры и технологии работы с инструментарием составляют центральную часть тома. Оценка возможностей Интеллсист...
Информатика в семи томах iconСтихотворения М. И. Цветаевой печатаются в основном по двум изданиям
Стихотворений (главным образом ранних, относящихся к 10-м годам) печатается по изданию: М. Цветаева. Неизданное: Стихи. Театр. Проза....
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница