Информатика в семи томах




НазваниеИнформатика в семи томах
страница9/44
Дата30.08.2012
Размер6.34 Mb.
ТипДокументы
1   ...   5   6   7   8   9   10   11   12   ...   44
Глава 6. Вычисление смысла понятия


6.1. Смысл понятия


Общее определение смысла некоторого понятия включает то, что смысл выражает мысль, содержащуюся в понятии. Это определение надо уточнить. Оно указывает содержание или назначение какой-либо вещи, цель какого-либо процесса или поступка, сущность какого-либо явления. Смысл определяет контекст, в котором используется определяемое понятие, и наоборот, контекст подчас уточняет или даже определяет смысл определяемого понятия. Именно это обстоятельство чрезвычайно усложняет определение смысла данного понятия. Фактически здесь дано косвенное определение, которое создает общее представление о понятии смысла (см. также т.2).


Несколько точнее будет представлено определение смысла, если сопоставим два понятия: значение и смысл. Значение понятия - это предмет, смысл понятия - это сообщение, содержащееся в нем. Смысл эквивалентен значению только тогда, когда рассматривается собственное имя. Например, число 49 имеет значение, которое совпадает со смыслом этого числа. Такой же пример и так же интерпретируется - это собственное имя человека. Вообще же, смысл понятия не эквивалентен значению по двум причинам. Во-первых, одно и то же понятие в различных контекстах может иметь различные значения. Во-вторых, смысл вносит вклад в интерпретацию текста (и наоборот), включающего данное понятие, а значение обычно остается самим собой. Можно привести еще некоторые различия в понятия смысл и значение. Из приведенных характеристик уже можно сделать вывод об их различении.


Рассмотрим логические основы понятия смысла. Поскольку определение понятия представляет собой совокупность логических суждений, то и смысл понятия определяется из этих же суждений. Знание смысла некоторого суждения может зависеть от знания смысла другого суждения (вложенного в него или находящегося в контексте). Смысл определения понятия заключается в логической связи известных понятий. И эта интерпретация понятия смысла уточняет сущность самого смысла.


Формирование понятия, которое должно выражать некоторый смысл, осуществляется человеком и передается в память ВМ. Проблема концептуальной информатики, связанная с автоматическим формированием понятия, пока еще находится в начальной стадии постановки. Поэтому рано говорить об алгоритмах обучения Интеллсист данным из среды исследования и распознавания понятий по результатам исследований. В связи с этим будем ориентироваться на возможности человека, которые можно представить вариантами его деятельности при формировании понятия.


Прежде всего, понятие может возникнуть в результате озарения. Озарение - это итоговое проявление подсознания, результат внутренних не осознанных процессов принятия решений для некоторых ситуаций, положений или действий. Как и другие понятия, понятие озарения многолико, поэтому его краткое определение только вычленяет канву для понимания того, как человек осуществляет свою работу по формированию данного конкретного или абстрактного понятия (в частности).


Понятие может подсказать так называемый здравый смысл человека. Здравый смысл - это совокупность взглядов, навыков, форм мышления, используемая человеком в повседневной практической деятельности и в зависимости от сложившихся ситуаций, положений или действий. Этот способ формирования, например, понятий работает чаще всего при использовании интуиции, наития или беглого исследования окружающего мира. Так или иначе, но здравый смысл способствует, по крайней мере, экспресс формулировке понятия в исследуемой предметной и проблемной области.


Следующий прием определения смысла, применяемый при формировании понятия, именуется интеллектом, который может использоваться только при наличии знаний. Интеллект - это разум человека, способность его познавать предметы, явления и процессы действительности, умение его мыслить (или производить логический вывод) и в процессе мышления достигать целей формирования понятий (в частности). Моделирование интеллекта, создание Интеллсист или ЭС составляют ведущий предмет современных исследований информатики. Можно надеяться на то, что с помощью Интеллсист можно будет достичь результатов автоматизации процессов формирования понятий, тем самым разрешить проблемы концептуальной информатики.


Немаловажную роль играет память при формировании новых понятий. Память - это способность сохранять и воспроизводить сообщения о внешнем мире и о своем внутреннем состоянии для последующего использования в реальных жизненных процессах. Память важна не сама по себе, а в союзе с другими подходами формирования понятий. В данном случае имеется в виду под памятью не только средство хранения, но и средство быстрого доступа к сохраняемым сообщениям.


Фундаментальным подходом к формированию понятий является применение логического мышления. Это следует из того факта, что определение понятия состоит из совокупностей логических суждений. Логическое мышление - это совокупность навыков и умений строить логические суждения, исходя из имеющихся логических суждений по некоторым правилам вывода. Например, определения направлений в информатике логически следует из развития методов программирования.


Нельзя сколько-нибудь пренебрегать возможностью человека к фантазии, к сочинительству или к выдумке нового. Это ему свойственно. Фантазия - это плод воображения человека, которое характеризуется особой силой, яростью и необходимостью создаваемых им представлений и образов воображаемого мира. Может быть, при самом начале формирования, например понятия, человек прибегает к фантазии, что создает поле работы с новыми предметами, явлениями или процессами.


Наконец, человек еще обладает интересным свойством изобретательства. Изобретательность - это умение человека, способность его синтезировать новые предметы, явления и процессы, а также их образы, с помощью имеющегося знания и известных приемов изобретания. Изобретательность - это наиболее «сложная» процедура работы мышления человека, она дается в результате упорной учебы методов изобретания и формирования навыков в такой работе.


Мы рассмотрели почти все способы формирования понятия в результате мыслительной деятельности человека. Как сформировалось понятие информатики? Можно с большой достоверностью сказать, что никоим образом не превалировал ни один способ, способы работали параллельно, проверяя результаты работы каждого способа всеми остальными способами.


6.2. Приемы определения понятия


На интуитивном уровне каждый представляет о том, какие приемы необходимы для выбора, создания и построение понятия. Во многом приемы формирования понятия и его атрибутов уже рассмотрены выше во многих разделах. ЯПП предписывает правила и способы записи атрибутов понятий, которые покрывают все практически полезные случаи. Среди приемов определения отметим следующие.


Указание на представительность понятия. Описание предмета, явления или процесса - это, в частности, перечисление наименований конкретных представителей данного предмета, явления или процесса. Такое описание может и не составлять определение и быть временным до построения полного определения. Такое описание может быть исходным данным для изучения понятия - оно является началом осмысления понятия.


Расстановка ограничений для признаков. Приемом построения определения является сбор или формирование ограничительных признаков, позволяющих отличить одно понятие от других понятий. Границы для понятия существенно уточняют смысл данного понятия.


Объяснение понятия. Третий прием связан с установлением достоверности суждений, сопровождающих данное определение. Этот прием позволяет получать более ясное и отчетливое представление о предмете, явлении или процессе изучения. Именно здесь устанавливается единый смысл понятия.


Перечисление характеристик. Указание списка признаков понятия задает довольно точное определение этого понятия. Сами признаки еще не дают окончательного понимания понятия, необходимы перечисления количественных или качественных характеристик каждого признака. Список признаков вместе с указанием характеристик образуют прием определения понятия.


Сравнение понятий. Этот прием согласуется с приемом познания окружающего мира, с его помощью устанавливаются сходства и различия разнообразных понятий. Прием составляет основу для альтернативного выбора. Результатом сравнения будет факт установления самых общих признаков, присущих данному предмету, данному явлению или данному процессу.


Переработка определения. Каждое определение может формироваться некоторым сортом определения. Наилучшим вариантом работы с определением является формирование всех сортов определений для данного понятия. Такая переработка определения также составляет эффективный прием построения определения.


Применение логических правил. Поскольку определение является по существу логическим выражением, имеет смысл рассмотреть умозаключения при аналогиях, индукции, традукции и дедукции. Такого сорта умозаключения дают в руки аппарат для формирования новых определений. Определения по аналогии базируются на подобии, сходстве свойств, признаков и отношений различных вещей. В связи с этим и их определения можно строить на таких же принципах. Принципы аналогии работают там, где имеется больше общих свойств вещей, где общими свойствами являются наиболее существенные, где связь аналогичных вещей познана более всего. Определения формируются с применением индуктивных методов. Этот метод можно охарактеризовать так. Если определение наводится на общие свойства вещей, присущие всем единичным вещам, то такое определение строится по индукции. Знание вообще является понятием об общем, а общее может познаваться в частных случаях путем сравнения частностей. Это все позволяет применять при построении определений принципы умозаключений по индукции. Имеется промежуточный между индукцией и дедукцией метод исследования и определения новых понятий - это метод традукции. В методе традукции посылки и заключения имеют одинаковую общность. Использование этого метода реализует переход от одного знания к другому знанию той же общности. В основе метода лежат логические умозаключения с правилами вывода с указанными свойствами. Некоторое определение приписывается вещам в силу того, что такое же определение приписано другой вещи, имеющей ту же общность. Перенос формы или содержания определения в таких случаях закономерен. Наконец, имеется еще метод дедукции, который во многих случаях целесообразно использовать при построении нового определения. Этот метод использует логический вывод из исходных мыслей, аксиом, гипотез или ранее доказанного нового более общего, а из общего делается заключение в отношении частного.


Следует иметь в виду, что указанные приемы и методы можно применять и при формировании одного и того же определения. Построение определений в такой форме его развития важно для получения более надежного определения и более соответствующего реальной действительности.


6.3. Правила определения понятия


Имеется семь правил построения определений понятий, они даны в справочнике [Кондаков71]. Правила изучаются в формальной и неформальной логиках. Рассмотрим их описательно в той же последовательности.


Правило 1. Понятие определяется через ближайший род и видовое отличие. Например, «Информатика (определяемое понятие) есть наука (ближайший род) об описании, осмыслении, определении, представлении, обобщении и использовании знаний с применением средств вычислительной техники для получения нового знания (видовое отличие информатики от других наук) в различных сферах деятельности человека.


Такой логический прием определения понятия заключается в отыскании ближайшего рода и отличительных признаков, имеющихся только у данного вида предметов, явлений или процессов и отсутствующих у других предметов, явлений или процессов, входящих в данный род. Определять понятие через широкое перечисление признаков вещи невозможно, поскольку каждая вещь обладает бесконечным числом признаков, перечисление признаков становится нереальным делом. Здесь должен эффективно работать прием, состоящий в подведении данного понятия под другое, более широкое (информатика - это наука).


Подведение данного понятия под более широкое понятие - это только начинает или открывает определение. Каждое понятие есть вид одного из родов. Из всех видов необходимо выделить именно тот, который определяет понятие. Для этого надо найти существенный специфический признак, который отличает этот вид от другого вида, входящих в указанный род. В ЯПП определение понятий связано с первым правилом. Вначале сообщается термин (имя понятия), затем указывается его общая характеристика - тип, которым могут обладать многие родственные понятия. Здесь схематично и через характеристику указывается род всех понятий по смыслам. Описанный прием определения понятия является наиболее распространенным приемом, но не единственным. Рассмотрим другие приемы.


Правило 2. Определение должно быть соразмерным так, чтобы объемы определяемого понятия и определяющего понятия совпадали, были одинаковыми, соответственны. Здесь могут быть допущены логические ошибки в определении понятия. Например, в определении информатики нельзя опускать слово «использование». При опускании этого слова понятие информатики по объему становится шире по сравнению с определяющим понятием. Другая логическая ошибка в определении понятия заключается в нарушении правила соразмерности: объем определяемого понятия больше объема определяющего понятия. Опускание слов «с применением средств вычислительной техники» приводит к логической ошибке, в результате которой произойдет смешение информатики с логикой, гносеологией и др. науками. В определениях понятий смешения недопустимы и опасны, поскольку могут привести к явным или скрытым противоречиям.


Нарушение этого правила приводит к опусканию части знания о понятии. В новом определении информатики указано, что она является наукой. Этот факт требует последовательного доказательства, которое и дано на протяжении всего материала книг. Если доказательство удалось или оно было правильным, то объемы понятий наука и информатика соизмеримы.


Правило 3. Видовым отличительным признаком правильности нового определения должен быть признак или группа признаков, свойственные только данному понятию и отсутствующие у других понятий, относящихся к тому же роду. Этот прием по существу своему выдвигает требование к правилам отбора признаков вещи. Признаки должны быть информативными, ох общее количество должно быть минимальным. Если М - число видов, то N = [log М] + 1 - это число признаков. В новом определении информатики существенными признаками являются применение ВМ и технология получения нового знания. Эти признаки являются отличительными. Программирование обладает признаком применения ВМ, но не обладает признаком технология получения нового знания. Гносеология обладает признаком исследование (обработка) знания, но не обладает признаком технологии применения ВМ. Интересно, что информатика определяет новые науки «Информатика программирования» и «Информатика гносеологии». В отличие от определения информатики в указанных двух науках отсутствует признак в различных сферах деятельности человека.


Правило 4. Определение не должно быть циклически рекурсивным. Когда говорят, что х := х + 1, то непрерывно определяется значение х до тех пор, пока не определим начальное значение для этого рекурсивного определения х. Другое определение х исключает ошибки цикличности. Пусть х := 0 вместе с х := х + 1, тогда х становится определимым. Для каждого рекурсивного определения (чтобы оно не было циклическим) необходимо указать некоторое частное (начальное) значение определяемого понятия, на основе которого искомое понятие будет вполне определенным.


Рекурсивные определения весьма полезны, так как они экономят место и время не только при определении понятия, сколько в освоении, применении и использовании определяемого понятия. При конструировании рекурсивных определений необходимо соблюдать указанное правило, в особенности в тех случаях, когда несколько рекурсивных определений переплетаются между собой. Необходимо точно обнаружить число начальных значений для каждого понятия. Практически сложные рекурсивные определения могут встретиться главным образом в математике.


Правило 5. Определение должно быть внутренне и внешне логически непротиворечивым. О внутренних противоречиях уже частично говорилось. Определение может быть логически противоречивым другим определениям (внешнее противоречие), что недопустимо. Например, в формальной логике С определяется так: С = А и С = not А. Тогда знание об этом понятии есть (С = А) & (С = not А) равно ложь. Знание разрушается полностью. Определение может быть внутренне противоречиво. Рассмотрим также формальный пример из формальной логики: С=А \/ В и С=А \/ not В, тогда знание о понятии С есть (С=А \/ В)&(С=А \/ not В) равно С & А, что уничтожает знания частично (частичное разрушение знания, которое, вообще говоря, допустимо, но должно быть контролируемо).


Поиск логических противоречий для определения или системы определений является сложной проблемой при конструировании Интеллсист. Некоторые вопросы разрешения таких проблем рассматриваются в томе 5. Практическая рекомендация может быть такой: используйте Интеллсист для определения противоречий, если ручная работа не приводит к окончательному результату проверки с помощью рассматриваемого правила построения определения.


Правило 6. Определение должно быть положительным, а в исключительных случаях допускать отрицательность. Цель каждого определения заключается в том, чтобы ответить на вопрос, чем же является данный предмет, явление или процесс, который отражается в понятии. Определение должно в утвердительной форме указывать признаки, определяющие понятие. В определении их должно быть строго конечное число. Вся сумма признаков чаще всего (или теоретически) бывает бесконечной. Поэтому указание на отсутствующие признаки (негативное определение) не позволяет перечислить требуемое конечное число признаков, характеризующие предмет, явление или процесс.


Если определение построено на основе указаний тех вещей, которые не относятся к данному понятию, то пользователь понятия встретится с многочисленными противоречиями при использовании его в БЗ или запросе. Однако определение может содержать указание классов вещей, которые не относятся к данному понятию. Примеров тому много. Простейший пример Х < 0 может полностью определить величину Х в некоторой математической задаче. Х такой, что все (класс) положительные числа, включая 0, не характеризуют Х. Использование отрицания признаков также допускается, например, в тех случаях, когда число признаков конечно или равно нулю. Пустое множество определяется как множество, не содержащее элементов. Это вполне понятное определение. Здесь использовано конечное число признаков (один признак): имеются элементы или не имеются. В п.5 перечисления правил дано отрицательное определение в силу того, что определение может быть либо противоречивым, либо непротиворечивым.


Правило 7. Определение должно быть ясным и четким и не должно содержать двусмысленностей. Это требование удовлетворяет запросам человека, познающего определения. Здесь понятие двусмысленности нужно понимать обще и не сводить его только к возможным противоречиям. Однако, с такой точки зрения формальное определение удовлетворительно (в соответствии с некоторым формализмом), так как они подвергаются формальной проверке машиной. Для Интеллсист формальные определения ясны и четки, даже если они не понятны человеку. Любая формализация имеет содержательное пояснение. Поэтому проблемы формализации определения или обратная задача - толкование определения понятий актуальны, они являются проблемами концептуальной информатики.


Перечисленные правила применяются чаще всего комплексно, каждое правило может применяться в каждом определении понятия. Их комплексное применение к определениям понятий служит критерием в оценке самого определения.


6.4. Словари и смысл текста


Формальную модель русского языка (или другого ЕЯ) построить сложно, а, скорее всего, невозможно, поскольку его развитие связано не только с непрерывным пополнением словарного запаса, но и с быстрым формированием новых лексиконов или его более быстрым пополнением (по сравнению со словным словарем). Главный аргумент против построения формальных моделей ЕЯ состоит в том, что грамматика ЕЯ не формализует смысл текста, а определяет правила построения слов, предложений и текста. Правила ЕЯ не определяют смысла терминов и всего текста.


Однако следует иметь в виду, что словарь из слов и грамматические правила ЕЯ для их формирования полезен как вспомогательная информационная база для поиска смысла терминов и текста. Поэтому создание словарного машинного фонда, в частности русского языка, является фундаментальной постановкой проблемы развития ИП. Наряду с созданием такого фонда для каждого ЕЯ необходимо создание машинного фонда терминов русского языка по специальности или специализации, а точнее надо сказать лексикона данной специальности, в котором термины содержат не только определения для человека, но и все характеристики всех терминов [Машина86]. Это фундаментальная проблема машинной лингвистики, или лингвистической информатики. Работа по созданию машинных фонда слов и фондов терминов может осуществляться автоматизировано или автоматически на ВМ без привлечения формальных средств, например ФЯ. Использование словарей связано со многими задачами:

- реализация анализа текстов со знаниями для их отладки,

- ввод знаний в БЗ и их автоматический анализ,

- определение смысла текстов,

- реализация информационно-справочных систем,

- консультация пользователей для ручной работы,

- поддержка машинных методов информатики лингвистики,

- поиск ошибок всех сортов в текстах,

Это составляет задачи практической работы знаниеведа над словарями.


В качестве примера рассматривалась частная проблема создания вопросно-ответной системы по налогам. В результате автоматического построения словаря из слов по текстам законов, указов, инструкций и других законодательных или подзаконных актов, которые были представлены текстуально в 1150 файлах, было обнаружено 46177 слов с вариацией окончаний, с ошибками в записях слов (их примерно до 10%), без учета переноса слова на следующую строчку. Перенос слов вносит дополнительные ошибки (их 20%). Программа составления словаря работала несколько минут над текстом размером 13 Мб. В словарь попали около 3500 английских слов.


Работа знаниеведа по редактированию словаря состоит из следующих частей:

  • устранение ошибочных слов (пропуски букв, замена необходимой буквы на случайную букву, окончание перенесенного слова, использование при записи слов русского языка регистра латинских букв, слипание слов, слипание чисел со словами и др.),

  • конструирование слов ЯПП из базы и конца слова привело к тому, что в результате осталось в словаре 19500 слов из 46177,

  • пополнение фундаментального словаря русских слов и создание машинного словаря для многих применений,

  • исследование частоты использования слов в указанных текстах позволяет строить эффективные алгоритмы кодирования и обработки и правильно строить терминологические словари,

  • автоматическое построение словаря терминов (по алгоритму вычисления корреляционной функции текста) также как и словарей из слов позволяет строить эффективные алгоритмы кодирования,

  • составление словаря терминов с помощью инструментария Интеллсист и смыслового наполнения каждого понятия, что обеспечивает надежность результатов построения словарей.

Эти виды работ реализуются вначале деятельности по созданию БЗ в конкретной специальности или области деятельности (данной профессии) перед загрузкой БЗ профессиональными знаниями.


Конечно, анализ ЕЯ в США и Японии не ведется в полной мере, поскольку программирование насущных задач является прибыльным делом, а построение фондов слов и терминов пока не находит явного спроса на рынке программ. Сформулирован математический формализм ИП, который позволяет реализовать смысловой анализ текстов для решения насущных проблем. Поэтому проблемы создания фондов являются также насущными, без разрешения этих проблем невозможно создание многих Интеллсист и широкое внедрение ИП.


Вопросы создания ФЯ представления знаний необходимо разрешить только в условиях создания ИИС, но ни в коем случае для пользователя. О существовании формализма пользователь ничего не должен знать.


Всегда представляет интерес статистический анализ текстов на ЯПП. Ниже рассматривается статистика, которая получена при формировании словарей конкретной области знания. Будем предполагать, что приводимая ниже статистика характерна для каждого ЯПП (возможно с некоторыми отклонениями). Всего в области после редактировании словаря из слов обнаружено 14915 слов. Разделим словарь по первой букве. Тогда получим, исключая буквы из набора (ъ, Ъ, ы, Ы, ь, Ь), число слов в итоговом словаре, начинающихся с первой буквы (общее число букв стоит в числителе, для заглавных букв - в знаменателе):

Буква


Число слов

%

Буква

Число слов

%

Буква

Число слов

%

А

560/40

3.8

к

940/95

6.3

Ф

250/15

1.7

Б

410/57

2.7

л

270/15

1.8

Х

130/15

0.9

В

1100/45

7.4

м

590/85

4.0

Ц

80/10

0.5

Г

460/75

3.1

н

940/35

6.3

Ч

140/20

0.9

Д

570/25

3.8

о

1180/35

7.9

Ш

130/ 5

0.9

Е

45/15

0.3

п

2270/40

15.2

Щ

30/ 0

0.2

Ж

75/ 5

0.5

р

830/65

5.6

Э

220/ 5

1.5

З

580/15

3.9

с

1440/85

9.7

Ю

40/ 5

0.3

И

500/30

3.4

т

540/50

3.6

Я

110/10

0.7

й

5/ 5

0.03

у

480/20

3.2









1   ...   5   6   7   8   9   10   11   12   ...   44

Похожие:

Информатика в семи томах iconСобрание сочинений в семи томах 3 «Собрание сочинений в семи томах»: Время; 2008
Собрание сочинений М. М. Зощенко — самое полное издание прозы одного из крупнейших писателей-новаторов XX века. В него входят практически...
Информатика в семи томах iconИнформатика в семи томах
Излагаемые методы частично модифицированы по сравнению с их оригинальным изложением для их ориентирования и усиления при использовании...
Информатика в семи томах iconИнформатика в семи томах
Определяются логические лексемы, фундаментальные операции, правила преобразования логических уравнений, а также металогика для обоснования...
Информатика в семи томах iconВ семи томах том Информатика смысла Машинная лингвистика
Семантическая и распознающая грамматики связаны между собой как алгоритм и средства его реализации. Основой для контроля правильности...
Информатика в семи томах iconВ семи томах том Основы информатики (Введение в информатику)
Вм на основе своих общих и профессиональных знаний без привлечения программистов для решения задач, для разрешения вопросов или проблем...
Информатика в семи томах iconВ семи томах том Представление знаний (Структуры данных)
Приводимые примеры служат фрагментами прототипов записей знаний и запросов, предназначенных для создателей заданий и запросов к базе...
Информатика в семи томах iconРавительство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том V уфа гилем 2010
Российская академия наук Уфимский научный центр ■ Институт истории, языка и литературы
Информатика в семи томах iconЬство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том VI москва восточная литература 2011
Российская академия наук Уфимский научный центр Институт истории, языка и литературы
Информатика в семи томах iconВ семи томах том Интеллектуальные системы (Системы решения проблем)
Интеллсист, их структуры и технологии работы с инструментарием составляют центральную часть тома. Оценка возможностей Интеллсист...
Информатика в семи томах iconСтихотворения М. И. Цветаевой печатаются в основном по двум изданиям
Стихотворений (главным образом ранних, относящихся к 10-м годам) печатается по изданию: М. Цветаева. Неизданное: Стихи. Театр. Проза....
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница