Интеллектуальные информационные системы

         

Базовая когнитивная концепция


Автоматизировать процесс познания в целом безусловно значительно сложнее, чем отдельные операции процесса познания. Но для этого прежде всего необходимо:

– выявить эти операции;

найти  место каждой из них в системе или последовательности процесса познания.

Сделать это предлагается в форме когнитивной концепции, которая должна удовлетворять следующим требованиям:

– адекватность, т.е. точное отражение сущности процессов познания, характерных для человека, в частности описание процессов вербализации, семантической адаптации и семантического синтеза (уточнения смысла слов и понятий и включения в словарь новых слов и понятий);

– высокая степень детализации и структурированности до уровня достаточно простых базовых когнитивных операций;

– возможность математического описания, формализации и автоматизации.

Однако приходится констатировать, что даже концепции когнитивной психологии, значительно более конкретные, чем философские (гносеологические), разрабатывались без учета необходимости построения реализующих их математических и алгоритмических моделей и программных систем. Более того, в когнитивной психологии из всего многообразия различных исследуемых когнитивных операций не выделены базовые, к суперпозиции и различным вариантам сочетаний которых сводятся различные процессы познания. В этой науке в настоящее время господствует эмпирический подход, т.е. имеется тенденция не к теоретическим обобщениям, а тщательному изучению отдельных когнитивных операций. Поэтому для достижения целей данного исследования концепции когнитивной психологии мало применимы.

В связи с этим в данном исследовании предлагается когнитивная концепция, удовлетворяющая сформулированным выше требованиям. Эта концепция достаточно проста, иначе было бы невозможно ее формализовать, многие ее положения интуитивно очевидны или хорошо известны, тем ни менее в целостном виде она впервые сформулирована лишь в работах [64, 91]. Положения когнитивной концепции приведены в определенном порядке, соответствующем реальному ходу процесса познания "от конкретных эмпирических исходных данных к содержательным информационным моделям, а затем к их верификации, адаптации и, в случае необходимости, к пересинтезу".


На базе выше сформулированных положений предложена целостная система взглядов на процесс познания, т.е. формализуемая когнитивная концепция [64], предназначенная для построения систем искусственного интеллекта.

Суть предложенной когнитивной концепции

Процесс познания рассматривается нами как многоуровневая иерархическая система обработки информации, в которой каждый последующий уровень является результатом интеграции элементов предыдущего уровня. На 1-м уровне этой системы находятся дискретные элементы потока чувственного восприятия, которые на 2-м уровне интегрируются в чувственный образ конкретного объекта. Те, в свою очередь, на 3-м уровне интегрируются в обобщенные образы классов и факторов, образующие на 4-м уровне кластеры, а на 5-м конструкты. Система конструктов на 6-м уровне образуют текущую парадигму реальности (т.е. человек познает мир путем синтеза и применения конструктов). На 7-м же уровне обнаруживается, что текущая парадигма не является единственно-возможной.

Данные, информация, знания

Существует неопределенность смыслового содержания "разночтения" терминов: "данные", "информация", "знания". Мы считаем целесообразным определить их следующим образом.

Данные представляют собой информацию, рассматриваемую в чисто синтаксическом аспекте, т.е. безотносительно к ее содержанию и использованию, т.е. семантике и телеологии (обычно на каком-либо носителе или в канале передачи).



Информация – это данные, проинтерпретированные

с использованием тезауруса, т.е. осмысленные данные, рассматриваемые в единстве синтаксического и семантического аспектов.

Знания, есть система

информации, обеспечивающая увеличение вероятности достижения какой-либо цели, т.е. по сути знания – это "Ноу-хау" или технологии.

Вышесказанное резюмируем в следующей форме:

знание = информация + цель

информация = данные + смысл;

знания = данные +  смысл + цель.

При разработке предложенной интерпретации содержания данных понятий и формы его представления учтены и использованы разработки Лаптева В.Н., а также Владимира Кива, приведенные на его сайте: http://vlak.webzone.ru/rus/it/knowledge.html.



В этой связи необходимо отметить, что название теории информации Шеннона не вполне соответствует предлагаемому пониманию содержания понятий "данные – информация – знания": теорию Шеннона по сути дела более точно было бы называть "теорией передачи данных по каналам связи". Общеизвестная количественная мера Шеннона "для измерения количества информации" также в этом смысле является лишь мерой количества данных, т.к. не содержит семантического аспекта.

Количественная теория автоматизированной интерпретации данных, основанная на теории информации, в настоящее время лишь только создается и получила название семантической теории информации. Предложены различные количественные меры для измерения смысла информации [64]. Из этих мер выделяется мера А.Харкевича, в основу которой положено понятие цели.

В литературе и А.Харкевичем это не отмечается, но, учитывая вышеизложенное, по сути дела можно утверждать, что по сути дела им в 1962 году впервые предложена научная  количественная мера знаний.

Однако предложенная А.Харкевичем мера не удовлетворяет принципу соответствия, обязательному для более общей теории, аналогично тому, как, например, мера Шеннона сводится к мере Хартли в случае равновероятных событий. Поэтому теория А.Харкеивча как бы "стояла особняком"

от теории информации Найквиста-Хартли-Больцмана и Шеннона и в этом плане она нуждалась в развитии, что и было осуществлено автором [1, 64, 75, 79, 93].

Известно, что корреляция не является мерой причинно-следственных связей. Если корреляция между действием некоторого фактора и переходом объекта управления в определенное состояние высока, то это еще не значит, что данный фактор является причиной этого перехода. Для того чтобы по корреляции можно было судить о наличии причинно-следственной связи необходимо сравнить исследуемую группу с контрольной группой, т.е. с группой, в которой данный фактор не действовал.

Также и высокая вероятность перехода объекта управления в определенное состояние в условиях действия некоторого фактора сама по себе не говорит о наличии причинно-следственной связи между ними, т.е.


о том, что данный фактор обусловил переход объекта в это состояние. Это связано с тем, что вероятность перехода объекта в это состояние может быть и сама по себе очень высокой независимо от действия фактора. Поэтому в качестве меры силы причинной обусловленности определенного состояния объекта действием некоторого фактора Харкевич предложил логарифм отношения

вероятностей перехода в объекта в это состояние в условиях действия фактора и при его отсутствии или в среднем (13). Таким образом, вероятность перехода объектов в некоторое состояние в исследуемой группе сравнивается с средней вероятностью перехода в это состояние по всем группам и это среднее выступает в качестве контрольной группы.

Таким образом семантическая мера информации Харкевича является мерой наличия причинно-следственных связей между факторами и состояниями объекта управления.

В связи с тем, что подход Харкевича является ярким примером нормативного подхода, будет уместно вспомнить о нормативном и критериальном подходах к оценке (идентификации) состояния объекта.

При критериальном подходе это состояние оценивают по жесткой системе критериев. Правда при этом остается открытым вопрос о том, каким образом формируется эта система критериев.

При нормативном подходе, который получил свое название от понятия "норма", сначала формируется эта норма, а затем состояние объектов оценивается относительно этой нормы. В частности, если это сформированное понятие нормы зафиксировать, стандартизировать, как и критерии его определения и сравнения с ним, то мы получим одни из вариантов синтеза критериального подхода.

Мониторинг, анализ, прогнозирование, управление

Существует определенная иерархия задач обработки данных, информации и знаний:

Мониторингнакопление данных

по ряду показателей об объекте управления с привязкой ко времени.

Анализвыявление смысла

в данных, т.е. выявление в них причинно-следственных взаимосвязей.

Прогнозированиеиспользование смысла причинно-следственных зависимостей в предметной области для предсказания



поведения объекта управления в условиях действия определенных факторов.

Управлениеиспользования знаний для достижения определенных целей управления:

– сохранение стабильного функционирования объекта управления;

– перевод объекта управления в заранее заданное целевое состояние.

Таким образом, управление – это высшая форма обработки и использования информации.

Факт, смысл, мысль

Ключевым для когнитивной концепции является понятие факта.

Под фактом будем понимать соответствие дискретного и интегрального элементов познания, т.е. элементов разных уровней интеграции-иерархии процессов познания, обнаруженное на опыте.

Факт рассматривается как квант смысла.

Это является основой для формализации смысла.

Смысл представляет собой "разность потенциалов" между смежными уровнями интеграции-иерархии в системе обработки информации в процессах познания.

Мысль является операцией выявления смысла из фактов.

Мышление есть процесс, состоящий из ряда взаимосвязанных по смыслу мыслей.

Но существуют различные формы мыслей, которые перед разработкой методов формализации и программной реализации необходимо классифицировать и выявить среди них основные, т.е. такие, к которым сводятся все остальные или по крайней мере большинство из них. Как уже отмечалось выше, сделать это предлагается на основе базовой когнитивной концепции.

Иерархическая структура (пирамида) обработки информации

Сказанное в разделах 4.2.2–4.2.4 можно резюмировать в графической диаграмме, в форме "Мексиканской" (ступенчатой) пирамиды (рисунок 4).



Рисунок 4. Иерархическая структура обработки информации

Базовая когнитивная концепция в свободном изложении

Исходные данные для процесса познания поставляются из нескольких независимых информационных источников, имеющих качественно

различную природу, которые мы будем условно называть "органы чувств". Данные от органов чувств также имеют качественно различную природу, обусловленную конкретным видом информационного источника.


Для обозначения этих исходных данных будем использовать термин "атрибут". В результате выполнения когнитивной операции "присвоение имен" атрибутам могут быть присвоены уникальные имена, т.е. они могут быть отнесены к некоторым градациям номинальных шкал. Получение информации о предметной области в атрибутивной форме осуществляется когнитивной операцией "восприятие".

Исходные данные содержат внутренние закономерности, объединяющие качественно разнородные исходные данные от различных информационных источников.

После восприятия предметной области может быть проведен ее первичный анализ путем выполнения когнитивной операции: "сопоставление опыта, воплощенного в модели, с общественным", т.е. с результатами восприятия той же предметной области другими. Это делается с целью исключения из дальнейшего анализа всех наиболее явных расхождений, как сомнительных.

Однако, закономерности в предметной области могут быть выявлены путем выполнения когнитивной операции "обобщение"

только после накопления в результате мониторинга достаточно большого объема исходных данных в памяти.

Наличие этих закономерностей позволяют предположить, что:

– существуют некие интегративные структуры, не сводящиеся ни к одному из качественно-различных аспектов исходных данных и обладающие по отношению к ним системными, т.е. эмерджентными свойствами, которые не могут быть предметом прямого восприятия с помощью органов чувств, но могут являться предметом для других форм познания, например логической формы. Для обозначения этих структур будем использовать термин "объект";

– "объекты" считаются причинами существования взаимосвязей между атрибутами.

Объектам приписывается объективное существование, в том смысле, что любой объект обнаруживается несколькими независимыми друг от друга способами с помощью различных органов чувств (этот критерий объективного существования в физике называется "принцип наблюдаемости").

После обобщения возможны когнитивные операции: "определение значимости шкал и градаций атрибутов" и "определение степени сформированности шкал и градаций классов".



Путем выполнения когнитивной операции "присвоение имен" конкретным объектам могут быть присвоены уникальные имена, т.е. они могут быть отнесены к некоторым градациям номинальной шкалы, которые мы будем называть "классами". В данном случае класс представляет собой отображение объекта шкалу, т.е. это своего рода целостный образ объекта. После этого возможно выполнение когнитивной операции "идентификация"

объектов, т.е. их "узнавание": при этом по атрибутам объекта определяется класс, к которому принадлежит объект. При этом все атрибуты, независимо от их качественно различной природы, рассматриваются с одной-единственной точки зрения: "Какое количество информации они несут о принадлежности данного объекта к каждому из классов".

Кроме того возможно выполнение когнитивной операции: "дедукция и абдукция, обратная задача идентификации и прогнозирования", имеющей очень важное значение для управления, т.е. вывод всех атрибутов в порядке убывания содержащегося в них количества информации о принадлежности к данному классу.

Аналогично, может быть выполнена когнитивная операция: "семантический анализ атрибута", представляющий собой список классов, в порядке убывания количества информации о принадлежности к ним, содержащейся в данном атрибуте.

Таким образом возможно два взаимно-дополнительных способа отображения объекта: в форме принадлежности к некоторому классу (целостное, интегральное, экстенсиональное); в форме системы атрибутов (дискретное, интенсиональное).

Дальнейшее изучение атрибутов позволяет ввести понятия "порядковая шкала" и "градация". Порядковая шкала представляет собой способ классификации атрибутов одного качества, обычно по степени выраженности (интенсивности). Градация – это конкретное положение или диапазон на шкале, которому ставится в соответствие конкретный атрибут, соответствующее определенной степени интенсивности. Каждому виду атрибутов, информация о которых получается с помощью определенного "органа чувств", ставится в соответствие одна шкала.


Таким образом, если при анализе в номинальных шкалах, можно было в принципе ввести одну шкалу для всех атрибутов, то в порядковых шкалах каждому атрибуту будет соответствовать своя шкала.

После идентификации уникальных объектов с классами возможна их классификация и присвоение обобщающих имен группам похожих классов. Для обозначения группы похожих классов используем понятие "кластер". Формирование кластеров осуществляется с помощью когнитивной операции

"классификация".
Кластер представляет собой своего рода "объект, состоящий из объектов", т.е. объект 2-го порядка. Если объект выполняет интегративную функцию по отношению к атрибутам, то кластер – по отношению к объектам.

Необходимо подчеркнуть, что термин "класс" используется не только для обозначения образов уникальных объектов, но и для обозначения их кластеров, т.е. классу может соответствовать не уникальное, а обобщающее имя, в этом случае мы имеем дело с обобщенным классом. Да и кластеры могут быть не только кластерами уникальных объектов, но и обобщенных классов.

Если объективное существование уникальных объектов мало у кого вызывает сомнение, то вопрос об объективном существовании интегративных структур 2-го и более высоких порядков остается открытым. В некоторых философских системах подобным объектам приписывался даже более высокий статус существования, чем самим объектам, например обычные объекты рассматриваются лишь как "тени" "Эйдосов" (Платон). Известны и другие понятия для обозначения объектов высоких порядков, например "архетип" (Юм), "эгрегор" (Андреев) и др. Нельзя не отметить, что в современной физике (специальной и общей теории относительности) есть подобное понятие пространственно-временного интервала, который проявляется как движение объекта. По-видимому, статус существования структур реальности, отражаемых когнитивными структурами тем выше, чем выше интегративный уровень этих структур.

Являясь объектами 2-го порядка сами кластеры в результате выполнения когнитивной операции "генерация конструктов" могут быть классифицированы по степени сходства друг с другом.


Для обозначения системы двух противоположных кластеров, с "спектром" промежуточных кластеров между ними, будем использовать термин "бинарный конструкт", при этом сами противоположные кластеры будем называть "полюса бинарного конструкта". Таким образом конструкт представляет собой объект 3-го порядка.

Словом "бинарный" определяется, что в данном случае полюсов у конструкта всего два, но этим самым подчеркивается, что в принципе их может быть 3, 4 и больше. Бинарный конструкт можно формально представить в виде порядковой шкалы или даже шкалы отношений, на которой градациям соответствуют кластеры, а значит и сами классы и соответствующие объекты. Конструкты с количеством полюсов больше 2 могут быть представлены графически в форме семантических сетей в которых полюса являются вершинами, а дуги имеют цвет и толщину, соответствующие степени сходства-различия этих вершин. Семантические сети можно считать также просто графической формой представления результатов кластерного анализа. 

Аналогично кластерам и конструктам классов формируются кластеры и конструкты атрибутов. В кластеры объединяются атрибуты, имеющие наиболее сходный смысл. В качестве полюсов конструктов выступают кластеры атрибутов, противоположных по смыслу.

Бинарные конструкты классов и атрибутов представляет собой когнитивные структуры, играющие огромную роль в процессах познания. Не будет преувеличением сказать, что познание представляет собой процесс генерации, совершенствования и применения конструктов. Будем считать, что конструкт тем более совершенен и тем выше его качество, чем сильнее отличаются его полюса, т.е. чем больше диапазон его области значений.

В кластерном анализе определялась степень сходства или различия классов, а не то, чем конкретно сходны или отличаются. При выполнении когнитивной операции "содержательное сравнение" двух классов определяется вклад каждого атрибута в их сходство или различие. Результаты содержательного сравнения выводятся в наглядной графической форме когнитивных диаграмм, в которых изображаются информационные портреты классов с наиболее характерными и нехарактерными для них атрибутами и атрибуты разных классов соединяются линиями, цвет и толщина которых соответствуют величине и знаку вклада этих атрибутов в сходство или различие данных классов.



Результаты идентификации и прогнозирования, осуществленные с помощью модели, путем выполнения когнитивной операции "верификация" сопоставляются с опытом, после чего определяется выполнять ли когнитивную операцию "обучение", состоящую в том, что параметры модели могут изменяться количественно, и тогда мы имеем дело с адаптацией, или качественно, и тогда идет речь о переформировании модели.

Базовая когнитивная концепция в формальном изложении

1. Процесс познания начинается с чувственного восприятия. Различные органы восприятия дают качественно-различную чувственную информацию в форме дискретного потока элементов восприятия. Эти элементы формализуются с помощью описательных шкал и градаций.

2. В процессе накопления опыта выявляются взаимосвязи между элементами чувственного восприятия: одни элементы часто наблюдаются с другими (имеет место их пространственно-временная корреляция), другие же вместе встречаются достаточно редко. Существование устойчивых связей между элементами восприятия говорит о том, что они отражают некую реальность, интегральную по отношению к этим элементам. Эту реальность будем называть объектами восприятия. Рассматриваемые в единстве

с объектами элементы восприятия будем называть признаками объектов. Таким образом, органы восприятия дают чувственную информацию о признаках наблюдаемых объектов, процессов и явлений окружающего мира (объектов). Чувственный образ конкретного объекта представляет собой систему, возникающую как результат процесса синтеза признаков этого объекта. В условиях усложненного восприятия синтез чувственного образа объекта может быть существенно замедленным и даже не завершаться в реальном времени.

3. Человек присваивает конкретным объектам названия (имена) и сравнивает объекты друг с другом. При сравнении выясняется, что одни объекты в различных степенях сходны по их признакам, а другие отличаются. Сходные объекты объединяются в обобщенные категории (классы), которым присваиваются имена, производные от имен входящих в категорию конкретных объектов.


Классы формализуются с помощью классификационных шкал и градаций и обеспечивают интегральный способ описания действительности. Путем обобщения (синтеза, индукции) информации о признаках конкретных объектов, входящих в те или иные классы, формируются обобщенные образы классов. Накопление опыта и сравнение обобщенных образов классов друг с другом позволяет определить степень характерности признаков для классов, смысл признаков и ценность каждого признака для идентификации конкретных объектов с классами и сравнения классов, а также исключить наименее ценные признаки из дальнейшего анализа без существенного сокращения количества полезной информации о предметной области (абстрагирование). Абстрагирование позволяет существенно сократить затраты внутренних ресурсов системы на анализ информации. Идентификация представляет собой процесс узнавания, т.е. установление соответствия между чувственным описанием объекта, как совокупности дискретных признаков, и неделимым (целостным) именем класса, которое ассоциируется с местом и ролью воспринимаемого объекта в природе и обществе. Дискретное и целостное восприятие действительности поддерживаются, как правило, различными полушариями мозга: соответственно, правым и левым (доминантность полушарий). Таким образом, именно системное взаимодействие интегрального (целостного) и дискретного способов восприятия обеспечивает возможность установление содержательного смысла событий. При выполнении когнитивной операции "содержательное сравнение" двух классов определяется вклад каждого признака в их сходство или различие.

4. После идентификации уникальных объектов с классами возможна их классификация и присвоение обобщающих имен группам похожих классов. Для обозначения группы похожих классов используем понятие "кластер". Но и сами кластеры в результате выполнения когнитивной операции "генерация конструктов" могут быть классифицированы по степени сходства друг с другом. Для обозначения системы двух противоположных кластеров, со "спектром" промежуточных кластеров между ними, будем использовать термин "бинарный конструкт", при этом сами противоположные кластеры будем называть "полюса бинарного конструкта".


Бинарные конструкты классов и атрибутов, т.е. конструкты с двумя полюсами, наиболее типичны для человека и представляет собой когнитивные структуры, играющие огромную роль в процессах познания. Достаточно сказать, что познание можно рассматривать как процесс генерации, совершенствования и применения конструктов. Качество конструкта тем выше, чем сильнее отличаются его полюса, т.е. чем больше диапазон его смысла.

Результаты идентификации и прогнозирования, осуществленные с помощью модели, путем выполнения когнитивной операции "верификация" сопоставляются с опытом, после чего определяется целесообразность выполнения когнитивной операции "обучение". При этом может возникнуть три основных варианта:

1. Объект, входит в обучающую выборку и достоверно идентифицируется (внутренняя валидность, в адаптации нет необходимости).

2. Объект, не входит в обучающую выборку, но входит в исходную генеральную совокупность, по отношению к которой эта выборка репрезентативна, и достоверно идентифицируется (внешняя валидность, добавление объекта к обучающей выборке и адаптация модели приводит к количественному уточнению смысла признаков и образов классов).

3. Объект не входит в исходную генеральную совокупность и идентифицируется недостоверно (внешняя валидность, добавление объекта к обучающей выборке и синтез модели приводит к качественному уточнению смысла признаков и образов классов, исходная генеральная совокупность расширяется).


Содержание раздела