Интеллектуальные информационные системы

         

Выполнить формализацию предметной области.


Под формализацией предметной области понимается разработка классификационных и описательных шкал и градаций и ввод их в программную систему "Эйдос", являющуюся инструментарием СК-анализа.

2.1. Формирование классификационных шкал и градаций

В подсистеме "Классификационные шкалы и градации" введем классы, соответствующие следующим писателям: Ф.М. Достоевский; Н.В. Гоголь; А.С.Грибоедов; М.Ю. Лермонтов; А.С. Пушкин; Л.Н. Толстой; И.С. Тургенев (рисунок 152).

Рисунок 152. Ввод классов

2.1. Формирование описательных шкал и градаций

Для этого исходные файлы для формирования объекты обучающей выборки должны быть средствами Word представлены в виде текстовых файлов, стандарта "Текст DOS" (без разбиения на строки).

Затем каждый из этих файлов разбивается на столько файлов, сколько в нем строк, причем имена этих файлов должны иметь вид: ####SUBSTR(File_name,4).TXT, где #### – сквозной номер файлов, соответствующий будущему номеру анкеты обучающей выборки, SUBSTR(File_name,4) – первые 4 символа имени исходного файла.



Полученные файлы должны быть помещены в поддиректорию DOB системы "Эйдос", а исходные – удалены из нее.

Это осуществляется одним из трех способов:

1. Вручную.

2. С использованием специальной программы, текст которой приводится ниже (язык программирования xBase).

3. В режиме: "Словари – Программные интерфейсы для импорта данных – Импорт данных из TXT-файлов стандарта "Текст DOS", формируем описательные шкалы и градации (рисунок 153), причем в качестве признаков выбираем слова.

Исходный текст программы записи TXT-файлов с данными по строкам

**************************************************************************

********** Разбиение текстовых файлов DOS на нумерованные файлы по строкам

********** Луценко Е.В., 03/31/04 04:24pm

**************************************************************************

scr_start=SAVESCREEN(0,0,24,79)

SHOWTIME(0,58,.T.,"rb/n")

FOR j=0 TO 24


    @j,0 SAY SPACE(80) COLOR "n/n"

NEXT

********** Удаление TXT-файлов, имена которых начинаются на 0

FILEDELETE("0*.TXT")

***** РЕКОГНОСЦИРОВКА

Count = ADIR("*.TXT")             && Кол-во TXT-файлов

IF Count = 0

   Mess = "В текущей директории TXT-файлов не обнаружено !!!"

   @15,40-LEN(Mess)/2 SAY Mess COLOR "gr+/n"

   INKEY(0)

   RESTSCREEN(0,0,24,79,scr_start)

   SHOWTIME()

   QUIT

ENDIF

PRIVATE Name[Count],Size[Count]   && Имена и размеры файлов

Count = ADIR("*.txt",Name,Size)

SortData(Name,Size,LEN(Name),1)   && Сортировка файлов по алфавиту

CrLf = CHR(13)+CHR(10)            && Конец строки (абзаца) (CrLf)

*** Загрузка TXT-файлов

Num_pp = 0                        && Номера выходных файлов

FOR f = 1 TO Count                && Начало цикла по TXT-файлам

    ****** Загрузка файла

    Buffer = FILESTR(Name[f],.T.)

    Buffer = CHARONE(" ",Buffer)  && Удаление повторяющихся пробелов

    Buffer = Buffer + CrLf

    Len = AT(CrLf,Buffer)

    DO WHILE Len > 0 .AND. LASTKEY() <> 27     && Цикл по строкам

       Len = AT(CrLf,Buffer)

       IF Len > 0

          ****** Запись фрагмента файла

          Str_pr = ALLTRIM(SUBSTR(Buffer,1,Len-1))

          Fn_out = STRTRAN(STR(++Num_pp,4)," ","0")+SUBSTR(Name[f],1,4)+".TXT"

          STRFILE(Str_pr,Fn_out)

          ****** Исключение из буфера записанной строки

          Buffer = ALLTRIM(SUBSTR(Buffer,Len+1))

       ENDIF

    ENDDO

NEXT

*** Удаление исходных TXT-файлов

FOR f=1 TO Count

    FILEDELETE(Name[f])

NEXT

RESTSCREEN(0,0,24,79,scr_start)

SHOWTIME()

QUIT



Рисунок 153. Выход на режим генерации справочников

на основе текстовых файлов

На рисунке 154 приведена экранная форма, отображающая ход процесса генерации описательных шкал и градаций и TXT-файлов, содержащих примеры текстов с разбиением по строкам.





Рисунок 154. Генерация описательных шкал и градаций

на основе TXT-файлов

В результате получаем классификационные и описательные шкалы и градации, приведенные в таблицах 79 и 80.

Таблица 79 – КЛАССИФИКАЦИОННЫЕ

ШКАЛЫ И ГРАДАЦИИ

Код

Наименование

1

Достоевский

2

Гоголь

3

Грибоедов

4

Лермонтов

5

Пушкин

6

Толстой

7

Тургенев

Таблица 80 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ (фрагмент)

Код

Наименование

Код

Наименование

Код

Наименование

1

!

41

Бедные

81

Все

2

(

42

Без

82

Вспомним

3

(основной

43

Бездушных

83

Встреча

4

)

44

Безумным

84

Всюду

5

,

45

Безумных

85

Вы

6

-

46

Безухов

86

Вызывают

7

.

47

Безухову

87

Высокие

8

1812

48

Белинский

88

Высокопарные

9

20-

49

Бессильной

89

Г

10

30-е

50

Бог

90

Герой

11

30-х

51

Боже

91

Главная

12

60-х

52

Болконский

92

Глухость

13

:

53

Болконскому

93

Говоря

14

;

54

Бордо

94

Гоголь

15

?

55

Борис

95

Гоголя

16

Bcтает

56

Бориса

96

Годунов

17

XIX

57

Бородинским

97

Горе

18

А

58

Бородинского

98

Гости

19

Автор

59

Буянов

99

Грибоедов

20

Авторский

60

Была

100

Грибоедова

21

Агрессивная

61

В

101

Гулливера

22

Адама

62

Ведь

102

Да

23

Александр

63

Везде

103

Даже

24

Александра

64

Век

104

Дворянин-аристократ

25

Алексевна

65

Великий

105

Действительно

26

Алексеевна

66

Великолепная

106

Дельвигу

27

Аммоса

67

Вернулся

107

Денисова

28

Андреевич

68

Взволнованный

108

Дидло

29

Андрей

69

Взгляды

109

Для

30

Андрею

70

Власы

110

Дмитриевна

31

Анной

71

Вместе

111

Добролюбова

32

Архивам

72

Внешней

112

Достоевского

33

Афанасьевича

73

Внешние

113

Драматична

34

Ах

74

Воды

114

Друбецкого

35

Базаров

75

Возникает

115

Другое

36

Базарова

76

Война

116

Думы

37

Базаровым

77

Вообще

117

Дуни

38

Балы

78

Вопрос

118

Дуня

39

Бегущим

79

Вот

119

Душа

40

Бедность

80

Время

120

Евгений

Приводится лишь фрагмент описательных шкал и градаций, т.к. размерность справочника составляет 3522 градации (т.е. слова).


Содержание раздела