In Russian: Latin letters DOS Windows Unix KOI-8 Unix ISO-5
In English:         ASCII

Институт Высокопроизводительных Вычислительных Систем РАН

Леонид Ованесбеков [94b-96]

Классификация гипертекстов 2Q


Institute for High-Performance Computer Systems RAS
Leonid Ovanesbekov [94b-96]

Hypertext Classification 2Q


Альтернативные заголовки для данной статьи:

2) Понятие "вид гипертекстов"
3) Классификация текстов 2Q


Оглавление

1. Понятие "вид гипертекстов"
2. Классификация 2Q
2.1. Перечень видов гипертекстов "2Q-list"
2.2. Каталог видов гипертекстов "2Q-catalogue"
3. Постанализ классификации 2Q


1. Понятия "вид текстов" и "вид гипертекстов"

1.1. основная идея

Тексты (и гипертексты) могут быть разными по своей внутренней логической структуре. Например, словарь имеет одну структуру, учебник - другую, а гипертекстовый каталог, например, запасных деталей к автомобилю, третью. Даже такое беглое и краткое перечисление - словарь, учебник, каталог, наталкивает на мысль, что тексты могут быть разных "видов". Но понятие "вид" само по себе - весьма расплывчатое, оно ничего не сообщает. Для того, чтобы понятие "вид текстов" стало осмысленным, четким и полезным для использования, необходимо найти некоторую идею, некоторую определенную точку зрения, с которой мы могли бы увидеть разные, отличающиеся друг от друга виды текстов.

Эта идея применима к текстам вообще, но особенно ярко проявляется, по отношению к гипертекстам, поэтому на основе этой идеи мы будем одновременно определять два понятия "вид текстов" и "вид гипертекстов".

Предлагается следующая точка зрения. Некоторые тексты естественно разбиваются на отдельные темы (разделы, главы) и есть некая логическая "основа", некоторая смысловая структура, связывающая отдельные темы в единое целое.

Гипертексты, в отличие от текстов вообще, по определению уже разбиты на отдельные темы и есть что-то, позволяющее говорить об этих темах как о чем-то целом, как о гипертексте.

Для того, чтобы посмотреть на тексты и гипертексты с предлагаемой точки зрения, нужно задать вопросы:

a) какого рода информация содержится в отдельных темах?
b) что является "логической" основой?

или, в другой форме:

a) какого типа темы составляют большинство?
b) какая структура отражается в тексте и связывает отдельные темы в одно целое?

Каждая конкретная оригинальная пара ответов на эти вопросы - это конкретный "вид текстов" или "вид гипертекстов".


1.2. эксперимент

Проведем микроэксперимент: попробуем в трех вышеперечисленных видах текстов (словарь, учебник, каталог) выделить и описать два элемента нашей точки зрения - "основной тип тем" и "логическая основа".

Словарь.
Основной вид тем: Описания слов.
Логическая основа: Множество слов, требующих описания.

Учебник.
Основной вид тем: Разделы учебника, излагающие те или иные сведения.
Логическая основа: Структура изложения знаний, от простого к сложному.

Каталог (например, фильмов).
Основной вид тем: Описания экземпляров какой-либо категории (описания конкретных фильмов).
Логическая основа: Коллекция этих экземпляров (подборка фильмов).

Наш микроэксперимент оказался удачным: то, что мы выделяли как "основной тип тем" и "логическая основа" было относительно легко вычленить и полученное описание достаточно хорошо описывало суть словаря, учебника и каталога именно как видов текстов, а если представить словарь, учебник, каталог в форме гипертекстов, то и как видов гипертекстов.


1.3. не всякие два вопроса могут стать основой классификации

Сделаем одно методологическое замечание.

Основа нашей классификации - это вышеприведенные два вопроса (отсюда и название - "2Q" - 2 questions).

Конечно, каких-либо 2, 3, 5 вопросов к текстам придумать нетрудно. Но для того, чтобы эти вопросы были реальной основой для того, чтобы говорить о "видах" текстах и о классификации, необходимо, чтобы эти вопросы были "существенными", т.е. разные ответы на эти вопросы давали бы достаточно разные и содержательные виды текстов (гипертекстов).

Кроме этого, важно, чтобы эти вопросы позволяли предсказывать новые виды текстов (гипертекстов), подбирая новые нетривиальные ответы-значения для этих вопросов-параметров.

Автор считает, что классификация 2Q этим требованиям удовлетворяет. В этом состоит основная гипотеза этого небольшого исследования. А качество этой гипотезы можно оценить по тому, сколько разных и интересных конкретных видов текстов можно предложить в рамках данной основной идеи.

1.4. классификация как коллекция ярких ответов на данные два вопроса

Классификация 2Q состоит не только из двух вопросов, но и из перечня возможных ответов, т.е. собственно перечня различных видов гипертекстов.

Автор будет пользоваться приемом коллекции: называя перечень возможных видов гипертекстов "коллекцией", тем самым неявно предполагается:

a) автор старались в коллекцию отобрать самое лучшее (т.е. наиболее характерные виды),
б) при возможности, автор помещал туда и некоторые "граничные", (т.е. не совсем обычные) экземпляры,
в) эта коллекция расширяема,
г) автор не претендует на объективное объяснение почему в коллекции именно такой состав (особенно в связи п. (в)), т.е. эта коллекция составлена эмпирически и допускает дальнейшую структуризацию (а возможно, и несколько разных структуризаций).

Кроме перечня названий видов гипертекстов (в разделе 2.1.) дается еще и более развернутое описание каждого вида. Перечень с описанием каждого элемента автор называет "каталогом".

Таким образом, предлагаемая Вам классификация гипертекстов 2Q это система из 4 объектов:

небольшое исследование вокруг этой темы в форме статьи (данная статья),
два центральных вопроса,
перечень видов гипертекстов,
каталог видов гипертекстов.

Для удобства ссылок мы дали перечню, каталогу и паре вопросов свои отдельные названия.

Перечень видов гипертекстов мы назвали "2Q-list", каталог - "2Q-catalogue", паре вопросов - "2Q-questions". Название "2Q" мы оставили для классификации в целом и для данной темы исследования.


2. Классификация 2Q


2.1. перечень видов гипертекстов "2Q-list"

Виды гипертекстов:

Учебник
Справочник
Научная статья
Статья с аннотациями

Словари:
Толковый словарь
Словарь переводчика

Документация
Руководство пользователя
Руководство администратора

Энциклопедия

Система таблиц
База данных рисунков

Пространственные карты

Абстрактная модель

Каталог
Хронология
Гипертекстовая база знаний

Программа

2.2. каталог видов гипертекстов "2Q-catalogue"

Учебник
Основной вид тем: Главы, излагающие сведения, посвященные той или иной теме.
Логическая основа: Структура обучения, от простого к сложному.

Справочник
Основной вид тем: Главы, излагающие сведения, посвященные той или иной теме.
Логическая основа: Структура предметной области.

Научная статья
Основной вид тем: Главы и подразделы статьи, обычно посвящаются тому или иному аспекту излагаемого вопроса.
Логическая основа: Структура изложения, структура излагаемого вопроса.

Статья с аннотациями
Основной вид тем: Аннотации и комментарии к различным местам статьи или текста
Логическая основа: Структура статьи или текста

Толковый словарь
Основной вид тем: Статьи словаря, объясняющие понятия/ термины.
Логическая основа: Множество специальных понятий и терминов в некоторой предметной области.

Словарь переводчика
Основной вид тем: Статьи словаря с переводом слова или словосочетания.
Логическая основа: Множество слов в языке, выбранное по некоторому критерию.

Документация
Основной вид тем: Главы и разделы, описывающие аспекты сложного объекта.
Логическая основа: Структура описываемого объекта.

Руководство пользователя
Основной вид тем: Разделы, описывающие действия, которые может делать пользователь в сложной программе (или в сложном устройстве)
Логическая основа: Структура интерфейса программы с пользователем: окна, меню, кнопки. Для физических устройств - клавиши, переключатели, ручки управления и т.п.
А также структура самой программы (или сложного устройства).

Руководство администратора
Основной вид тем: Разделы, описывающие действия по сопровождению данной программы (или сложного устройства) и основные настраиваемые структуры.
Логическая основа: Структура работ человека по поддержке программы (устройства) в рабочем состоянии.
Структура особо важных частей программы (устройства), от которых зависит работа программы.
Структура причинно-следственных связей, связанная с функционированием программы (устройства).

Энциклопедия
Основной вид тем: Статьи, излагающие сведения
Логическая основа: Структура системы предметных областей, Множество ключевых понятий в каждой предметной области

Система таблиц
Основной вид тем: Таблицы
Логическая основа: Структура предметной области с т.зр. того - какие в ней есть множества объектов, перечни, таблицы

База данных рисунков
Основной вид тем: Рисунки, графические изображения
Логическая основа: Некоторая тема и множество объектов, которые можно изобразить в виде рисунков

Пространственные карты
Основной вид тем: Карты или схемы тех или иных участков пространства
Логическая основа: Структура описываемого пространства

Абстрактная модель
Основной вид тем: Описание тех или иных элементов модели
Логическая основа: Структура моделируемого объекта

Каталог
Основной вид тем: Описания отдельных экземпляров, входящих в каталог
Логическая основа: Множество экземпляров, собранных в коллекцию

Хронология
Основной вид тем: Описания событий
Логическая основа: Последовательность событий во времени

Гипертекстовая база знаний
Основной вид тем: Эвристики/ правила
Логическая основа: Структура сложной работы, выполняемой человеком

Программа
Основной вид тем: Тексты отдельных процедур, функций, типов данных, объявлений переменных, комментарии к фрагментам программы
Логическая основа: Структура программы


3. Постанализ классификации 2Q

3.1. понятие "постанализа"

Выше, в данной статье, мы предложили идею классификации текстов и гипертекстов, представили некоторый информационный объект, воплощающий данную идею, дали этому информационному объекту название, "классификация 2Q".

Теперь эта классификация 2Q "существует".

Ранее, чтобы компактнее и яснее представить данную идею, автор старался поменьше отвлекаться на смежные вопросы. Теперь же, когда классификация 2Q объявлена, можно попытаться найти интересные идеи о том - как можно с других точек зрения посмотреть на классификацию 2Q, как классификация 2Q связывается с другими близкими темами и т.п.. Это уже другой вид анализа, он отличается от анализа, в начале данной статьи, в 1 главе. Если в начале статьи автор старался оправдать появление новой информационной сущности, то теперь можно предложить идеи, которые опираются на существование этой сущности.

Разновидность научного исследования, в котором
- стремятся посмотреть на уже объявленные идеи, или информационные объекты, или физические объекты, с разных точек зрения,
- в котором стремятся связать данную тему с разными другими близкими по смыслу аспектами,
- в котором стремятся собрать коллекцию разных аспектов-связей данной темы с другими аспектами, темами и точками зрения,
предлагается назвать "постанализом".

Термин "постанализ" подчеркивает, что это анализ некоторой идеи после ("пост-") ее объявления, в противоположность другому виду анализа, ("пред-"), когда автор стремится подойти к тому, чтобы только эту идею объявить.

Постанализ это текст, который по своей сути, вообще говоря, не имеет конца. Множество интересных связей одной конечной идеи с бесконечным множеством возможных точек зрения и окружающих других тем - это коллекция, которая со временем может только расширяться. (И изредка - сужаться, если некоторые аспекты станут казаться автору неинтересными.) По этой причине данная глава 3. не имеет логического конца и может от версии к версии изменяться и расти.

3.2. перечень "сущностей лежащих в основе" для перечня "видов текстов"

Итак, у нас есть следующая логическая цепочка:

Тексты (гипертексты) бывают очень разными.
Можно выделить что-то, что можно назвать "видами" текстов.
Эти виды определяются разными ответами на (1) вопрос о том, структура "чего" составляет логическую основу текста и на (2) вопрос о том, что описывается в большинстве частей текста.

Эту логическую цепочку можно попытаться продолжить дальше - выписать перечень того, "что" может составлять логическую основу текста.

Давайте выпишем такой список.

Формат перечня:
- вид текста: структура какой сущности лежит в основе данного вида текста?

- учебник: структура предметной области
- справочник: структура предметной области
- научная статья: некоторая тема
- статья с аннотациями: сама статья как информационный объект
- толковый словарь: множество понятий
- словарь переводчика: множество слов
- документация: структура некоторого объекта
- руководство пользователя: интерфейс программы как сложный объект, его структура
- руководство администратора: структура работы человека по сопровождению, структура самого объекта, структура причинно-следственных связей в функционировании объекта
- энциклопедия: структуры предметных областей, множество предметных областей, структура системы предметных областей
- база данных таблиц: структура предметной области, множество различных таблиц (перечней)
- база данных рисунков: некоторая тема, множество объектов, которые можно изобразить
- гипертекстовая база знаний: структура работы человека, структура предметной области
- пространственные карты: структура пространства
- абстрактная модель: структура некоторого объекта
- каталог: множество некоторых объектов
- хронология: множество событий
- программа: структура сложного информационного объекта конкретного типа - программы


3.3. перечень сущностей "2Q-entities"

Из предыдущего эксперимента можно сделать следующие выводы:

Большая часть видов текстов из перечня "2Q-list" посвящена:

- предметной области
- теме
- множеству объектов
- сложному объекту
- работе человека

Но кроме этого встречаются и более редкие, "маргинальные" сущности:

- причинно-следственные связи
- пространство

Данный список (пусть и далее разбитый на эти две части) играет для классификации "2Q" очень важную роль, поэтому мы дадим ему отдельное название: "2Q-entities".


В начало этого файла
Об авторе
Об ИВВС РАН

e-mail: Leonid Ovanesbekov <olg@www.ivvs.ru>

1992 -- 1998 март 09 пн