Содержимое моделей интеллектуального анализа данных для моделей логистической регрессии
Интеллектуальный анализ данных не рекомендуется использовать в службах SQL Server 2017 Analysis Services, а в SQL Server 2022 Analysis Services его поддержка прекращена. Документация не обновляется для устаревших и неподдерживаемых функций. Дополнительные сведения см. в статье об обратной совместимости служб Analysis Services.
В этом разделе приведено описание содержимого модели интеллектуального анализа данных, характерного для моделей, в которых используется алгоритм логистической регрессии (Майкрософт). Объяснение того, как интерпретировать статистику и структуру, совместно используемые всеми типами моделей, и общие определения терминов, связанных с содержимым модели интеллектуального анализа данных, см. в разделе "Содержимое модели интеллектуального анализа данных" (службы Analysis Services — интеллектуальный анализ данных).
Основные сведения о структуре модели логистической регрессии
Модель логистической регрессии создается алгоритмом нейронной сети (Майкрософт) с параметрами, которые исключают из модели скрытый узел. Таким образом, общая структура модели логистической регрессии почти идентична структуре нейронной сети: каждая модель имеет один родительский узел, представляющий модель и ее метаданные, а также специальный узел граничной статистики (NODE_TYPE = 24), который содержит описательную статистику о входных атрибутах, используемых в модели.
Кроме того, модель содержит подсеть (NODE_TYPE = 17) для каждого прогнозируемого атрибута. Как и в модели нейронной сети, каждая подсеть всегда содержит две ветви: одну для входного слоя и вторую, содержащую скрытый слой (NODE_TYPE = 19) и выходной слой (NODE_TYPE = 20), для сети. Одна подсеть может использоваться для нескольких атрибутов, если они заданы только как прогнозируемые. Прогнозируемые атрибуты, которые также являются входными, не могут использоваться в одной подсети.
Однако в модели логистической регрессии узел, представляющий скрытый слой, является пустым и не имеет потомков. Поэтому модель содержит узлы, представляющие отдельные выходы (NODE_TYPE = 23) и отдельные входы (NODE_TYPE = 21), но не содержит отдельных скрытых узлов.
По умолчанию модель логистической регрессии отображается в средстве просмотра нейронных сетей (Майкрософт). С помощью этого средства просмотра можно применить фильтр по входным атрибутам и их значениям, чтобы получить графическое представление об их влиянии на выходы. Подсказки в средстве просмотра покажут вероятность и точность, связанные с каждой парой входных и выходных значений. Дополнительные сведения см. в разделе Просмотр модели с помощью средства просмотра нейронных сетей (Майкрософт).
Чтобы изучить структуру входов и подсетей, а также просмотреть подробную статистику, можно использовать средство просмотра деревьев содержимого общего вида (Майкрософт). Можно щелкнуть любой узел, чтобы развернуть его и просмотреть дочерние узлы или отобразить весовые коэффициенты и другие статистические данные, содержащиеся в узле.
Содержимое модели логистической регрессии
В этом разделе представлено подробное описание с примерами только для тех столбцов модели интеллектуального анализа данных, которые имеют отношение к логистической регрессии. Содержимое модели почти полностью идентично содержимому модели нейронной сети, но описания, применимые к моделям нейронной сети, можно для удобства повторить в этой таблице.
Сведения о столбцах общего назначения в наборе строк схемы, таких как MODEL_CATALOG и MODEL_NAME, которые не описаны здесь, или пояснения к терминологии модели интеллектуального анализа данных см. в разделе "Содержимое модели интеллектуального анализа данных" (службы Analysis Services — интеллектуальный анализ данных).
MODEL_CATALOG Имя базы данных, в которой хранится модель.
MODEL_NAME Имя модели.
ATTRIBUTE_NAME Имя атрибута, соответствующего этому узлу.
Узел Содержимое Корневой элемент модели Пусто Граничная статистика Пусто Входной слой Пусто Входной узел Имя входного атрибута скрытый слой Пусто Выходной слой Пусто Выходной узел Имя выходного атрибута
NODE_NAME Имя узла. В текущей версии этот столбец содержит то же значение, что и NODE_UNIQUE_NAME, но такое соответствие может измениться в следующих версиях.
NODE_UNIQUE_NAME Уникальное имя узла.
Дополнительные сведения о структурных данных о модели, содержащихся в именах и идентификаторах, см. в разделе Использование имен и идентификаторов узлов.
NODE_TYPE Выходными данными модели логистической регрессии являются узлы следующих типов.
Идентификатор типа узла Описание 1 Модель. 17 Узел-организатор подсети. 18 Узел-организатор входного слоя. 19 Узел-организатор скрытого слоя. Скрытый слой является пустым. 20 Узел-организатор выходного слоя. 21 Узел входного атрибута. 23 Узел выходного атрибута. 24 Узел граничной статистики.
NODE_CAPTION Метка или заголовок, связанный с узлом. В моделях логистической регрессии этот столбец всегда пуст.
CHILDREN_CARDINALITY Оценка количества дочерних узлов, которые имеет данный узел.
Узел Содержимое Корневой элемент модели Показывает число дочерних узлов, куда входят по крайней мере 1 сеть, 1 необходимый граничный узел и 1 необходимый входной слой. Например, если значение равно 5, то существуют 3 подсети. Граничная статистика Всегда равно 0. Входной слой Показывает число пар «входной атрибут-значение», использованных моделью. Входной узел Всегда равно 0. скрытый слой В моделях логистической регрессии значение всегда равно 0. Выходной слой Показывает число выходных значений. Выходной узел Всегда равно 0.
PARENT_UNIQUE_NAME Уникальное имя родителя узла. Для любых узлов на корневом уровне возвращается значение NULL.
Дополнительные сведения о структурных данных о модели, содержащихся в именах и идентификаторах, см. в разделе Использование имен и идентификаторов узлов.
NODE_DESCRIPTION Понятное описание узла.
NODE_RULE XML-описание правила, внедренного в узел.
Узел Содержимое Корневой элемент модели Пусто Граничная статистика Пусто Входной слой Пусто Входной узел Фрагмент XML-кода, содержащий те же сведения, что и столбец NODE_DESCRIPTION. скрытый слой Пусто Выходной слой Пусто Выходной узел Фрагмент XML-кода, содержащий те же сведения, что и столбец NODE_DESCRIPTION.
MARGINAL_RULE В моделях логистической регрессии этот столбец всегда пуст.
NODE_PROBABILITY Вероятность, связанная с этим узлом. В моделях логистической регрессии значение всегда равно 0.
MARGINAL_PROBABILITY Вероятность доступа к узлу от родительского узла. В моделях логистической регрессии значение всегда равно 0.
NODE_DISTRIBUTION Вложенная таблица, содержащая статистические данные для узла. Подробные сведения о содержимом этой таблицы для каждого типа узла см. в разделе "Общие сведения о таблице NODE_DISTRIBUTION" в содержимом модели интеллектуального анализа данных для моделей нейронной сети (службы Analysis Services — интеллектуальный анализ данных).
NODE_SUPPORT В моделях логистической регрессии значение всегда равно 0.
Вероятность несущего множества всегда равна 0, поскольку выход этой модели не является вероятностным. Для алгоритма значимыми являются только весовые коэффициенты, и поэтому алгоритм не вычисляет вероятность, несущее множество и дисперсию.
Сведения о несущем множестве в обучающих вариантах для определенных значений см. в узле граничной статистики.
Узел Содержимое Корневой элемент модели Пусто Граничная статистика Пусто Входной слой Пусто Входной узел Имя входного атрибута. скрытый слой Пусто Выходной слой Пусто Выходной узел Имя входного атрибута.
MSOLAP_NODE_SCORE В моделях логистической регрессии значение всегда равно 0.
MSOLAP_NODE_SHORT_CAPTION В моделях логистической регрессии этот столбец всегда пуст.
Использование имен и идентификаторов узлов
Система именования узлов в модели логистической регрессии передает дополнительные сведения о связях между узлами в модели. В следующей таблице показаны стандартные идентификаторы, назначаемые узлам в каждом слое.
Тип узла Стандартный идентификатор узла Корневой элемент модели (1) 00000000000000000. Узел граничной статистики (24) 10000000000000000 Входной слой (18) 30000000000000000 Входной узел (21) Начинается с 60000000000000000 Подсеть (17) 20000000000000000 Скрытый слой (19) 40000000000000000 Выходной слой (20) 50000000000000000 Выходной узел (23) Начинается с 80000000000000000
С помощью этих идентификаторов можно определить, как выходные атрибуты связаны с заданными атрибутами входного слоя. Для этого нужно просмотреть таблицу NODE_DISTRIBUTION выходного узла. Каждая строка в этой таблице содержит идентификатор, указывающий на определенный узел входного атрибута. В таблице NODE_DISTRIBUTION также содержится коэффициент для этой пары входного и выходного атрибутов.