Продлённая аутентификация позволяет избавиться от недостатков, присущих статической аутентификации, например, идентификаторы могут быть потеряны или забыты, пользователь совершает только первоначальный вход в систему, что может быть опасно не только для областей, требующих обеспечения высокого уровня безопасности, но и для обычного офиса. Динамическая проверка пользователя во время всего сеанса работы может повысить безопасность системы, поскольку во время работы пользователь может подвергнуться воздействию со стороны злоумышленника (например, быть атакованным) или намеренно передать ему права. В таком случае оперировать машиной будет не пользователь, который выполнил первоначальный вход. Классификация пользователей во время работы системы позволит ограничить доступ к важным данным, которые могут быть получены злоумышленником. Во время исследования были изучены методы и наборы данных, использующихся для продлённой аутентификации. Затем был сделан выбор наборов данных, которые использовались в дальнейшем исследовании: данные о движении смартфона и смарт-часов (WISDM) и динамике активности мыши (Chao Shen’s, DFL, Balabit). Помочь улучшить результаты работы моделей при классификации может предварительный отбор признаков, например, через оценивание их информативности. Уменьшение размерности признаков позволяет снизить требования к устройствам, которые будут использоваться при их обработке, повысить объём перебора значений параметров классификаторов при одинаковых временных затратах, тем самым потенциально повысить долю правильных ответов при классификации за счёт более полного перебора параметров значений. Для оценивания информативности использовались метод Шеннона, а также алгоритмы, встроенные в программы для анализа данных и машинного обучения (WEKA: Machine Learning Software и RapidMiner). В ходе исследования были выполнены расчёты информативности каждого признака в выбранных для исследования наборах данных, затем с помощью RapidMiner были проведены эксперименты по классификации пользователей с последовательным уменьшением количества используемых при классификации признаков с шагом в 20%. В результате была сформирована таблица с рекомендуемыми наборами признаков для каждого набора данных, а также построены графики зависимостей точности и времени работы различных моделей от количества используемых при классификации признаков.
Эта статья фокусируется на том, чтобы уловить смысл значения текстовых функций понимания естественного языка (NLU) для обнаружения дубликатов неконтролируемых признаков. Особенности NLU сравниваются с лексическими подходами для доказательства подходящей методики классификации. Подход трансфертного обучения используется для обучения извлечению признаков в задаче семантического текстового сходства (STS). Все функции оцениваются с помощью двух типов наборов данных, которые принадлежат отчетам об ошибках Bosch и статьям Википедии. Цель данного исследованияструктурировать последние исследовательские усилия путем сравнения концепций NLU для описания семантики текста и применения их к IR. Основным вкладом данной работы является сравнительное исследование измерений семантического сходства. Экспериментальные результаты демонстрируют результаты функции Term Frequency–Inverse Document Frequency (TF-IDF) для обоих наборов данных с разумным объемом словаря. Это указывает на то, что двунаправленная долговременная кратковременная память (BiLSTM) может изучать структуру предложения для улучшения классификации.
Спектральный анализ сигналов используется как один из основных методов исследования систем и объектов различной физической природы. В условиях статистической неопределенности сигналы подвергаются случайным изменениям и зашумлениям. Анализ таких сигналов приводит к необходимости оценивания спектральной плотности мощности (СПМ). На практике для её оценивания широко используется периодограммный метод. Основу цифровых алгоритмов, реализующих этот метод, составляет дискретное преобразование Фурье. В этих алгоритмах операции цифрового умножения являются массовыми операциями. Применение оконных функций ведет к увеличению числа этих операций. Операции умножения относятся к наиболее трудоемким операциям. Они являются доминирующим фактором при определении вычислительных возможностей алгоритма и определяют его мультипликативную сложность. В статье рассматривается задача снижения мультипликативной сложности вычисления периодограммной оценки СПМ с применением оконных функций. Задача решается на основе использования бинарно-знакового стохастического квантования для преобразования сигнала в цифровую форму. Такое двухуровневое квантование сигналов осуществляется без систематической погрешности. На основе теории дискретно-событийного моделирования, результат бинарно-знакового стохастического квантования во времени рассматривается как хронологическая последовательность существенных событий, определяемых сменой его значений. Использование дискретно-событийной модели для результата бинарно-знакового стохастического квантования обеспечило аналитическое вычисление операций интегрирования при переходе от аналоговой формы периодограммной оценки СПМ к математическим процедурам ее вычисления в дискретном виде. Эти процедуры стали основой для разработки цифрового алгоритма. Основными вычислительными операциями алгоритма являются арифметические операции сложения и вычитания. Уменьшение количества операций умножения снижает общую вычислительную трудоемкость оценивания СПМ. С целью исследования работы алгоритма были проведены численные эксперименты. Они осуществлялись на основе имитационного моделирования дискретно-событийной процедуры бинарно-знакового стохастического квантования. В качестве примера приведены результаты вычисления оценок СПМ с применением ряда наиболее известных оконных функций. Полученные результаты свидетельствуют, что использование разработанного алгоритма позволяет вычислять периодограммные оценки СПМ с высокой точностью и частотным разрешением в условиях присутствия аддитивного белого шума при низком отношении сигнал/шум. Практическая реализация алгоритма осуществлена в виде функционально самостоятельного программного модуля. Данный модуль может использоваться как отдельный компонент в составе комплексного метрологически значимого программного обеспечения для оперативного анализа частотного состава сложных сигналов.
Рассматривается задача нахождения минимального по размеру множества атрибутов, используемых для распределения многомерных объектов по классам, например на основе деревьев решений. Задача имеет важное значение при разработке высокопроизводительных и точных классифицирующих систем. Приведен краткий сравнительный обзор известных методов. Задача сформулирована как отыскание минимального (взвешенного) покрытия на различающей 0,1-матрице, которая служит для описания возможности атрибутов разделять пары объектов из разных классов. Приведено описание способа построения различающей матрицы. Сформулированы и решены на основе общего разрешающего принципа групповых резолюций следующие варианты задачи: отыскание минимального по размеру множества атрибутов на заданном входном наборе данных; отыскание минимального по размеру множества атрибутов с минимальным суммарным весом атрибутов (в качестве весов атрибутов можно использовать величины, определяемые на основе известных алгоритмов, например на основе метода RELIEF); нахождение оптимального взвешенного нечеткого покрытия для случая, когда элементы различающей матрицы принимают значения в диапазоне [0,1]; определение статистически оптимального покрытия различающей матрицы (например, для входных наборов данных больших размеров). Статистически оптимальный алгоритм позволяет ограничить время решения полиномом от размеров задачи и плотности единичных элементов в различающей матрице и при этом обеспечить близкую к единице вероятность отыскания точного решения.
Таким образом, предлагается общий подход к определению минимального по размеру множества атрибутов, учитывающий различные особенности в постановке задачи, что отличает данный подход от известных. Изложение содержит многочисленные иллюстрации с целью придать ему максимальную ясность. Ряд теоретических положений, приводимых в статье, основывается на ранее опубликованных результатах. В заключительной части представлены результаты экспериментов, а также сведения о сокращении размерности задачи о покрытии для больших массивов данных. Отмечаются некоторые перспективные направления изложенного подхода, включая работу с неполными и качественными данными, интегрировании управляющей модели в систему классификации данных.
Исследования геоакустической эмиссии в сейсмоактивном регионе на Камчатке показывают, что при подготовке землетрясений и последующей релаксации поля локальных напряжений в пункте наблюдений в геоакустических сигналах возникают ярко выраженные импульсные аномалии. Качественному выделению таких аномалий препятствуют сильное искажение и ослабление амплитуды сигнала. Обзор существующих методов анализа акустической эмиссии показывает, что чаще всего исследователи обращаются к анализу энергетических и статистических свойств сигналов, как более доступных для изучения. Отличительными особенностями предлагаемого авторами подхода являются выделение информативных признаков на основе анализа временной и частотно-временной структур геоакустических сигналов и описание многообразных форм распознаваемых импульсов ограниченным набором паттернов. Настоящее исследование открывает перспективу разработки новых методов выявления аномального поведения геоакустических сигналов, в том числе и перед землетрясениями.
В работе описана методика извлечения информации из потоков импульсов геоакустической эмиссии звукового частотного диапазона. Представлена математическая модель геоакустического импульса, отражающая процесс генерации сигнала от множества элементарных источников. Приводится решение задачи выделения информативных признаков в геоакустических сигналах путем описания фрагментов сигнала матрицами отношений амплитуд локальных экстремумов и интервалов между ними. Приводится результат применения разработанного алгоритма для автоматического описания структуры выделяемых импульсов и для образования множества паттернов, характеризующих особенности сигналов геоакустической эмиссии, наблюдаемых на полевых станциях ИКИР ДВО РАН. Представлена методика сокращения размерности множества выделенных импульсов, позволяющая найти близкие по структуре паттерны. Предложено решение проблемы обработки большого потока данных путем унификации описания импульсов и их систематизации. Предлагается метод идентификации модели геоакустического импульса с использованием разреженных аппроксимационных схем. Дано алгоритмическое решение задачи понижения вычислительной сложности метода согласованного преследования, заключающееся во включении в метод алгоритма итерационного уточнения решения на каждом шаге. Результаты проведенных научных работ позволили создать инструмент для исследования динамических свойств сигналов геоакустической эмиссии в интересах разработки детекторов предсказания землетрясений.
В работе представлены результаты исследований комбинаторно-метрического алгоритма распознавания многомерных групповых точечных объектов (ГТО) в пространстве признаков, имеющих иерархическую организацию. На примере многоуровневых описаний смоделированных и реальных объектов исследован характер изменения показателей достоверности в условиях, когда результаты распознавания, полученные на одном уровне иерархии, используются в качестве исходных данных на следующем. Рассмотрены предпосылки представления распознаваемых объектов или процессов в виде ГТО и источники иерархии. Так, результаты измерений n -мерного процесса в m временных сечениях или в одном сечении, но m независимыми наблюдателями представляются при распознавании n -мерным m -элементным ГТО. В случае распознавания протяженных в пространстве объектов — априорная неопределенность относительно ракурса представления, неполноты состава и координатных шумов элементов обуславливают комбинаторные процедуры количественной оценки меры близости многомерных ГТО, представляющих объект распознавания тому или иному классу. Устойчивость представленного комбинаторно-метрического алгоритма распознавания ГТО достигается возможностью смены стратегии принятия классификационного решения, использующей априорные показатели распознавания на низших уровнях иерархии. В численных экспериментах проводилась классификация геометрии ГТО, представляющего образец, по составу элементов образца или по комплексному априорному показателю достоверности. Для повышения вероятности правильного распознавания предложено использовать перебор результатов распознавания на нижних уровнях иерархии, характеризующихся более низкими априорными показателями достоверности распознавания по первичным признакам. Благодаря использованию процедур поиска комбинаций индексов в окрестности максимума апостериорной вероятности правильного распознавания на нижних уровнях доставляется экстремальное значение критерию качества функционирования системы распознавания на ее верхнем уровне иерархии. Приведены экспериментальные зависимости априорных и апостериорных показателей достоверности при различных условиях проведения измерений и состояний объектов распознавания.
В настоящей статье представлен подход к извлечению робастного водяного знака из изображений, содержащих текст. Извлечение данных основано на разработаном подходе к внедрению робастного водяного знака в текстовые данные, отличающегося устойчивостью к преобразованию текстовых данных в формат изображения. Проведен сравнительный анализ существующих подходов к стеганографическому внедрению информации в текстовые данные, определены их достоинства и недостатки. Обоснован выбор группы методов стеганографического внедрения информации, основанных на форматировании текста. В качестве алгоритма встраивания выбран подход на основе изменения величины межстрочных интервалов. Приведены блок-схема и описание разработанного алгоритма встраивания информации в текстовые данные. Осуществлена экспериментальная оценка емкости встраивания и границ перцептивной невидимости встроенных данных. На основе существующих ограничений разработан подход к извлечению встроенной информации из изображений, содержащих робастный водяной знак. Базовым в процедуре извлечения встроенной информации выбрано преобразование Радона, позволяющее извлекать значения величин межстрочных интервалов. Для выделения значений битов встроенной информации был выбран подход на основе разделения смеси нормальных распределений, поскольку полученное распределение является бимодальным. Экспериментально установлены границы применимости, а также дана оценка робастности разработанного подхода встраивания к осуществлению различных преобразований. Определены следующие параметры робастности разработанного подхода к осуществлению преобразований: поворот изображения, содержащего встроенные данные на любой угол, масштабирование изображения с множителем масштабирования не превыщающим 1,5; преобразование в любой формат растрового изображения; применение медианного фильтра к изображению с пределом ядра свертки не более 9, гауссовского фильтра размытия -- с пределом показателя размытия не более 8 и усредненного фильтра с пределом ядра свертки не более 5.
В настоящей работе рассмотрена задача распределения ролей при составлении общего плана действий в коалиции когнитивных агентов. Когнитивные агенты реализуют основные функции интеллектуального агента с использованием моделей когнитивных функций человека, к которым относятся применяемые в данной работе функции обучения концептуальным знаниям и планирования коллективного поведения. В работе представлен оригинальный метод распределения ролей — алгоритм MultiMAP, основанный на знаковом способе планирования поведения агента. Представлены основные особенности описываемого подхода, включающие способы представления знаний агента о себе и о других агентах, способы знаковой коммуникации и сохранения опыта кооперации с другими агентами. Описаны модельные эксперименты, демонстрирующие основные преимущества представленного подхода и некоторые недостатки, на устранение которых направлена будущая работа в данном направлении.
В данной статье предлагается метод автоматического предсказания интонационно выделенных слов, то есть наиболее важной информации в высказывании. Метод опирается на использование лексических, грамматических и синтаксических маркеров интонационного выделения, что делает возможным его применение в системах синтеза речи по тексту, где реализация интонационного выделения может повысить естественность звучания синтезированной речи.
В качестве методов классификации независимо друг от друга использовалось несколько различных моделей: наивная байесовская модель, модель максимальной энтропии и условные случайные поля. Сопоставление результатов, полученных в ходе нескольких экспериментов, показало, что использовавшиеся дискриминативные модели демонстрируют сбалансированные и примерно равные значения метрик качества, в то время как генеративная модель потенциально более пригодна для поиска интонационно выделенных слов в речевом сигнале.
Результаты, представленные в статье, сравнимы и в некоторых случаях превосходят аналогичные системы, разработанные для других языков.
Данная статья посвящена отбору и оценке речевых признаков, используемых в задаче автоматической текстонезависимой верификации диктора. Для решения поставленной задачи была использована система верификации диктора, основанная на модели Гауссовых смесей и универсальной фоновой модели (GMM-UBM система).
Рассмотрены область применения и проблемы современных систем автоматической идентификации диктора. Произведен обзор современных методов идентификации диктора, основных речевых признаков, используемых при решении задачи идентификации диктора, а также рассмотрен процесс извлечения признаков, использованных далее. К рассмотренным признакам относятся мел-кепстральные коэффициенты (MFCC), пары линейного спектра (LSP), кепстральные коэффициенты перцептивного линейного предсказания (PLP), кратковременная энергия, формантные частоты, частота основного тона, вероятность вокализации (voicing probability), частота пересечения нуля (ZCR), джиттер и шиммер.
Произведена экспериментальная оценка GMM-UBM системы с применением различных наборов речевых признаков на речевом корпусе, включающем в себя записи 50 дикторов. Признаки отобраны с помощью генетического алгоритма и алгоритма жадного добавления-удаления.
Используя 256-компонентные Гауссовы смеси и полученный вектор из 28 признаков, была получена равная ошибка 1-го и 2-го рода (EER), составляющая 0,579 %. По сравнению со стандартным вектором, состоящим из 14 мел-кепстральных коэффициентов, ошибка EER была уменьшена на 42,1 %.
Значительное количество отказов в системах интервального управления движением поездов связано с воздействием возмущающих факторов в широком диапазоне изменения на единственный информационный признак, характеризующий состояние рельсовых линий. В работе предложено определять состояния объекта контроля принципами распознавания образов с многомерными информативными признаками. В качестве признаков предложено использовать амплитуды напряжений и токов на входе и выходе рельсового четырехполюсника. В качестве полинома решающей функции – ортогональный многочлен Эрмита, позволяющий путем усложнения порядка и размерности увеличить глубину распознавания и обеспечить относительную инвариантность к возмущающим воздействиям. При решении задачи распознавания состояний рельсовых линий в качестве критерия качества использована относительная погрешность вычисления границ классов решающими функциями.
Работоспособность предложенной методики демонстрируется результатами исследования распознавания состояний рельсовых линий с «обученной» решающей функцией.
В работе исследуется возможность формирования модели голоса заданного диктора на основе записей образцов его голоса с транскрипцией. В работе предлагается практический способ построения голосовой модели и результаты экспериментов ее применения к задаче конверсии голоса. Модель использует искусственную нейронную сеть, устроенную по принципу автоматического кодера, устанавливающую соответствие между пространством речевых параметров и пространством возможных фонетических состояний, унифицированным для произвольного голоса.
В статье рассматриваются методологические основы космического монито- ринга и тематической обработки спутниковых снимков лесных территорий. Использова- ны методы системного анализа для исследования процессов тематической обработки спутниковых снимков. Разработаны модели структурных связей и свойств лесных насаждений и дешифровочных признаков спутниковых снимков в различных спектраль- ных каналах для обзорных и детальных снимков. Предложен критерий оценки альтерна- тивных вариантов тематической обработки. Построены продукционные правила дешиф- рирования таксационных параметров насаждений.
Рассматриваются различные аспекты применения информационных радиолокационных критериев к решению задач, составляющих предмет биомедицинской информатики в целом, и биометрии в частности. Особое внимание уделено факторам «ложная тревога» и «пропуск признака». Обсуждается смысл этих терминов применительно к задачам биоинформатики. Проанализированы следующие аспекты фактора «ложная тревога»: психологический; диагностический; аспект ложной тревоги в доказательной медицине; «ложная тревога» при идентификации личности. Рассматриваются особенности решения задач биометрии по минимально возможному объему выборки наблюдений.
В работе рассматривается задача отбора информативных признаков из числа тех, которые вычисляются при обработке тензометрических данных методом анализа фрактальной динамики. Обсуждаются способы вычисления признаков, методы классификации и критерии отбора признаков. Приводятся основные алгоритмы отбора информативных признаков.
Рассматриваются сравнительные возможности различных групп алгоритмов классификации объектов. В частности, рассматривается группа спектральных алгоритмов, оперирующих данными о спектрах расстояний между объектами. Рассматриваются также более широкие в общем случае группы разностных алгоритмов, оперирующих данными о шкалах различий между объектами, и еще более широкой группы алгоритмов, инвариантных к смене кодировки признаков. Показано, что для множеств в пространстве двоичных признаков возможности группы спектральных алгоритмов совпадают с возможностями разностных алгоритмов, а для множеств с нечетным числом объектов — и с возможностями алгоритмов, инвариантных к смене кодировки признаков.
В интернете «фейковые новости» - это распространенное явление, которое часто беспокоит общество, поскольку содержит заведомо ложную информацию. Проблема активно исследовалась с использованием обучения с учителем для автоматического обнаружения фейковых новостей. Хотя точность растет, она по-прежнему ограничивается идентификацией ложной информации через каналы на социальных платформах. Это исследование направлено на повышение надежности обнаружения фейковых новостей на платформах социальных сетей путем изучения новостей с неизвестных доменов. Особенно трудно обнаружить и предотвратить распространение информации в социальных сетях во Вьетнаме, потому что все имеют равные права на использование интернета для разных целей. Эти люди имеют доступ к нескольким платформам социальных сетей. Любой пользователь может публиковать или распространять новости через онлайн-платформы. Эти платформы не пытаются проверять пользователей, их местоположение или содержимое их новостей. В результате некоторые пользователи пытаются распространять через эти платформы фейковые новости для пропаганды против отдельного лица, общества, организации или политической партии. Мы предложили проанализировать и разработать модель распознавания фейковых новостей с использованием глубокого обучения (называемого AAFNDL). Метод выполнения работы: 1) во-первых, анализируем существующие методы, такие как представление двунаправленного кодировщика от преобразователя (BERT); 2) приступаем к построению модели для оценки; 3) подходим к применению некоторых современных методов к модели, таких как метод глубокого обучения, метод классификатора и т.д., для классификации ложной информации. Эксперименты показывают, что наш метод может улучшить результаты на 8,72% по сравнению с другими методами.
Целью работы является разработка способа и алгоритма распознавания объектов окружающего пространства, качество работы которого не будет зависеть от числа типов объектов реального мира, которые он может распознавать. Для этого поставлены и решены задачи распознавания множества элементарных геометрических объектов (признаков-примитивов), определения отношений между ними и поиска соответствий между найденными признаками-примитивами и отношениями и заданными шаблонами–описаниями сложносоставных и простых объектов реального мира. Для распознавания элементарных геометрических фигур применена нейронная сеть свёрточного типа. Для её обучения использовались искусственно сгенерированные изображения с элементарными геометрическими фигурами (3D примитивами), которые располагались на сцене случайным образом с различными свойствами их поверхностей и текстурами. В результате обучения была получена нейронная сеть, способная распознавать объекты примитивы. Сформировано множество отношений, необходимое для распознавания объектов, которые могут быть представлены как составные из признаков-примитивов. В предложенном способе распознавания количество классов для поиска ограничивается набором признаков-примитивов. Проверка на фотографиях реальных объектов показала способность распознавать объекты реального мира в независимости от их типа (в случаях, когда возможны их разные модели и модификации) и материала изготовления, а также способность успешно решать задачи поиска объектов в условиях частичного перекрытия объектов и их ограниченной видимости и частичной деформации. В работе рассмотрен пример с распознаванием светильника уличного освещения. Пример показывает способность алгоритма не только выявлять объект на изображении, но и определять ориентацию положения его составляющих. Предложенное решение может быть использовано в задачах манипуляции объектами внешнего мира робототехническими системами.
Рассматривается новый подход к синтезу самопроверяемых устройств, основанный на контроле вычислений контролируемыми объектами с помощью кодов Хэмминга, проверочные символы (контрольные биты) которых описываются самодвойственными функциями. При этом структура работает в импульсном режиме, что фактические основано на внесении временнóй избыточности при построении самопроверяемого устройства. Это, к сожалению, приводит к некоторому снижению быстродействия, однако существенно повышает характеристики контролепригодности, что особенно актуально для устройств и систем критического применения, входные данные для которых изменяются не столь часто. Дается краткий обзор методов построения схем встроенного контроля на основе свойства самодвойственности вычисляемых функций. Приведены основные структуры организации схем встроенного контроля. Отмечены предполагаемые пути развития теории синтеза схем встроенного контроля на основе проверки принадлежности вычисляемых функций классу самодвойственных булевых функций. Установлены все возможные значения числа информационных символов для кодов Хэмминга, которые будут обладать свойством самодвойственности функций, описывающих контрольные биты. Кодеры таких кодов Хэмминга будут являться самодвойственными устройствами. Так как функции, описывающие контрольные биты кодов Хэмминга, являются линейными, то для того, чтобы они были самодвойственными необходимо, чтобы в каждой из них использовалось нечетное количество аргументов. Доказано, что число разрядов кодовых слов кодов Хэмминга с самодвойственными контрольными функциями равно n =3+4 l , l ∈ N 0 . Приводятся результаты моделирования самодвойственных устройств со схемами встроенного контроля по двум диагностическим признакам в среде Multisim. Предложен способ модификации структуры контроля вычислений по двум диагностическим признакам, позволяющий использовать любой линейный блоковый код (не обязательно код Хэмминга). Он основан на дооснащении кодера устройством преобразования функций в самодвойственные. Фактически это устройство для формирования модифицированного кода. Доказано, что для получения модифицированного кода Хэмминга с самодвойственными контрольными функциями для случаев n≠3+4l, l∈N 0 , достаточно сложить по модулю M =2 несамодвойственную контрольную функцию с функцией старшего информационного бита.
В работе представлено применение алгоритма статистического анализа данных разновременной мультиспектральной аэрофотосъемки с целью выявления участков исторического антропогенного воздействия на природную среду. Исследуемый участок расположен на окраине поселка городского типа Знаменка (Знаменский район Тамбовской области) в лесостепной зоне с типичными черноземными почвами, где во второй половине XIX – начале XX вв. были расположены пашни. Признаком для выявления следов исторического антропогенного воздействия может быть растительность, возникшая в результате вторичной сукцессии на заброшенных участках. Отличительной особенностью такой растительности от окружающей природной среды является ее тип, возраст и плотность произрастания. Таким образом, задача обнаружения границ антропогенного воздействия по мультиспектральным изображениям сводится к задаче классификации растительности. Исходными данными являлись результаты разновременной мультиспектральной съемки в зеленом (Green), красном (Red), краевом красном (RedEdge) и ближнем инфракрасном (NIR) спектральных диапазонах. На первом этапе алгоритма предполагается вычисление текстурных признаков Харалика по данным мультиспектральной съемки, на втором этапе – уменьшение количества признаков методом главных компонент, на третьем – сегментация изображений на основе полученных признаков методом k-means. Эффективность предложенного алгоритма показана при сопоставлении результатов сегментации с эталонными данными исторических картографических материалов. Полученный результат сегментации отражает не только конфигурацию участков анотропогенно-преобразованной природной среды, но и особенности зарастания заброшенной пашни, поскольку исследование разновременных мультиспектральных снимков позволяет более полно охарактеризовать и учесть динамику наращивания фитомассы в разные периоды вегетации.
данные на основе встраивания растровых цифровых водяных знаков. Метод сочетает оригинальные авторские идеи, а именно: подход к встраиванию скрытой защитной информации в графические данные, не искажающей координатную информацию векторных объектов, и синтез шумоподобных изображений, выступающих в качестве контейнера для битовой последовательности цифровых водяных знаков. Шумоподобный сигнал кодирует биты цифровых водяных знаков в виде синусоидальных функций и таким образом отображает бинарную последовательность в растровое изображение, непосредственно встраиваемое в защищаемые данные. Применение шумоподобных сигналов в качестве цифровых водяных знаков значительно упрощает процедуру верификации, а также позволяет обеспечить устойчивость скрытой битовой последовательности при различных искажениях изображения цифровых водяных знаков, в том числе при интерполяции.
Целью экспериментальных исследований являлась оценка достижимой вероятности правильного извлечения двоичной последовательности цифровых водяных знаков при различных параметрах и условиях встраивания.
Исследование информационной емкости показало, что потенциальный объем информации, встраиваемый в каждый полигон без искажения битовой последовательности цифровых водяных знаков, зависит от типа карты, а именно от количества вершин, составляющих каждый полигон.
Проведено экспериментальное исследование стойкости полученного метода к потенциально возможным преобразованиям, направленным на злоумышленное удаление цифровых водяных знаков из векторной карты. Разработанный метод демонстрирует стойкость к аффинным преобразованиям, кадрированию, добавлению, удалению и переупорядочиванию вершин/объектов, и может применяться в качестве решения задачи защиты авторских прав на векторные данные.
Проведен анализ качества метода по критериям точности, стойкости, информационной емкости, вычислительной сложности. Результаты всех проведенных исследований подтверждают возможность использования и эффективность предложенного метода защиты векторных картографических данных, а также его преимущества перед существующими методами встраивания цифровых водяных знаков.
Утверждается, что первостепенное значение в решении задачи классификации занимают: нахождение условий разбиения генеральной совокупности на классы, определение качества такого расслоения и верификация модели классификатора. Рассмотрена математическая модель нерандомизированного классификатора признаков, полученных без учителя, когда априори не задается число классов, а лишь устанавливается его верхняя граница. Математическая модель приведена в виде постановки минимаксной условной экстремальной задачи и представляет собой задачу поиска матрицы принадлежности объектов к какому-либо классу. В основе разработки классификатора признаков находится синтез двумерной плотности вероятностей в пространстве координат: классы – объекты. С помощью обобщенных функций вероятностная задача поиска минимума Байесовского риска сведена к детерминированной задаче на множестве нерандомизированных классификаторов. Вместе с тем использование специально введенных ограничений фиксирует нерандомизированные правила принятия решений и погружает целочисленную задачу нелинейного программирования в общую непрерывную нелинейную задачу. Для корректного синтеза классификатора необходимы дисперсионная кривая изотропной выборки и характеристики качества классификации в зависимости от суммарной внутриклассовой и межклассовой дисперсии. Задача классификации может быть интерпретирована как частная задача теории катастроф. В условиях ограниченных исходных данных найден минимаксный функционал, отражающий качество классификации при квадратичной функции потерь. Математическая модель представлена в виде задачи целочисленного нелинейного программирования и приведена с помощью полиномиальных ограничений к виду общей задачи нелинейного непрерывного программирования. Найдены необходимые условия расслоения на классы. Эти условия могут быть использованы как достаточные при проверке гипотезы о существовании классов.
В настоящее время остро стоит проблема создания методологического обеспечения безопасности киберфизических систем, в частности проектирования и реализации подсистем информационной безопасности. При этом ландшафт угроз и уязвимостей, характерных для применяемого в киберфизических системах широкого спектра аппаратных и программных технологий, чрезвычайно широк и сложен. В этом контексте безопасность протоколов прикладного уровня имеет первостепенное значение, поскольку эти протоколы лежат в основе взаимодействия между приложениями и службами, работающими на различных устройствах, а также в облачных инфраструктурах. В условиях постоянного взаимодействия исследуемых систем с реальной физической инфраструктурой актуальна проблема определения эффективных мер по обеспечению целостности передаваемых команд управления, поскольку нарушение выполняемых критически важных процессов может затрагивать жизнь и здоровье людей. Представлен обзор основных методов обеспечения целостности данных в протоколах управления киберфизических систем, а также обзор уязвимостей протоколов прикладного уровня, широко используемых в различных киберфизических системах. Рассмотрены классические методы обеспечения целостности и новые методы, в частности блокчейн, а также основные направления повышения эффективности протоколов обеспечения целостности данных в киберфизических системах. Анализ уязвимостей прикладного уровня проведен на примере наиболее популярных спецификаций MQTT, CoAP, AMQP, DDS, XMPP, а также их реализаций. Установлено, что несмотря на наличие во всех перечисленных протоколах базовых механизмов обеспечения безопасности, исследователи продолжают регулярно выявлять уязвимости в популярных реализациях, что зачастую ставит под угрозу сервисы критической инфраструктуры. В ходе подготовки обзора существующих методов обеспечения целостности данных для исследуемого класса систем были определены ключевые проблемы интеграции этих методов и способы их решения.
Возникновение чрезвычайных ситуаций, которые угрожают жизни и здоровью людей, резко повышает требования к полноте и точности представления информации о текущей ситуации. Современные робототехнические средства оснащены датчиками, работающими на различных физических принципах. Это приводит к росту входной информации, поступающей в управляющую систему. С учетом ограниченной производительности бортовой вычислительной системы, а также высокой априорной неопределенности наземной обстановки робототехнические средства не могут быть эффективно использованы без объединения получаемой информации от группы робототехнических средств и создания единой картины наземной обстановки.
Решить задачу отождествления вектор-признаков, относящихся к одному объекту, а также оценить эффективность полученных решений можно по известным формулам теории проверки статистических гипотез и теории вероятностей только при нормальном законе распределения с известными математическим ожиданием вектор-признака и корреляционной матрицей. Однако перечисленные условия на практике, как правило, не выполняются.
Предложен новый метод решения задачи отождествления вектор-признаков, не опирающийся на статистический подход, и, следовательно, не требующий знание вида закона распределения и значений его параметров. Предлагаемый метод основан на идее сочетания кластерного анализа и нечеткой логики и отличается сравнительной простой по отношению к базовым методам многомерной непараметрической статистики.
Обсуждаются математические аспекты метода нечеткой кластеризации и возможное упрощение алгоритма нечеткого отождествления при временных ограничениях. Установлено, что применение нечеткой кластеризации объектов в сложной наземной обстановке позволяет уменьшить количество ложных распознаваний объектов по сравнению с существующим статистическим подходом, ориентированным на использование нормального закона распределения.
Показано преимущество предлагаемого метода отождествления вектор-признаков объектов, даны сравнительные значения по количеству ложных распознаваний. Даны рекомендации построения правил нечеткого вывода при создании базы знаний экспертной системы.
Предложен метод определения патологических изменений голоса на основе анализа модуляционного спектра речевого сигнала. Модуляционный спектр вычисляется при помощи двух последовательных частотно-временных преобразований: первое переводит сигнал в частотную область, второе – в модуляционную. Особенностью предложенного метода является использование неравномерного частотно-временного плана при переводе сигнала в частотную область. Предложен способ оценки модуляционного спектра, основанный на принципах антропоморфической обработки сигналов, имитирующий неравномерное частотно-временное разрешение слуховой системы человека. Использован неравнополосный банк фильтров модулированный дискретным преобразований Фурье, аппроксимирующий шкалу критических частот и повышающий временное разрешение в широких полосах. Банк фильтров использует фазовые (всепропускающие) звенья в качестве элементов задержки, что позволяет получить неравномерный частотно-временной план. Выполнено сравнение предложенного способа с более традиционным способом вычисления модуляционного спектра в критических полосах с фиксированным временным разрешением. Приведены данные экспериментов по использованию параметров модуляционного спектра для определения патологических изменений голоса, обусловленных: 1) боковым амиотрофическим склерозом (БАС); 2) заболеваниями гортани. Отбор и ранжирование параметров модуляционного спектра, использованных в качестве информационных признаков для классификации, выполнен при помощи метода LASSO. Классификация параметров на основе линейного дискриминантного анализа обеспечила высокую точность определения патологии (более 97%). Полученные результаты свидетельствуют о том, что использование неравномерного частотного-временного плана является предпочтительным в случае, когда анализируемый сигнал является протяжным гласным звуком, поскольку обеспечивает более высокую точность обнаружения патологии при меньшем числе модуляционных параметров.
Существующие методы вычисления ценности диагностической информации, циркулирующей в автоматизированных системах мониторинга технического состояния объектов, не учитывают потери (выигрыши), связанные с принятием неправильных решений при идентификации этого состояния.
Цель работы — разработка алгоритма, позволяющего решить задачу распознавания технического состояния, в котором находится анализируемый объект, методом динамического программирования, используя в качестве оптимизируемого показателя ценность диагностической информации. Решение задачи оптимизации диагностической процедуры основано на использовании меры ценности информации Р. Л. Стратоновича, модифицированной применительно к предметной области технического диагностирования и при использовании диагностических признаков, представленных в виде интервалов на вещественной числовой оси. Максимальная ценность диагностической информации достигается при минимизации средних потерь (максимизации средних выигрышей), получаемых при выполнении проверок диагностических признаков, в процессе распознавания технического состояния объекта.
Для решения задачи предложено обладающее научной новизной рекуррентное выражение, позволяющее вычислять ценность информации, получаемой при выполнении проверок диагностических признаков в каждом из анализируемых информационных состояний процесса диагностирования. В процессе реализации программы диагностирования при распознавании технического состояния объекта возможны как потери, так и выигрыши. Разность их априорных и апостериорных средних значений численно характеризует ценность диагностической информации. Величина показателя ценности информации зависит от вероятностей исходов проверок диагностических признаков и пропорциональна разности апостериорных и априорных вероятностей достижения цели диагностирования.
Использование предложенного решения позволяет синтезировать оптимальную по критерию максимума ценности диагностической информации гибкую программу диагностирования в виде ориентированного графа или упорядоченных по очередности их выполнения наборов проверок, необходимых для распознавания конкретного технического состояния, в котором находится объект.
Реализация разработанного алгоритма возможна в программно-алгоритмическом обеспечении автоматизированных систем мониторинга состояния сложных технических объектов.
В настоящее время не используются адекватные математические средства для анализа расположения компонентов в массивах естественно упорядоченных данных различной природы, в том числе – слов или букв в текстах, нотных знаков в записях музыкальных произведений, символов в знаковых последовательностях, данных мониторинга, чисел, отображающих упорядоченные результаты измерений, компонентов в генетических текстах. Поэтому затруднены или невозможны измерение и сравнение порядка следования сообщений, выделенных в длинных информационных цепях. Основные подходы при сравнении символьных последовательностей используют вероятностные модели и статистический инструментарий, попарное и множественное выравнивание, позволяющее определить степень сходства цепей с помощью мер редакционного расстояния. В некотором роде экзотическим являются использование псевдоспектрального и фрактального представления символьных последовательностей. Следует особо отметить «проклятие априорного неосознаваемого знания» об очевидной упорядоченности цепи, которое широко распространено в математической лингвистике, биоинформатике (математической биологии) и других аналогичных областях науки. Отмеченные подходы почти не уделяют внимания исследованию и обнаружению закономерностей конкретного расположения всех знаков, слов, компонентов массивов данных, составляющих отдельную целостную последовательность. Объектом исследования в наших работах является специальным образом организованный числовой кортеж – расположение компонентов (строй) в символьных или числовых последовательностях. При этом в качестве основы для количественного отображения строя цепи используются интервалы между ближайшими одинаковыми её компонентами. Перемножение всех интервалов или суммирование их логарифмов позволяет получить числа, которые однозначно отображают расположение компонентов в конкретной последовательности. Эти числа, в свою очередь, позволяют получить целый набор нормированных характеристик строя, среди которых средний геометрический интервал и его логарифм. Такие характеристики на удивление точно отражают расположение компонентов в знаковых последовательностях. В данной работе представлен подход для количественного сравнения построений массивов естественно упорядоченных данных (информационных цепей) произвольной природы. Предложены меры сходства-расхождения и процедура сравнения строя цепей, основанные на выделении списка совпадающих и сходных по характеристикам строя подпоследовательностей (компонентов). При этом для быстрого выделения списка совпадающих компонентов используются ранговые распределения. В работе представлен инструментарий для сравнения построений информационных цепей и продемонстрированы некоторые его возможности при исследовании строя нуклеотидных последовательностей.
Распознавание эмоций в речи стало одним из важных направлений в области аффективных вычислений. Это комплексная задача, трудности которой во многом определяются необходимостью выбора признаков и их оптимального представления. Оптимальное представление признаков должно отражать глобальные характеристики, а также локальную структуру сигнала, поскольку эмоции естественным образом длятся во времени. Подобное представление возможно моделировать с помощью рекуррентных нейронных сетей (РНС – RNN), которые активно используются для различных задач распознавания, предполагающих работу с последовательностями. Предлагается смешанный подход к представлению признаков, который объединяет традиционные статистические признаки с последовательностью значений, полученных на выходе РНС с длинной кратковременной памятью (ДКП – LSTM) и хорошо моделирующих временную структуру сигнала. Таким образом, удается получить одновременное представление как кратковременных, так и долгосрочных характеристик, позволяющих использовать преимущества обоих подходов к моделированию признаков речевого сигнала. Для экспериментальной проверки предложенного метода была произведена оценка его эффективности на трех различных базах данных эмоционально окрашенной речи, находящихся в свободном доступе: RUSLANA (русская речь), BUEMODB (турецкая речь) и EMODB (немецкая речь). В сравнении с традиционным подходом результаты наших экспериментов показывают абсолютный прирост в точности распознавания эмоций в 2.3% и 2.8% для двух из вышеупомянутых корпусов, в то время как для третьего корпуса предложенный метод не уступает базовой системе. Следовательно, данный подход можно признать эффективным для моделирования эмоциональной окраски речевых высказываний при условии достаточного количества обучающих данных.
Отсутствие достаточного количества данных шепотной речи для обучения является серьезной проблемой для современных систем автоматического распознавания речи (АРР). Из-за большого акустического различия между обычной и шепотной речью АРР системы значительно снижают производительность при обработке шепота.
В статье приведен анализ подходов к распознаванию нейтральной и шепотной речи на основе традиционных скрытых марковских моделей (СММ) для дикторозависимых (SD) и дикторонезависимых (SI) случаев. Особое внимание уделяется распознаванию шепотной речи с использованием нейтральной речи на этапе обучения (сценарий N/W). Система АРР разработана для распознавания изолированных слов из базы данных (Whi-Spe), включающей пары слов реально произнесенной речи нейтрально и шепотом. В сценарии N/W увеличение надежности достигается с применением предлагаемого частотного преобразования, изначально разработанного для сжатия и декомпрессии речевого сигнала в цифровых телекоммуникационных системах. Вместе с тем сохраняются хорошие показатели в распознавании нейтральной речи.
По сравнению с базовой моделью распознавания с применением Мел-частотных кепстральных коэффициентов (MFCC) точность распознавания слов с использованием кепстральных коэффициентов, полученных с помощью предложенного частотного деформирования (обозначаемого как μFCC), улучшена на 7,36% (SD) и 3,44% (SI) в абсолютных значениях. Кроме того, F-мера (гармоническое среднее значение точности и полноты) для векторов признаков μFCC увеличивается на 6,90% (SD) и 3,59 %(SI). Статистические тесты подтверждают значимость достигнутого улучшения точности распознавания.
На основе проведенных исследований автоматизированных систем управления промышленных предприятий в работе предложена математическая модель аутентификации персонала с использованием технологии формирования и обработки гетерогенного потока, содержащего с источников видеонаблюдения в трафике видеоданных фотографические идентификационные признаки персонала. Отличительной особенностью модели являются операторы переходов и выходов, направленные на формирование сигнала управления по результатам обработки агрегированного потока видеоданных, выделении кадров-вставок, несущих фотографические идентификационные признаки о персонале, сегментации пространства изображения, необходимого для аутентификации персонала в интегрированной системе контроля и управления доступом, а также применение технологий по восстановлению видеопотока. Разработана методика идентификации кадров-вставок в гетерогенном потоке видеоданных, базирующаяся на оценке суммарной дифференциальной экстремальной яркости кадров-сверток, анализе гистограмм изображений кадров по коэффициентам корреляции и полиномам Чебышевской аппроксимации, отличающаяся использованием динамического порога при идентификации кадров и принятия решения об их классе на основе мажоритарного способа обработки данных. Представлены результаты имитационного моделирования процесса аутентификации персонала на основе предложенных модели и методик, позволяющие оценить эффективность визуальной аутентификации персонала при выполнении требований достоверности принятия решения и ограничения пропускной способности сети передачи данных.
Предложен алгоритм формирования системы эффективных классификационных характеристик, основанный на концепции усеченного перебора и использовании информации об индивидуальных показателях классификации при выборе гранул. Его вычислительная эффективность обеспечивается применением операций простого сравнения результатов классификации отдельных классов при выборе наиболее информативной гранулы на очередной итерации и использованием технологии параллельных вычислений на графических процессорах.
Рассмотрены известные методы усеченного перебора для формирования систем эффективных классификационных характеристик. Обсуждаются результаты поиска информативных признаков на примере решения задачи классификации облачности на основе применения вероятностной нейронной сети и информации о текстуре спутниковых снимков MODIS. Представлено описание используемого классификатора и статистического подхода к описанию текстуры изображений.
Определены наиболее эффективные классификационные характеристики облачности путем сравнения комбинаций текстурных признаков, полученных с помощью методов усеченного перебора. Показаны результаты исследования динамики изменения оценки правильно проклассифицированных облаков при выполнении различных алгоритмов поиска информативных признаков. Установлено, что разработанный в данной работе метод позволяет уменьшить разброс значений вероятности правильной классификации отдельных классов.
В статье рассматривается новый подход к выполнению классификации текстов, учитывающий наличие различных типов классификационных признаков (бинарных, номинальных, порядковых и интервальных).
Особенность представленного подхода состоит в поэтапном проведении классификации, которое дает возможность не приводить разнотипные признаки, характеризующие текст, к единому диапазону. Также в статье предлагается набор классификационных признаков для проведения классификации русскоязычных текстов на основании их предполагаемой возрастной аудитории.
В работе описывается вычислительный эксперимент с использованием текстов, включенных в Национальный корпус русского языка. Выборка включает в себя заведомо качественные и максимально разнообразные тексты, написанные на русском языке. Документы, входящие в состав рассматриваемой выборки, разделены в соответствии с мнениями экспертов-лингвистов на две категории — взрослые и детские. Таким образом, для обучения и тестирования использовались тексты, размеченные экспертами.
В статье приведены значения точности классификации текстов, полученные в результате проведения серии экспериментов по автоматическому определению возрастных категорий адресатов текста (для кого написан текст — для детей или для взрослых).
В статье описаны результаты обработки электромиограммы (ЭМГ) и результаты распознавания мимических движений алгоритмом радиальной базисной функции нейронной сети (НС). В качестве входного вектора признаков использовались девять признаков-функций ЭМГ во временной области. Наиболее высокая точность распознавания и скорость обучения получены для признака «Максимальные значения», наихудший результат получен для признака «Среднее арифметическое». На основе полученных данных предложен алгоритм распознавания движений. Классификатор может применяться для создания интерфейсов вида «человек-машина».
Сформулированы аксиомы, позволившие выделить теорию многокритериального выбора на конечном множестве альтернатив из общей теории принятия решений. Теория, объединившая все известные методы многокритериального выбора в сис-тему, положена в основу учебника «Теория принятия управленческих решений».
Трактовка функций, применяемых различными методами оптимизации, ожидаемой полезностью, естественной для принятия решений, позволила выделить две группы методов – критериального и функционального выбора. Первые устанавливают предпочтения на значениях критериев, а вторые – на значениях функций, отражающих предпочтения на шкалах признаков. Роль видовых отличий отведена шкалам, в которых измеряются признаки. Такая трактовка функций, не зависящая от способа их создания, позволила рассматривать методы многокритериальной оптимизации и многомерной полезности с единых позиций. К группе методов функционального выбора отнесён и метод анализа иерархий, использующий функции приоритетов, вычисляемые на основе матриц парных сравнений. Полученная система методов позволяет сопоставлять их по качеству и оценивать эффективность решения конкретных задач.
В статье представляется метод построения классификатора для классификации текстов по тональности на два и на три класса (положительные и негативные; положительные, нейтральные и негативные тексты). Представляются результаты экспериментов, показывающие высокую точность работы метода не зависимо от предметной области к которой принадлежит текст. Эффективность представленного метода подтверждается экспериментами на текстовой коллекции блогов с разметкой по оценочной тональности семинара РОМИП-2012. Для оценки используются метрики: precision, recall, accuracy и F-меры. Значение F-меры для предлагаемого метода при классификации на 2 класса составляет 93%. Помимо блоговой коллекции РОМИП-2012, используются коллекция новостей и коллекция текстов социальных сетей.
В англоязычной и отечественной литературе работы, посвящённые проблемам дискретной оптимизации, носят обособленный характер. В основу систем поддержки принятия решений кладутся частные методы оптимизации. Это затрудняет выбор подходящего метода для решения задачи выбора. В работе предлагается рассматривать все методы оптимизации с точки зрения полезности признаков, участвующих в оценивании объектов. На основе систематизации критериев выбора показывается возможность интерпретации функций, применяемых в методах многокритериальной оптимизации, как простейших вариантов функции полезности. Как следствие, констатируется более высокая степень информативности по предпочтениям функций полезности по сравнению с другими функциями, используемыми в задачах оптимизации.
Проведен анализ роли и места информационных процессов в современном мире. Определено, что информация, получаемая с помощью космических и наземных средств, существенно влияет на все сферы жизни общества и государства. Показана необходимость разработки научно-методического аппарата по созданию единого информационного пространства и единой автоматизированной системы управления разнородными средствами в воздушно-космической сфере путем интеграции существующих систем на базе единого информационного подхода формирования признакового пространства. Предложен подход к формированию единого информационного пространства в сложных информационно-управляющих системах на основе комплексного применения современных методов и моделей, базирующихся на многофакторности пространства признаков и синтезированных с использованием теории фракталов, вейвлет-преобразований, синергетических подходов, теории эффективности и качества
В статье обосновывается применение знакопеременных функций полезности, и решается вопрос обобщения их значений с целью многокритериального упорядочения объектов. В том числе рассматривается возможность применения мультипликативной обобщающей функции, и решаются возникающие при этом проблемы.
1 - 25 из 39 результатов