Обоснована актуальность пространственной кластеризации мест возникновения чрезвычайных ситуаций. Представлен адаптированный алгоритм STING кластеризации. На основе сравнительного анализа описан выбор вида базы данных для хранения результатов работы алгоритма. Предложен алгоритм подготовки данных для последующей визуализации
Управление знаниями — это совокупность процессов, которые управляют созданием, извлечением, обработкой, использованием, распространением, использованием знаний и предоставлением доступа к ним в некоторой предметной области. Система управления знаниями представляет собой комплекс процедур, реализующих эти процессы. Для представления знаний в настоящее время в России и в мире широко используются онтологии. Неотъемлемой частью любой системы взаимодействующей с пользователем является возможность персонифицировать поток информации и знаний между системой и пользователем. В работе предложен метод онтолого-ориентированной кластеризации для группировки пользователей системы управления знаниями на основе их предпочтений. Такая группировка позволяет выявлять общие предпочтения групп пользователей и адаптировать поток информации и знаний в зависимости от этих предпочтений.
В работе представлено применение алгоритма статистического анализа данных разновременной мультиспектральной аэрофотосъемки с целью выявления участков исторического антропогенного воздействия на природную среду. Исследуемый участок расположен на окраине поселка городского типа Знаменка (Знаменский район Тамбовской области) в лесостепной зоне с типичными черноземными почвами, где во второй половине XIX – начале XX вв. были расположены пашни. Признаком для выявления следов исторического антропогенного воздействия может быть растительность, возникшая в результате вторичной сукцессии на заброшенных участках. Отличительной особенностью такой растительности от окружающей природной среды является ее тип, возраст и плотность произрастания. Таким образом, задача обнаружения границ антропогенного воздействия по мультиспектральным изображениям сводится к задаче классификации растительности. Исходными данными являлись результаты разновременной мультиспектральной съемки в зеленом (Green), красном (Red), краевом красном (RedEdge) и ближнем инфракрасном (NIR) спектральных диапазонах. На первом этапе алгоритма предполагается вычисление текстурных признаков Харалика по данным мультиспектральной съемки, на втором этапе – уменьшение количества признаков методом главных компонент, на третьем – сегментация изображений на основе полученных признаков методом k-means. Эффективность предложенного алгоритма показана при сопоставлении результатов сегментации с эталонными данными исторических картографических материалов. Полученный результат сегментации отражает не только конфигурацию участков анотропогенно-преобразованной природной среды, но и особенности зарастания заброшенной пашни, поскольку исследование разновременных мультиспектральных снимков позволяет более полно охарактеризовать и учесть динамику наращивания фитомассы в разные периоды вегетации.
Эта статья фокусируется на том, чтобы уловить смысл значения текстовых функций понимания естественного языка (NLU) для обнаружения дубликатов неконтролируемых признаков. Особенности NLU сравниваются с лексическими подходами для доказательства подходящей методики классификации. Подход трансфертного обучения используется для обучения извлечению признаков в задаче семантического текстового сходства (STS). Все функции оцениваются с помощью двух типов наборов данных, которые принадлежат отчетам об ошибках Bosch и статьям Википедии. Цель данного исследованияструктурировать последние исследовательские усилия путем сравнения концепций NLU для описания семантики текста и применения их к IR. Основным вкладом данной работы является сравнительное исследование измерений семантического сходства. Экспериментальные результаты демонстрируют результаты функции Term Frequency–Inverse Document Frequency (TF-IDF) для обоих наборов данных с разумным объемом словаря. Это указывает на то, что двунаправленная долговременная кратковременная память (BiLSTM) может изучать структуру предложения для улучшения классификации.
Предлагается способ комплексирования разноракурсных изображений с применением алгоритма квазиоптимальной кластеризации пикселей к исходным снимкам земной поверхности. Исходные разноракурсные изображения, сформированные бортовой аппаратурой многопозиционных локационных систем, состыковываются в единый составной снимок и при помощи высокоскоростного алгоритма квазиоптимальной кластеризации пикселей редуцируются до нескольких цветов с сохранением характерных границ. Особенность алгоритма квазиоптимальной кластеризации заключается в генерации серии разбиений с постепенно увеличивающейся детализацией за счет переменного числа кластеров. Эта особенность позволяет выбрать подходящие разбиения пар состыкованных изображений из серии сгенерированных. На паре изображений из выбранного разбиения состыкованного снимка осуществляется поиск опорных точек выделенных контуров. Для этих точек определяется функциональное преобразование и после его применения к исходным снимкам осуществляется оценка степени корреляции комплексированного изображения. Как положение опорных точек контура, так и само искомое функциональное преобразование уточняется до тех пор, пока оценка качества комплексирования не будет приемлемой. Вид функционального преобразования подбирается по редуцированным по цвету изображениям, а затем применяется к исходным снимкам. Этот процесс повторяется для кластеризованных изображений с большей детализацией в том случае, если оценка качества комплексирования не является приемлемой. Целью настоящего исследования является разработка способа, позволяющего сформировать комплексное изображение земной поверхности из разноформатных и разнородных снимков.
В работе представлены следующие особенности способа комплексирования. Первая особенность заключается в обработке единого составного изображения из пары состыкованных исходных снимков алгоритмом кластеризации пикселей, что позволяет подобным образом выделить одинаковые области на его различных частях. Вторая особенность заключается в определении функционального преобразования по выделенным точкам контура на обработанной паре кластеризованных снимков, которое и применяется к исходным изображениям для их комплексирования. В работе представлены результаты формирования комплексного изображения как по однородным (оптическим) снимкам, так и по разнородным (радиолокационным и оптическим) снимкам. Отличительной чертой предлагаемого способа является улучшение качества формирования, повышение точности и информативности итогового комплексного изображения земной поверхности.
Рассматривается задача определения текущего положения пневматических исполнительных механизмов. Решение поставленной задачи достигается введением системы технического зрения, позволяющей на основе метода нечеткой кластеризации определять в режиме реального времени координаты центра цветовой метки, установленной на исполнительных механизмах мехатронного комплекса и позицию её смещения. Целью работы является повышение точности распознавания цветовой метки для прецизионного позиционирования исполнительных механизмов мехатронного комплекса и повышение быстродействия дефаззификатора за счет распараллеливания вычислительных процедур в нем. Интеллектуализация процесса распознавания цветового оттенка производится на основе нечёткой кластеризации. Сначала строится нечеткая модель, позволяющая в зависимости от входных параметров интенсивности цвета по каждому из каналов RGB и составляющей цветового тона выделять на изображении заданный цвет. Затем осуществляется бинаризация цветного изображения и подавление шумов. При моделировании нечеткой системы авторами были применены две модели дефаззификации: на основе метода центра тяжести и на основе отношения площадей. Модель, реализованная на основе метода отношения площадей, позволяет убрать зоны нечувствительности, которые присутствуют в модели центра тяжести. Метод на основе отношения площадей определяет принадлежность пикселей к заданному цветовому тону, и после этого расположение цветовой метки в кадре изображения определяется на основе определения центра тяжести распознанных пикселей цветовой метки. В последующем, при перемещении исполнительного механизма в продольном направлении, система технического зрения определяет расположение цветовой метки в новом кадре. Разность положений цветовой метки на исходном и текущем изображениях позволяет определить расстояние смещения цветовой метки. С целью исследования влияния шума на точность распознавания были использованы цифровые фильтры: медианный, Гауссовский, матричный и биноминальный. Анализ точности данных фильтров показал, что лучший результат получен при использовании Гауссовского фильтра. Оценка производилась на основе показателя сигнал-шум. Реализация математической модели распознавания цветовой метки выполнена в среде Matlab/Simulink. Экспериментальные исследования работоспособности системы технического зрения с предложенной нечёткой моделью кластеризации проводились на пневматическом мехатронном комплексе. В ходе экспериментов на корпусе цилиндра закреплялась цветовая метка, после чего цилиндр перемещался по направляющим в продольном направлении. В процессе перемещения выполнялась видеофиксация и распознавание изображений. Для определения точности распознавания цветовой метки рассчитаны коэффициенты PSNR и RMSE, которые составили 38,21 и 3,14 соответственно. Точность определения смещения на основе разработанной модели распознавания цветовых меток достигла 99,7%. Быстродействие дефаззификатора увеличилось до 590 нс.
Анализ сетей разнообразной природы, которыми являются сети цитирования, а также социальные или информационно-коммуникационные сети, включает изучение топологических свойств, позволяющих оценивать взаимосвязи между узлами сети и различные характеристики, такие как плотность и диаметр сети, связанные подгруппы узлов и тому подобное. Для этого сеть представляется в виде графа – совокупности вершин и ребер между ними. Одной из важнейших задач анализа сетей является оценивание значимости узла (или в терминах теории графов – вершины). Для этого разработаны различные меры центральности, позволяющие оценить степень значимости вершин сетевого графа в структуре рассматриваемой сети.
Существующее многообразие мер центральности порождает проблему выбора той, которая наиболее полно описывает значимость центральность узла.
Актуальность работы обусловлена необходимостью анализа мер центральности для определения значимости вершин, что является одной из основных задач изучения сетей (графов) в практических приложениях.
Проведенное исследование позволило с использованием метода главных компонент среди известных мер центральности выявить коллинеарные меры, которые в дальнейшем можно исключать из рассмотрения. Это позволяет уменьшить вычислительную сложность расчетов, что особенно важно для сетей с большим числом узлов, и повысить достоверность интерпретации получаемых результатов при оценивании значимости узла в рамках анализируемой сети при решении практических задач.
Выявлены закономерности представления различных мер центральности в пространстве главных компонент, что позволяет классифицировать их с точки зрения близости образов узлов сети, формируемых в определяемом применяемыми мерами центральности пространстве.
Рассматриваются основные способы применения интеллектуальных методов и алгоритмов, синтезированных на их основе, представления данных сетевого мониторинга для управления рисками информационной безопасности защищенных мультисервисных сетей (ЗМС). Разработана и исследована математическая модель интеллектуального представления данных для анализа и оценки риска информационной безопасности ЗМС.
Описан оригинальный алгоритм кластеризации разнотипных данных, основанный на комплексном применении набора мер расстояний и методов кластеризации и многоэтапной кластеризации. В рамках алгоритма реализовано ранжирование признаков объекта по их значимости для группировки и выбор оптимального набора признаков, ансамблевый подход для получения более устойчивого итогового кластерного решения. Алгоритм реализован в программной системе MixDC (Mixed Data Clustering). Приведены методика и результаты решения реальной задачи кластеризации медицинских данных средствами программной системы.
Целью работы является создание алгоритма генерации тезауруса синонимов для названий продуктов. Такие тезаурусы используются в современных поисковых машинах для расширения пользовательского запроса и улучшения качества поиска. При этом подходе из поискового индекса выбираются документы, включающие в себя не только слова, содержащиеся в запросе, но и близкие по смыслу термины. В ходе работы был реализован полуавтоматический метод обучения распознавателя именованных сущностей. Для валидации извлеченных сущностей был предложен метод полуавтоматической валидации.
Статья посвящена разработке комплексной модели диктора в задаче текстонезависимой идентификации по голосу. Комплексная модель базируется на методе гауссовых смесей. Ее формируют по речевому сигналу, который предварительно сегментируется на фрагменты, соответствующие различным фонетическим классам звуков. Предложен способ структурирования моделей дикторов. Модели дикторов структурированы в виде дерева, что позволило проводить идентификацию диктора без выполнения полного перебора всего множества моделей. Проведенные исследования показали, что деление акустического пространства голоса диктора на множество классов, представляющих некоторые фонетические события, приводит к увеличению эффективности идентификации по голосу, а предложенное структурирование множества моделей дикторов ускоряет операцию поиска.
1 - 11 из 11 результатов