В работе выполнен анализ современного состояния проблемы извлечения знаний из клинических рекомендаций, представленных в виде слабоструктурированных корпусов текстовых документов на естественном языке с учетом их периодического обновления. Рассматриваемые методы интеллектуального анализа накопленных массивов медицинских данных позволяют автоматизировать ряд задач, направленных на повышение качества медицинской помощи за счет значимой поддержки принятия решений в процессе диагностики и лечения. Выполнен обзор известных публикаций, освещающий подходы к автоматизации построения нейросетевых языковых моделей, онтологий и графов знаний в задачах семантического моделирования проблемно-ориентированного корпуса текстов. Представлена структурно-функциональная организация системы извлечения знаний и автоматического построения онтологии и графа знаний проблемно-ориентированного корпуса для конкретной предметной области. Рассмотрены основные этапы извлечения знаний и динамического обновления графа знаний: извлечение именованных сущностей, семантическое аннотирование, извлечение терминов, ключевых слов, тематическое моделирование, идентификация тем и извлечение отношений. Формализованное представление текстов получено с помощью предобученной модели-трансформера BERT. Использовано автоматическое выделение триплетов «объект»-«действие»-«субъект» на основе частеречной разметки корпуса текстов для построения фрагментов графа знаний. Проведен эксперимент на корпусе медицинских текстов заданной тематики (162 документа обезличенных историй болезни пациентов педиатрического центра) без предварительной разметки с целью проверки предложенного решения по извлечению триплетов и конструирования на их основе графа знаний. Анализ экспериментальных результатов подтверждает необходимость более глубокой разметки корпуса текстовых документов для учета специфики медицинских текстовых документов. Показано, что модели общего назначения не позволяют приблизиться по качеству выделения именованных сущностей к специализированным моделям, однако, позволяют предварительно разметить корпус для дальнейшей верификации и уточнения разметки (оценка F1-меры для модели общего назначения – 20,4% по сравнению с вариантом использования словаря – 16,7%). Для неразмеченного корпуса текстов предложенное решение демонстрирует удовлетворительную работоспособность ввиду выделения атомарных фрагментов, включаемых в автоматически формируемую онтологию.
Резкое ухудшение состояния на фоне развития жизнеугрожающих аритмий с симптомами острой сердечной недостаточности (ОСН), синдрома полиорганной недостаточности (СПОН) или отёка головного мозга (ОГМ) может привести к гибели пациента. Поскольку известные методы автоматизированной диагностики в настоящий момент не могут достаточно точно и своевременно определить, что пациент находится в жизнеугрожающем состоянии, ведущем к летальному исходу от ОСН, СПОН или ОГМ, существует необходимость в разработке соответствующих методов. Одним из способов выявить предикторы такого состояния является применение методов машинного обучения к накопленным наборам данных. В данной статье решалась задача проверки с помощью методов анализа данных гипотезы о наличии зависимости между результатами измерения ЭКГ и последующим летальным исходом пациента в результате развития СПОН, ОСН или ОГМ. Был предложен метод комбинирования данных, сводящейся к тому, чтобы на основе характеристик ЭКГ для каждого пациента предложить алгоритм, на вход которого подаются пары интервалов RR и QT, а на выходе получается число, которое является характеристикой состояния пациента. На основе полученной характеристики производится классификация пациентов на группы: основную (пациенты с летальным исходом) и контрольную (выжившие пациенты). Полученная модель классификации закладывает потенциал для разработки методов идентификации клинического состояния пациента, что позволит автоматизировать получение сигнала о его ухудшении. Новизна результата заключается в подтверждении гипотезы о наличии зависимости между результатами измерения ЭКГ и последующим летальным исходом пациента в результате развития СПОН, ОСН или ОГМ, а также предложенном критерии и модели классификации, которые позволяют решать актуальную задачу автоматической фиксации ухудшения состояния пациентов.
Активное внедрение систем машинного обучения ставит актуальную задачу обеспечения их защиты от различных типов атак, направленных на нарушение свойств конфиденциальности, целостности и доступности как обрабатываемых данных, так и обучаемых моделей. Одним из перспективных направлений защиты является разработка конфиденциальных систем машинного обучения, использующих гомоморфные схемы шифрования для защиты моделей и данных. Однако такие схемы могут обрабатывать только полиномиальные функции, что в свою очередь ставит задачу построения полиномиальных аппроксимаций используемых в нейросетевых моделях нелинейных функций. Целью настоящей работы является построение наиболее точных аппроксимаций некоторых широко используемых функций активаций нейронных сетей, а именно ReLU, логистического сигмоида и гиперблолического тангенса, при ограничениях на степень аппроксимирующего полинома, а также оценка влияния точности такой аппроксимации на результат работы нейронной сети в целом. В отличие от опубликованных ранее работ рассматриваются и сравниваются различные способы построения аппроксимирующих полиномов, вводятся метрики точности приближения, приводится конкретный вид аппроксимирующих полиномов, а также соответствующие значения точности приближения. Проводится сравнение с аппроксимациями, приведенными в опубликованных ранее работах. В заключение для простейшей нейронной сети экспериментально оценено влияние точности приближения аппроксимирующего полинома на величину отклонения значений выходных нейронов такой сети от соответствующих значений выходных нейронов исходной сети. Результаты показывают, что для функции ReLU наилучшее приближение может быть получено с помощью численного метода, а для логистического сигмоида и гиперболического тангенса – с помощью полиномов Чебышева. При этом наилучшее приближение из трех рассмотренных функций получено для функции ReLU. Полученные результаты в дальнейшем могут быть использованы при построении аппроксимаций функций активации в конфиденциальных системах машинного обучения.
Фотоактивация растений посредством лазерной обработки является перспективным направлением развития современного аграрного производства. Обработка растений излучением с заданными характеристиками стимулирует развитие растений, формирование генеративных признаков и рост урожайности. Для автоматизации процесса фотоактивации больших посевных площадей предложен подход, основанный на использовании специализированной лазерной установки, монтируемой на беспилотный летательный аппарат (БпЛА). При помощи БпЛА можно производить лазерную обработку сельскохозяйственных полей большой площади при минимальных затратах временных и человеческих ресурсов. В работе предложен алгоритм расчета траектории для равномерного покрытия прямоугольного участка земли лазерным излучением с заданными характеристиками. Приводится методика расчета требуемой мощности лазерной установки в зависимости от высоты и времени полета БпЛА. Преимуществом разработанного подхода является его универсальность, поскольку данный подход учитывает характеристики лазерного устройства и может применяться с устройствами различного типа. В зависимости от параметров лазера алгоритм строит такую траекторию для БпЛА, чтобы облучение всходов растений было равномерным на протяжении всего процесса обработки. При проведении полевых экспериментов при движении БпЛА вдоль рассчитанной траектории со скоростью 0,3 м/c время обработки поля длиной в 200 м и шириной 1 м составило 9 мин. Результаты полевых экспериментов показывают, что лазерное облучение для большей части изучаемых культур увеличило урожайность и высоту травостоя (у злаковых – для четырех из шести культур, у бобовых – для четырех из пяти изучаемых культур). Предлагаемый алгоритм построения пути для равномерного лазерного облучения участка учитывает площадь проекции лазерного излучения для обеспечения требуемых характеристик обработки поля.
Цель исследования заключается в выборе оптимальных условий сбора некоординатной информации о космическом объекте орбитальным оптическим средством при прохождении обоими объектами окрестностей точек минимального расстояния между их орбитами. Для достижения указанной цели предложен количественный показатель, характеризующий меру возможности получения некоординатной информации о космическом объекте с требуемым уровнем качества. Аргументами функции, характеризующей вводимый показатель, являются: расстояние между объектами; относительная скорость объектов; фазовый угол освещенности космического объекта Солнцем по отношению к оптико-электронному средству; длительность интервала времени, в течение которого оба объекта находятся в окрестности точки минимума расстояния между их орбитами. Расчет величины показателя обеспечивается решением трех частных задач исследования. Первая задача – поиск окрестностей, включающих минимальные расстояния между орбитами космического объекта и орбитального оптического средства. Для ее решения используется быстрый алгоритм расчета минимального расстояния между орбитами, при этом осуществляется прогноз дрейфа найденных окрестностей на интервале времени до 60 часов. Вторая задача – оценка характеристик движения и условий оптической видимости космического объекта в окрестностях точек минимума расстояния между его орбитой и орбитой оптического средства. Решение данной задачи осуществляется средствами имитационного моделирования с использованием библиотеки прогноза движения космических объектов SGP4. Третья задача – обоснование и расчет показателя, характеризующего меру возможности получения некоординатной информации о космическом объекте. Для решения данной задачи разработана система правил нечеткого логического вывода, которая используется в качестве входных данных алгоритма Мамдани. Рассматриваемая методика реализована программно, в ходе вычислительного эксперимента проведена оценка возможности получения некоординатной информации по низкоорбитальным и геостационарным космическим объектам. Применение предложенного показателя обеспечивает повышение результативности процедуры сбора некоординатной информации о космических объектах за счет выбора наиболее информативных альтернатив контроля космических объектов из доступного множества возможных наблюдений на заданном интервале планирования сбора информации о космических объектах.
Рассмотрен класс движущихся объектов, представляющих собой тела вращения, претерпевшие по тем или иным причинам необратимые деформации корпуса.
Актуальность исследуемой задачи обусловлена как потребностью изучения динамики таких объектов, так и недостаточностью уже проведенных исследований, которые в основном сосредоточены на изучении эффектов аэроупругости или массовой асимметрии и не затрагивают динамику тел с необратимыми деформациями.
Сформулирована проблема устойчивости движения, в том числе в процессе взаимодействия продольного и бокового движений деформированного тела. Особое внимание уделено движению искривленного тела при наличии вращения по углу крена и выявлению критических угловых скоростей крена. Отмечено, что для случая пассивного движения возможны три причины такого взаимодействия: аэродинамическое, кинематическое, инерционное.
Разработан теоретический подход, учитывающий особенности геометрии деформированных тел, который позволил в рамках практических исследований определить допустимые уровни деформации и их связь с параметрами движения деформированных тел.
Анализ устойчивости проводился на основе критериев устойчивости решений системы, описывающей движение тела согласно критерию Рауса — Гурвица. Определены параметры тела, которые в той или иной степени влияют на устойчивость движения. Отмечен более сложный вид кривой границы устойчивости для данной угловой скорости по крену, чем простая гипербола.
Также показана возможность прямого решения нелинейного относительно определяющих параметров уравнения, что позволит получать зависимости критических угловых скоростей крена и диапазонов устойчивости от этих параметров.
Математическое моделирование на основе разработанных методик, проведенное для прямого и искривленного тел, показало, что искривление тела существенно влияет на смещение линий производных моментов тангажа по углу атаки и моментов рыскания по углу скольжения относительно границ устойчивости. Определен диапазон угловых скоростей по крену, в котором наблюдается потеря устойчивости для искривленного тела. Проанализировано влияние вариаций угловой скорости и относительного изменения производной коэффициента момента рыскания по углу скольжения на значение определяющего коэффициента из условий устойчивости для прямого и искривленного тел. Показано, как искривление тела приводит к сдвигу седловой точки. Изучено влияние изменения числа Маха на коэффициент характеристического уравнения, который определяет устойчивость движения системы по критерию Рауса — Гурвица.
Сохранение культурного и исторического наследия разных народов мира и их тщательное изложение - это долгосрочное обязательство ученых и исследователей, работающих во многих областях. На протяжении веков каждое поколение стремится вести учет своего труда, чтобы его могли пересмотреть и изучить следующие поколения. За последние пару лет были разработаны новые информационные и мультимедийные технологии, которые представили новые методы сохранения, обслуживания и распространения огромного количества собранного материала. Эта статья призвана представить виртуальный музей, передовую систему, управляющую разнообразными коллекциями цифровых объектов, которые по-разному организованы с помощью сложной специализированной функциональности. Управление цифровым содержанием требует хорошо продуманной архитектуры, которая включает в себя сервисы для представления, управления и администрирования содержания. Все элементы архитектуры системы взаимосвязаны, поэтому точность каждого элемента имеет большое значение. Эти системы страдают от недостатка инструментов для интеллектуального курирования данных с возможностью проверки данных из разных источников и повышения ценности данных. В этой статье предлагается решение для интеллектуального курирования данных, которое может быть реализовано в виртуальном музее, чтобы предоставить возможность надлежащим образом наблюдать ценные исторические образцы. Решение сфокусировано на процессах валидации и верификации, чтобы предотвратить дублирование записей цифровых объектов, чтобы гарантировать целость данных и более точный поиск знаний.
Объектами данного исследования являются существующие и перспективные информационные технологии, формирующие основу концепций «Индустрия 4.0» и кибер-физических систем (КФС), и соответствующие предприятия, на которых они внедряются. В статье в качестве примеров таких предприятий рассматриваются транспортно-логистические и промышленные предприятия. Цель проведенных исследований состоит в анализе влияния интеллектуальных информационных технологий (ИИТ), разрабатываемых в рамках проектов «Индустрия 4.0» и соответствующих кибер-физических систем, на изменения принципов и способов управления указанными предприятиями в настоящее время и в ближайшем будущем. В статье на конкретных практических примерах проводится иллюстрация происходящих изменений, вызванных внедрением ИИТ. Анализ литературы и практических примеров Индустрии 4.0 показал, что наряду с развитием информационных и инженерных технологий Индустрии 4.0 в экономической части управления транспортно-логистическими и промышленными предприятиями отсутствует четкое понимание и описание бизнес-моделей, в рамках которых эти технологии могут применяться. Проанализированные примеры из практики позволяют сделать вывод, что технологии Индустрии 4.0 и киберфизических систем используются контекстно в виде лишь ограниченного набора той или иной функциональности. Основная же идея Индустрии 4.0 и КФС — создание самоорганизующихся и самоадаптирующихся динамических сетевых структур поставок на протяжении всего жизненного цикла изделий для реализации максимально гибкого индивидуального производства с затратами массового поточного производства — на данный момент реализована лишь в ряде исследовательских проектов. В статье предложена оригинальная интерпретация сервис-ориентированного подхода к описанию и решению задач оценивания и выбора эффективных стратегий использования ИИТ на существующих и перспективных предприятиях. Данная интерпретация базируется на разрабатываемой авторами статьи теории управления структурной динамикой сложных объектов.
В работе продолжается рассмотрение основных результатов, моделей и методов, разработанных в области ассоциативной классификации, ориентированных на обработку данных большого объема. Дается анализ подходов, методов и алгоритмов, разработанных в области ассоциативной классификации к настоящему времени. В заключении формулируются достоинства и недостатки ассоциативной классификации как модели машинного обучения, а также дается оценка перспектив ее использования в интеллектуальном анализе больших данных.
В работе описаны основные результаты, модели и методы, разработанные в области ассоциативной классификации, ориентированные на обработку данных большого объема. В работе дается постановка задачи ассоциативной классификации, вводится необходимая терминология и формальные обозначения, используемые в ассоциативной классификации. Приводится описание и сравнительный анализ ранних подходов, методов и конкретных алгоритмов ассоциативной классификации. Дается оценка вклада первых работ, посвящённых ассоциативной классификации, в развитие этого направления.
При автоматической обработке спонтанной речи возникает ряд трудностей, таких как вариативность речи или присутствие речевых сбоев различной природы. В статье рассматриваются различные виды речевых сбоев и причины их возникновения, а также представлен алгоритм их автоматического определения, основанный на анализе акустических параметров. Для выделения звонких хезитационных явлений использовался кросскорреляционный метод, а для выделения глухих хезитационных явлений – метод полосовой спектральной фильтрации. Эксперименты проводились на специально собранном корпусе спонтанной русской речи, состоящем из диалогов по описанию маршрута по карте и нахождению общего свободного времени по расписанию. Проведенные эксперименты показали, что звонкие хезитационные явления выделяются с точностью 80%, глухие хезитационные явления и дыхание - с точностью 66%.
Основной задачей данного исследования явилось изучение особенностей функционирования психологической защиты и копинг-стратегии у ВИЧ-инфицированных. Особое внимание было уделено анализу рискованного поведения ВИЧ-инфицированных, в частности, рассмотрены наиболее вероятные формы опасного для общества поведения, которое способен демонстрировать ВИЧ-инфицированный. Подробно рассмотрены аспекты автоматизации сбора, хранения и обработки данных. В статье также описан комплекс программного обеспечения, ориентированный на автоматизацию процесса переноса данных с бумажного носителя, первичной обработке данных и их частичной верификации с использованием MS Access.
В качестве регулятивных компонентов разрабатываемой разновидности методологии системного анализа рассматриваются: системная парадигма и принципы системного анализа, уточненные на основе определения организационно-технической системы. Развивая аналогичные общеметодологические средства системного анализа, предложенные регулятивы способствуют снижению степени неопределенности и повышению степени конструктивности анализа и синтеза систем, согласованности получаемых в ходе его проведения результатов. Применение данных регулятивов в структурно-целевом анализе рыбохозяйственных комплексов показало их практическую значимость.
Логико-лингвистическое моделирование целеполагания в промышленных организационных системах предполагает лингвистическую формализацию цели. Для лингвистической формализации цели предложены настраиваемая на предметную область и решаемую проблему специфическая деятельностная модель цели и разработанный на ее основе адаптивный язык представления целей.
Перспектива развития групповой технологии экспертизы управленческих организационно-технических решений, разработанной в лаборатории интегрированных систем автоматизации СПИИРАН, связана с использованием коммуникационных возможностей Internet в процессе кооперативной работы пользователей. В статье рассматриваются вопросы места и роли групповой технологии экспертизы в общей структуре принятия управленческих решений в условиях неопределенности, значение языка XML как открытого стандарта для обмена информацией между пользователями Internet, других стандартов и подходов к организации коммуникации компонент в распределенных гетерогенных информационных средах
При решении сложных проблем широко используется системный анализ (СА). На начальных этапах СА на основе экспертных методов осуществляют анализ проблем/целей и получают структуры проблем/целей (СП/СЦ), качество которых обычно невысоко из-за наличия в них различного рода ошибок. Но именно от качества СП/СЦ зависит, та ли целереализующая система (ЦРС) и для достижения тех ли целей будет сформирована при решении проблемы. Научные основы системного анализа нельзя поэтому считать окончательно сложившимися. Методология, основывающаяся на логико-лингвистическом моделировании структурно-целевого анализа проблемных ситуаций — шаг в направлении формализации начальных этапов СА, повышения качества его результатов и надежности принимаемых в организационных системах решений в целом.
Предложен простой быстродействующий алгоритм полногеномного поиска ассоциаций для оценки основного и эпистатического эффекта влияния маркеров или единичных нуклеотидных полиморфизмов (SNP). Основная идея, лежащая в основе алгоритма, заключается в сравнении генотипов пар объектов популяции и сравнении соответствующих значений фенотипа. В алгоритме используется интуитивное предположение, что изменения аллелей, соответствующих важным SNP у пары объектов, приводят к большому различию значений фенотипа этих индивидуумов. Алгоритм основан на рассмотрении пар индивидуумов вместо SNP или пар SNP. Основным преимуществом алгоритма является то, что он слабо зависит от количества SNP в матрице генотипов. В основном он зависит от количества объектов, которое, как правило, очень мало по сравнению с количеством SNP. Другое важное преимущество алгоритма заключается в том, что он позволяет без дополнительных вычислений обнаруживать эпистатический эффект, рассматриваемый как взаимодействие генов. Алгоритм также может использоваться в случае, когда фенотип принимает только два значения (схема случай–контроль). Кроме того, алгоритм может быть достаточно просто расширен с анализа двоичной матрицы генотипов на случай количественного анализа экспрессии генов. Численные эксперименты с реальными наборами данных, состоящими из популяций удвоенных гаплоидных линий ячменя, иллюстрируют преимущество предлагаемого алгоритма по сравнению со стандартными алгоритмами полногеномного поиска ассоциаций с вычислительной точки зрения, особенно для обнаружения эпистатического эффекта. Пути для повышения эффективности предлагаемого алгоритма также обсуждаются в статье.
1 - 17 из 17 результатов