Предметной моделью является: 1) макет самолета 2)карта 3)чертеж 4)диаграмма…

Содержание

Тест по информатике для 9 класса на тему «Модели»

Тест на тему «Модели»

  1. Модель есть замещение изучаемого объекта другим объектом, который отражает:

А – все стороны данного объекта;

Б – некоторые стороны данного объекта;

В – существенные стороны данного объекта;

Г – несущественные стороны данного объекта.

  1. Информационной моделью организации занятий в школе является:

А – правила поведения учащихся;

Б – список класса;

В – расписание уроков;

Г – перечень учебников.

  1. Предметной моделью является:

А – макет самолёта;

Б – карта;

В – чертёж;

Г – диаграмма.

  1. Генеалогическое древо семьи является:

А – табличной информационной моделью;

Б – иерархической информационной моделью;

В – сетевой информационной моделью;

Г – предметной информационной моделью.

  1. Информационной (знаковой) моделью является:

А – анатомический муляж;

Б – макет здания;

В – модель корабля;

Г – диаграмма.

  1. Сочинение – рассуждение учащегося – это:

А – описательная модель;

Б – математическая модель;

В – графическая модель;

Г – предметная модель.

  1. Выберите пару «объект – модель»:

А — город – республика;

Б – отец – сын;

В – болт – чертёж болта;

Г – кукла – кукольный домик.

  1. В информационной модели компьютера в виде схемы отражается его:

А — цвет;

Б – форма;

В — структура;

Г — размер.

  1. Какую модель удобнее использовать при описании траектории движения объекта?

А — табличную;

Б – текстовую;

В – графическую;

Г — математическую.

  1. Какая модель является сетевой?

А — модель сети Интернет;

Б – генеалогическое древо семьи;

В – файловая система компьютера;

Г — модель Солнечной системы.

Ключ к тесту

1

2

3

4

5

6

7

8

9

10

В

В

А

Б

Г

А

В

В

В

А

Тесты, часть 4.

Моделирование

Категория: Информатика.

Тесты, часть 4. Моделирование

1. Информационная модель – это:

A) Модель, описывающая и изучающая свойства и состояние объекта, процесса или явления, а также их связи и отношения с окружающим миром

B) Материальные копии объектов моделирования.

C) Созданный за счет ресурсов компьютера виртуальный образ, качественно и количественно отражающий внутренние свойства и связи моделируемого объекта, иногда передающий и его внешние характеристики.

D) Способ представления информационной модели, отображающей связь различных параметров объекта через математические формулы и понятия.

E) Модель, выражающая свойства оригинала с помощью образов.

2. В биологии классификация представителей животного мира представляет собой:

A) Табличную модель

B) Иерархическую модель

C) Математическую модель

D) Графическую модель

E) Натурную модель

3. Предметной моделью является

A) Схема

B) Диаграмма

C) Макет самолета

D) Карта

E) Чертеж

4. Модель – это …

A) представление, процесса реального или вымышленного мара, которое отражает его существенные стороны;

B) набор величин, содержащий всю необходимую информацию об исследуемом объекте;

C) уменьшенная копия создаваемого объекта;

D) набор уравнений и функций, выражающих существенные черты объекта;

E) искусственно созданный объект, дающий упрощенное представление о реальном объекте, процессе или явлении*;

5. Математическая модель – это. . .

A) способ представления информационной модели, отображающей связь различных параметров объекта через математические формулы и понятия;*

B) созданный за счет ресурсов компьютера виртуальный образ, качественно и количественно отражающий внутренние свойства и связи моделируемого объекта, иногда передающий и его внешние характеристики;

C) модель, описывающая и изучающая свойства и состояние объекта, процесса или явления, а также их связи и отношения с окружающим миром;

D) материальные копии объектов моделирования;

E) модель, выражающая свойства оригинала с помощью образов.

6. Модель отражает:

A) все существующие признаки объекта;

B) некоторые из всех существующих;

C) существенные признаки в соответствии с целью моделирования;*

D) некоторые существенные признаки объекта;

E) все существенные признаки.

7. Рисунки, карты, чертежи, диаграммы, схемы, графики представляют собой:

A) табличные информационные модели.

B) математические модели;

C) натурные модели;

D) графические информационные модели;*

E) иерархические информационные модели.

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

А

В

С

Е

А

С

D

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

Н. В. Литвинова, МОУ СОШ №3, Красный Кут, Саратовская область

Метки: Информатика

О МОДЕЛИ ПРЕДМЕТНОЙ ОБЛАСТИ ДЛЯ ЛИНГВИСТИЧЕСКОГО ТРАНСЛЯТОРА

О МОДЕЛИ ПРЕДМЕТНОЙ ОБЛАСТИ ДЛЯ ЛИНГВИСТИЧЕСКОГО ТРАНСЛЯТОРА

 

 

Г. К. Хахалин

Московский Автомобильно-Дорожный Институт

(Государственный Технический Университет)

[email protected]

 

 

Ключевые слова: модель проблемной области, интегральная интеллектуальная система, лингвистический транслятор, онтология, гиперграфовое представление знаний, концептуальная модель, описание объекта треугольник.

 

Рассматриваются вопросы построения модели предметной области для интегральной интеллектуальной системы (ИС). Языком представления знания является язык гиперграфов. Этот тип модели может быть общим для любого компонента интегральной ИС. Метод создания концептуальных моделей в системе понимания ЕЯ-текста, использование языка гиперграфов для представления знания, попытка структурной унификации объектов модели и т. п. направлены на построение онтологии.

 

 

  1. Введение

 

Каждая система искусственного интеллекта имеет модель предметной области или проблемной среды. Это относится и к системам понимания естественного языка (ЕЯ). Часто же системы понимания ЕЯ для одной и той же предметной области, разработанные разными коллективами, имеют разные модели, даже если эти модели написаны на одном и том же языке представления знаний. Различия в моделях предметных областей (МПО) проявляются в терминах, понятиях, фрагментации, структурах представления знаний и т.д. Это вызывает существенные трудности при использовании результатов разработок одних лингвистических систем в других.

Еще с большими трудностями можно столкнуться, если комплексировать систему понимания ЕЯ (или лингвистический транслятор) в интегральную интеллектуальную систему (ИС). Задача комплексирования требует, чтобы модели проблемных сред, которые выступают в качестве интерфейса между компонентами, были доступны и однотипны для всех составляющих интегральной ИС.

 

 

  1. Комплексирование системы понимания ЕЯ-текста с другими ИС

 

В настоящее время все четче проглядывается тенденция объединения систем обработки ЕЯ-текста с другими ИС. Степень комплексирования определяется как степенью проработки каждой из ИС, так и возможностью их простого и эффективного взаимодействия. Например, в системах типа «ТЕКСТ « РИСУНОК» требуется обработка изображений и обработка ЕЯ-текста. Взаимосвязь между этими подсистемами может эффективно осуществляться только в том случае, если она реализуется через единое представление зрительных образов и ситуаций описываемых ЕЯ-текстом. В системах анализа/синтеза звучащей речи привлечение уровня ЕЯ-текста позволяет проверять гипотезы звуковых образов более целенаправленно и эффективно. В системах доступа к базам данных на ЕЯ  более универсальным способом взаимодействия ЕЯ-системы и СУБД является концептуальная система управления, в которой представлен, с одной стороны, концептуальный уровень проблемной среды, а с другой стороны, концептуальная структура баз данных (БД) и распределение информации между БД. К другим комплексным системам можно отнести системы решения задач по ЕЯ-формулировкам, экспертные системы с ЕЯ-входом, OCR-системы с лингвистической надстройкой и др. Даже в системах машинного перевода (которые почти полностью относятся только к обработке ЕЯ-текстов) существенный скачок по качеству перевода может быть достигнут только с привлечением концептуальной модели мира, которая служит «инвариантом» того, что описывается текстами на входном и выходном языках. Например, в случае перевода текстов по компьютерам в модели необходимо заложить описания компонентов компьютера и их взаимосвязей.

Комплексирование системы понимания ЕЯ-текста с другими ИС может осуществляться различными способами. Одним из таких методов комплексирования является передача информации от системы понимания ЕЯ-текста в другую ИС и в обратном направлении через единую концептуальную модель, в которой элементы и фрагменты модели описываются в виде единых понятий, отношений, структур, ситуаций и т.п. Например, если рассматривать систему типа «ТЕКСТ® РИСУНОК», то в качестве результата работы системы понимания ЕЯ-текста выступает описание графической ситуации в виде фрагмента концептуальной модели. На основе этого фрагмента графическая система строит конкретное изображение объектов на экране дисплея. В ИС типа «РИСУНОК ® ТЕКСТ» система распознавания по сканируемому изображению выдает описание сцены в виде фрагмента концептуальной модели. По этому описанию система синтеза ЕЯ-текста выдает описание графической сцены в виде абзаца связанных ЕЯ-предложений при использовании доступных языковых средств (простые и сложные предложения, использование эллипсисов и анафор и т.д.). Здесь важно, чтобы концептуальные фрагменты были «понятны» как для системы обработки ЕЯ-текстов, так и для системы анализа/синтеза изображений. А эта «понятность» может быть только тогда, когда концептуальная модель построена не только по общим принципам, но и унифицирована по номенклатуре понятий, отношений, структур и т.д. или может быть легко трансформирована для нужд составляющих комплекса.

При интегрировании системы обработки ЕЯ-текстов с другими ИС можно сформулировать следующие требования для их «связки» в следующем виде:

  • концептуальная модель того, что описывает ЕЯ-текст, должна совпадать с концептуальной моделью другой ИС;
  • должна существовать единая номенклатура понятий и отношений, структур и ситуаций;
  • интерфейсная модель должна описываться на одном и том же языке представления знаний.

Выполнение подобных требований позволило бы унифицировать построение МПО, использовать модель, разработанную для одной ИС, другой системой и, наконец, создавать библиотеки моделей, из которых можно было бы конструировать то, что нужно конкретной ИС.

 

 

  1. Пример фрагмента модели предметной области

 

Морфологическая и синтаксическая модели системы понимания ЕЯ определяются разработчиками ЛТ. А согласованная модель проблемной области – уже парой групп разработчиков: разработчиками ЛТ и разработчиками другой интеллектуальной системы.

Для примера модели предметной области используем гиперграфовое представление, которое можно считать объединением семантических сетей и фреймов [1]. Рассмотрим небольшой фрагмент модели предметной области для геометрических фигур.

На рис. 1 представлен фрагмент концептуальной модели описания прямоугольного треугольника, его свойств и взаимосвязей с другими объектами среды «геометрические фигуры» в гиперграфовом представлении. Такое представление может быть единым как для ЛТ, так и для системы анализа изображений геометрических фигур или для системы решения геометрических задач (например, при обучении школьников). Эта модель также достаточна для анализа и синтеза текстов на естественном языке, относящихся к данной области.

 

Рис. 1. Гиперграф фрагмента геометрической модели

 

На рисунке приняты следующие обозначения: отношения типа AKO обозначены как “вид”, отношения “вх_в_стр” как “входит в структуру”, “им_площ” – “имеет площадь”,  “им_перим” – “имеет периметр”, “соприк_к.т.” – “соприкасается в концевой точке”, “им_длину” – “имеет длину”, “по_формуле” – “вычисляется по формуле”,  понятие “прям_тре-к” обозначает “прямоугольный треугольник”, “равнобедр_тре-к” – “равнобедренный треугольник”, “равност_тре-к” – “равносторонний треугольник”, а F1, F2, F3 и F4 суть присоединенные процедуры, которые по соответствующим формулам вычисляют характеристики определенных фигур. Все остальные обозначения очевидны.

Если рассматривать задачу анализа текстов, то примерами этих текстов могут служить следующие группы предложений:

Найти площадь прямоугольного треугольника, высота которого равна 5 см, а катет – 10. | Дан прямоугольный треугольник с гипотенузой 15 см и катетом 7 см. Рассчитать его периметр. | Нарисовать прямоугольный треугольник АВС, сторона ав которого равна 16 см, а перпендикулярная ей сторона вс 33 см.

Список подобных текстов можно легко продолжить.

Заметим, что концептуальная модель содержит только обобщенную информацию об этих геометрических фигурах; конкретизация объектов осуществляется в процессе трансляции конкретных ЕЯ-предложений. Конкретизация может касаться имени треугольника, имен сторон, конкретных значений длин сторон и т.д.

В данном фрагменте заложена вся информация, которая необходима для представления знаний о подобных объектах: иерархия понятий, структуры объектов, взаимосвязи элементов в структуре, функциональные зависимости и т. д. Рисунок можно легко дополнить введением понятий других видов треугольников и структурами дополнительных объектов.

Такая модель достаточна для семантического анализа различных типов ЕЯ-предложений. Это, в частности, относится и к неполным предложениям. Наличие семантической эллиптичности транслируемого ЕЯ-текста определяется по невозможности отождествления «высказывания» в этой модели. Например, для ЕЯ-текста «Найти площадь.» трансляция на язык модели даст понятие «площадь ?», которое может быть идентифицировано и с понятием «прям_тре-к», просто «треугольник», «равнобедр_тре-к» и т.д. Такая неопределенность идентификации и говорит о семантической неполноте текста. Для текста же типа «Задан прямоугольный треугольник с высотой 5 см и катетом 10 см. Найти площадь.» неполноты для последнего предложения не существует, т.к. первое предложение задает понятие со структурой «прям_тре-к», а второе (рассмотренное в контексте первого) позволяет связать понятие «площадь ?» с понятием «прям_тре-к».

 

 

  1. Заключение

 

Как можно заметить, построение такого рода концептуальных моделей как для ЛТ, так и для других ИС связано с областью знаний, именуемой термином онтология. В энциклопедическом словаре онтология (от греч. on, род п. ontos – сущее и …логия) определяется как учение о бытии, в котором исследуются общие основы, принципы бытия, его структура и закономерности. Словарь Американского наследия (The American Heritage Dictionary) определяет онтологию как «ветвь метафизики, которая рассматривает природу бытия». Этот термин, недавно принятый сообществом ИИ, относится к множеству понятий или терминов, которые могут быть использованы для описания некоторой области знаний или для построения представления о них. Онтология может быть очень высокого уровня, состоящая из понятий, которые организуют верхние части базы знаний, или она может быть конкретно проблемной, например, онтология персонального компьютера. И хотя на сегодняшний день существует несколько различных определений онтологии применительно к искусственному интеллекту, тем не менее, можно согласиться, что онтология есть базовая структура или костяк, вокруг которой может быть построена база знаний ИС [2-5].

Цель создания онтологий – иметь библиотеки базовых структур моделей мира, из которых впоследствии можно «собирать» базы знаний для конкретной системы. Подход к построению концептуальных моделей в системах понимания ЕЯ-текстов, использование гиперграфового языка представления знаний, попытка унификации структур объектов и т.п. как раз и направлены на создание онтологий.

 

 

 

Литература

 

  1. Хахалин Г.К. Использование гиперграфов в лингвистической трансляции // Труды Международного семинара «Диалог’99» по компьютерной лингвистике и ее приложениям. М., 1999. Т. 2. С. 315-320.
  2. Нариньяни А.С. Кентавр по имени ТЕОН: тезаурус+онтология // Труды Международного семинара Диалог’2001 по компьютерной лингвистике и ее приложениям. Аксаково, 2001. Т. 1. С. 184-188.
  3. Шаров С.А. О различии между онтологией языка и онтологией предметной области // Труды VI национальной конференции по Искусственному Интеллекту РАН — КИИ-98. Пущино, 1998. Т. 1. С. 41-48.
  4. Chandrasekaran B. and Josephson J. R. What Are Ontologies, and Why Do We Need Them? // IEEE Intelligent System and their Applications. 1999. Vol. 14, No 1 (Jun/Feb). P. 20-26.
  5. Swartout W. Ontologies // IEEE Intelligent System and their Applications. 1999. Vol. 14, No 1 (Jun/Feb). P. 18-19.

 

 

 

On the domain model for linguistic translator

Gennady Konstantinovich Khakhalin

 

 

Keywords: domain model, integral intelligence system, linguistic translator, ontology, hypergraph knowledge representation, conceptual model, NL-text understanding system

 

 

There are considered questions of building of domain model for integral intelligence system (IIS). The knowledge representation language is hypergraph language. This model type is general for any component of the IIS. Approach to the building of conceptual models in the NL-text understanding system, usage of the hypergraph language for the knowledge representation, attempt of the object structure unification etc. are directed on making of the ontology.

 

Понятие модели

Понятие модели

Понятие модели. Информационная модель. Виды информационных моделей.

Человечество в своей деятельности (научной, образовательной, технологической, художественной) постоянно создает и использует модели окружающего мира.

Модели позволяют представить в наглядной форме объекты и процессы, недоступные для непосредственного восприятия (очень большие или очень маленькие объекты, очень быстрые или очень медленные процессы и др.).

Наглядные модели часто используются в процессе обучения. В курсе географии первые представления о нашей планете Земля мы получаем, изучая ее модель — глобус, в курсе физики изучаем работу двигателя внутреннего сгорания по его модели, в химии при изучении строения вещества используем модели молекул и кристаллических решеток, в биологии изучаем строение человека по анатомическим муляжам и др.

Модели играют чрезвычайно важную роль в проектировании и создании различных технических устройств, машин и механизмов, зданий, электрических цепей и т. д. Без предварительного создания чертежа невозможно изготовить даже простую деталь, не говоря уже о сложном механизме.

Развитие науки невозможно без создания теоретических моделей (теорий, законов, гипотез и пр.), отражающих строение, свойства и поведение реальных объектов.

Все художественное творчество фактически является процессом создания моделей. Более того, практически любое литературное произведение может рассматриваться как модель реальной человеческой жизни. Моделями в художественной форме отражающими реальную действительность, являются также живописные полотна, скульптуры, театральные постановки и пр.

Моделирование — это метод познания, состоящий в создании и исследовании моделей.

Модель — это некий новый объект, который отражает существенные особенности изучаемого объекта, явления или процесса. Один и тот же объект может иметь множество моделей, а разные объекты могут описываться одной моделью. Так, в механике различные материальные тела (от планеты до песчинки) могут рассматриваться как материальные точки, т.е. объекты разные – модель одна.

Предметные и информационные модели

Все модели можно разбить на два больших класса: модели предметные (материальные) и модели информационные.

Предметные модели воспроизводят геометрические, физические и другие свойства объектов в материальной форме (глобус, анатомические муляжи, модели кристаллических решеток, макеты зданий и сооружений и др.).

Информационные модели представляют объекты и процессы в образной или знаковой форме.

Образные модели (рисунки, фотографии и др.) представляют собой зрительные образы объектов, зафиксированные на каком-либо носителе информации (бумаге, фото- и кинопленке и др. ). Широко используются образные информационные модели в образовании (учебные плакаты по различным предметам) и науках, где требуется классификация объектов по их внешним признакам (в ботанике, биологии, палеонтологии и др.).

Знаковые информационные модели
строятся с использованием различных языков (знаковых систем). Знаковая информационная модель может быть представлена в форме текста (например, программы на языке программирования), формулы (например, второго закона Ньютона F = ma), таблицы (например, периодической таблицы элементов Д. И. Менделеева) и так далее.

Иногда при построении знаковых информационных моделей используются одновременно несколько различных языков. Примерами таких моделей могут служить географические карты, графики, диаграммы и пр. Во всех этих моделях используются одновременно как язык графических элементов, так и символьный язык.

Формализация.

На протяжении своей истории человечество использовало различные способы и инструменты для создания информационных моделей. Так, первые информационные модели создавались в форме наскальных рисунков, в настоящее же время информационные модели обычно строятся и исследуются с использованием современных компьютерных технологий.

Процесс построения информационных моделей с помощью формальных языков называется формализацией.

Естественные языки используются для создания описательных информационных моделей. В истории науки известны многочисленные описательные информационные модели. Например, гелиоцентрическая модель мира, которую предложил Коперник, формулировалась следующим образом:

Земля вращается вокруг своей оси и вокруг Солнца;

орбиты всех планет проходят вокруг Солнца.

С помощью формальных языков строятся формальные информационные модели (математические, логические и др.). Одним из наиболее широко используемых формальных языков является математика. Модели, построенные с использованием математических понятий и формул, называются математическими моделями. Язык математики является совокупностью формальных языков.

Визуализация

В процессе исследования формальных моделей часто производится их визуализация. Для визуализации алгоритмов используются блок-схемы: пространственных соотношений между объектами — чертежи, моделей электрических цепей — электрические схемы, логических моделей устройств — логические схемы и так далее.

Так при визуализации формальных физических моделей с помощью анимации может отображаться динамика процесса, производиться построение графиков изменения физических величин и так далее. Визуальные модели обычно являются интерактивными, то есть исследователь может менять начальные условия и параметры протекания процессов и наблюдать изменения в поведении модели.

Основные этапы разработки и исследования моделей на компьютере

Использование компьютера для исследования информационных моделей различных объектов и систем позволяет изучить их изменения в зависимости от значения тех или иных параметров. Компьютерное моделирование является одним из эффективных методов изучения сложных систем. Часто компьютерные модели проще и удобнее исследовать, они позволяют проводить вычислительные эксперименты, реальная постановка которых затруднена или может дать непредсказуемый результат.

Процесс разработки моделей и их исследования на компьютере можно разделить на несколько основных этапов:

Построение описательной информационной модели (выделение существенных параметров).

Создание формализованной модели (запись формул).

Построение компьютерной модели.

Компьютерный эксперимент.

Анализ полученных результатов и корректировка исследуемой модели.

На первом этапе исследования объекта или процесса обычно строится описательная информационная модель. Такая модель выделяет существенные с точки зрения целей проводимого исследования параметры объекта, а несущественными параметрами пренебрегает.

На втором этапе создается формализованная модель, то есть описательная информационная модель записывается с помощью какого-либо формального языка. В такой модели с помощью формул, уравнений, неравенств и пр. фиксируются формальные соотношения между начальными и конечными значениями свойств объектов, а также накладываются ограничения на допустимые значения этих свойств.

Однако далеко не всегда удается найти формулы явно выражающие искомые величины через исходные данные. В таких случаях используются приближенные математические методы, позволяющие получать результаты с заданной точностью.

На третьем этапе необходимо формализованную информационную модель преобразовать в компьютерную на понятном для компьютера языке. Существуют два принципиально различных пути построения компьютерной модели:

1) создание алгоритма решения задачи и его кодирование на одном из языков программирования;

2) формирование компьютерной модели с использованием одного из приложений (электронных таблиц, СУБД и т. д.).

В процессе создания компьютерной модели полезно разработать удобный графический интерфейс, который позволит визуализировать формальную модель, а также реализовать интерактивный диалог человека с компьютером на этапе исследования модели.

Четвертый этап исследования информационной модели состоит в проведении компьютерного эксперимента. Если компьютерная модель существует в виде программы на одном из языков программирования, ее нужно запустить на выполнение и получить результаты.

Если компьютерная модель исследуется в приложении, например в электронных таблицах, можно провести сортировку или поиск данных, построить диаграмму или график и так далее.

Пятый этап состоит в анализе полученных результатов и корректировке исследуемой модели. В случае различия результатов, полученных при исследовании информационной модели, с измеряемыми параметрами реальных объектов можно сделать вывод, что на предыдущих этапах построения модели были допущены ошибки или неточности. Например, при построении описательной качественной модели могут быть неправильно отобраны существенные свойства объектов, в процессе формализации могут быть допущены ошибки в формулах и так далее. В этих случаях необходимо провести корректировку модели, причем уточнение модели может проводиться многократно, пока анализ результатов не покажет их соответствие изучаемому объекту.




Проектирование модели предметной области микрослужбы

  • Статья
  • Чтение занимает 8 мин
  • Участники: 6

Были ли сведения на этой странице полезными?

Да Нет

Хотите оставить дополнительный отзыв?

Отзывы будут отправляться в корпорацию Майкрософт. Нажав кнопку «Отправить», вы разрешаете использовать свой отзыв для улучшения продуктов и служб Майкрософт. Политика конфиденциальности.

Отправить

В этой статье

Определите одну расширенную модель предметной области для каждой бизнес-микрослужбы или ограниченного контекста.

Ваша цель состоит в создании одной целостной модели предметной области для каждой бизнес-микрослужбы или ограниченного контекста (BC). Однако следует помнить, что BC или бизнес-микрослужба иногда может состоять из нескольких физических служб, совместно использующих одну модель предметной области. Модель предметной области должна определять правила, поведение, бизнес-язык и ограничения для одного ограниченного контекста или бизнес-микрослужбы, которая его представляет.

Шаблон сущности предметной области

Сущности представляют объекты предметной области и в первую очередь определяются их идентификаторами, непрерывностью и сохраняемостью с течением временем, а не только атрибутами, которые их составляют. Как правило, в Эванс написано, что объект, который в основном определяется его удостоверением, называется сущностью. Сущности очень важны в модели предметной области, так как они являются основой для модели. Следовательно, вы должны идентифицировать и разрабатывать их очень внимательно.

Идентификатор сущности может пересекать несколько микрослужб или ограниченных контекстов.

Один и тот же идентификатор (то есть то же значение Id, хотя и необязательно та же сущность предметной области) может быть смоделирован в нескольких ограниченных контекстах или микрослужбах. Однако это не означает, что в нескольких ограниченных контекстах будет реализована одна и та же сущность с теми же атрибутами и логикой. Вместо этого атрибуты и поведение сущностей в каждом ограниченном контексте находятся в рамках требований предметной области каждого конкретного ограниченного контекста.

Например, сущность «покупатель» может иметь большинство атрибутов человека, определенных в сущности «пользователь» в микрослужбе профиля или идентификации, включая идентификатор пользователя. Но сущность «покупатель» в микрослужбе заказов может иметь меньше атрибутов, так как только некоторые данные покупателя связаны с обработкой заказа. Контекст каждой микрослужбы или ограниченного контекста влияет на его модель предметной области.

Помимо реализации атрибутов данных, сущности предметной области должны реализовывать поведение.

Сущность предметной области в DDD должна реализовывать логику предметной области или поведение, связанное с данными этой сущности (объекта, доступного в памяти). Например, в рамках класса сущности заказа должна быть задана бизнес-логика и операции, реализованные как методы для таких задач, как добавление позиции заказа, проверка данных и итоговый расчет. Методы сущности обеспечивают инварианты и правила сущности вместо определения этих правил как распределенных на уровне приложения.

На рис. 7-8 показана сущность предметной области, реализующая не только атрибуты данных, но также и операции или методы с логикой, связанной с предметной областью.

Рис. 7-8. Пример структуры сущности предметной области, реализующей данные и поведение

Сущность модели предметной области реализует поведение через методы, то есть это не «слабая» модель. Конечно, иногда у вас могут быть сущности, не реализующие никакую логику в рамках класса сущностей. Это может произойти в дочерних сущностях в агрегате, если дочерняя сущность не имеет никакой специальной логики, так как большая часть логики определяется в корне агрегата. При наличии сложной микрослужбы с логикой, реализуемой в классах службы вместо сущностей предметной области, вы рискуете попасть в слабую модель предметной области, что объясняется в следующем разделе.

Сравнение расширенной и слабой моделей предметной области

В своей записи в блоге AnemicDomainModel Мартин Фаулер (Martin Fowler) описывает слабую модель предметной области следующим образом.

Основным признаком слабой модели предметной области является то, что на первый взгляд она выглядит как что-то реальное. Там есть объекты, многие из которых названы по именам в пространстве предметной области, и эти объекты связаны широкими отношениями и структурой, которую имеют настоящие модели предметной области. Замкнутый круг возникает, когда вы посмотрите на поведение и поймете, что это вряд ли поведение в этих объектах, делающее их чем-то большим, чем контейнеры методов получения и задания.

Конечно, при использовании слабой модели предметной области эти модели данных будут использоваться из набора объектов службы (обычно называемого слоем предметной области), который фиксирует всю бизнес-логику или логику предметной области. Слой предметной области находится вверху модели данных и использует модель данных так же, как данные.

Слабая модель предметной области — это просто структура процедурного стиля. Слабые объекты сущности не являются реальными объектами из-за отсутствия поведения (методов). Они лишь содержат свойства данных, и, таким образом, это не объектно-ориентированный проект. Помещая все поведение в объекты служб (слой предметной области), вы, в сущности, получаете плохо структурированный код или сценарии транзакции, таким образом теряя преимущества, которые предоставляет модель предметной области.

Как бы там ни было, если вы имеете очень простой ограниченный контекст или микрослужбу (службу CRUD), слабая модель предметной области в форме объектов сущности только со свойствами данных может быть достаточно хороша, и, возможно, не имеет смысла реализовывать более сложные шаблоны DDD. В таком случае это будет просто модель сохраняемости, так как вы намеренно создали сущность только с данными для целей CRUD.

Именно поэтому архитектуры микрослужб прекрасно сочетаются с мультиархитектурным подходом, учитывающим каждый ограниченный контекст. Например, в приложении eShopOnContainers микрослужба заказов реализует шаблоны DDD, а микрослужба каталога, представляющая собой простую службу CRUD, — нет.

Некоторые говорят, что слабая модель предметной области является антишаблоном. В действительности это зависит от того, что вы реализуете. Если вы создаете довольно простую микрослужбу (например, службу CRUD), то слабая модель предметной области не является антишаблоном. Однако если вам предстоит иметь дело со сложной предметной областью микрослужбы, имеющей множество постоянно меняющихся бизнес-правил, слабая модель предметной области может быть антишаблоном для этой микрослужбы или ограниченного контекста. В этом случае разрабатывается как многофункциональная модель с сущностями, содержащими данные и поведение, а также с реализацией дополнительных шаблонов DDD (статистические выражения, объекты значений и т. д.). может иметь огромные преимущества для долгосрочного успеха такой микрослужбы.

Дополнительные ресурсы

Шаблон объекта значения

Как заметил Эрик Эванс (Eric Evans), «многие объекты не имеют концептуальной идентификации, эти объекты описывают определенные характеристики предмета».

Сущности требуется идентификатор, но в системе имеется множество объектов, у которых он отсутствует, например шаблон объекта значения. Объект значения — это объект без концептуального идентификатора, который описывает аспект предметной области. Это объекты, создаваемые для представления элементов структуры, которые вы считаете временными. Вас интересует, что они собой представляют, а не чем они являются. В качестве примеров можно привести числа и строки, но это также могут быть высокоуровневые понятия, такие как группы атрибутов.

То, что является сущностью в микрослужбе, может не быть сущностью в другой микрослужбе, поскольку во втором случае ограниченный контекст может иметь другой смысл. Например, адрес в приложении электронной коммерции может вообще не иметь идентификатора, так как он может лишь представлять группу атрибутов профиля клиента — человека или организации. В этом случае адрес должен классифицироваться как объект значения. Однако в приложении для компании, обслуживающей электроэнергетическую систему общего пользования, адрес клиента может быть важен для предметной области бизнеса. Следовательно, адрес должен иметь идентификатор, чтобы систему выставления счетов можно было привязать непосредственно к адресу. В этом случае адрес должен классифицироваться как сущность предметной области.

Человек с именем и фамилией обычно является сущностью, так как он имеет идентификатор, даже если имя и фамилия совпадают с другим набором значений, например, если такие имя и фамилия также связаны и с другим человеком.

Объектами значений трудно управлять в реляционных базах данных и моделях ORM, таких как Entity Framework (EF), тогда как в документоориентированных базах данных их гораздо проще реализовать и использовать.

В EF Core 2.0 и более поздних версий представлена функция Принадлежащие сущности, которая упрощает обработку объектов-значений, как мы увидим во всех подробностях позже.

Дополнительные ресурсы

Шаблон агрегата

Модель предметной области содержит кластеры разных сущностей данных и процессы, которые могут управлять значительными областями функций, такими как выполнение заказов или инвентаризация. Более мелкой единицей DDD является агрегат, описывающий кластер или группу сущностей и поведений, которые могут рассматриваться как единый блок.

Агрегат обычно определяется на основе необходимых транзакций. Классический пример — заказ, который также содержит список позиций заказа. Позиция заказа обычно является сущностью. Но это будет дочерняя сущность в агрегате заказа, который также будет содержать сущность «заказ» как корневую сущность, обычно называемую корнем агрегата.

Идентифицировать агрегаты может быть довольно трудно. Агрегат — это группа объектов, которые должны быть согласованы друг с другом, но нельзя просто выбрать группу объектов и пометить их как агрегат. Вы должны начать с концепции предметной области и обдумать сущности, которые используются в наиболее распространенных транзакциях, связанных с этой концепцией. Именно такие сущности, которые должны быть согласованными на уровне транзакций, и формируют агрегат. Обдумывание транзакционных операций, скорее всего, является лучшим способом определения агрегатов.

Шаблон корня агрегата или корневой сущности

В агрегате содержится по крайней мере одна сущность — корень агрегата, также называемый корневой или основной сущностью. Кроме того, в агрегате может находиться несколько дочерних сущностей и объектов значений, причем все сущности и объекты работают совместно для реализации необходимого поведения и транзакций.

Цель корня агрегата заключается в обеспечении согласованности агрегата; он должен быть единственной точкой входа для обновлений агрегата с помощью методов или операций в классе корня агрегата. Изменения сущностей в агрегате должны происходить только через корень агрегата. Это защитник согласованности агрегата, учитывающий все инварианты и правила целостности, соблюдение которых может требоваться в агрегате. Если изменить дочернюю сущность или объект значения независимо, корень агрегата не сможет обеспечить правильное состояние агрегата. Это было бы похоже на стол с оторванной ножкой. Обеспечение согласованности является главной задачей корня агрегата.

На рис. 7-9 показаны примеры агрегатов, например агрегат «покупатель», содержащий одну сущность (корень агрегации Buyer). Агрегат «заказ» содержит несколько сущностей и объект значения.

Рис. 7-9. Пример агрегатов с одной или несколькими сущностями

Модель предметной области DDD состоит из агрегатов, агрегат может иметь только одну сущность или несколько сущностей, а также включать объекты значений. Обратите внимание, что агрегат Buyer может иметь дополнительные дочерние сущности в зависимости от предметной области, как, например, в микрослужбе заказов в эталонном приложении eShopOnContainers. На рис. 7-9 просто показан случай, в котором покупатель состоит из одной сущности, в качестве примера агрегата, содержащего только корень агрегации.

Для поддержки разделения агрегатов и сохранения четких границ между ними рекомендуется в модели предметной области DDD запретить прямой переход между агрегатами и иметь только поле внешнего ключа (FK), как реализовано в модели предметной области микрослужбы заказов в приложении eShopOnContainers. Сущность Order имеет только поле внешнего ключа для покупателя, и в ней отсутствует свойство навигации EF Core, как показано в следующем коде:

public class Order : Entity, IAggregateRoot
{
    private DateTime _orderDate;
    public Address Address { get; private set; }
    private int? _buyerId; // FK pointing to a different aggregate root
    public OrderStatus OrderStatus { get; private set; }
    private readonly List<OrderItem> _orderItems;
    public IReadOnlyCollection<OrderItem> OrderItems => _orderItems;
    // ... Additional code
}

Для идентификации агрегатов и работы с ними требуется опыт и проведение исследования. Дополнительные сведения см. в следующем списке дополнительных ресурсов.

Дополнительные ресурсы

Представление модели предметной области (МПО) и точек интеграции / Хабр

Как известно, описание архитектуры состоит из множества представлений, для соответствующих точек зрения, интересов и заинтересованных сторон.

В этой статье я расскажу о способе создания представления (диаграммы) модели предметной области (МПО), дополненное связями с точками интеграции, на базе которых построена функциональность системы: хранимыми процедурами, функциями и веб-сервисами. Таким образом, данное представление хорошо подойдёт проектам с большим количество точек интеграций и поможет разработчикам и аналитикам быстрее ориентироваться в проекте, порой даже не заходя в код.

Разработка такого представления велась для оптимизации разработки интернет банка. Характерной особенностью подобных систем, является то, что они являются прослойкой над множеством внутренних банковских систем, предоставляющих множество точек интеграции для интернет банка. Поэтому данное представление может быть востребовано в интернет банках и других фронт системах в высокотехнологичных компаниях, использующих множество внутренних интегрированных систем.

Возможности, которые даёт такое представление:

  • диаграмма МПО позволяет быстро получить понимание о функциональности, которая существует в системе, какие сущности присутствуют в системе и какие операции с ними можно выполнять;
  • связь сущностей МПО с точками интеграции — ускоряет поиск нужного участка кода при модификации функционала. Понимая какую операцию и по какому объекту надо модифицировать, можно быстро найти точку интеграции, а отталкиваясь от неё — проанализировать весь стек вызова;
  • удобно накапливать информацию о предметной области в простом наглядном стиле;

Вопросы, на которые отвечает такое представление:
  • какие сущности МПО существуют в системе?
  • как сущности МПО друг с другом связаны?
  • какие действия можно выполнять с сущностями МПО?
  • с помощью каких точек интеграции выполняются те или иные действия?

Представление сущности МПО

Представление строится на основе диаграммы классов. Для отображения сущности МПО используется класс. Сама сущность МПО представляет из себя абстракцию, которой может не существовать в реализации в описанном виде.

Аттрибуты сущности МПО содержат перечень основных полей, при этом они могут содержать не все используемые в коде поля, так как их может быть достаточно много и в этом нет смысла.

Название аттрибута задаётся в наиболее удобной для понимания форме. В случае с атрибутами чаще всего было проще использовать то название, которое указано в коде.

Методы бизнес-модели содержат все возможные действия, над данной моделью. Это могут быть CRUD и какие либо ещё возможные методы. Выделение метода зачастую ориентируется на точку интеграции, которая используется в данном методе. Есть смысл так же выносить производные методы, для понимания предметной области.

Название метода в бизнес-модели указывается в свободной форме, таким образом, чтобы по названию можно было понять его суть. Зачастую проще использовать русскоязычные имена. Например, метод получения списка банковских карт, будет иметь названия ПолучитьСписокКартПоКлиенту.

Точки интеграции — это могут быть хранимые процедуры, функции или веб-сервисы. Описываются по формату %схема/веб-сервис%: хп/хф/метод веб сервиса. Стрелкой соединяются с соответствующим методом.


Рисунок 1. МПО на примере одной сущности

Пример того, как описывается одна сущность МПО — изображён на Рисунке 1.

Представление МПО

Итоговое представление МПО может выглядеть примерно как на рисунке. В примере я привёл значительно упрощённую модель. В реальной модели было в 10-15 раз больше сущностей с значительно большим количеством методов и точек интеграции. Однако даже с большими размерами МПО было достаточно просто ориентироваться. Свою роль сыграли возможностям Enterprise Architect и Visual Paradigm, однако в первую очередь помог логический поиск Функциональность->Сущность->Метод->Точка интеграции


Рисунок 2. Пример полного представления МПО.

На рисунке 2 изображён пример полного представления МПО. По этому рисунку уже можно сложить мнение о том, какая функциональность реализована в приложении.

Как представление МПО + точки интеграции может упростить разработку

Для наглядности я приложил диаграмму компонентов (Рисунок 3), распределённых по приложениям инфраструктуры проекта:

  • UIWebSite
  • MainOnlineBackendService
  • PCIDSSOnlineBankLogicService

Эта диаграмма в статье только для того, чтобы дать представление о количестве слоёв в стэке вызова, которое может быть между элементами управления UI и интеграционной точкой, что влияет на анализ стэка.


Рисунок 3. Диаграмма компонентов.

Задача 1:

Допустим, что у нас стоит задача модифицировать функциональность открытия счёта и мы не знакомы с кодом проекта. В такой задаче может прийтись исследовать стэк вызова, а учитывая, что в каждом приложении существует свой набор компонентов, стэк вызова при клике на кнопку «Открыть счёт» может состоять из 8 уровней:

1 — ReactUI
2 — RestApiController
3 — AccountCachedController
4 — AccountServiceWrapper
5 — MainOnlineBackendServiceImplementation
6 — AccountServiceWrapper
7 — OnlineBankLogicServiceImplementation
8 — sheme1: sp_createAccount

Анализ сверху-вниз при помощи отладчика в такой ситуации может занять значительное время, так как на каждом слое, метод может содержать множество строк и ещё вложенные методы, которые будут либо возвращать обратно либо вести к другим точкам интеграции. Поэтому чтобы найти точку интеграции (а именно она выполняет действие), нужно будет прошарить отладчиком почти все строки стэка вызова.

В случае, если мы используем диаграмму МПО, то по соответствующему действию можно получить название хранимой функции, а через неё, с помощью глобального поиска по проекту, найти нужный участок кода и поставить на ней точку останова. Дальше остаётся только вызвать эту точку и идти по стэку вызова снизу-вверх, что значительно проще.

Задача 2:

Допустим, что у нас стала возникать ошибка при выполнении какого-либо действия. Для проектов с множеством интеграций частой причиной ошибок является ошибки внешних систем, например было выполнено обновление хранимой процедуры, отключение/недоступность веб-сервиса. На уровне пользователя такие ошибки совсем не очевидны и возникает ощущение, что проблема конкретно в системе, с которой работает пользователь. Чтобы локализовать ошибку чаще всего необходимо проанализировать стэк вызова.

В случае, если мы используем диаграмму МПО, то по действию, с которым происходит ошибка мы находим точку интеграции, ставим на неё точку останова и делаем вызов.

Если точку не поймали, то проблема лежит до вызова.

Если точку поймали, делаем вызов и смотрим прошёл ли вызов без ошибок. Очень часто на этом этапе находятся все ответы.

Если точку поймали и действие выполнилось, тогда идём по стэку снизу-вверх, пока не найдём ошибку.

Это две типовые распространённые задачи, при которых требуется находить точки интеграции.

Задача 3:

Другое множество, где диаграмма была полезна — это различные вопросы:

  • какая внешняя система отвечает за ту или иную функциональность
  • какая точка интеграции используется для выполнения того или иного действия
  • где получить номер карты по её Id
  • кто отвечает за функциональность со стороны другой системы

Задача 4:

Вы исследуете систему и вам необходимо накапливать информацию о всех понятиях и функционале системы. Диаграмма помогает это выполнять в достаточно лаконичном виде. В дальнейшем такая декомпозиция/композиция позволяет спроектировать архитектурные слои.

(PDF) О некоторых свойствах моделей предметных областей информационных систем

МНПК «Современные информационные и электронные технологии»

УДК 004.9

О некоторых свойствах моделей предметных областей информационных

систем

Канд. техн. наук В.В. Любченко

Одесский национальный политехнический университет

Украина, Одесса

[email protected]

Аннотация: В работе рассмотрены свойства моделей предметных областей

информационных систем. Определено необходимое и достаточное условие существования

моделей предметных областей. Доказано существование достаточного уровня детализации

модели.

Ключевые слова: модель предметной области, необходимое и достаточное условие,

детализация модели.

Любая информационная система должна обеспечивать определенные результаты или цели,

исходя из которых можно объяснить ее функционирование [1]. При разработке информационной

системы возникает необходимость применить заменитель объекта исследования, находящийся с ним

в таком соответствии, которое позволяет получить новое знание об этом объекте, то есть применить

модель предметной области задачи. Моделирование предметных областей информационных систем

осуществляется с познавательной целью, поэтому в отличие от простого описания объекта модель

должна быть активной, способствовать проникновению в глубину объекта исследования, в его суть.

Целью данной работы является определение условий существования модели предметной

области, а также обоснование существования достаточного уровня детализации модели.

Прежде всего, дадим рабочее определение предметной области информационной системы.

Предметная область — это часть реального мира (класс или совокупность классов реальных

объектов), подлежащего модельному отображению в целях ее изучения под некоторым вполне

определенным углом зрения. Последний определяется целями информационной системы, для

которой требуется построить модель предметной области. Особенностью предметных областей

информационных систем является их конечность, следовательно, количество классов, подлежащих

модельному отражению, всегда конечно.

В данной работе модель предметной области будем определять как совокупность базовых

моделей объектов, которым соответствуют объекты реального мира, их свойств и отношений между

ними, а также правил формирования моделей объектов и методов анализа этих моделей. Очевидно,

что количество базовых моделей объектов и количество отношений между ними является конечным.

Построение модели предметной области остается процедурой неформализованной, а качество

полученного результата определяется, прежде всего, опытом эксперта, который строил модель.

Характеристики модели предметной области напрямую зависят от цели информационной системы.

Однако сама цель остается за пределами модели предметной области, что затрудняет дальнейшую

работу с моделью и выполнения ее модификаций. В связи с этим естественным вопросом является

вопрос существования модели предметной области информационной системы.

Сформулируем необходимое и достаточное условие существования модели предметной

области.

Предметная область имеет модель тогда и только тогда, когда каждое подмножество ее классов

имеет модель.

Доказательство. Предположим, что некоторое подмножество классов предметной области не

имеет модельного отображения по некоторым причинам. Однако охват предметной области

определяется целями информационной системы, каждой цели соответствует свой класс или

множество классов и отношений. Поэтому если некоторое подмножество классов не будет иметь

модельного отображения, то модель предметной области будет недостаточной для достижения целей

Одесса, 27 — 31 мая 2013 г.

– 00 –

Модельный предмет | Природа

Global Energy and Water Cycles

Под редакцией:
  • К. А. Браунинга и
  • Р. Дж. Герни

Cambridge University Press: 1999. 292 стр. 50 фунтов стерлингов, 95 долларов США

Взаимодействие между энергетическим и водным циклами лежит в основе как прогнозирования погоды, так и предсказания изменения климата.Эта книга основана на конференции 1994 года, посвященной эксперименту по глобальному энергетическому и водному циклу, и пытается оценить наше понимание этого взаимодействия для прогнозирования как в краткосрочном, так и в долгосрочном масштабе.

Почти все соответствующие процессы, связанные с круговоротом воды и энергии (за заметным исключением морского льда), имеют в книге свои собственные подразделы. К ним относятся такие разнообразные области, как численные схемы адвекции водяного пара, физика облаков, движение воды через почву и реакция океана на пресную воду.Каждый раздел представляет передовую науку, подчеркивает неопределенность и прогнозирует, какие будущие исследования необходимы и вероятны.

В книге основное внимание уделяется тому, как работает процесс и как его можно смоделировать, особенно в моделях глобальной общей циркуляции, используемых для прогнозирования изменения климата. Проблемы огромны. Чтобы смоделировать процесс, мы должны сначала понять его, а значит, мы должны иметь возможность наблюдать за ним. Наблюдения за многими гидрологическими процессами весьма бедны. Используя имеющиеся данные, разработчики моделей предоставили подробные представления о конкретных процессах, причем соответствующие физические явления часто проявляются в очень малых масштабах.Могут ли эти процессы быть точно смоделированы в терминах переменных более крупного масштаба, используемых в моделях общей циркуляции, какой уровень детализации необходим, чтобы сделать глобальные модели полезными, и как можно сделать представления согласованными между различными процессами — это три основные темы в этом обзоре. книга.

Несмотря на то, что уровень изложения довольно высок, нет попытки сделать освещение систематическим. Например, нет рисунка, показывающего климатологическое глобальное поле осадков, каким бы неопределенным оно ни было.

Эта книга больше всего подходит исследователям и аспирантам, поскольку она будет информировать их о различных компонентах, связанных с моделированием климата. Но современные книги в быстро развивающихся областях имеют относительно короткий срок годности. За три года, прошедшие с момента написания большинства этих статей, уже произошли значительные события. Например, мы стали свидетелями запуска миссии по измерению осадков в тропиках, и была разработана влагосберегающая форма полулагранжевой схемы адвекции водяного пара.По моим оценкам, еще одна такая книга понадобится примерно через пять лет. Если повезет, редакторы рассмотрят возможность сделать из этого сериал.

Информация об авторе

Членство

  1. Центр космических полетов имени Годдарда НАСА, Годдардовский институт космических исследований, 2880 Бродвей, Нью-Йорк, 10025, Нью-Йорк, США

    Дэвид Ринд

0 Об этой статье

Ринд Д. Образцовый предмет. Природа 398, 480 (1999).https://doi.org/10.1038/19019

Загрузить цитату

Поделиться этой статьей

Любой, с кем вы поделитесь следующей ссылкой, сможет прочитать этот контент:

Получить ссылку для общего доступа

Извините, ссылка для общего доступа в настоящее время недоступна доступны для этой статьи.

Предоставлено инициативой Springer Nature SharedIt по обмену контентом.

Что такое модель учебного плана? — Видео и стенограмма урока

Основы модели учебного плана

Модели учебного плана имеют пять областей, которые они определяют:

  1. Основной предмет или студент.Где ударение?
  2. Подход — традиционный или современный. Какой тип инструкции будет использоваться?
  3. Контент — на основе темы или контента. Как будут записываться единицы или нити?
  4. Процесс — формирующий или итоговый. Как будут использоваться оценки?
  5. Структура — системная, линейная или циклическая. Как часто пересматривается учебный план?

Имейте в виду, что большинство моделей учебных программ уже разработаны. В большинстве случаев, когда группы по составлению учебных программ собираются вместе, они рассматривают существующие модели и сопоставляют их со своими потребностями, прежде чем выбрать лучшую. Например, недавно открытая инновационная школа будет искать модель с современным подходом.

Модели продуктов и процессов

Хотя существует несколько моделей учебных программ, наиболее узнаваемыми являются две модели: модель продукта и модель процесса.

Модель продукта делает акцент на выходе или эффектах. Он ориентирован на конечный продукт. Примеры включают знание и понимание фактов, овладение навыками, приобретение опыта или развитие морали.Когда модели учебного плана фокусируются на продукте, это означает, что готовому продукту придается большее значение, чем тому, что происходит в ходе изучения урока. Сторонники продукта утверждают, что модели, основанные на процессах, никогда не совершенствуются, а только улучшаются.

Модель процесса подчеркивает намерение. Он фокусируется на том, как все происходит в процессе обучения. Этот метод более открытый и учитывает мысли, чувства и действия. Учебная программа, ориентированная на модель процесса, подчеркивает, как учащиеся учатся, каково их мышление и как это повлияет на обучение в будущем. Сторонники модели процесса утверждают, что, хотя учащиеся получают знания, продукт, это получение является результатом размышлений и объединения мыслей, что является процессом.

Важно отметить, что смешение этих двух моделей часто наблюдается в современных учебных программах, поскольку исследования показывают, что и процесс, и продукт важны для обучения.

Резюме урока

Модель учебной программы — это широкий термин, относящийся к руководству, используемому для написания руководств по учебной программе , или документам, используемым в образовании для определения конкретных аспектов обучения, таких как предмет, временные рамки и способ обучения .Существуют две давние модели учебных программ: модель процесса и модель продукта. Как следует из названия, модель процесса фокусируется на том, как достигается обучение, а модель продукта больше связана с конечным результатом. Сегодня используются многие современные модели учебных программ, которые сочетают в себе эти две основные идеи.

Часть вторая ― Официальный запуск

В 2015 году Публичная библиотека Омахи (OPL) представила бета-группу тематических библиотекарей для удовлетворения информационных потребностей, связанных со здоровьем и благополучием, бизнесом, пожилыми людьми и генеалогией/местной историей.На втором году бета-программы я назначил нового предметного библиотекаря, чтобы помогать посетителям, испытывающим бездомность и бедность. Получив положительные отзывы от сотрудников, мы приступили к расширению команды, включив в нее всех библиотекарей по обслуживанию взрослых.

Поскольку у нас было в общей сложности 10 библиотекарей по обслуживанию взрослых, нам понадобилось бы всего 10 предметов. Чтобы определить оставшиеся темы, мы опросили сотрудников всей системы на предмет типов справочных вопросов, которые они получали. В ходе этого опроса мы обнаружили множество запросов о помощи в повышении грамотности потребителей, касающихся здравоохранения, права и финансов.Кроме того, мы отметили, что наш стратегический план направлен на вовлечение сообщества.

После того, как мы собрали данные, мы определили 10 субъектов.

  • Бета-команда предметных библиотекарей перенесена для следующих предметов:
    • Генеалогия и краеведение
    • Пожилые люди
    • Бизнес
    • Бездомность и бедность
  • Здоровье и хорошее самочувствие объединены в Грамотность потребителей , которая стала общей темой, посвященной потребностям, связанным со здоровьем, правом и финансами.
  • Городское садоводство вырос из существующей библиотеки семян общей почвы OPL. В OPL был библиотекарь, работающий координатором программирования и общим связным для Библиотеки семян Common Soil, и она продолжала выполнять эту роль.
  • Технологии обратился к цифровому разрыву и рассмотрел будущие технологические тенденции.
  • Разнообразие и инклюзивность Номер появился из-за желания OPL поддержать усилия местных организаций, работающих над устранением социально-экономического и расового неравенства и превращением Омахи в более инклюзивный город.
  • Гражданская активность сейчас более чем когда-либо предназначена для того, чтобы дать гражданам возможность быть активными членами своего сообщества, подключив их к таким ресурсам, как информация о регистрации избирателей.
  • Читатели и писатели восприняли книги как библиотечный хлеб с маслом. Этот предметный библиотекарь работает над созданием сообщества читателей и писателей, подключая людей к книжным беседам, книжным клубам, авторским и литературным мероприятиям, а также поддерживая писателей, подключая их к ресурсам и писательским группам.

В дополнение к определению предметных областей, которые лучше всего отвечают потребностям клиентов OPL, мы официально определили нашу концепцию профильного библиотекаря.

Библиотекарь-предметник обладает экспертными знаниями в определенной области. Библиотекарь поддерживает стратегический план OPL, охватывая нишевые интересы, отдельных лиц и группы в сообществе. Библиотекари-предметники рассмотрят программирование, информационно-разъяснительную работу, вовлечение сообщества и сбор на общесистемном уровне.

В апреле 2017 года OPL официально создала команду тематических библиотекарей.Большую часть этого первого года я поручил библиотекарям по обслуживанию взрослых собирать информацию по своей предметной области, разбираться в программировании с точки зрения всей системы, связываться с другими отделами, искать возможности для профессионального развития и, наконец, начинать разрабатывать и курировать контент для внутренней сети OPL. Как их менеджер, я установил ожидания, чтобы помочь направлять рост.

Одним из ярких событий первого года стало то, что библиотекарь OPL Readers & Writers хотел создать специальную команду по обслуживанию читателей, что требовало обучения.OPL наняла Бекки Спратфорд, тренера Readers Advisory (RA), которая ведет признанный критиками обучающий блог RA for All. Тренировки Бекки изменили правила игры. До ее визита команда не использовала свои навыки и знания в области РА. Изучив и ознакомившись с ресурсами RA, такими как продукт EBSCO NoveList® Plus, члены команды начали обсуждать книги внутри компании. Этот культурный сдвиг помог команде более комфортно обсуждать и продвигать книги с читателями и подготовил нас к возможному переходу OPL от взаимодействия с сообществом к новому набору приоритетов обслуживания, которые связывают покровителей с нашими коллекциями путем активного вовлечения нашего сообщества читателей.

Модель предметного библиотекаря

OPL предлагает как внешние, так и внутренние преимущества. Во-первых, это позволяет нам быть более обдуманными в наших общесистемных программах, работе с общественностью и взаимодействии с населением. Кроме того, наши профильные библиотекари служат внутренними экспертами в предметной области, к которым сотрудники могут обращаться со своими вопросами, справочными запросами и возможностями информационно-разъяснительной работы.

В третьей части, заключительной статье этой серии, я расскажу о том, как сейчас работает модель предметного библиотекаря и куда мы движемся, продолжая развиваться как команда.

Мнение | За образцом того, как преподавать тему американского расизма, обращайтесь к Фредерику Дугласу

. В первые дни республики нередко спрашивали, стоит ли спасать американскую форму правления. Аболиционисты, такие как Уильям Ллойд Гаррисон и молодой Фредерик Дуглас, считали Конституцию США документом, выступающим за рабство. Конституция, «пропитанная человеческой кровью», провозгласил Гаррисон, была «самым дерзким соглашением, когда-либо сделанным людьми для продолжения и защиты системы самого ужасного злодейства, когда-либо проявлявшегося на земле.

Ясно, что критическая расовая теория не требовалась, чтобы поднимать вопросы о системной природе американского расизма. Гаррисон осуждал любое участие в конституционном строе, включая голосование, как компромисс со злом. Некоторые чернокожие лидеры того времени сочли американский эксперимент настолько коррумпированным, что выступили за черный сепаратизм и возвращение чернокожих в Африку.

Продолжение истории под рекламой

Неудобные разговоры о расизме — неотъемлемая черта американской жизни. И они привели к определенным категориям современной мысли.

Во-первых, есть те, кто считает, что благодаря катаклизму Гражданской войны и триумфу движения за гражданские права Соединенные Штаты в значительной степени исправили свои структурные дефекты. 14-я поправка, 15-я поправка, Закон о гражданских правах 1964 года и Закон об избирательных правах 1965 года, с этой точки зрения, теперь обеспечивают относительно равные условия для человеческих достижений. Расизм стал делом отдельных граждан, придерживающихся предвзятых взглядов.Поэтому целью исторического образования является привитие дальтонизма.

Во-вторых, есть те, кто считает, что расизм впитался в американское общество на протяжении сотен лет и не будет легко устранен. Кумулятивные результаты предвзятости, с этой точки зрения, можно увидеть в американских институтах — жилье, правосудие, кредитование, охрана правопорядка, образование, накопление богатства — которые ставят многие меньшинства в крайне невыгодное положение с момента их рождения. Поэтому борьба с расизмом требует позитивных усилий по разоблачению и искоренению системного расизма.Это не просто вопрос воспитания определенных взглядов; он диктует позитивные действия против несправедливости.

История продолжается ниже рекламного объявления

В-третьих, есть те — в основном в академических кругах, но не ограничиваясь ими — которые считают, что американская демократия и либеральный индивидуализм в более широком смысле остаются прикрытием или предлогом для расовой и экономической эксплуатации. Это критика не только американских институтов, но и американской идеологии. Свободное, равное, демократическое общество, с этой точки зрения, не является идеалом, которому Белое большинство не может соответствовать; это миф, используемый сильными мира сего для сохранения власти.И только применение большей силы для свержения существующего порядка является адекватным ответом.

Первая точка зрения, которой придерживаются многие консервативные родители, кажется мне крайне неадекватной. Дальтонизм является важным обязательством для людей. Этого недостаточно для понимания наследия расизма. В детстве меня должны были научить (но этого не произошло), что моя монохромная жизнь в пригороде не является естественным или нейтральным состоянием. Он был построен поколениями законов и правил, которые окружили меня действующими институтами и разделили сообщество, в котором я жил.

Проблема возникает, когда второе и третье представление на практике смешиваются. Существуют маргинальные формы антирасизма, которые участвуют в своего рода силовой игре. Цель состоит в том, чтобы культивировать чувство вины и поощрять ритуальное самоосуждение, ведущее к самоуничижению — цель, которая должна преобладать над всеми либеральными нормами, предпосылками и институтами.

История продолжается ниже объявления

Я не вижу особых доказательств того, что этот способ обучения широко распространен в американских государственных школах. Но это было бы тревожным событием. И не только потому, что это оскорбило бы некоторых белых родителей. Это затруднило бы подлинное историческое образование о расовом прошлом нашей страны и подлинные усилия по устранению продолжающейся несправедливости.

Некоторые из наиболее важных вопросов, связанных с расизмом, присутствовали с самого начала: можно ли устранить глубокие недостатки этой страны путем более решительного применения американских идеалов? Или эти идеалы были просто предлогом для эксплуатации и фанатизма?

Старший Дуглас ответил не так, как его младший.В конце концов он порвал с Гаррисоном из-за характера Конституции. «Если толковать так, как следует, — сказал Дуглас, — Конституция — это великолепный документ о свободе». Его борьба за конституцию против рабства и его приверженность политическому аболиционизму сформировали его столетие.

Дуглас остается образцом борьбы с расизмом — в своем праведном гневе на системную коррупцию в американском эксперименте и в своей вере в искупительную силу американских идеалов и институтов. Хорошее образование будет развивать и то, и другое.

Стоит ли специфическое моделирование опорно-двигательного аппарата дополнительных усилий или стоит сократить путь?

Abstract

В большинстве исследований по моделированию опорно-двигательного аппарата, изучающих здоровые группы населения, используются общие модели, линейно масштабированные для приблизительного соответствия антропометрии человека. Общие модели не учитывают значительные различия в геометрии скелетно-мышечной системы и свойствах тканей у разных людей.В этом исследовании изучались физиологические последствия персонализации геометрии скелетно-мышечной модели (масса сегмента тела, инерция, центр сустава и максимальная изометрическая мышечная сила). Девять здоровых спортсменов выполнили десять повторений 15-метрового спринта со скоростью 75–95 % от их максимальной спринтерской скорости и десять повторений непредвиденных попыток обхода со скоростью разбега 4,5–5,5 м/с. На нижних конечностях была получена структурная магнитно-резонансная томография, на основе которой были разработаны специфические модели опорно-двигательного аппарата. Одномерное статистическое параметрическое сопоставление, парное t -тест, использовалось для сравнения общих и специфических моделей опорно-двигательного аппарата для: кинематики нижних конечностей, кинетики, согласования крутящего момента, а также активации подколенных сухожилий, приводящих и четырехглавых мышц и динамики волокон. . Было определено процентное изменение геометрических параметров между общей и предметной моделями. По сравнению с общими моделями, тематические модели показали значительно более низкий угол тыльного/подошвенного сгибания голеностопного сустава во время спринта и несколько значительно отличающихся чистых моментов в суставах во время спринтерских задач и задач сокращения.Кроме того, тематические модели продемонстрировали лучшее согласование крутящего момента, более физиологически правдоподобные длины волокон, более высокие скорости волокон, более низкие мышечные усилия и более низкую смоделированную активацию в подмножестве исследованных мышц и двигательных задач. Кроме того, предметно-специфические модели выявили различия между конечностями, которые не были идентифицированы с помощью общих моделей. Использование предметно-специфического моделирования, даже в здоровой популяции, может привести к более физиологически правдоподобной механике мышечных волокон.Внедрение тематических моделей может быть особенно полезным при исследовании популяций со значительными геометрическими различиями между конечностями или односторонними скелетно-мышечными патологиями, поскольку они не охвачены общей моделью.

Образец цитирования: Ахундов Р., Саксби Д.Дж., Даймонд Л.Е., Эдвардс С., Клаузен П., Дули К. и др. (2022) Стоит ли тематическое моделирование опорно-двигательного аппарата дополнительных усилий или универсальное моделирование стоит сокращения? ПЛОС ОДИН 17(1): е0262936.https://doi.org/10.1371/journal.pone.0262936

Редактор: Орели Карлье, Маастрихтский университет, БЕЛЬГИЯ

Поступила в редакцию: 25 августа 2021 г. ; Принято: 7 января 2022 г .; Опубликовано: 25 января 2022 г.

Copyright: © 2022 Akhundov et al. Это статья с открытым доступом, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания автора и источника.

Доступность данных: Анонимные данные, лежащие в основе графиков и сводной статистики, представленные в этом исследовании, доступны в следующем общедоступном репозитории: https://github.com/RiadAkhundov/PLOS-ONE-Subject-specific-musculoskeletal-modelling.

Финансирование: Это исследование было проведено при финансовой поддержке General Electric и Ассоциации ортопедии и спортивной медицины Национальной баскетбольной ассоциации.

Конкурирующие интересы: Авторы заявили об отсутствии конкурирующих интересов.

Сокращения: АА, приведение/отведение; АБ, короткая приводящая мышца; АЛ, длинная приводящая мышца; ЯВЛЯЮСЬ, большая приводящая мышца; БФЛХ, двуглавая мышца бедра длинная головка; БФШ, двуглавая мышца бедра короткая головка; ЦЭИНМС, откалиброванный электромиографический набор инструментов для нейромышечно-скелетного моделирования; ГРИП, степени свободы; ДПФ, тыльное/подошвенное сгибание; ЭМГ, электромиография; ФЭ, сгибание/разгибание; ГРА, тонкий; ГРФ, наземные силы реакции; МРТ, магнитно-резонансная томография; МСК, опорно-двигательный аппарат; МТУ, мышечно-сухожильный узел; Р 2 , коэффициент детерминации; РФ, прямая мышца бедра; СКО, Средняя квадратическая ошибка; СМ, полуперепончатая; СПМ, статистическое параметрическое отображение; СТ, полусухожильная; VI, промежуточная широкая мышца бедра; ВЛ, латеральная широкая мышца бедра; ВМ, медиальная широкая мышца бедра

1 Введение

Инвазивное прямое измерение длины, скорости и силы мышечных волокон невозможно при исследовании здоровых людей [1]. Моделирование опорно-двигательного аппарата (MSK) обеспечивает неинвазивную альтернативу для количественной оценки этих и других биомеханических переменных. Важным аспектом проверки модели MSK является ее соответствие анатомии, движению и нагрузке человека. Обычно общая геометрия костей, полученная из трупов, линейно масштабируется, чтобы соответствовать антропометрии человека на основе положения анатомических ориентиров из трехмерного захвата движения [2]. Этот подход приводит к общей модели MSK с низкой геометрической специфичностью [3].

Напротив, специфические модели, имитирующие скелетно-мышечную анатомию человека, полученные с помощью медицинских изображений (например, магнитно-резонансная томография (МРТ), компьютерная томография), обладают высокой геометрической специфичностью [4]. В зависимости от уровня детализации реализации, тематические модели могут включать персонализированные массы сегментов тела, инерцию, определения суставов (например, центры, механизмы) и максимальную изометрическую мышечную силу, генерирующую способность [3]. Точно так же предметная специфичность может быть расширена на параметры, не относящиеся к геометрической специфичности, например.грамм. внутренние параметры мышц, такие как провисание сухожилия, оптимальная длина волокна и угол перистости [5]. Кроме того, предметная специфичность может распространяться на подходы нейронного управления, используемые для управления моделью MSK [6]. Из-за стоимости визуализации и дополнительного времени и опыта, необходимых для анализа, в большинстве исследований моделирования MSK, изучающих здоровые группы населения, используются общие модели, которые используют математическую оптимизацию для прогнозирования паттернов мышечной активации и игнорируют значительные различия в геометрии скелетно-мышечной системы и свойствах тканей у разных людей. [7–9].

В литературе рекомендуется использование тематических моделей MSK с высокой геометрической специфичностью для субъектов с патологиями опорно-двигательного аппарата [3, 10]. Вопрос о том, является ли подход общего масштабирования адекватным для исследования механики мышечно-сухожильных единиц (MTU) при передвижении здорового взрослого человека, является спорным. В то время как в некоторых исследованиях не сообщается о существенных различиях в механике MTU между общими и предметно-специфичными моделями MSK [11, 12], в других исследованиях были обнаружены значительные различия в длине плеча и мышц-сухожилий [13], а также в контактных силах мышц и суставов [11, 12]. 14].Ни в одном из этих исследований не учитывался субъект-специфический нейронный контроль мышц, который доминирует в нагрузке на суставы нижних конечностей [15] и, следовательно, может способствовать получению противоречивых результатов. Существенно отличающиеся результаты моделирования сами по себе не могут объяснить, является ли одна модель MSK лучшим представлением объекта реального мира и его движения, чем другая. Вместо этого следует сравнивать модели по тому, насколько точно они соответствуют экспериментальным данным in vivo, доступны ли такие данные для конкретной двигательной задачи и/или находятся ли параметры модели в пределах физиологически правдоподобных диапазонов.

В этом исследовании сравнивались общие и предметно-специфические модели MSK, созданные из одной и той же группы субъектов, оценивалось влияние геометрической специфичности (индивидуальная масса сегмента тела, инерция, центр сустава и максимальная изометрическая мышечная сила) на кинематику, кинетику и динамику MTU, а также исследовал физиологические последствия этих эффектов. Основная гипотеза заключалась в том, что общие и предметно-специфические модели MSK будут давать значительно разные кинематику, кинетику и динамику MTU, а предметно-специфические модели приведут к более физиологически правдоподобной механике мышечных волокон.

2 Материалы и методы

2.1 Участники

Для этого исследования были набраны девять здоровых спортсменов мужского пола (возраст = 22,2 ± 3,1 года, масса тела = 86,8 ± 20,2 кг, рост = 186,0 ± 6,0 см) из различных соревновательных уровней в баскетболе, футболе, лиге регби и союзе регби. Перед сбором данных было получено одобрение Комитета по этике исследований человека (H-2017-0110), и все спортсмены дали письменное информированное согласие.

После пятиминутной разминки на велотренажере участники выполнили протокол тестирования, который состоял из статического испытания (спокойная вертикальная стойка) и серии максимальных произвольных сокращений с использованием изокинетического динамометра (модель 770 HUMAC/NORM, компьютерная спортивная медицина). Инк., Стоутон, Массачусетс, США), за которыми следуют три повторения 15-метрового спринта, каждый из которых выполняется со 100% усилия, пять минут бега на беговой дорожке со скоростью 60% от максимальной спринтерской скорости, десять повторений 15-метрового спринта с усилием 75–95% от максимума. спринтерская скорость, пять повторений прыжков с максимальным усилием в обратном направлении с махом руками и десять повторений непредвиденных прыжков в сторону со скоростью разбега 4,5–5,5 м/с. Набор максимальных произвольных сокращений включал тыльное сгибание голеностопного сустава, подошвенное сгибание голеностопного сустава (на животе и на спине), разгибание бедра, отведение бедра, приведение бедра, сгибание бедра, внешнее вращение бедра, внутреннее вращение бедра, разгибание колена и сгибание колена.Для каждого теста участники выполнили пробную разминку с одним трехсекундным изометрическим сокращением на вводной руке HUMAC перед протоколом тестирования трех трехсекундных изометрических сокращений с одной минутой отдыха между всеми сокращениями. Участники выполнили все повторения для одной тестовой позиции перед переходом в следующую тестовую позицию в стандартном порядке для всех участников.

Это исследование посвящено исключительно задачам субмаксимального спринта и непредвиденных боковых подсечек.Участники были одеты в собственную обувь, но баскетбольные шорты предоставили исследователи. Стороны шорт были заклеены лентой, чтобы предотвратить окклюзию маркера. Субмаксимальная скорость спринта и скорость приближения к шагу в сторону были подтверждены с помощью инфракрасных хронометров (SmartSpeed ​​4-Gate System, Fusion Sport, Боулдер, Колорадо, США). Полный контакт ступни с одной из двух опорных силовых платформ также требовался для того, чтобы спринтерская и/или резная задача считалась успешной и подходящей для анализа.Кроме того, для успешного выполнения разреза требовался угол разреза от 35° до 55°, который был отмечен на полу и визуально подтверждался одним исследователем во время каждого испытания. Между испытаниями участникам давали минимум 30 секунд отдыха.

Две наземные силовые платформы (2000 Гц, тип 9287CA, Kistler, Винтертур, Швейцария), подключенные к блоку управления (тип 5695B, Kistler, Винтертур, Швейцария), использовались для получения трехмерной GRF. Электроды на поверхности кожи, подключенные к беспроводной системе ЭМГ Trigno (Delsys, Бостон, Массачусетс, США), снимали электромиограммы мышц с частотой 2000 Гц.Электроды фиксировали на брюшках следующих 16 мышц нижней конечности [16] доминирующей ноги участника: большая приводящая мышца, длинная головка двуглавой мышцы бедра, латеральная икроножная мышца, медиальная икроножная мышца, большая ягодичная мышца, средняя ягодичная мышца, тонкая мышца, малоберцовая мышца, прямая мышца бедра, портняжную, полуперепончатую, камбаловидную, напрягатель широкой фасции, переднюю большеберцовую, латеральную и медиальную широкие мышцы. В начале тестирования расположение электродов определялось квалифицированным врачом, подтверждалось функциональным мышечным тестом и проверялось на адекватное качество сигнала ЭМГ [17], чтобы гарантировать минимизацию перекрестных помех ЭМГ. Перед размещением участки поверхности кожи сбривали, слегка шлифовали для удаления омертвевшей кожи и очищали тампоном со спиртом. Система захвата движения Oqus 7+ с 16 камерами (Qualisys AB, Гетеборг, Швеция), которая использовала набор рефлекторных маркеров всего тела [18] с частотой 250 Гц, использовалась для получения трехмерного движения всего тела. Qualisys Track Manager (версия 2.15) использовался для синхронизации времени и сбора кинематических, кинетических данных и данных ЭМГ от системы захвата движения, силовых платформ и системы ЭМГ соответственно.Кроме того, нижние конечности участника были визуализированы в течение нескольких дней после сбора данных с использованием устройства МРТ GE Discovery MR750w 3 Тл (GE Medical Systems, Чикаго, Иллинойс, США) посредством одного сканирования трех отдельных стопок (название последовательности: спиновое эхо; последовательность вариант: сегментированное k-пространство, время повторения: 3 мс, время эха: 37,368 мс). Последовательности изображений были оптимизированы для видимости костей и мышц и состояли из примерно 400 изображений с разрешением 512×512 пикселей в плоскости, толщиной среза 3 мм и промежутком между срезами 3 мм.

2.2 Обработка данных

Траектории трехмерных маркеров были помечены в Qualisys Track Manager и экспортированы в виде файлов c3d (C3D.org, 2020) вместе с данными GRF и EMG. Маркерные траектории и GRF были отфильтрованы с помощью фильтра Баттерворта с нулевой задержкой 4 th порядка 18 Гц [19] в MATLAB (версия 2019a, Mathworks, Natick, MA, USA). Была выполнена коррекция нулевого смещения, чтобы удалить любой постоянный ток. Затем ЭМГ подвергались полосовой фильтрации с использованием фильтра Баттерворта 4 th порядка с нулевой задержкой (30–300 Гц), двухполупериодному выпрямлению и фильтрации нижних частот с помощью фильтра Баттерворта 4 th порядка с нулевой задержкой ( 6 Гц) для создания линейной огибающей [5].Сигналы ЭМГ после полосовой фильтрации вместе с соответствующими линейными огибающими вводились в инструмент классификации ЭМГ [17] и оценивалось качество сигнала ЭМГ. Все 16 результирующих линейных огибающих ЭМГ были нормализованы по амплитуде к их соответствующим максимумам, полученным во время испытаний на максимальное произвольное сокращение участника [5].

Трехмерные изображения костей, мышц и внешних границ кожи каждого участника были полностью сегментированы на МРТ одним обученным оператором с использованием Mimics (версия 21.0, Materialise NV, Лёвен, Бельгия), а затем визуально подтверждается оператором-экспертом. Сегментированные кости включали бедренную, большеберцовую и малоберцовую кости, образующие обе ноги и таз. В тех случаях, когда МРТ не включала полный таз (из-за габаритов спортсменов и фиксированного поля зрения), для реконструкции таза из частичной сегментации использовалось статистическое моделирование формы [20]. Сегментарные мышцы включали: приводящую группу, двуглавую мышцу бедра, длинную головку, двуглавую мышцу бедра, короткую головку, латеральную икроножную, медиальную икроножную, тонкую, прямую, портняжную, полуперепончатую, полусухожильную, камбаловидную, промежуточную, латеральную и медиальную широкую мышцу бедра.Сегментированные внешние кожные границы включали верхнюю и нижнюю часть ног и бедро. Всего для МРТ каждого участника было сегментировано 40 объектов.

2.3 Моделирование опорно-двигательного аппарата

Для каждого участника были созданы две модели MSK: общая модель всего тела [21] и модель всего тела для конкретного субъекта. В общей модели, используемой в этом исследовании, использовалась комбинация оценок параметров MTU на основе трупов, таких как оптимальная длина мышечных волокон и угол перистости, и данных МРТ-объема мышц 24 молодых здоровых взрослых людей [21, 22].Общая модель была впервые линейно масштабирована в OpenSim версии 3.3 [23] для соответствия предполагаемым размерам, массе и инерции сегмента тела каждого участника. Центры тазобедренных суставов рассчитывали по уравнению регрессии Харрингтона [24]. Центры коленного и голеностопного суставов рассчитывали как среднее значение медиальных и латеральных маркеров, расположенных над мыщелками и лодыжками бедренной кости соответственно. Расчетные центры тазобедренного, коленного и голеностопного суставов использовались во время процедуры масштабирования для повышения точности масштабирования [19]. Общая длина волокон и сухожилий была оптимизирована для поддержания физиологических рабочих диапазонов после масштабирования модели [25]. Максимальные изометрические мышечные силы общей модели были обновлены с использованием уравнения Хэндсфилда, которое оценивает общий объем мышц нижних конечностей и, в сочетании с фракционными назначениями конкретным мышцам, объемы отдельных мышц на основе измерений массы и роста субъекта [22]. .

Для индивидуальной модели MSK костные сегментации использовались для создания частичной модели нижней части тела с использованием конвейера STAPLE [26].Затем эта частичная модель была объединена с частью верхней части тела и ступнями общей модели, обновляя массы нижнего сегмента тела, центры масс и центры тазобедренного, коленного и голеностопного суставов для создания модели для конкретного субъекта. Чтобы сохранить постоянство массы всего тела в модели для конкретного субъекта, массу туловища корректировали пропорционально общей разнице массы нижней части тела между общими и специфическими значениями для субъекта. Кроме того, обновленные максимальные изометрические мышечные силы сегментированных мышц были рассчитаны по следующей формуле:

Где, σ – значение удельного мышечного напряжения 60 Н/см 2 [21], В m объем сегментированной мышцы, а l 7 0 o длина волокна мышцы.Инерция сегментов тела рассчитывалась с использованием внешних границ кожи и сегментации костей в nmsBuilder [27] и впоследствии обновлялась в модели, специфичной для субъекта. Рассчитывали расстояние между предполагаемыми суставными центрами, найденными в общей модели, и анатомическими суставными центрами, используемыми в предметно-специфичной модели. Персонализация точек и путей прикрепления мышц не проводилась, поскольку в литературе нет единого мнения о том, как это должно быть реализовано, и добавление этого в наш метод расширило бы объем этой статьи за пределы нашего намерения.Таким образом, как общая, так и предметная модели имели одни и те же точки и пути прикрепления мышц, которые были масштабированы по сравнению с эталонной моделью [21].

Для моделирования MSK в OpenSim версии 3.3 использовались как общие, так и предметные модели для каждого участника [23]. Нижняя конечность моделей имела следующие степени свободы (DOF): сгибание/разгибание бедра и колена (FE), приведение/отведение бедра (AA) и тыльное/подошвенное сгибание голеностопного сустава (DPF). Модели включали 34 MTU, воздействующие на одну сторону нижних конечностей [16].Обобщенные координаты модели (т. е. движения), обобщённые нагрузки (т. е. результирующие силы и моменты в суставах) и кинематика MTU (т. е. длины волокон и плеча моментов) рассчитывались в OpenSim для каждого испытания с использованием обратной кинематики, обратной динамики и анализа мышц. инструменты соответственно. Нормализованные линейные огибающие ЭМГ (далее называемые экспериментальными мышечными возбуждениями), обобщенные нагрузки и кинематика MTU впоследствии использовались в наборе калиброванных инструментов нейромышечно-скелетного моделирования на основе ЭМГ (CEINMS) [6].Здесь для калибровки были выбраны 30% как задач на сокращение, так и спринтерских испытаний с лучшим качеством ЭМГ. Калибровка скорректировала общие значения длины провисания сухожилия, оптимальной длины волокна, угла перистости, параметров динамики активации и максимальной изометрической силы каждой мышцы общей и предметно-специфической моделей участника в индивидуальной манере, ограниченной физиологическими диапазонами, для свести к минимуму ошибку в суставных моментах и ​​экспериментальной ЭМГ [6]. Максимальные изометрические мышечные силы ранее сегментированных мышц, использованные в модели для конкретного субъекта, не корректировались с помощью CEINMS.

После того, как модель каждого участника была откалибрована, CEINMS использовалась в режиме с ЭМГ [6] для прогнозирования длины, скорости и силы мышц во время упражнений на сокращение и спринта. Режим с поддержкой ЭМГ оптимизировал существующие возбуждения, определенные из экспериментальных сигналов ЭМГ, чтобы лучше соответствовать экспериментальным моментам в суставах за счет использования двух весовых коэффициентов, которые определяют, насколько возбуждение мышц и моменты в суставах могут отклоняться от соответствующих экспериментальных данных. Для мышц без экспериментальной ЭМГ или с качеством ЭМГ, классифицированным как непригодное для использования с помощью инструмента классификации ЭМГ [17], CEINMS реализовала статическую оптимизацию для прогнозирования мышечных возбуждений [28].CEINMS был настроен на использование эластичного сухожилия с методом поиска корней для динамики мышечно-сухожильного аппарата. В обеих моделях использовались параметры MTU для конкретного субъекта, полученные с помощью калибровки CEINMS, и нейронное решение для конкретного субъекта, рассчитанное с помощью CEINMS в режиме с поддержкой ЭМГ, поскольку это исследование сосредоточено исключительно на эффектах геометрической специфичности.

Непрерывные во времени биомеханические данные были нормализованы до 101 кадра, в общей сложности состоящего из трех отдельных временных фаз: фазы маха и опоры, причем последняя подразделялась на принятие веса и отталкивание (рис. 1).Анализ начался с ипсилатерального маха, когда неинструментальная (т.е. контралатеральная) ступня находилась в контакте с землей, что было подтверждено визуально. Контакт ступни с землей инструментированной ноги, обнаруженный по вертикальной GRF, превышающей 20 Н, указывал на окончание ипсилатерального маха и начало принятия веса. Окончание приема веса и начало отталкивания определяли по первому локальному минимуму вертикальной ФГО (рис. 1). Отталкивание (окончание отталкивания и анализа) определяли по вертикальной GRF, опускающейся ниже порога 20 Н.Окно анализа отслеживало большую часть цикла шага, при этом 0–40% окна анализа представляло собой мах, начальный контакт стопы с землей и начало принятия веса; окончание принятия веса произошло в 55% окна анализа и 55–100% окна анализа, представляющего отталкивание и окончательный контакт ступни с землей. Кроме того, средняя стойка была определена как первая половина отталкивания (55,0%-77,5% окна анализа). Длина и скорость волокон каждой мышцы были нормализованы по оптимальной длине волокна для конкретной мышцы и максимальной скорости укорочения соответственно.Мышечные силы также были нормализованы к массе тела соответствующего субъекта, но это не повлияло на результаты исследования, поэтому сообщалось об исходных мышечных силах.

Рис. 1. Визуализация силы реакции опоры на соответствующих фазах цикла шага.

(A.) Временные события: контакт ступни с землей ноги без инструментов (FC без инструментов), контакт ступни с землей ноги с инструментами (FC с инструментами), окончание фазы принятия веса (WA End) и схождение (Toe-Off).Окно анализа (%) начинается с FC без инструментов и заканчивается схождением ноги с инструментами. (B.) Нога с инструментами показана белым цветом. Фазы цикла шага соответствуют окну анализа (%) на рис. 1А.

https://doi.org/10.1371/journal.pone.0262936.g001

2.4 Статистический анализ

Для проверки процесса калибровки CEINMS были рассчитаны коэффициент детерминации (R 2 ) и среднеквадратическая ошибка (RMSE) для моментов FE бедра, AA бедра, FE колена и моментов DPF голеностопного сустава, предсказанных CEINMS, а также моментов из обратных динамика.Из 34 динамических MTU, оцененных с помощью CEINMS, четыре подколенных сухожилия (длинная головка двуглавой мышцы бедра (BFLH), короткая головка двуглавой мышцы бедра (BFSH), полуперепончатая мышца (SM) и полусухожильная мышца (ST)), четыре приводящие мышцы (короткая приводящая мышца (AB), приводящая длинная мышца (AL), большая приводящая мышца (AM) и тонкая мышца (GRA)), а также четыре четырехглавые мышцы (прямая мышца бедра (RF), промежуточная широкая мышца (VI), латеральная широкая мышца (VL) и медиальная широкая мышца (VM)) были статистически проанализировано. Эти мышцы были выбраны потому, что их мышечные границы были четко видны на изображениях МРТ и могли быть сегментированы с высокой точностью.Все четыре отсека AM в модели участника были проанализированы, объединены и зарегистрированы как AM.

Статистическое параметрическое картирование (SPM) использовалось для сравнения длин мышц, скоростей, сил и активаций, а также обратной кинематики и обратной динамики общей и предметно-специфичной моделей [29]. Был использован одномерный парный t-критерий СЗМ (α = 0,05) [29]. Все анализы СЗМ были реализованы с использованием кода spm1d с открытым исходным кодом (v.M.0.4.7, www.spm1d.org) в MATLAB (версия 2019a, Mathworks, Натик, Массачусетс, США).Для геометрических параметров (масса сегмента тела, инерция, центр сустава и максимальная изометрическая мышечная сила) было рассчитано процентное изменение между общей и индивидуальной моделями.

Где SM — предметно-ориентированная модель, а GM — соответствующая общая модель. Кроме того, внутри субъекта было рассчитано процентное изменение пиковых мышечных сил и активаций между общей и индивидуальной моделями и представлено в таблицах S1 и S2.

3 результатов

3.1 Изменения параметров модели

Средние массы сегментов тела различались между общей и предметной моделями (таблица 1). В индивидуальных моделях масса сегментов таза и голени была на 18,1–21,0 % ниже, тогда как масса голени и туловища была выше на 5,3–10,5 %. Сегментная инерция таза и голени была ниже на 14,7–40,4 % (табл. 1). Сегментарная инерция голени увеличилась на 0,3–4,9% относительно осей x и z и уменьшилась на 7,1–9,6% относительно оси y.

Анатомические центры суставов, реализованные в предметной модели, отличались от таковых, оцененных по типовой модели.Евклидово расстояние между анатомическими и общими суставными центрами различалось в области тазобедренного (правое 2,3±0,4 см, левое 2,3±0,3 см), коленного (правое 2,5±1,0 см, левое 2,6±1,0 см) и голеностопного сустава (правое 1,0±0,7 см, слева 1,1 ±0,4 см). Индивидуальные максимальные изометрические силы всех проанализированных мышц были на 12,7–43,7% выше по сравнению с соответствующими общими значениями (таблица 2). Межконечностные (то есть левые по сравнению с правыми) различия в максимальной изометрической мышечной силе в диапазоне от -3,9% до 2,2% были выявлены только в модели, специфичной для субъекта.

3.2 Результаты моделирования

Калибровка CEINMS показала, что моменты в соединениях с R 2 составляют 0,78–0,96 и среднеквадратичное отклонение 8,5–49,6 Нм/кг для всех степеней свободы по сравнению с внешними моментами в соединениях, определенными с помощью обратной динамики (таблица 3) для обеих моделей. По сравнению с общими моделями все R 2 были выше (0,6–8,8%), а все RMSE были ниже (1,0–52,1%) для тематических моделей. Статистически значимая разница между моделями в кинематике была обнаружена исключительно для DPF голеностопного сустава (9.на 8% ниже в СМ, p = 0,008) во время спринта (рис. 2). Ни одна другая модель DOF во время спринта или резки не показала значительных кинематических различий между моделями. По сравнению с общими моделями, тематические модели показали значительно более высокие моменты FE бедра (разница 15,2%, p = 0,039) вокруг контакта ступни с землей, моменты FE нижней части бедра (разница 24,1%, p = 0,002) во время принятия веса и более низкие моменты колена. Моменты КЭ (разница 8,5%, p = 0,037) во время задачи по резке (рис. 2). Во время спринта тематические модели показали значительно более низкие моменты FE бедра (42.разница 2 %, p = 0,001) во время середины замаха, более высокие моменты FE бедра (разница 8,4 %, p = 0,033) во время позднего замаха, более низкие моменты AA бедра (разница 54,4 %, p <0,001) во время отталкивания, более высокая FE колена моменты (разница 17,0%, p = 0,041) во время середины замаха, моменты FE нижнего колена (разница 14,1%, p = 0,026) во время позднего замаха, моменты DPF нижней лодыжки (разница 38,0%, p<0,001) во время позднего замаха и выше моменты DPF голеностопного сустава (разница 7,9%, p<0,001) во время средней стойки (рис. 2). Никаких существенных различий между моделями в мышечных активациях, скорректированных с помощью CEINMS, не было обнаружено во время задания на разрез, но AM (34.разница 2%, p<0,001) и GRA (разница 20,5%, p = 0,049) продемонстрировали значительно более низкую активацию в предметно-специфичной модели во время спринта (рис. 3).

Рис. 2. Значительные различия в углах и моментах суставов между общей и специализированной моделями.

FE, сгибание/разгибание; АА, приведение/отведение; DPF, тыльное/подошвенное сгибание; Общая модель (GM), тематическая модель (SM) и соответствующие различия между участниками в качестве стандартного отклонения. Контакт ступни опорной конечности с землей показан красной линией.Конец фазы принятия веса показан синей линией. Области значительных различий, определенные с помощью статистического параметрического картирования (серые).

https://doi.org/10.1371/journal.pone.0262936.g002

Рис. 3. Значительные различия в активации и мышечной силе между общей и предметной моделями.

AM, большая приводящая мышца; ВЛ, латеральная широкая мышца бедра; Общая модель (GM), тематическая модель (SM) и соответствующие различия между участниками в качестве стандартного отклонения.Контакт ступни опорной конечности с землей показан красной линией. Конец фазы принятия веса показан синей линией. Области значительных различий, определенные с помощью статистического параметрического картирования (серые).

https://doi.org/10.1371/journal.pone.0262936.g003

По сравнению с общими моделями предметные модели давали значительно меньшую силу в AM (разница 38,1%, p = 0,010) и VL (разница 43,3%, p = 0,032 и разница 60,0%, p = 0,044) во время задачи на отсечку, но нет различий во время спринта.По сравнению с общими моделями, предметно-ориентированные модели демонстрировали значительно более короткую нормализованную длину волокон в AB (разница 6,3%, p = 0,049 и разница 6,7%, p = 0,008) и AL (разница 6,3%, p = 0,005) во время задачи разрезания и в BFLH (разница 16,3%, p = 0,012), BFSH (разница 8,7%, p = 0,043) и ST (разница 4,6%, p = 0,008 и разница 1,8%, p = 0,024) (рис. 4) во время спринта. В общих моделях нормированные длины волокон в четырех мышцах (AB = 1,56, AL = 1,60, GRA = 1,58 и VL = 1.60) превышал физиологические диапазоны от 0,50 до 1,50 [30] во время выполнения задачи на разрез и в двух мышцах (AL = 1,57 и GRA = 1,56) во время спринта. Напротив, в предметно-ориентированных моделях длина мышечных волокон не выходила за пределы физиологических диапазонов ни для одной из задач. Значимых различий между моделями в нормализованной скорости волокон не было обнаружено во время выполнения задания на разрез, тогда как BFSH (разница 16,6%, p = 0,032 и разница 22,1%, p = 0,031) и ST (разница 52,6%, p<0,001, разница 33,7%). , p = 0,042) скорости были значительно выше в предметно-ориентированных моделях по сравнению с общими моделями во время спринта.

Рис. 4. Значительные различия нормализованной длины волокна и скорости между общей и индивидуальной моделями.

AM, короткая приводящая мышца; AL, длинная приводящая мышца; BFLH, двуглавая мышца бедра длинная головка; BFSH, двуглавая мышца бедра короткая головка; ST, полусухожильная; Общая модель (GM), тематическая модель (SM) и соответствующие различия между участниками в качестве стандартного отклонения. Контакт ступни опорной конечности с землей показан красной линией. Конец фазы принятия веса показан синей линией.Области значительных различий, определенные с помощью статистического параметрического картирования (серые). Длина волокна каждой мышцы была нормализована соответствующей оптимальной длиной волокна, а скорость волокна каждой мышцы была нормализована соответствующей максимальной скоростью сокращения.

https://doi.org/10.1371/journal.pone.0262936.g004

4 Обсуждение

В этом исследовании изучались различия в модельных оценках мышечной и суставной механики в результате включения высокой геометрической специфичности и последствия этих различий для здоровых взрослых.Анатомически полученные параметры, включая массу сегмента тела, инерцию, центр сустава и максимальную изометрическую мышечную силу, которые были включены в модели для конкретных субъектов, отличались от общих оценок по шкале. Действительно, по сравнению с общими моделями включение высокой геометрической специфичности в предметно-специфическую модель привело к значительным различиям в подмножестве смоделированной кинематики и моментов в суставах и привело к лучшему согласованию крутящего момента, физиологически правдоподобной длине волокон, более высоким скоростям волокон, меньшим мышечным усилиям. , и более низкие смоделированные активации.Шесть из десяти наблюдаемых областей значительной разницы моментов в суставах были обнаружены в фазе переноса (три в тазобедренном суставе, два в колене и один в голеностопном суставе), что может быть фазой риска повреждения подколенного сухожилия во время спринта [31]. ]. Если возможно, тематическое моделирование MSK стоит дополнительных ресурсов и усилий и может быть необходимо даже при исследовании непатологических популяций, если желательна уверенность в результатах моделирования. Внедрение тематических моделей может быть особенно полезным при изучении популяций с односторонними патологиями опорно-двигательного аппарата, поскольку они не охватываются общей моделью.

По сравнению с анатомическими параметрами модели, общие модели завышали массу сегментов таза и голени на 18,1–21,0 % и занижали массу сегмента голени и туловища на 5,3–10,5 %. Эти различия в физических свойствах сегментов также проявлялись в инерции сегментов. Общие кости были однородными и, как правило, больше, чем кости, полученные с помощью изображений, что означает, что на них приходилось более высокий процент объема сегмента (например, бедренная кость внутри сегмента бедра). Кроме того, общая модель недооценила максимальное изометрическое мышечное усилие, произведение соответствующего объема мышц, скорректированного с помощью калибровки CEINMS, на 12.7–43,7%. Несмотря на то, что общая модель, выбранная для этого исследования, использовала оценки объема мышц у молодых здоровых взрослых [21], эти оценки могут не быть репрезентативными для спортивной популяции, что может объяснить наблюдаемые расхождения. В целом, несоответствие между приблизительным и реальным соотношением костей и мышц в сегментах тела могло способствовать наблюдаемым значительным различиям в кинематике, моментах в суставах и механике MTU между общей и индивидуальной моделями.

Различия между конечностями в максимальной изометрической мышечной силе были выявлены только в модели, специфичной для субъекта. Правая нога доминировала у всех участников, кроме двух, и в среднем показала больший объем мышц, измеренный с помощью МРТ, что привело к более высоким максимальным изометрическим мышечным силам по сравнению с левой ногой. Эта разница между конечностями не отражена в общей модели и может иметь особое значение в популяциях с односторонними патологиями опорно-двигательного аппарата. Анатомические суставные центры, реализованные в предметной модели, располагались выше и кпереди для правого бедра (расстояние 2.3±0,4 см), ниже и кпереди для правого колена (расстояние 2,5±1,0 см) и ниже для правой лодыжки (расстояние 1,0±0,7 см) с минимальными межконечностными различиями. Предыдущие исследования показали, что изменения в расположении центра тазобедренного сустава могут не только повлиять на симулированную мышечную активацию отводящих мышц бедра и контактную силу бедра, в три раза превышающую массу тела [32], но также снизить мышечные силы, которые способствуют крутящему моменту тазобедренного сустава [3]. , 33]. Таким образом, включение специфических для субъекта суставных центров, а также различия между конечностями в максимальной изометрической мышечной силе могли еще больше способствовать значительным различиям в механике MTU между общей и специфической для субъекта моделями, наблюдаемыми в этом исследовании.

Модель для конкретного субъекта реализовывала массу сегмента тела, инерцию, суставные центры и максимальную изометрическую мышечную силу, которые были получены анатомически и, следовательно, вероятно, были бы более правдоподобными с физиологической точки зрения, чем те, которые оценивались по общей модели. Было обнаружено, что длины мышечных волокон четырех мышц во время выполнения упражнения на разрез (AB = 1,56, AL = 1,60, GRA = 1,58 и VL = 1,60) и двух мышц во время спринта (AL = 1,57 и GRA = 1,56) находятся за пределами физиологических значений. правдоподобный диапазон [30] исключительно в общей модели.Насколько нам известно, на сегодняшний день отсутствуют экспериментальные данные in vivo динамики MTU приводящих мышц, четырехглавой мышцы или подколенного сухожилия для спринта и/или задачи на разрез. Следовательно, трудно сделать подтверждающие утверждения о том, какая модель более правдоподобна с физиологической точки зрения, поскольку, например, моменты в соединении обеих моделей находятся в пределах диапазонов, которые могут быть созданы статически на управляемом оборудовании.

Следует учитывать ограничения результатов, представленных в этой статье. Сегментация костей, мышц и наружных границ кожи, а также полученные на их основе анатомические параметры (масса сегмента, инерция сегмента, суставные центры и максимальные изометрические мышечные силы) имеют небольшие неопределенности и вариабельность между операторами, что могло повлиять на результаты.Чтобы уменьшить эти неопределенности, сегментация выполнялась одним оператором, подтверждаемым другим обученным оператором, и меры применялись последовательно для предметно-ориентированных моделей с использованием систематизированного рабочего процесса [26]. Кроме того, чтобы масса всего тела в модели для конкретного субъекта соответствовала массе участника, масса туловища была скорректирована с учетом полученной разницы массы нижней части тела, но инерция туловища осталась идентичной общей модели, поскольку верхняя часть тела не была захвачена. в МРТ.МРТ всего тела позволит сегментировать верхнюю часть тела и еще больше повысит геометрическую специфичность модели для конкретного субъекта. Дополнительным ограничением было то, что оценка чувствительности параметров модели, ответственных за наблюдаемые различия между общей и предметно-специфической моделями, не проводилась, поскольку такой анализ не входил в рамки данного исследования. В это исследование вошли девять участников; большая когорта может обнаружить дальнейшие изменения в некоторых исследуемых параметрах. Персонализация точек и путей прикрепления мышц не проводилась, так как в литературе нет единого мнения о том, как это должно быть реализовано.Роль персонализированных точек и путей прикрепления мышц в модулировании результатов моделирования, вероятно, существенна и, следовательно, должна быть изучена дополнительно. Недавно обнаруженная роль титина в производстве мышечной силы [34] не рассматривалась в этом исследовании, поскольку модели мышц типа Хилла в настоящее время не включают титин в состав своих препаратов. Кроме того, в этом исследовании изучались только спринт и резка, движения, являющиеся неотъемлемой частью многих видов спорта. Специфичная для субъекта геометрия может уникальным образом влиять на различные наборы двигательных задач.Наконец, эти результаты следует интерпретировать с осторожностью, поскольку экспериментальные данные in vivo для исследованных мышц и двигательных задач еще недоступны.

5 Выводы

В заключение, тематические модели с анатомически полученными геометрическими параметрами показали значительно более низкий угол тыльного/подошвенного сгибания голеностопного сустава во время спринта и несколько значительно отличающихся чистых моментов в суставах как во время спринта, так и во время резки по сравнению с обычными моделями. Эти различия между моделями привели к лучшему согласованию крутящего момента, более физиологически правдоподобным длинам волокон, более высоким скоростям волокон, более низким мышечным силам и более низким смоделированным активациям для модели, специфичной для субъекта, в подмножестве мышц.Поэтому рекомендуется, чтобы в исследованиях здоровых субъектов применялось предметно-специфическое моделирование, а не общее моделирование, чтобы создать более физиологически правдоподобную механику MTU. Кроме того, внедрение предметно-ориентированных моделей может быть особенно полезным при исследовании популяций со значительными геометрическими различиями между конечностями или односторонними скелетно-мышечными патологиями, поскольку они не охватываются общей моделью.

Вспомогательная информация

S1 Таблица. Сравнение средней активации мышц с поправкой на CEINMS между общей и предметной моделями.

BFLH, двуглавая мышца бедра, длинная головка; BFSH, двуглавая мышца бедра короткая головка; SM, полуперепончатая; ST, полусухожильная; АВ, короткая приводящая мышца; AL, длинная приводящая мышца; AM, большая приводящая мышца; GRA, тонкий; RF, прямая мышца бедра; VI, промежуточная широкая мышца бедра; ВЛ, латеральная широкая мышца бедра; VM, медиальная широкая мышца бедра; GM, общая модель; предметная модель СМ; Изменение, процентное изменение SM/GM.

https://doi.org/10.1371/journal.pone.0262936.s001

(DOCX)

S2 Таблица. Процентное изменение максимальной мышечной силы между общей и предметной моделями отдельных участников.

BFLH, двуглавая мышца бедра, длинная головка; BFSH, двуглавая мышца бедра короткая головка; SM, полуперепончатая; ST, полусухожильная; АВ, короткая приводящая мышца; AL, длинная приводящая мышца; AM, большая приводящая мышца; GRA, тонкий; RF, прямая мышца бедра; VI, промежуточная широкая мышца бедра; ВЛ, латеральная широкая мышца бедра; VM, медиальная широкая мышца бедра; Значения в процентах (тематическая модель/общая модель).

https://doi.org/10.1371/journal.pone.0262936.s002

(DOCX)

Каталожные номера

  1. 1. Панди М.Г., Андриакки Т.П.Функции мышц и суставов при передвижении человека. Анну Рев Биомед Инж. 2010; 12:401–33. Эпб 2010/07/14. пмид: 20617942.
  2. 2. Хикс Дж.Л., Учида Т.К., Сет А., Раджагопал А., Делп С.Л. Достаточно ли хороша моя модель? Лучшие практики для проверки и проверки моделей опорно-двигательного аппарата и симуляций движения. J Биомех Инж. 2015;137(2):020905. Эпублик от 05.12.2014. пмид: 25474098; Центральный PMCID в PubMed: PMC4321112.
  3. 3. Песня К., Андерсон А.Е., Вайс Дж.А., Харрис М.Д. Скелетно-мышечные модели с общей и индивидуальной геометрией оценивают различную биомеханику суставов при диспластических тазобедренных суставах.Методы расчета Биомех Биомед Энгин. 2019;22(3):259–70. Эпб 2019/01/22. пмид:30663342; Центральный PMCID в PubMed: PMC6478547.
  4. 4. Моденезе Л., Монтефиори Э., Ван А., Весарг С., Вицеконти М., Мацца С. Исследование зависимости контактных сил суставов от параметров мышечно-сухожильных мышц с использованием систематизированного рабочего процесса для моделирования на основе изображений. Дж. Биомех. 2018;73:108–18. Эпаб 2018/04/21. пмид: 29673935.
  5. 5. Ллойд Д.Г., Безье Т.Ф. Скелетно-мышечная модель, основанная на ЭМГ, для оценки мышечных сил и моментов в коленных суставах in vivo.Дж. Биомех. 2003;36(6):765–76. Эпублик 14 мая 2003 г. пмид:12742444.
  6. 6. Pizzolato C, Lloyd DG, Sartori M, Ceseracciu E, Besier TF, Fregly BJ и др. CEINMS: набор инструментов для исследования влияния различных решений для нейронного контроля на прогнозирование мышечного возбуждения и моментов в суставах во время динамических двигательных задач. Дж. Биомех. 2015;48(14):3929–36. Эпб 2015/11/03. пмид: 26522621; Центральный PMCID в PubMed: PMC4655131.
  7. 7. Нептун Р.Р., Каутц С.А., Заяц Ф.Е. Вклад отдельных подошвенных сгибателей голеностопного сустава в поддержку, продвижение вперед и начало поворота во время ходьбы.Дж. Биомех. 2001;34(11):1387–98. Эпублик 24.10.2001. пмид: 11672713.
  8. 8. Хамнер С.Р., Сет А., Делп С.Л. Вклад мышц в движение и поддержку во время бега. Дж. Биомех. 2010;43(14):2709–16. Эпублик 2010/08/10. пмид: 206; Центральный PMCID в PubMed: PMC2973845.
  9. 9. Ленхарт Р.Л., Телен Д.Г., Вилле К.М., Чуманов Э.С., Хайдершайт Б.С. Увеличение частоты шагов при беге снижает нагрузку на пателлофеморальный сустав. Медицинские спортивные упражнения. 2014;46(3):557–64. Эпб 2013/08/07. пмид: 230; Центральный PMCID в PubMed: PMC3

    3.
  10. 10. Кайнц Х., Весселинг М., Джонкерс И. Общие масштабированные модели по сравнению с моделями, специфичными для субъекта, для расчета скелетно-мышечной нагрузки при походке с церебральным параличом: влияние персонализированной скелетно-мышечной геометрии перевешивает эффект персонализированного нейронного контроля. Клиническая биомеханика. 2021:105402. пмид:34098149
  11. 11. Корреа Т.А., Бейкер Р., Грэм Х.К., Панди М.Г. Точность общих скелетно-мышечных моделей в прогнозировании функциональной роли мышц в походке человека.Дж. Биомех. 2011;44(11):2096–105. Эпб 2011/06/28. пмид: 21703627.
  12. 12. Валенте Г., Питто Л., Тести Д., Сет А., Делп С.Л., Стагни Р. и др. Устойчивы ли тематические скелетно-мышечные модели к неопределенностям в идентификации параметров? ПЛОС Один. 2014;9(11):e112625. Эпублик 13.11.2014. пмид: 253; Центральный PMCID в PubMed: PMC4229232.
  13. 13. Scheys L, Spaepen A, Suetens P, Jonkers I. Рассчитанные длины моментных рычагов и мышц-сухожилий во время ходьбы существенно различаются с использованием моделей опорно-двигательного аппарата нижних конечностей, основанных на магнитно-резонансной томографии и перемасштабированных.Осанка походки. 2008;28(4):640–8. Эпб 2008/06/07. пмид: 18534855.
  14. 14. Вагнер Д.В., Степанян В., Шиппен Дж.М., Демерс М.С., Гиббонс Р.С., Эндрюс Б.Дж. и др. Согласованность между скелетно-мышечными моделями: предостерегающий пользователь. Энн Биомед Инж. 2013;41(8):1787–99. Эпб 2013/06/19. пмид: 23775441.
  15. 15. Хоанг Х.С., Пиццолато С., Даймонд Л.Е., Ллойд Д.Г. Индивидуальная калибровка нервно-мышечных параметров позволяет нейромышечно-скелетным моделям оценивать физиологически правдоподобные контактные силы в тазобедренном суставе у здоровых взрослых.Дж. Биомех. 2018;80:111–20. пмид:30213647
  16. 16. Сартори М., Реджиани М. , Фарина Д., Ллойд Д.Г. ЭМГ-управляемая динамическая оценка мышечной силы и суставного момента с несколькими степенями свободы в нижней конечности человека. ПЛОС Один. 2012;7(12):e52618. Эпублик 2013/01/10. пмид: 23300725; Центральный PMCID в PubMed: PMC3530468.
  17. 17. Ахундов Р., Саксби Д.Дж., Эдвардс С., Снодграсс С., Клаузен П., Даймонд Л.Е. Разработка глубокой нейронной сети для автоматизированной классификации электромиографических паттернов.J Эксперт Биол. 2019; 222 (часть 5). Эпб 2019/02/15. пмид:30760552.
  18. 18. Шефер А., О’Дуайер Н., Фердинандс РЕД, Эдвардс С. Согласованность кинематических и кинетических паттернов во время продолжительной игры в боулинг в крикет: исследовательское лабораторное исследование. J Sports Sci. 2018;36(6):679–90. Эпаб 2017/05/26. пмид: 28535739.
  19. 19. Mantoan A, Pizzolato C, Sartori M, Sawacha Z, Cobelli C, Reggiani M. MOtoNMS: набор инструментов MATLAB для обработки данных движения для нейромышечно-скелетного моделирования и симуляции. Исходный код по биологии и медицине. 2015;10(1):1–14. пмид:26579208
  20. 20. Чжан Дж., Безье Т.Ф. Точность реконструкции бедренной кости по разреженным геометрическим данным с использованием статистической модели формы. Методы расчета Биомех Биомед Энгин. 2017;20(5):566–76. Эпублик 22 декабря 2016 г. пмид: 27998170.
  21. 21. Раджагопал А., Дембиа С.Л., ДеМерс М.С., Делп Д.Д., Хикс Д.Л., Делп С.Л. Скелетно-мышечная модель всего тела для мышечного моделирования походки человека. IEEE Trans Biomed Eng. 2016;63(10):2068–79.Эпублик 2016/07/09. пмид: 273

    ; Центральный PMCID в PubMed: PMC5507211.

  22. 22. Хэндсфилд Г.Г., Мейер К.Х., Харт Дж.М., Абель М.Ф., Блемкер С.С. Взаимосвязь 35 мышц нижних конечностей с ростом и массой тела, определенная с помощью МРТ. Дж. Биомех. 2014;47(3):631–638. Эпублик 2013/12/26. пмид: 24368144.
  23. 23. Делп С.Л., Андерсон Ф.К., Арнольд А.С., Лоан П., Хабиб А., Джон К.Т. и др. OpenSim: программное обеспечение с открытым исходным кодом для создания и анализа динамических симуляций движения. IEEE Trans Biomed Eng.2007; 54 (11): 1940–50. Эпублик 21 ноября 2007 г. пмид: 18018689.
  24. 24. Харрингтон М.Е., Заватский А.Б., Лоусон С.Е., Юань З., Теологис Т.Н. Прогнозирование центра тазобедренного сустава у взрослых, детей и больных детским церебральным параличом по данным магнитно-резонансной томографии. Дж. Биомех. 2007;40(3):595–602. Эпб 06.04.2006. пмид: 16584737.
  25. 25. Моденес Л., Чезерачу Э., Реджани М., Ллойд Д.Г. Оценка параметров мышечно-сухожильного аппарата для масштабированных и специфических моделей опорно-двигательного аппарата с использованием метода оптимизации.Дж. Биомех. 2016;49(2):141–8. Эпб 2016/01/19. пмид: 26776930.
  26. 26. Моденезе Л, Рено Ж-Б. Автоматическое создание персонализированных моделей скелета нижних конечностей из трехмерных геометрий костей. Дж. Биомех. 2021;116:110186. пмид:33515872
  27. 27. Валенте Г., Крими Г., Ванелла Н., Шилео Э., Таддеи Ф. nmsBuilder: бесплатное программное обеспечение для создания тематических моделей опорно-двигательного аппарата для OpenSim. 2017; (1872–7565 (электронный)). пмид:263
  28. 28.Сартори М., Фарина Д., Ллойд Д.Г. Гибридное нейромышечно-скелетное моделирование для лучшего отслеживания моментов в суставах с использованием баланса между мышечными возбуждениями, полученными на основе электромиограмм, и оптимизацией. Дж. Биомех. 2014;47(15):3613–21. Эпб 2014/12/03. пмид: 25458151.
  29. 29. Патаки Т.К., Робинсон М.А., Ванрентергем Дж. Анализ областей интереса одномерных биомеханических траекторий: объединение 0D и 1D теорий, увеличение статистической мощности. Пир Дж. 2016;4:e2652. Эпублик 2016/11/12.пмид: 27833816; Центральный PMCID в PubMed: PMC5101620.
  30. 30. Заяц FE. Мышцы и сухожилия: свойства, модели, масштабирование и применение в биомеханике и управлении двигателем. Crit Rev Biomed Eng. 1989;17(4):359–411. Эпб 1989/01/01. пмид: 2676342.
  31. 31. Schache AG, Wrigley TV, Baker R, Pandy MG. Биомеханическая реакция на растяжение мышц задней поверхности бедра. Походка и осанка. 2009;29(2):332–8. пмид:1

    49
  32. 32. Ленартс Г., Де Гроот Ф., Демельенэр Б., Мюльер М., Ван дер Перре Г., Спаепен А. и др.Индивидуальная геометрия тазобедренного сустава влияет на прогнозируемые контактные силы тазобедренного сустава во время ходьбы. Дж. Биомех. 2008;41(6):1243–52. Эпб 2008/03/19. пмид: 18346745.
  33. 33. Дельп С.Л., Мэлони В. Влияние расположения центра бедра на способность мышц создавать момент. Дж. Биомех. 1993; 26 (4–5): 485–99. Эпб 1993/04/01. пмид:8478351
  34. 34. Герцог В. Многочисленные роли титина в сокращении мышц и производстве силы. Biophys Rev. 2018;10(4):1187–99. Эпб 2018/01/22.пмид: 29353351; Центральный PMCID в PubMed: PMC6082311.

Анализ временного разрыва с помощью темпоральной техники на основе тематической модели

https://doi.org/10.1016/j.joi.2014.07.005Получить права и контент ресурсов путем анализа содержания и тенденций.

Мы измеряем точную разницу во времени между академическими дисциплинами с помощью анализа временного разрыва.

Мы оцениваем результаты тематического моделирования с помощью статистического подхода и контент-анализа репрезентативных тем.

Abstract

В этом исследовании предлагается метод временного анализа для интегрированного использования разнородных ресурсов, таких как документы, патенты и новостные веб-статьи. Мы проанализировали явление временного разрыва между тремя ресурсами и двумя академическими областями, проведя контент-анализ на основе анализа текста. С этой целью был использован метод тематического моделирования, скрытое распределение Дирихле (LDA) для оценки оптимальных временных промежутков между тремя ресурсами (документами, патентами и новостными веб-статьями) в двух областях исследования.Вклад этого исследования резюмируется следующим образом: во-первых, мы предлагаем новый метод временного анализа для комплексного понимания характеристик содержания и тенденций разнородных множественных ресурсов. Мы применили его для измерения точных временных интервалов между академическими областями, поняв феномен временного разрыва. Результаты темпорального анализа показали, что ресурсы медицинской области обладают более современным свойством, чем ресурсы компьютерной области, и, следовательно, более оперативным раскрытием для общественности.Во-вторых, мы приняли измерение экспоненты по степенному закону и контент-анализ для оценки предлагаемого метода. С помощью предлагаемого метода мы демонстрируем, как более точно и всесторонне анализировать разнородные ресурсы.

ключевые слова

ключевые слова

Текст Mining

Тема Моделирование

Латентное распределение Дирихле (LDA)

Анализ контента

Временный анализ

Несколько ресурсов

Рекомендуемые статьи Статьи (0)

Просмотреть полный текст

Copyright © 2014 Elsevier Ltd.Все права защищены.

Рекомендуемые статьи

Цитирующие статьи

Оценка сходства индивидуального генома с тематической моделью | Биоинформатика

Аннотация

Мотивация

Оценка сходства геномов между людьми является важным шагом в анализе данных. Усовершенствованная технология секвенирования обнаруживает все больше и больше редких вариантов массивных индивидуальных геномов, что позволяет проводить оценку сходства геномов на индивидуальном уровне.Однако современные методологии, такие как анализ основных компонентов (PCA), не имеют возможности в полной мере использовать редкие варианты, а также их трудно интерпретировать с точки зрения популяционной генетики.

Результаты

Здесь мы вводим вероятностную топическую модель, латентное распределение Дирихле, для оценки сходства отдельных геномов. В общей сложности 2535 человек из проекта 1000 геномов (KGP) были использованы для демонстрации нашего метода. Были изучены различные аспекты выбора варианта и выбора параметров модели.Мы обнаружили, что относительно редкие (0,001<частота аллеля < 0,175) и разреженные (средний интервал > 20 000  п.н.) варианты более эффективны для оценки сходства генома. Необходимо не менее 100 000 таких вариантов. В наших результатах популяции показывают значительно менее смешанную и более связную визуализацию, чем результаты PCA. Глобальное сходство геномов KGP согласуется с известными географическими, историческими и культурными факторами.

1 Введение

Оценка сходства индивидуальных геномов имеет решающее значение для изучения происхождения этнических групп и причин генетических нарушений.В настоящее время стоимость секвенирования всего генома составляет 1000 долларов США, а полный процесс анализа, включая выравнивание последовательностей, определение вариантов и функциональную аннотацию всего генома человека, может быть выполнен всего за 13 часов (Chiang et al. , 2015). Достижения высокопроизводительных технологий секвенирования позволяют осуществлять крупномасштабные проекты секвенирования генома, такие как проект 1000 геномов (KGP), проект UK10K, программа GSP, программа NHLBI TOPMed и программа исследований всех нас (Auer et др., 2016; Коллинз и Вармус, 2015 г.; Проект «Геномы», 2015 г.; Консорциум UK10K, 2015 г.; Ву и др. , 2019). Секвенируются миллионы отдельных геномов. Население, болезни и многие другие исследования могут значительно выиграть от большого объема данных. Независимо от того, как можно использовать данные, оценка локального или глобального сходства геномов между людьми является важным шагом в анализе данных.

Варианты являются основой для оценки сходства генома. В исследованиях популяционной генетики и полногеномных ассоциативных исследованиях (GWAS) основной проблемой является поиск набора вариантов, максимально сходных внутри групп образцов с одинаковыми фенотипами и максимально различающихся между образцами с разными фенотипами; другими словами, соотнесение вариантов генома с группами образцов.Идентифицированный набор вариантов является лучшим показателем сходства генома с точки зрения интересующих фенотипов. Для популяционно-генетических исследований они представляют собой отдельные варианты каждой этнической группы; для исследований генетической ассоциации они представляют собой варианты, связанные с заболеванием (Schaub et al. , 2009). Знание того, как варианты и их функциональные эффекты различаются в разных популяциях, увеличивает нашу способность понимать генетические основы здоровья и болезней (Hindorff et al. , 2018).

Стратификация населения имеет фундаментальное значение в исследованиях генетических ассоциаций.Несколько методов, таких как кластеризация на основе моделей и анализ основных компонентов (PCA), были разработаны для анализа структуры населения в различных типах исследований. СТРУКТУРА — это ранний метод, использующий данные о генотипах нескольких локусов для определения структуры популяции и распределения особей по популяциям (Pritchard et al. , 2000). ADMIXTURE использует основанную на модели оценку происхождения, аналогичную STRUCTURE, и работает значительно быстрее (Александр и др. , 2009). EIGENSTRAT использует PCA для явного моделирования различий в происхождении между случаями и контролем (Galinsky et al., 2016; Паттерсон и др. , 2006; Цена и др. , 2006 г.). LASER оценивает индивидуальное генетическое происхождение непосредственно из чтения нецелевой последовательности без вызова генотипов (Wang et al. , 2014). FRAPPE делает вывод об истории потока генов, используя марковскую скрытую марковскую модель (MHMM) для учета фонового неравновесия по сцеплению (LD), которое существует в наследственных популяциях (Tang et al. , 2006). Метод регрессии используется для сопоставления вариаций в степени геномного несходства/расстояния среди группы индивидуумов (Wessel and Schork, 2006).Чен и др. (2016) предложила логистическую смешанную модель для проверки ассоциации между бинарным признаком и отдельными генетическими вариантами. Представлен подход на основе расстояния для вывода о структуре популяции с использованием генетических данных путем определения структуры популяции с использованием терминологии и методов теории сетей (Greenbaum et al. , 2016). Для связанных лиц PC-Relate использует основные компоненты, рассчитанные на основе данных геномного скрининга, чтобы отличить семейное родство от структуры популяции (Conomos et al. , 2016). Yazdani and Dunson (2015) также предложили гибридный байесовский подход для рассмотрения семейной зависимости в GWAS.

Существующие подходы сосредоточены на изучении структуры популяции и общих взаимоотношений между популяциями. Входными данными методов являются наборы вариантов, определяемые исследователями, которые в большинстве популяционных исследований представляют собой общие SNP на основе массивов. Поскольку у обычных SNP нет возможности изучать точные различия между геномами на индивидуальном уровне, часто приходится проводить импутацию (Das et al., 2016). Усовершенствованная технология секвенирования выявляет все больше и больше редких вариантов массивных индивидуальных геномов, что позволяет проводить оценку сходства геномов на индивидуальном уровне. Однако современные методологии, такие как PCA, не могут полностью использовать редкие варианты, а также их трудно интерпретировать с точки зрения популяционной генетики.

Здесь мы представили вероятностную топическую модель, латентное распределение Дирихле (LDA), для оценки сходства отдельных геномов. LDA — это метод обучения без учителя, разработанный для моделирования корпусов текстов или других коллекций неупорядоченных дискретных данных (Blei et al. , 2003) и определяется в более строгой вероятностной структуре, которая гарантирует, что найденные скрытые переменные сохраняют существенные статистические взаимосвязи, и предоставляет ряд инструментов для основных задач, таких как классификация, обнаружение новизны, обобщение, а также суждения о сходстве и релевантности (Behr ). и др. , 2016; Blei, 2012).

LDA и другие тематические модели применяются в различных аспектах исследований в области биоинформатики, таких как обнаружение новых сигнатур мутаций (Matsutani et al. , 2019), анализ состава микробиома (Abe et al. , 2018; Yan et al. , 2017), анализ текстов литературы по биоинформатике (Heo et al. , 2017) и клинические отчеты (Arnold et al. , 2016), а также исследование субструктуры в метаболомике (Der Hooft et al. , 2016), взаимосвязях путь-лекарство (Pratanwanich and Lio, 2014) и генной онтологии (Liu et al. , 2018).

Геном похож на книгу. В нашем исследовании модель LDA использовалась для выявления скрытых «тем» «книги».По сравнению с основными компонентами метода PCA «темы» LDA можно интерпретировать как предполагаемых предков. Модель LDA описывает людей как смешение предполагаемых предков и характеризует каждое предполагаемое происхождение как распределение по вариантам. Варианты являются «словами» «книги» и подразумевают особенность отдельных геномов.

В этой статье, во-первых, был предложен ранговый балл (RS) для измерения близости между предполагаемым сходством генома и истинной правдой.Во-вторых, мы изучили различные аспекты выбора вариантов и параметров при оценке сходства индивидуальных геномов. Затем мы проанализировали 2535 человек из проекта «1000 геномов» и визуализировали сходство индивидуальных геномов. Наконец, несколько наборов данных моделирования использовались для проверки возможностей модели LDA, демонстрации способности к обобщению и оценки вычислительной производительности.

2 Материалы и методы

2.1 Физические лица КГП

Всего в этом исследовании участвовало 2535 особей, включая 2504 неродственных особи и 31 родственницу КГП. Мы загрузили файлы данных VCF для отдельных вариантов генома с FTP-сайта 1000 Genomes Project (дополнительная таблица S1).

2.2 Рейтинговый балл

RS был предложен для измерения близости между оцененным сходством индивидуального генома и истинной правдой.

Сходства между размерами геномов различны и могут быть охарактеризованы.Индивидуальный геном идентичен самому себе, и в целом геномы близких родственников более схожи, чем геномы случайных особей, геномы одной популяции более сходны, чем геномы разных популяций, а геномы одной суперпопуляции более сходны, чем геномы разных популяций. из разных суперпопуляций. Другими словами, хотя нет точного измерения для описания сходства де-факто между геномами, основанного на отношениях, сходство между геномом и другими геномами можно сравнивать, упорядочивать и наблюдать как истину, т. е.е. эталонный рейтинг (рис. 1).

Рис. 1.

Расчет RS: эталонное ранжирование, смоделированное ранжирование и случайное ранжирование. Для каждого индивидуума I j эталонный рейтинг представляет собой порядок сходства de facto между ним и всеми остальными геномами, порядок сходства определяется отношениями между I j и другими индивидуумами. Лица, имеющие одинаковое отношение к I j , группируются вместе.Группы упорядочены по типам отношений с I j , как показано в таблице 1. Каждая группа G i имеет верхний индекс G ic и нижний индекс G , если 0 0 , которые являются границами группы. Для каждого отдельного I j смоделированное ранжирование основано на предполагаемом моделью сходстве между I j и всеми другими геномами. Если индивидуум I k занял неправильную позицию k’ , которая выходит за границы исходной группы I k’ s, можно рассчитать ошибочные позиции I k . В то время как случайным образом каждый человек имеет равную вероятность оказаться в любой позиции. Таким образом, ожидание RMP также может быть рассчитано. RS рассчитывается путем сравнения ошибочных позиций между смоделированным рейтингом и случайным рейтингом

Рис. 1.

Расчет RS: эталонный рейтинг, смоделированный рейтинг и случайный рейтинг. Для каждого индивидуума I j эталонный рейтинг представляет собой порядок сходства de facto между ним и всеми остальными геномами, порядок сходства определяется отношениями между I j и другими индивидуумами.Лица, имеющие одинаковое отношение к I j , группируются вместе. Группы упорядочены по типам отношений с I j , как показано в таблице 1. Каждая группа G i имеет верхний индекс G ic и нижний индекс G , если 0 0 , которые являются границами группы. Для каждого отдельного I j смоделированное ранжирование основано на предполагаемом моделью сходстве между I j и всеми другими геномами. Если индивидуум I k занял неправильную позицию k’ , которая выходит за границы исходной группы I k’ s, можно рассчитать ошибочные позиции I k . В то время как случайным образом каждый человек имеет равную вероятность оказаться в любой позиции. Таким образом, ожидание RMP также может быть рассчитано. RS рассчитывается путем сравнения неправильно ранжированных позиций между смоделированным ранжированием и случайным ранжированием

Количественное сходство между отдельными геномами можно вывести с помощью различных моделей, напримерграмм. Самый простой метод — подсчитать количество общих вариантов двух геномов. Для нескольких людей можно ранжировать количественное сходство между одним геномом и всеми другими геномами. Чем ближе этот результат ранжирования к эталонному ранжированию, тем точнее смоделированное сходство с истинной реальностью.

RS характеризует согласованность между смоделированным рейтингом и эталонным рейтингом.

Как показано на рисунке 1, для отдельного генома I 5 каждый геном I k ( k  = ) отнесен к группе 1 0 902 909, …, на основе ссылочного ранжирования.Каждая ранговая группа G i имеет граничные ранги группы, то есть верхний предел группы G ic и нижний предел группы G if . Всего имеется 10 групп, как показано в таблице 1.

9079 —
Ранг . Связь с I . Примечания .
0 0
1 Родители, братьев и сестер, дети
9 2
3 Третье -Заформенные родственники 4 4 в одной и той же группе подпопуляции
5
6 в аналогичных популяциях в континентальной группе а   д. грамм. GBR & CEU… b  
7 В других популяциях внутри континентальной группы например. IBS & FIN… 
В сходных популяциях в разных континентальных группах  например. IBS & CLM…
9 В других популяциях в континентальных группах например. FIN и JPT… 
9079 —
Ранг . Связь с I . Примечания .
0 0
1 Родители, братьев и сестер, дети
9 2
3 Третье -Заформенные родственники 4 4 в одной и той же группе подпопуляции
5
6 в аналогичных популяциях в континентальной группе а   д. грамм. GBR & CEU… b  
7 В других популяциях внутри континентальной группы например. IBS & FIN… 
В сходных популяциях в разных континентальных группах  например. IBS & CLM…
9 В других популяциях в континентальных группах например. FIN и JPT… 
9079 —
Ранг . Связь с I . Примечания .
0 0
1 Родители, братьев и сестер, дети
9 2
3 Третье -Заформенные родственники 4 4 в одной и той же группе подпопуляции
5
6 в аналогичных популяциях в континентальной группе а   д. грамм. GBR & CEU… b  
7 В других популяциях внутри континентальной группы например. IBS & FIN… 
В сходных популяциях в разных континентальных группах  например. IBS & CLM…
9 В других популяциях в континентальных группах например. FIN и JPT… 
9079 —
Ранг . Связь с I . Примечания .
0 0
1 Родители, братьев и сестер, дети
9 2
3 Третье -Заформенные родственники 4 4 в одной и той же группе подпопуляции
5
6 в аналогичных популяциях в континентальной группе а   д. грамм. GBR & CEU… b  
7 В других популяциях внутри континентальной группы например. IBS & FIN… 
В сходных популяциях в разных континентальных группах  например. IBS & CLM…
9 В других популяциях в континентальных группах например. FIN & JPT …
Согласно сходству до I 5 , данные определенной моделью, каждый геном I K ( K = 1, 2, …, N ) занимает правильную/неправильную позицию k′ ( k′ = 1, 2, …, n ).Пусть Misranked Positions (MP) обозначает отклонение позиции от назначенной ранговой группы, тогда

MPIk=Gif-k’, k’Gic, (Ik∈ Gi)

(1) Таким образом, среднее ошибочное ранжирование позиций (AMP) I 5 является случайным образом, каждый человек имеет равную вероятность оказаться на любой позиции. Таким образом, случайное положение индивида I k следует дискретному равномерному распределению. Математическое ожидание случайных неправильно ранжированных позиций (RMP) можно рассчитать следующим образом: Gic=12n·Gif2-Gif+Gic2-2n+1·Gic+n+12, Ik∈Gi

(3) Таким образом, среднее значение случайных ошибочных позиций (ARMP) I 5 равно

ARMPI5=1n· ∑k=1nRMPIk 

(4) Мы определили RS каждого индивидуума RS Ij как отношение ARMP к AMP,

RSIj=ARMPIjAMPIj, (j=1, 2, …,n) 

(5)И RS для всего набора данных определяется как среднее значение RS для каждого индивидуума:

AMP описывает среднее расстояние между рейтингом подобия, выведенным моделью, и эталонным рейтингом.Более точная оценка сходства может привести к снижению AMP, что указывает на то, что больше людей ранжируются в правильном порядке или, по крайней мере, находятся ближе к правильным позициям. Если все люди правильно ранжированы в свои группы, AMP равен 0. Если ранжирование, выведенное моделью, хуже, чем случайный случай, AMP больше, чем ARMP.

Когда AMP равен 0, это указывает на то, что рейтинг, выведенный моделью, так же точен, как и эталонный рейтинг. Модели, ранжирующие всех людей правильно, являются лучшими оценками, и их точность эквивалентна друг другу.В этом случае RS не может быть рассчитан после деления на 0,

. За исключением приведенного выше случая, осмысленная модель должна давать AMP в диапазоне от 2/ n до ARMP. Соответствующий RS находится в диапазоне от 1 до ARMP *n /2.

RS показывает, во сколько раз ранжирование сходства генома, выведенное моделью, ближе к истинному, чем случайный случай. Лучшая модель оценки подобия получит более высокий RS.

2.3 Модель LDA для оценки сходства индивидуальных геномов

В этой статье LDA использовался для оценки сходства между отдельными геномами (дополнительная рис.С1). Основная идея заключалась в том, что геномы представлены в виде случайных смесей по латентным предкам (темам), где каждое происхождение характеризуется распределением по вариантам (словам). Модель сделала вывод о предках людей на основе наблюдения за вариантами их геномов.

Модель LDA при оценке сходства геномов предполагает следующий генеративный процесс для каждого из M геномов, I : где N обозначает распределение количества отдельных вариантов, а θ обозначает параметр полиномиального распределения.

  1. Выберите N ∼ Пуассона (ξ).

  2. Выберите θ ∼ Направление (α).

  3. Для каждого из вариантов N w n :

  4. Выберите родословную z n 902 (мультиномиальная).

  5. Выберите вариант W N от P ( W ( W N | Z N , β), многоизоляционная вероятность, кондиционированная на предков Z N .

Модель LDA предполагает, что размерность T распределения Дирихле, т. е. размерность переменной происхождения z известна и фиксирована. Вариант вероятностей для предки параметризован на T × V Matrix β , где β IJ = P ( W J = 1 | Z I = 1) , V обозначает размер полной комплектации всех возможных вариантов.Матрица β может быть оценена в процессе машинного обучения.

Количество отдельных вариантов N не обязательно должно быть распределением Пуассона. При необходимости можно использовать любое реалистичное распределение, N не зависит от всех других переменных, генерирующих данные ( θ и z ), и поэтому его случайность обычно игнорируется в модели LDA.

Модель LDA может быть решена с помощью вариационного метода максимизации байесовского ожидания (VBEM) или методов выборки Гиббса.Были оценены как матрица варианта происхождения ( β , T × V ), так и матрица индивидуального происхождения ( M × T ). Каждая строка матрицы предков-вариантов, т. е. распределения вероятностей вариантов, указывает репрезентативные варианты предков; каждая строка матрицы индивидуального происхождения, т. Е. Распределение вероятности происхождения, указывает пропорции смешанного происхождения индивидуального генома. Расстояние Хеллингера использовалось для количественной оценки сходства между двумя распределениями вероятностей.Таким образом, сходство геномов было представлено расстояниями Хеллингера между распределениями вероятностей происхождения. Модель LDA была реализована пакетом «topicmodels» R (R Core Team, 2013) (Hornik and Grün, 2011).

2.4 Визуализация сходства индивидуальных геномов

Метод многомерного масштабирования (MDS) использовался для визуализации сходства отдельных геномов.

И модель LDA, и метод PCA оценивают попарное сходство или расстояние между отдельными геномами.В случае LDA сходство генома количественно определяется расстоянием Хеллингера между распределениями Дирихле по латентным предкам. В случае PCA сходство генома количественно определяется евклидовым расстоянием между векторами главных компонентов.

И распределения Дирихле, и векторы главных компонент находятся в многомерном пространстве и не могут быть визуализированы напрямую. Метод MDS представляет собой форму нелинейного уменьшения размеров. Учитывая оцененные расстояния, он помещает каждого человека в двухмерную систему координат, сохраняя при этом относительные расстояния между геномами, насколько это возможно.

Метод MDS итеративно упорядочивает двумерные координаты людей, позволяя расстояниям между ними приблизиться к исходным расстояниям. В этой статье это было реализовано с помощью пакета R «smacof» (De Leeuw and Mair, 2011).

3 результатов

3.1 Выбор варианта и параметра модели

Точность оценки сходства отдельных геномов зависит от размера выборки, параметров модели и выбора исходных вариантов. На рис. 2 показано влияние этих факторов на РС.

Рис. 2.

Влияние параметров модели и выбора варианта, включая взаимосвязь между RS и ( a ) количеством предков T в моделировании LDA, ( b ) количеством вариантов, ( c ) вариантная дисперсия, ( d , e ) AF, ( g ) как AF, так и вариантная дисперсия, (g) варианты типов. Для каждой точки данных RS представляет собой среднее значение RS, рассчитанное путем случайного выбора вариантов 10 раз.( h ) Распределение AF SNP и INDEL с использованием в (g)

Рис. 2.

Влияние параметров модели и выбора вариантов, включая взаимосвязь между RS и ( a ) количеством предков T в моделировании LDA, ( b ) количество вариантов, ( c ) вариант дисперсии, ( d , e ) AF, ( g ) как AF, так и вариант дисперсии, (g) вариант типы. Для каждой точки данных RS представляет собой среднее значение RS, рассчитанное путем случайного выбора вариантов 10 раз.( h ) Распределение AF SNP и INDEL с использованием в (g)

Чем больше размер выборки, тем лучше результат оценки. Все 2535 человек из проекта «1000 геномов» были использованы в следующем анализе.

Для особей KGP модель LDA получила самый высокий RS, когда параметр T  = 17, что указывает на то, что 17 предполагаемых предков лучше всего объясняют структуру популяции KGP (рис. 2a).

Использование большего количества вариантов приводит к более высокому RS.Ввод всех вариантов индивидуумов в модель неэффективен и требует больших вычислительных ресурсов. Для определения достаточного количества вариантов была проведена серия тестов с использованием 1 000–1 000 000 вариантов. Как показано на рисунке 2b, когда вариантов меньше 100 000, увеличение номера варианта резко повышает производительность модели. Однако слишком много (например, более 300 000) вариантов не обязательно.

Более редкий выбор вариантов приводит к более высокому RS (рис. 2c). Одинаковое количество вариантов было выбрано случайным образом из геномных участков разной длины.В среднем более близкие варианты вносят меньший вклад в оценку сходства индивидуальных геномов, вероятно, из-за LD.

Варианты с разной частотой аллелей (AF) имеют разную точность оценки. Как правило, более редкие варианты приводят к более высоким RS (рис. 2d). Однако более широкий диапазон автофокусировки работает лучше. Точность достигает максимума при изменении АФ входных вариантов от 0,001 до 0,175 (рис. 2д).

Использование вариантов с большим средним расстоянием и меньшей AF может аналогичным образом уменьшить LD среди выбранных вариантов.Таким образом, мы дополнительно оценили RS по вариантной дисперсии и параметрам AF (рис. 2f). Как показано на тепловой карте, более распространенные варианты работают лучше за счет увеличения дисперсии вариантов. Однако в экспериментах было отобрано 100 000 вариантов, наибольшее среднее расстояние составляет примерно 29 500 пн. Возможности для увеличения дисперсии вариантов ограничены.

Варианты в областях вблизи теломер, как правило, более эффективны для оценки сходства отдельных геномов. Как показано на дополнительном рисунке S2, весь геном разделен на 305 областей.Размер каждого региона составляет 10 000 000 баз. RS были рассчитаны с использованием вариантов в этих регионах. Верхние 10% RS обогащены областями вблизи теломер. Это может быть из-за меньшей сохранности и большего количества вариантов. Также было замечено, что RS не полностью коррелируют с количеством вариантов; некоторые области, прилегающие к теломерам, набирают 10% лучших, но не содержат 10% лучших вариантов. Между вариантами существует сильная связь, ограниченная размером регионов. RS относительно низки при использовании только местных вариантов.

Для оценки сходства отдельных геномов использовали либо SNV, либо INDEL. Модели, использующие SNV, получили более высокие RS, чем модели, использующие INDEL (рис. 2g). Обе модели включали одинаковое количество SNV или INDEL. Это может быть связано с тем, что INDEL имеют более высокий AF и более низкое разнообразие среди популяций (рис. 2h).

3.2 Оценка сходства геномов лиц KGP

Для демонстрации нашего метода мы используем 2535 участников проекта «1000 геномов». Сходство генома было количественно определено расстоянием Хеллингера между распределениями Дирихле по латентным предкам особей KGP.Расстояния Хеллингера впоследствии были визуализированы методом МДС.

Как показано на рисунке 3a, за исключением популяций AMR, особи из одних и тех же суперпопуляций сгруппированы. Внутри этих суперпопуляций люди более тесно сгруппированы с точки зрения субконтинентального населения. Особи из сходных популяций, таких как CEU и GBR, YRI и ESN, ITU и STU, CHB и CHS, полностью или частично смешиваются друг с другом.

Рис. 3.

Сходство геномов между особями KGP.( a ) Визуализация сходства геномов между людьми KGP, T  = 17, с использованием 500 000 случайных вариантов всего генома, 0,001 Точки разной формы представляют людей из различные континентальные группы, т.е. суперпопуляции. Точки одинаковой формы разного цвета представляют особей из разных субконтинентальных популяций. Расстояния между точками представляют относительное сходство геномов между людьми.( b ) Географическое положение каждой популяции. ( c ) Сравнение PCA и LDA в оценке сходства генома KGP с использованием 500 000 случайных вариантов из всего генома, 0,001 d ) Визуализация сходства генома индивидуумов KGP с использованием метода PCA, число ПК = 8, с использованием того же набора вариантов, что и (a), который составляет 500 000 случайных вариантов из всего генома, 0,001

Рис. 3.

Сходство геномов между людьми KGP. ( a ) Визуализация сходства геномов между людьми KGP, T  = 17, с использованием 500 000 случайных вариантов всего генома, 0.001 b ) Географическое положение каждой популяции. ( c ) Сравнение PCA и LDA в оценке сходства генома KGP с использованием 500 000 случайных вариантов из всего генома, 0.001 d ) Визуализация сходства генома особей KGP с использованием метода PCA, номер ПК = 8, с использованием того же набора вариантов, что и (a ), что составляет 500 000 случайных вариантов из всего генома, 0,001 В случае LDA сходство генома количественно определяется расстоянием Хеллингера между распределениями Дирихле по латентным предкам. В случае PCA сходство генома количественно определяется евклидовым расстоянием между векторами главных компонентов

Ряд общепринятых консенсусов четко показан на рисунках 3a и b.Точки реже встречаются в смешанных популяциях, что указывает на меньшее сходство геномов. Чем больше площадь точек, покрываемых населением, тем более смешанным является население. Географически изолированные популяции, т.е. JPT, FIN, BEB и LWK отделены от других популяций в той же континентальной группе. Популяции AFR менее смешаны и более сплочены, чем популяции из других континентальных групп, за исключением ACB и ASW, которые фактически отобраны из США и Карибского бассейна и предположительно имеют европейское и индейское происхождение.В суперпопуляции AMR PUR и CLM расположены между EUR и AFR, популяция PEL несет наибольшую долю уникального происхождения, отличного от всех других популяций. Взаимное положение субконтинентальных популяций аналогично местам их проживания. Визуализация показывает, что сходство генома KGP, оцененное с помощью модели LDA, хорошо согласуется с известными географическими, историческими и культурными факторами.

Основываясь на RS, модель LDA работает значительно лучше, чем простой метод PCA в оценке сходства генома (рис.3с). Для метода PCA сходство генома количественно оценивали по евклидову расстоянию между векторами PC индивидуумов KGP. Модель, включающая восемь ПК, достигает наивысшего RS, а большее количество ПК приводит к более низким баллам. Первые 8 ПК объясняют примерно 12,1% дисперсии, а первые 3 ПК объясняют 10,9%. Координаты трех верхних ПК могут отличать только суперпопуляции друг от друга (дополнительный рис. S3).

Евклидовы расстояния также визуализируются методом МДС (рис. 3г).Распределение на уровне суперпопуляции согласуется с результатом LDA. Однако способность PCA различать субконтинентальные популяции ниже, чем у LDA. Например, в результатах PCA все популяции CEU/GBR, TSI и IBS смешаны вместе, в то время как в результатах LDA границы между ними более четкие. Подобные случаи наблюдаются в PJL/GIH и ITU/STU, CHS/CHB и CDX/KHV и т. д.

Простой метод PCA иногда дает неправильную оценку сходства генома у некоторых индивидуумов.Например, части особей LWK, MXL и PEL отделены от их собственных популяционных кластеров, в то время как в результатах LDA особи этих популяций связаны.

При оценке сходства генома люди из разных популяций получают неодинаковые AMP. Как показано на дополнительном рисунке S4, люди из географически или культурно близких групп населения вносят много неправильных оценок, таких как CHB / CHS, PJL / GIH, GBR / CEU, ESN / YRI и так далее. Популяции AMR также вносят значительный вклад в неправильное ранжирование, предположительно из-за их исторического происхождения от популяций EUR и AFR.Основываясь на этом результате, мы можем разумно сделать вывод, что вместо ранжирования, выведенного моделью, неточность эталонного ранжирования может быть источником части AMP. Более того, на дополнительном рисунке S4 показано, что модель LDA работает лучше, чем метод PCA, при указанных выше географических, исторических и культурных влияниях.

По сравнению с существующими методами модель LDA способна фиксировать больше субконтинентальных характеристик популяции, что необходимо для получения более высокого RS. Как показано на дополнительном рисунке S5, мы сравнили производительность модели LDA, метода PCA (функция prcomp в R), модуля «smartpca» EIGENSTRAT и инструмента ADMIXTURE.Были протестированы различные номера темы/ПК, только LDA постоянно получал более высокие RS при моделировании данных с большим количеством (> 10) скрытых предков, что указывает на то, что LDA встраивает в модель больше деталей на уровне популяции. В то время как метод PCA достигает самого высокого RS, когда PC   =   9, модуль «smartpca» EIGENSTRAT достигает самого высокого RS, когда PC   =   3, а ADMIXTURE достигает самого высокого RS, когда K   =   5. Это объясняет, почему LDA лучше подходит для различения субконтинентальных популяций. чем PCA (рис. 3a и d).

3.3 Оценка сходства геномов новых образцов

На основе модели, полученной от особей КГП, можно рассчитать смесь предполагаемых предков новых выборок. Здесь мы смоделировали 1000 новых индивидуальных геномов из набора данных KGP, сделали вывод об их латентном происхождении и оценили сходство между известными отдельными геномами и новыми.

Как показано на рисунке 4a, для каждого смоделированного индивидуума I k сначала была выбрана случайная совокупность P k , которая была присвоена I I 0 ’ Тогда для каждого варианта V J , случайный элемент 9 I 9 I из P K был выбран, его генотип г IJ был назначен как генотип моделируемого человека I к в В j . Этот процесс гарантировал, что вероятность того, что смоделированный индивидуум является носителем варианта, согласуется с его AF в заданной популяции.

Рис.4.

Оценка сходства геномов новых образцов. ( a ) Новая стратегия имитации образца. ( b ) Визуализация сходства геномов как у KGP, так и у смоделированных людей. Варианты, используемые в моделировании новых образцов и моделировании LDA, представляют собой те же варианты, что и на рисунке 3a, которые представляют собой 500 000 случайных вариантов из всего генома, 0,001 T  = 17

Рис.4.

Оценка сходства геномов новых образцов. ( a ) Новая стратегия имитации образца. ( b ) Визуализация сходства геномов как у KGP, так и у смоделированных людей. Варианты, используемые в моделировании новых образцов и моделировании LDA, представляют собой те же варианты, что и на рисунке 3a, которые представляют собой 500 000 случайных вариантов из всего генома, 0,001 T  = 17

Смоделированные особи использовались для оценки модели LDA, полученной от особей KGP. Вводя варианты, несущие образец каждого нового образца, в модель LDA, смесь предполагаемых предков была рассчитана для смоделированного индивидуума. Попарное сходство как между KGP, так и смоделированными людьми было количественно определено с помощью расстояния Хеллингера между распределениями Дирихле по латентным предкам. Затем методом МДС визуализировали расстояния Хеллингера.

Как показано на рисунке 4b, все смоделированные особи были правильно сгруппированы и помещены в кластеры соответствующих популяций KGP, что демонстрирует возможности модели и возможности обобщения нашего метода.Мы заметили, что смоделированные особи кажутся сгруппированными даже лучше, чем реальные данные КГП. Это может быть связано с тем, что случайное моделирование вариантов сохранило AF, но полностью удалило связь. На самом деле, когда новые выборки моделировались с помощью стратегии, обеспечивающей большее сцепление (дополнительный рис. S6a), смоделированные особи каждой популяции группировались менее сплоченно (дополнительный рис. S6b).

3.4 Вычислительная производительность модели LDA

Были исследованы вычислительные характеристики модели LDA как для KGP, так и для нескольких более крупных наборов данных моделирования.Как показано в таблице 2, мы сравнили модель LDA, функцию «prcomp» (PCA) в R, модуль «smartpca» EIGENSTRAT и инструмент ADMIXTURE в наборе данных KGP, используя 100 000 случайно выбранных вариантов, 0,001 < AF. < 0,5.

Таблица 2.

Вычислительная производительность LDA и других моделей

6
Модель . Размер образца . Память (ГБ) . Время (ч) . Очки рейтинга .
ЛДА 100 000 167 18,8
ЛДА 70 000 111 12,8
ЛДА 50 000 84 80780 8. 9
LDA 30 000 31 5.2
LDA 20 000 14 3.5
10 000 9 9 1.8
LDA 2535 (KGP) 5 0.2 26.6 ( T = 17)
PCA 2535 (KGP) 5 5 2 18.5 ( T = 9)
Eigen_PCA 2535 (KGP) 0.32 0.3 19.2 ( T = 3)
Примеситель 2535 (KGP) 0.53 3,1 13.8 ( T = 5)
6 9 5
Модель . Размер образца . Память (ГБ) . Время (ч) . Очки рейтинга .
LDA  100 000  167  18.8
70780 70 000 111 12.8
84 8.9
LDA 30 000 31 5.2 5.2
LDA 20 000 14 35
LDA 10 000 9 1.8
LDA 2535 (KGP) 5 0.2 26,6 ( T = 17)
PCA 2535 (KGP)
2.2 18.5 ( T = 9)
EIGEN_PCA 2535 (KGP) 0.32 0.3 19.2 ( T = 3)
Axixty 2535 (KGP) 0.53 3.1 13,8 ( T  =5)
Таблица 2.

Вычислительная производительность LDA и других моделей

. Размер образца . Память (ГБ) . Время (ч) . Очки рейтинга .
LDA 100 000 167 187 18.8
LDA 70 000 111 12.8
50 000 50 000 84 8.9
30 000 31 5,2
LDA 20 000 14 3.5
LDA 10 000 9 1.8
LDA 2535 (KGP) 5 0.2 26.6 ( T = 17)
PCA 2535 (KGP) 5 999 5 29 18. 5 ( T = 9)
Eigen_PCA 2535 (KGP) 0.32 0.3 0.3 19.2 ( T = 3)
Примеситель 2535 (KGP) 0.53 3,1 13.8 ( T = 5)
0
Модель . Размер образца . Память (ГБ) . Время (ч) . Очки рейтинга .
ЛДА 100 000 167 18,8
ЛДА 70 000 111 12,8
ЛДА 50 000 84 8.9  — 
LDA  30 000  31  5.2
LDA 20 000 14 35
LDA 10 000 9 1,8
LDA 2535 (КГП ) 5 0. 2 0,2 26.6 ( T = 17)
PCA 2535 (KGP) 5 2 18.5 ( T = 9)
Eigen_PCA 2535 (КГП) 0.32 0.3 0.3 19.2 ( T = 3)
Примеситель 2535 (KGP) 0.53 3,1 13.8 ( T = 5)

в сравнении из четырех инструментов модель LDA получила самый высокий RS за кратчайшее время процессора. Но модель LDA считывает все данные в память, ее использование памяти самое большое.

Мы также тестируем возможности LDA, используя смоделированные наборы данных с размером выборки от 10 до 100 K.Поскольку оценивалось попарное сходство отдельных геномов, использование памяти резко увеличивалось с ростом размера выборки. Когда набор данных включает 100 000 образцов, требуется более 167 ГБ памяти. В этом случае время моделирования составляет 18,8 ч.

4 Обсуждение

В этой статье мы предложили РС для оценки характеристик различных моделей и параметров. Затем мы применили модель LDA для анализа сходства геномов 2535 человек из проекта «1000 геномов», а также нескольких наборов данных моделирования.Были исследованы обобщающая способность и вычислительная производительность модели.

RS предназначен для измерения близости между результатом, оцененным моделью, и реальными данными. Он предназначен в качестве метрики для исследования лучших моделей и соответствующих параметров. Затем такие модели и параметры можно применять к неизвестным наборам данных.

RS определяется как отношение ARMP к AMP. Интуитивно это соотношение характеризует, во сколько раз случайное ранжирование более далеко от «реального» ранжирования, чем ранжирование, выведенное моделью.

Однако метод, обеспечивающий правильное ранжирование отдельного лица, получит значение AMP, равное 0, и, следовательно, бесконечный RS для всего набора данных. Таким образом, мы предложили альтернативную метрику «Точность ранжирования» (RA).

RA каждого отдельного RA Ij определяется следующим образом:

RAIj=ARMPIj-AMPIjARMPIj, (j=1, 2, …,n) 

(7) А точность ранжирования для всего набора данных определяется как среднее значение точности ранжирования для каждого человека:

. RA описывает модель, которая удаляет из результата случайные ошибки ранжирования и насколько близко результат приближается к истине.Если модель не дает ранжирования хуже, чем случайный случай, RA находится в диапазоне от 0 до 1.

Метрика RA в основном эквивалентна RS, а проблема «AMP» = 0 хорошо решается.

Когда AMP равен 0, RA равен 1, что указывает на то, что все случайные значения были удалены, результат такой же точный, как и на земле. столь же неточна, как и случайный случай. Модель, дающая результат хуже, чем случайное ранжирование, бессмысленна.В этом случае RA меньше 0.

Модель LDA представляет собой метод обучения без учителя и, следовательно, требует меньше предварительных знаний об отдельных геномах. Напротив, он извлекает знания из данных, даже исправляя ошибки маркировки. Как только модель изучена, можно рассчитать смесь предполагаемых предков новых образцов и оценить сходство между известными отдельными геномами и новыми. На основании этой информации новые образцы без меток могут быть сгруппированы в известные классы.

Скрытые темы или «предполагаемые предки» в нашем исследовании являются основным знанием, которое модель LDA обнаружила из данных. Результатом обучения может быть поправка на происхождение в моделях тестирования генетической ассоциации.

В модели LDA предполагаемые предки являются вариантами переноса особей. Каждое латентное происхождение объясняет происхождение части вариантов, которые носит индивидуум. Поскольку LDA не контролируется, предполагаемые предки не обязательно связаны с нынешними или древними популяциями, которые действительно существовали.Однако в идеале предполагаемое происхождение должно подразумевать репрезентативный набор вариантов, общих для группы генетически близких людей.

Индивидуум может иметь смешанное предполагаемое происхождение, но только к одной популяции. Различный и похожий состав предков объясняет популяции и их размытые границы. Благодаря этой встроенной функции LDA может моделировать смешанных людей.

Набор «внутренних» вариантов каждого предполагаемого происхождения также является важным знанием, которое модель LDA извлекла из данных.Основываясь на модели LDA, каждый вариант имеет вероятность быть выбранным с учетом предполагаемого происхождения. При ранжировании вероятностей варианты расставляются по приоритету с точки зрения отношения к происхождению. Могут быть обнаружены наиболее репрезентативные варианты.

«Сходство генома» характеризует генетическое родство двух людей. Коннотация понятия меняется в зависимости от контекста исследования. Например, при изучении генетического расстройства «сходство генома» отличается от его коннотации в популяционных исследованиях.В этой статье термин «сходство генома» используется с точки зрения стратификации населения; таким образом, скрытым параметром является «предполагаемое происхождение». Однако модель LDA также может быть модифицирована и расширена на другие области исследований генома, такие как исследования генетических нарушений.

Финансирование

Эта работа была поддержана Фондом естественных наук Китая [31601072], Фондом естественных наук провинции Хэйлунцзян [QC2016027], Китайским фондом постдокторских наук [2015M581458], Хэйлунцзянским фондом постдокторских исследований [LBH-Z15059] и Национальным ключевым научно-исследовательским центром. Программа Китая [2017YFC03].

Конфликт интересов : не объявлено.

Каталожные номера

Абэ

К.

и другие. (

2018

)

Модель латентного распределения для анализа микробного состава и заболеваний

.

Биоинформатика BMC

,

19

,

171

177

.

Александр

Д.Х.

и другие. (

2009

)

Быстрая оценка происхождения неродственных особей на основе моделей

.

Геном Res

.,

19

,

1655

1664

.

Арнольд

CW

и другие. (

2016

)

Оценка интерпретируемости тематической модели с точки зрения лечащего врача

.

Вычисл. Методы Программы Биомед

.,

124

,

67

75

.

Ауэр

П.Л.

и другие. (

2016

)

Руководящие принципы для крупномасштабных исследований ассоциаций сложных признаков на основе последовательностей: уроки, извлеченные из проекта секвенирования экзома NHLBI

.

утра. Дж. Хам. Жене

.,

99

,

791

801

.

Бер

А.А.

и другие. (

2016

)

pong: быстрый анализ и визуализация латентных кластеров в популяционных генетических данных

.

Биоинформатика

,

32

,

2817

2823

.

Блей

Д.М.

(

2012

)

Вероятностные тематические модели

.

Комм. АКМ

,

55

,

77

84

.

Блей

Д.М.

и другие. (

2003

)

Скрытое распределение Дирихле

.

Дж. Маха. Учить. Рез

.,

3

,

993

1022

.

Чен

Х.

и другие. (

2016

)

Контроль структуры популяции и родства бинарных признаков в исследованиях генетических ассоциаций с помощью смешанных логистических моделей

.

утра. Дж. Хам. Жене

.,

98

,

653

666

.

Чианг

К.

и другие. (

2015

)

SpeedSeq: сверхбыстрый персональный анализ и интерпретация генома

.

Нац. Методы

,

12

,

966

968

.

Коллинз

Ф.С.

,

Вармус

Х.

(

2015

)

Новая инициатива в области точной медицины

.

Н. англ. J. Med

.,

372

,

793

795

.

Кономос

М.П.

и другие. (

2016

)

Безмодельная оценка недавнего генетического родства

.

утра. Дж. Хам. Жене

.,

98

,

127

148

.

Дас

С.

и другие. (

2016

)

Служба и методы вменения генотипа нового поколения

.

Нац. Жене

.,

48

,

1284

1287

.

Де Леу

Дж.

,

Майр

П.

(

2011

) Многомерное масштабирование с использованием мажорации: SMACOF в R.

J. Stat. ПО

, 31. 10.18637/jss.v031.i03.

Дер Хоофт

Дж.Дж.Дж.В.

и другие. (

2016

)

Тематическое моделирование для нецелевого исследования подструктуры в метаболомике

.

Проц. Натл. акад. науч. США

,

113

,

13738

13743

.

Галинский

К.Дж.

и другие. (

2016

)

В структуре населения биобанка Великобритании и древних евразийцев обнаружена адаптация генов, влияющих на артериальное давление

.

утра. Дж. Хам. Жене

.,

99

,

1130

1139

.

Гринбаум

Г.

и другие. (

2016

)

Вывод и анализ структуры населения с использованием генетических данных и теории сетей

.

Генетика

,

202

,

1299

1312

.

Гео

Г.Е.

и другие. (

2017

)

Анализ области биоинформатики с помощью метода многогранного тематического моделирования

.

Биоинформатика BMC

,

18

,

251

251

.

Хиндорф

Л.А.

и другие. (

2018

)

Приоритизация разнообразия в исследованиях геномики человека

.

Нац. Rev. Genet

.,

19

,

175

185

.

Хорник

К.

,

Грюн

Б.

(

2011

)

тематических моделей: пакет R для настройки тематических моделей

.

Дж. Стат. ПО

.,

40

,

1

30

.

Лю

Л.

и другие. (

2018

)

Частично функциональная модель для предсказания функции белка

.

BMC Genomics

,

19

,

51

64

.

Мацутани

Т.

и другие. (

2019

)

Обнаружение новых сигнатур мутаций путем скрытого распределения Дирихле с вариационным выводом Байеса

.

Биоинформатика

,

35

,

4543

4552

.

Паттерсон

Н.

и другие. (

2006

)

Структура населения и собственный анализ

.

PLoS Genet

.,

2

,

e190

.

Пратанванич

Н.

,

Лио

П.

(

2014

)

Изучение сложности взаимосвязей путь-лекарство с использованием латентного распределения Дирихле

.

Вычисл. биол. Хим

.,

53

,

144

152

.

Цена

А.Л.

и другие. (

2006

)

Анализ основных компонентов корректирует стратификацию в полногеномных ассоциативных исследованиях

.

Нац. Жене

.,

38

,

904

909

.

Притчард

Дж.К.

и другие. (

2000

)

Вывод структуры популяции с использованием данных о многолокусном генотипе

.

Генетика

,

155

,

945

959

.

Основная команда R. (

2013

) R: Язык и среда для статистических вычислений . R Foundation for Statistical Computing, Вена, Австрия.URL-адрес https://www.R-project.org/.

Шауб

М.А.

и другие. (

2009

)

Основанный на классификаторе подход к выявлению генетического сходства между заболеваниями

.

Биоинформатика

,

25

,

i21

29

.

Танг

Х.

и другие. (

2006

)

Реконструкция блоков генетического происхождения у смешанных особей

.

утра. Дж. Хам. Жене

.,

79

,

1

12

.

Проект «Геномы». (

2015

)

Глобальный справочник по генетической изменчивости человека

.

Природа

,

526

,

68

74

.

Уолтер, К. и др.  (

2015

)

Проект UK10K идентифицирует редкие варианты здоровья и болезни

.

Природа

,

526

,

82

90

.

Ван

К.

и другие. (

2014

)

Оценка происхождения и контроль стратификации населения для исследований ассоциаций на основе последовательностей

.

Нац. Жене

.,

46

,

409

415

.

Вессель

Дж.

,

Шорк

Нью-Джерси

(

2006

)

Обобщенная методология регрессии на основе геномного расстояния для анализа мультилокусных ассоциаций

.

утра. Дж. Хам. Жене

.,

79

,

792

806

.

Ву

Д.

и другие. (

2019

)

Крупномасштабное полногеномное секвенирование трех различных азиатских популяций в Сингапуре

.

Ячейка

,

179

,

736

749. e715

.

Ян

Ж.

и другие. (

2017

)

MetaTopics: инструмент интеграции для анализа профиля микробного сообщества по тематической модели

.

BMC Genomics

,

18

,

962

962

.

Яздани

А.

,

Дансон

Д.Б.

(

2015

)

Гибридный байесовский подход для полногеномных ассоциативных исследований родственных особей

.

Биоинформатика

,

31

,

3890

3896

.

© Автор(ы), 2020. Опубликовано Oxford University Press. Все права защищены. Для разрешений, пожалуйста, по электронной почте: [email protected]

.

Добавить комментарий

Ваш адрес email не будет опубликован.