WWW.ДЕНЬСИЛЫ.РФ

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА - Медицина

 

Pages:   || 2 | 3 | 4 | 5 |

Разработка и применение методов полногеномного анализа генетических ассоциаций сложных признаков

-- [ Страница 1 ] --

На правах рукописи

Аульченко Юрий Сергеевич

Разработка и применение методов полногеномного анализа генетических ассоциаций сложных признаков

03.02.07 – генетика

Автореферат

диссертации на соискание ученой степени
доктора биологических наук

Новосибирск

2010

Работа выполнена в лаборатории рекомбинационного и сегрегационного анализа Учреждения Российской академии наук Институт цитологии и генетики Сибирского отделения РАН, г. Новосибирск, Россия

Официальные оппоненты: доктор биологических наук, профессор Маркель А. Л. Институт цитологии и генетики СО РАН, г. Новосибирск доктор биологических наук, профессор Поляков А. В. Медико-генетический научный центр РАМН, г. Москва доктор биологических наук, профессор Гуляева Л. Ф. Научно-исследовательский институт молекулярной биологии и биофизики СО РАМН, г. Новосибирск
Ведущее учреждение: Учреждение Российской академии Медицинских наук НИИ медицинской генетики СО РАМН, г. Томск

Защита диссертации состоится “___” ___________ 2010 г. на утреннем заседании диссертационного совета Д 003.011.01 при Институте цитологии и генетики СО РАН по адресу: 630090, Новосибирск, Россия, пр. ак. Лаврентьева, 10, тел/факс (383) 333-12-78, e-mail: dissov@bionet.nsc.ru

С диссертацией можно ознакомиться в библиотеке Института цитологии и генетики СО РАН

Автореферат разослан “___” ___________ 2010 г.

Ученый секретарь

диссертационного совета,

доктор биологических наук Т. М. Хлебодарова

Общая характеристика работы

Актуальность

Идентификация генов и аллелей, контролирующих разнообразие сложных признаков, является важной теоретической и прикладной задачей генетики. Информация об этих генах позволяет получить новые знания о биологических системах, участвующих в формировании таких признаков. Кроме того, знание конкретных аллельных вариантов, контролирующих сложные признаки человека, находит применение в таких областях как криминалистика и медицина. Для сельскохозяйственных и домашних животных знание аллельных вариантов позволяет вести направленную эффективную селекцию.

Исходная популяция, из которой формируется выборка для изучения генетического контроля признаков, может быть инбредной (модельные объекты), либо аутбредной. По структуре, выборки подразделяют на фиксированные (направленные скрещивания инбредных линий, некоторые скрещивания сельскохозяйственных или домашних животных) и произвольные, т.е. такие, структура которых не находится под контролем исследователя. В данной работе в качестве материала для генетического анализа мы рассматриваем выборки произвольной структуры, полученные из аутбредных популяций человека, сельскохозяйственных и домашних животных. При этом предполагается, что выборка формируется из одной исходной популяции.

Существует несколько подходов к идентификации генов и аллелей в выборках произвольной структуры, полученных из аутбредных популяций. Один из подходов предусматривает тестирование генов-кандидатов, т.е. исследование ассоциации признака с аллелями гена, участие которого в формировании признака можно предположить на основании накопленных данных. Ясно, что основным недостатком этого метода является невозможность получения принципиально новой информации о биологии признака, так как метод существенно ограничен уже имеющимися знаниями.

Этот недостаток подхода, основанного на поиске генов-кандидатов, устраняется при проведении полногеномного картирования. При этом подходе для поиска локусов, контролирующих признак, используется большое количество маркеров, покрывающих весь геном. Исторически, первым широко применяющимся методом полногеномного анализа стал анализ сцепления.

При анализе сцепления выборка, состоящая из близких родственников с известными значениями исследуемого признака, генотипируется с применением панели из 200–10,000 полиморфных маркеров, покрывающих весь геном. Далее, анализируется совместное наследование (сцепление, или косегрегация) признака и маркерных генотипов. Значимое сцепление указывает регион (как правило, довольно большой – от двух до пятидесяти миллионов пар оснований), содержащий ген, высокопенетрантные аллели которого оказывают влияние на изучаемый признак. Метод анализа сцепления хорошо зарекомендовал себя при идентификации генов простых менделевских признаков. Хотя с начала 1990-х годов этот метод широко применялся для изучения сложных признаков человека, он дал удручающе мало результатов. Идентифицированные гены, как правило, объясняли малую долю случаев болезни, так как метод позволяет картировать в основном относительно редкие «менделевские» семейные формы сложных заболеваний.

Одним из наиболее перспективных современных методов, применяемых для идентификации локусов, контролирующих сложные признаки, является метод полногеномного анализа ассоциаций (Genome-Wide Association, GWA). При проведении этого анализа сотни тысяч однонуклеотидных полиморфизмов (SNP), распределенных по всему геному, типируются в группах людей с известным значением изучаемого признака. Анализ ассоциации между распределением генотипов и фенотипов позволяет установить связь между аллельной вариацией в некотором регионе генома и исследуемым признаком.



В момент начала работы по теме данной диссертации метод полногеномного анализа ассоциаций ещё не являлся общепринятым методом исследования генетики сложных признаков человека и аутбредных животных. Необходимо было оценить теоретическую возможность таких исследований, рассмотреть вопросы наиболее эффективного формирования выборки, разработать методы статистического анализа полногеномных данных и создать пакеты прикладных программ, позволяющих осуществлять такой анализ. Именно этим теоретическим вопросам, а также апробации полученных методических разработок на реальных данных посвящена данная диссертация.

Цели и задачи исследования

Целью исследования является разработка методов полногеномного анализа ассоциаций в выборках произвольной структуры из аутбредных популяций, апробация этих методов на реальных данных и идентификация новых локусов, контролирующих сложные, в том числе патологические, признаки человека. Для достижения цели были поставлены следующие задачи:

  1. Исследовать возможные стратегии формирования выборки для картирования локусов, контролирующих сложные признаки человека методом полногеномного анализа ассоциаций. В частности, сравнить преимущества и недостатки формирования выборки из представителей молодых генетически изолированных и открытых популяций человека.
  2. Разработать методы и программное обеспечение для проведения полногеномного анализа ассоциаций на материале выборок произвольной структуры из аутбредных популяций человека, сельскохозяйственных и домашних животных.
  3. Провести апробацию разработанных методов и программного обеспечения на примере полногеномного анализа уровней липидов крови и роста человека; определить новые локусы, участвующие в контроле этих признаков.
  4. Оценить прогностический потенциал геномных данных для предсказания значений количественных признаков (на примере уровней липидов крови и роста человека) и вероятности развития определенного фенотипа (на примере гиперхолестеринемии и крайних вариантов роста).


Научная новизна

Показано, что в молодых генетически изолированных популяциях эффект дрейфа генов, выражающийся в потере или существенном увеличении частоты некоторых аллелей, выражен для аллелей с начальной частотой <1% и мало заметен для аллелей с начальной частотой 5%.

Показано, что длины карт неравновесия по сцеплению для молодых генетически изолированных популяций на ~30% меньше, чем для открытой популяции человека, что увеличивает мощность идентификации генетических локусов, ассоциированных с изучаемыми признаками.

Разработаны новые методы анализа ассоциации в рамках модели «измеренных генотипов», позволяющие анализировать выборки произвольной структуры из аутбредных популяций человека, сельскохозяйственных и домашних животных. Эти методы являются статистически мощными и вычислительно эффективными.

Создан пакет эффективных компьютерных программ для полногеномного анализа ассоциаций количественных и бинарных признаков в популяционных и семейных выборках человека и аутбредных животных.

В ходе апробации разработанных методов и пакетов программ, проведен полногеномный анализ ассоциаций уровней липидов в крови человека. Впервые подобный анализ проведен на популяционных выборках, а в набор картируемых характеристик липидного обмена введен уровень общего холестерина. Идентифицировано шесть новых локусов, контролирующих уровни липидов в крови человека. Также проведен полногеномный анализ роста человека и идентифицирован новый локус, JAZF1, контролирующий этот признак.

Показано, что геномный профиль роста объясняет 4–6% дисперсии этого признака. Геномные профили липидов объясняют существенную долю (1–7%) дисперсии этого признака; эта доля сравнима с таковой, объясняемой индексом массы тела.

Впервые показано, что геномный профиль общего холестерина является предиктором дислипидемии и статистически значимым, независимым от уровня циркулирующего холестерина, предиктором толщины комплекса интима-медиа сосудистой стенки. Из всех геномных профилей классических липидов, геномный профиль холестерина является наилучшим предиктором дислипидемии, ишемической болезни сердца и атеросклероза.

Теоретическая и практическая ценность

Полученные нами оценки вероятности потери аллелей, коэффициентов вариации частот аллелей, а также длины карты неравновесия по сцеплению позволили сделать важный теоретический вывод о том, что мощность метода полногеномного анализа ассоциаций в среднем выше, если используются выборки из молодых генетически изолированных, а не из открытых популяций. Далее, мы показали, что результаты анализа ассоциаций, проведенного на выборках из молодых генетически изолированных популяций в целом должны совпадать результатами, полученными в открытых популяциях человека. Эти выводы предоставили теоретическое обоснование для дальнейших практических полногеномных исследований сложных признаков с использованием генетически изолированных популяций человека (например, консорциумы EUROSPAN, ENGAGE, CHARGE, другие исследования). В настоящее время использование материала из молодых генетически изолированных популяций для верификации результатов, полученных на материале открытых популяций (и наоборот) является общепринятым.





Разработанные нами новые методы и пакеты программ широко применяются в исследованиях генетики сложных признаков человека, сельскохозяйственных и домашних животных. В частности, список зарегистрированных пользователей нашего пакета GenABEL составляет более 250 человек; статьи, представляющие результаты наших методических разработок, цитировались более 70 раз.

Наши полногеномные исследования контроля уровня холестерина в крови человека доказали важность этого признака и частично сместили акценты в исследованиях геномного контроля липидов; так, на основании этого результата консорциум GLGC (Global Lipids Genetics Consortium) включил уровень общего холестерина в список исследуемых характеристик.

Идентифицированные нами новые локусы, участвующие в контроле уровня липидов в крови и роста человека, расширили представления о механизмах контроля нормальной вариации этих признаков в популяциях человека. Кроме того, мы идентифицировали новый локус роста тела, JAZF1, обладающий плейотропным действием, что расширяет имеющиеся представления о механизмах генетического контроля роста и связи между раком, аутоиммунными заболеваниями и ростом тела.

Полученные результаты используются в нескольких курсах, преподаваемых в НГУ и медицинском центре «Эразмус» (GE03, “Advances in population-based analysis”; GE05, “Family-based genetic analysis”), а также использовались в лекциях на школах молодых ученых, проходивших в Москве, Уфе и Томске.

Положения, выносимые на защиту

  1. Полногеномный анализ ассоциаций, проводимый с использованием разработанных нами алгоритмов и пакетов программ, является мощным и воспроизводимым методом идентификации эффектов распространенных аллелей.
  2. Молодые генетически изолированные популяции являются лучшим ресурсом для выявления и изучения как распространенных, так и редких аллелей, влияющих на изучаемые сложные признаки.
  3. Геномный профиль холестерина является наилучшим геномным предиктором дислипидемии, ишемической болезни сердца и атеросклероза.
  4. Разработанный нами метод GRAMMAR-GC является статистически мощным и вычислительно эффективным методом полногеномного анализа ассоциации в выборках особей, связанных родством.
  5. Локус JAZF1 помимо участия в контроле диабета второго типа, рака простаты и системной красной волчанки также принимает участие в детерминации роста.

Личный вклад автора

В диссертации представлены результаты, полученные автором в сотрудничестве с учеными из России и многих стран мира.

Все экспериментальные данные (выборки, генотипирование, фенотипирование) получены в рамках сотрудничества. Автор принимал активное участие в планировании выборки ERF, являвшейся одним из основных ресурсов при проведении данной работы. Во всех исследованиях, представленных в данной работе, автор выступал в качестве руководителя и/или основного исполнителя.

Апробация работы

Результаты работы, изложенной в данной диссертации, были представлены на следующих конференциях и симпозиумах:

  • WEON (Werkgroep Epidemiologisch Onderzoek Nederland), (Rotterdam, The Netherlands, 2003). Presentation “Linkage disequilibrium in recently isolated Dutch population”
  • 6th International Conference “Health Insurance in Transition” (Dubrovnik, Croatia, 2003). Invited talk “ERF study: Erasmus family research in isolated population”
  • 9th Quantitative Trait Loci / Marker Assisted Selection Workshop (Rostock, Germany, 2004). Invited talk “Preliminary analysis of the Erasmus Rucphen Family Study”
  • Haplotype Sharing Workshop, (Heidelberg, Germany, 2006). Invited talk “Haplotype sharing, linkage disequilibrium and complex genealogies”
  • 9я школа-семинар по популяционной генетике (Уфа, 2006). Доклад “Методы генетической эпидемиологии сложных признаков человека”
  • VIII научная конференция «Генетика человека и патология» (Томск, 2007). Доклад «Методы картирования комплексных признаков человека»
  • 58th Annual Meeting of American Society of Human Genetics (Philadelphia, USA, 2008). Platform presentation “First neuronally expressed gene associated with multiple sclerosis.”
  • European Mathematical Genetics Meeting (Munich, Germany, 2009). Invited talk «Predicting human height by Victorian and post-genomic methods»
  • Dutch human genetics society meeting (Veldhoven, The Netherlands, 2009). Presentation «Genome-wide association analysis of 16 European populations identifies novel loci influencing lipid levels»
  • Genetics of complex diseases in isolated populations (Trieste, Italy, 2009). Invited talk «Meta-analysis of genome-wide association scans»
  • V Съезд Вавиловского общества генетиков и селекционеров (Москва, 2009). Доклад «Количественная интегративная геномика сложных признаков человека»
  • European Mathematical Genetics Meeting (Oxford, UK, 2010). Invited talk «Challenges in statistical genomics of complex human traits»

Публикации по теме диссертации

Результаты работы, изложенной в данной диссертации, были опубликованы в виде 37 статей в рецензируемых научных журналах, в том числе в «New England Journal of Medicine», «Nature Genetics», «American Journal of Human Genetics», «PLoS Genetics», «Human Molecular Genetics».

Объём и структура диссертации

Диссертация состоит из пяти глав. Объем диссертации составляет 290 страниц, диссертация включает 34 таблицы и 25 иллюстраций.

Результаты исследований и их обсуждение

Аллельный спектр и структура неравновесия по сцеплению в популяциях человека



Pages:   || 2 | 3 | 4 | 5 |
 


Похожие работы:







 
2013 www.деньсилы.рф - «МЕДИЦИНА-ЛЕЧЕНИЕ-ОЗДОРОВЛЕНИЕ»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.