. Боринская Светлана Александровна ГЕНЕТИЧЕСКАЯ АДАПТАЦИЯ ПОПУЛЯЦИЙ ЧЕЛОВЕКА К ПРИРОДНЫМ И АНТРОПОГЕННЫМ ФАКТОРАМ СРЕДЫ
Боринская Светлана Александровна ГЕНЕТИЧЕСКАЯ АДАПТАЦИЯ ПОПУЛЯЦИЙ ЧЕЛОВЕКА К ПРИРОДНЫМ И АНТРОПОГЕННЫМ ФАКТОРАМ СРЕДЫ

Боринская Светлана Александровна ГЕНЕТИЧЕСКАЯ АДАПТАЦИЯ ПОПУЛЯЦИЙ ЧЕЛОВЕКА К ПРИРОДНЫМ И АНТРОПОГЕННЫМ ФАКТОРАМ СРЕДЫ

1 На правах рукописи Боринская Светлана Александровна ГЕНЕТИЧЕСКАЯ АДАПТАЦИЯ ПОПУЛЯЦИЙ ЧЕЛОВЕКА К ПРИРОДНЫМ И АНТРОПОГЕННЫМ ФАКТОРАМ СРЕДЫ генетика АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора биологических наук Москва 2013

2 Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте общей генетики им.н.и. Вавилова Российской академии наук. Научный консультант: доктор биологических наук, член-корреспондент РАН Янковский Николай Казимирович Официальные оппоненты: Баранов Владислав Сергеевич доктор медицинских наук, профессор, член-корреспондент РАМН зав. лабораторией в Федеральном государственном бюджетном учреждении Научноисследовательском институте акушерства и гинекологии им. Д.О. Отта Российской академии медицинских наук, г. Санкт-Петербург. Гельфанд Михаил Сергеевич доктор биологических наук, профессор зам. директора в Федеральном государственном бюджетном учреждении науки Институте проблем передачи информации им. А.А. Харкевича Российской академии наук, г. Москва. Малярчук Борис Аркадьевич доктор биологических наук, профессор, зав. лабораторией в Федеральном государственном бюджетном учреждении науки Институте биологических проблем Севера Дальневосточного отделения Российской академии наук, г. Магадан. Ведущая организация: Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский государственный университет имени М.В. Ломоносова». Защита состоится «_18_» _ноября_ 2013 г. в _14_ часов на заседании диссертационного совета Д при Федеральном государственном бюджетном учреждении науки Институте общей генетики им. Н.И.Вавилова Российской академии наук (119991, Москва, ул. Губкина, д.3). Тел. 8(499) ; FAX: 8(499) ; E.mail: С диссертацией можно ознакомиться в библиотеке ИОГен РАН Автореферат разослан октября 2013 г. Учёный секретарь диссертационного совета Д по защите докторских и кандидатских диссертаций, Синельщикова Т.А.

3 Актуальность работы ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Популяционно-генетическая адаптация к локальным условиям среды может быть представлена как изменение частот аллелей вследствие естественного отбора признаков, ассоциированных с этими аллелями и важных для выживания и успешной репродукции человека. Помимо процессов адаптации, на изменение частот аллелей влияют генетический дрейф и миграции. Исследования генетической адаптации человека занимает одно из центральных мест в биологической антропологии, генетике человека и эволюционной биологии, и уже дали значительный вклад в понимание взаимодействия средовых и генетических факторов, влияющих на здоровье человека. Ранее при идентификации адаптации к локальной среде часто использовалось сравнение распределения фенотипов по отношению к средовым переменным, предположительно отражающим давление отбора. Такой подход был использован в классических исследованиях географического распределения аллелей бета-талассемии [Холдейн, 1949] и серповидноклеточной анемии [Эллисон, 1954], придающих устойчивость к малярии. Более поздние исследования дали прямые подтверждения «малярийной гипотезы». Для проверки гипотез о вовлечении определенного фенотипа в процесс адаптации и выявлении факторов среды, эту адаптацию вызывающих, необходим сбор фенотипических данных, что дорого и требует значительного времени, анализа больших выборок для достижения статистически значимых показателей [Hancock et al., 2008, 2010]. В то же время в последнее десятилетие интенсивно развиваются подходы к выявлению паттернов вариаций в геноме человека, свидетельствующих о действии отбора. Участки генома, подверженные действию отбора, отличаются по ряду характеристик от участков с нейтральными генетическими вариациями [Gillespi et al., 1991]. Недавнее развитие технологий и ресурсов (проекты HapMap, «1000 геномов» и др.) для исследования генетических вариаций человека в беспрецедентном масштабе позволяет исследователям сканировать полные геномы человека в поиске сигналов позитивного отбора (см. обзор в [Hancock et al., 2008, 2010]). Для многих локусов, выявленных методом геномного сканирования как предполагаемых мишеней отбора, связь с фенотипическими признаками пока не известна [Coop et al., 2009]. Не известны и факторы отбора этих локусов. Наиболее очевидными факторами являются адаптация к геоклиматическим условиям, особенностям традиционного питания, эндемичным инфекциям и особенностям образа жизни. Эти факторы можно подразделить на природные (особенности климата или биоты) и антропогенные, возникшие в результате деятельности человека (хозяйственнокультурные различия, возникшие в результате развития земледелия, одомашнивания скота, изменения социальной структуры). Эти факторы тесно взаимодействуют. Хозяйственно-культурые особенности обществ зависят от климатических условий, экорегиона. При этом ведение хозяйства определенного типа трансформирует ландшафт, меняет биоразнообразие. Одомашнивание животных приводит не только к изменению особенностей питания, но и к передаче возбудителей новых для человека инфекций от скота и других животных. Развитие земледелия ведет к росту плотности населения, что, в свою очередь, приводит к изменению эпидемиологической ситуации. Развитие технологий хранения продуктов также ведет к появлению дополнительных источников инфекций, распространяемых, например, грызунами. Таким образом, хозяйственная деятельность человека приводит к возникновению новых факторов отбора, адаптация к которым приводит к изменению частот аллелей генов, вовлеченных в адаптацию, или появлению и распространению новых аллелей. Проживающие в одном экорегионе общества с различным хозяйственным укладом могут отличаться по таким антропогенным факторам и вследствие этого могут иметь генетические различия, связанные с адаптацией к этим факторам. 1

4 В выявлении факторов среды, вызывающих генетическую адаптацию популяций человека, важным является сопоставление вариаций частот аллелей в популяциях и наличия потенциального фактора отбора в среде либо интенсивности его действия. Различия между популяциями по составу и частоте аллелей формируются либо в результате локус-специфичных процессов (различные виды отбора, направленные на один или несколько локусов, определяющих адаптивный фенотип), либо в результате событий популяционного уровня (колебания численности и экспансия популяций, метисация и др.), которые затрагивают множество локусов одновременно. К указаниям на возможное действие отбора относят высокую популяционную частоту либо гомозиготность по эволюционно «молодым» аллелям, присутствие в популяции протяженных гаплотипов с частотой, превышающей ожидаемую для случайного распределения размеров гаплотипов, экстремально высокий уровень межпопуляционных различий по частоте аллеля (высокий уровень Fst) [Sabeti et al., 2006]. Совпадение ареалов действия конкретных факторов среды и высокой частоты тех или иных аллелей позволяет предполагать их связь, но не доказывает её. Однако именно такое совпадение, после контроля возможных причин корреляции на популяционном уровне (контроля генетической структурированности популяций), является основой для выдвижения и дальнейшей проверки гипотез о факторах отбора, влияющих на частоты аллелей в популяциях человека. Прямое доказательство таких гипотез может быть получено, если будет показана связь фенотипа и меры приспособленности (выживаемости или репродуктивного успеха) [Hancock et al., 2008, 2010]. Развитие данного направления исследований важно для понимания биологических основ заболеваний человека. Как вид Homo sapiens уникален в том, что имеет широчайший ареал расселения и за счет биологических и культурных адаптаций приспособлен к самым различным экорегионам, использованию различных стратегий ведения хозяйства и источников пищи. На протяжении большей части своего существования как вида человек вел образ жизни охотника-собирателя. С появлением производящего хозяйства возникли новые векторы давления отбора переход на новый тип питания, изменение демографических характеристик обществ, появление новых источников инфекций в результате перехода к оседлому образу жизни, развитию технологий хранения продуктов, одомашнивания животных. В рамках гипотезы об «экономичных генах» («thrifty» гипотеза [Neel et al., 1998, 1999]) предполагается, что аллели генов, обеспечивших эффективное использование дефицитных нутриентов (сахаров, холестерина, соли) у охотников-собирателей, после развития производства продуктов и особенно в индустриализованных обществах стали аллелями риска соответствующих заболеваний (диабета, атеросклероза, гипертонии). Выявление аллелей генов, являющихся факторами риска развития широкораспространенных заболеваний в одних условиях среды и протективных или нейтральных в других условиях среды, актуально как с точки зрения генетики человека и эволюционной биологии, так и для фундаментальных аспектов антропологии и практического здравоохранения. Для исследования влияния природных и антропогенных факторов на частоты аллелей в популяциях человека и их связь с важными для здоровья признаками актуальными являются междисциплинарные исследования, дающие новые подходы к пониманию путей и механизмов адаптации популяций человека изменяющимся условиям среды. Такие исследования предпринимались в отношении климатических факторов [Coop et al., 2009; Hancock et al., 2008a] и эндемичных инфекций [Fumigalli et al., 2011]. Обширный массив сведений о факторах среды, влияющих на организм человека (особенности диеты, распространение инфекций и многие другие), содержится в базах данных, ранее сформированных исследователями в областях гуманитарных наук. Это в первую очередь база данных Дж.П. Мердока «Этнографический атлас». Такие базы пока крайне мало использовались в популяционно-генетических исследованиях человека [Gugliemino et al., 1995; Bersaglieri et al., 2004; Hancock et al., 2008b, 2010]. Они содержат информацию о сотнях этнических групп, которые, в случае географической компактности 2

5 обитания, могут рассматриваться как популяции. Использование данных «Этнографического атласа» для выявления корреляций с частотами аллелей популяций, обитающих в тех же регионах, может дать информацию о тех генах, аллели которых важных для адаптации к факторам. ЦЕЛЬ И ЗАДАЧИ ИССЛЕДОВАНИЯ Цель исследования - разработка подхода к выявлению генов человека, потенциально вовлеченных в популяционно-генетическую адаптацию к окружающей среде за счет изменения частот аллелей, и выявлению факторов среды, связанных с этой адаптацией, и апробация этого подхода для выявления природных и антропогенных факторов среды, влияющих на изменение частот аллелей генов, ассоциированных с важными для здоровья признаками. Задачи исследования 1. Анализ литературных данных для выявления генов потенциальных мишеней отбора, для которых известны частоты аллелей в большом количестве популяций мира, обитающих в контрастных условиях среды. 2. Исследовать характер географического распределения частот аллелей этих генов. 3. Сформировать коллекции биологических образцов из популяций, закрывающих «белые пятна» на геногеографической карте. Определить в этих образцах аллельный статус по генам - потенциальным мишеням действия отбора. Сформировать базы данных частот аллелей выбранных генов по опубликованным и собственным экспериментальным данным. 4. Определить фенотипические различия, детерминированные носительством разных аллелей исследуемых генов, их возможную роль в процессе адаптации и сопряженное влияние адаптивных аллелей на признаки, важные для здоровья людей. 5. Выявить средовые факторы, с которыми коррелируют частоты аллелей в популяциях. 6. Проанализировать соответствие распределения частот аллелей генетической структурированности популяций как альтернативное объяснение обусловленных отбором корреляций со средовыми факторами. НАУЧНАЯ НОВИЗНА В работе получены следующие оригинальные результаты: Предложен новый подход к выявлению генов человека, потенциально вовлеченных в популяционно-генетическую адаптацию к окружающей среде, и факторов, связанных с адаптацией, на основе сравнения межпопуляционных различий в частотах аллелей и формализованных этнографических описаний, соответствующих популяциям этнических групп. Экспериментально установлены частоты аллелей генов APOE, LCT, CCR5, ADH1B для популяций России и ряда сопредельных стран, из которых большинство было ранее не исследовано, а для некоторых были опубликованы ошибочные данные. Созданы базы данных по частотам изученных аллелей генов APOE, LCT, CCR5, ADH1B. Показано клинальное (по широте) распределение частот аллелей ε3 и ε4 в популяциях Африки и Евразии, при этом предковый аллель е4 достигает максимальной частоты в северных (субарктических) и южных (субсахарских) популяциях. Выдвинута гипотеза об участии гена АРОЕ в адаптации к климатическим условиям. Показано, что частота аллеля е4 положительно коррелирует с вкладом охоты собирательства в хозяйство, и что ассоциация с охотой-собирательством выше, чем с 3

6 широтой. Такой анализ впервые проведен на количественных данных о вкладе охотысобирательства в хозяйство. Показано, что в популяциях Европейской части России гиполактазия детерминируется преимущественно или исключительно генотипом C/C по полиморфизму LCT* Выявлено расхождение частот генотипа C/C и частот гиполактазии в азиатских популяциях, что указывает на возможное наличие в них других генетических детерминантов гиполактазии/персистенции лактазы у взрослых. Дана косвенная оценка верхней возрастной границы снижения синтеза лактазы (22 года) у русских носителей генотипа C/C по полиморфизму LCT*-13910C/T. На основе сравнения частот аллеля CCR5del32 в современных и исторических популяциях Евразии выдвинута гипотеза о том, что фактор отбора этого аллеля действовал до 3000 лет назад, и продолжал действовать также и после этого периода времени. Показано наличие слабого (OR = 1.22, CI 95% = ).), но статистически значимого (p=0.0002) протективного эффекта гетерозиготного носительства аллеля CCR5del32 в отношении ВИЧ-инфицирования на основе данных мета-анализа. Впервые дана оценка возможных межпопуляционных различий инфицируемости ВИЧ и выживаемости ВИЧ-инфицированных в зависимости от различий в популяционных частотах аллеля CCR5del32. На основе собственных и опубликованных данных о частоте протективного в отношении алкоголизма аллеля ALDH2*504Lys определено географическое распределение частот этого аллеля в Евразии для 190 популяций. Во всех исследованных популяциях РФ частота этого аллеля не превышает 1-2%. Таким образом, вклад носительства аллеля ALDH2*504Lys в генетически обусловленное снижение риска развития алкоголизма на популяционном уровне не может быть значительным для населения РФ. На основе собственных и литературных данных для 172 популяций Евразии определен характер его географического распределения частот аллеля ADH1B*48His. Частота встречаемости этого аллеля, обладающего протективным действием в отношении алкоголизма, экспериментально установлена в 27 популяциях, представляющих 20 этнических групп Евразии. Показано, что по частотам аллелей ADH1B*48His и ALDH2*504Lys, а следовательно и по особенностям метаболизма этанола, определяемым ферментами, кодируемыми этими генами, русские не отличаются от других народов Европы Показано, что носительство данного аллеля у русских является протективным в отношении запоев. На основе анализа корреляций частот аллеля ADH1B*48His в популяциях Северной Африки и Евразии с распространенностью эндемичных инфекций в тех же популяциях выдвинута гипотеза о протективном действии этого аллеля в отношении филяриозов. Указаны методы экспериментальной проверки предложенной гипотезы. ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Показано, что в популяциях европейской части России гиполактазия детерминируется преимущественно или исключительно генотипом C/C LCT-13910C/T. Это дает основания для выбора данного генотипа как единичной мишени для ДНК диагностики гиполактазии в этих популяциях. Нераспознанная вовремя гиполактазия приводит к ухудшению качества жизни, которое может быть снято рекомендациями по диете. Доля взрослых индивидов, неспособных к усвоению цельного молока, составляет до 36% в европейской части России увеличиваясь до более 70% в коренном населении азиатской части РФ. С учетом высокой пенетрантности (до 100%) столь высокие частоты носительства данного генотипа делают практически значимым проведение ДНКдиагностики гиполактазии по носительству данного генотипа, в том числе предиктивной. Такая диагностика представляется особенно целесообразной, поскольку проявление 4

7 генетически детерминированной гиполактазии у части индивидов ошибочно приписывается другим заболеваниям. Показано наличие слабого (OR=1.22), но статистически значимого протективного эффекта гетерозиготного носительства аллеля CCR5del32 в отношении ВИЧинфицирования на основе данных мета-анализа. Дана оценка возможных межпопуляционных различий инфицируемости ВИЧ и выживаемости ВИЧинфицированных в зависимости от различий в популяционных частотах аллеля CCR5del32. На основе анализа корреляций частот аллеля ADH1B*48His с распространенностью эндемичных инфекций в тех же популяциях выдвинута гипотеза о протективном действии этого аллеля в отношении филяриозов и указаны методы экспериментальной проверки предложенной гипотезы. Это открывает путь к выявлению молекулярно-генетических механизмов, определяющих повышенную устойчивость или предрасположенность к данному заболеванию, затрагивающему большее количество индивидов (около 120 млн человек), чем все известные моногенно контролируемые наследственные заболевания человека. Показано, что носительство аллеля ADH1B*48His у русских является протективным в отношении запоев. Получены собственные и проанализированы литературные данные о частоте протективного в отношении алкоголизма аллеля ALDH2*504Lys. Во всех исследованных популяциях РФ частота этого аллеля не превышает 1-2%. Таким образом, вклад носительства аллеля ALDH2*504Lys в генетически обусловленное снижение риска развития алкоголизма на популяционном уровне не может быть значительным для населения РФ. Результаты работы использовались - в лекциях для студентов, аспирантов, прочитанных в рамках курса «спецглавы генетики» на кафедре генетики биологического факультета МГУ и курса общей биологии на факультете молекулярной и биологической физики МФТИ; - в лекциях на курсах повышения квалификации учителей биологии биологического факультета МГУ; - в общеобразовательных лекциях и выступлениях автора и других специалистов на общероссийских каналах телевидения и радио, публиковались в общероссийских средствах массовой информации. ОСНОВНЫЕ ПОЛОЖЕНИЯ, ВЫНОСИМЫЕ НА ЗАЩИТУ Предложен новый подход к выявлению генов человека, потенциально вовлеченных в популяционно-генетическую адаптацию к окружающей среде, и факторов, связанных с адаптацией, на основе сравнения межпопуляционных различий в частотах аллелей и формализованных этнографических описаний соответствующих изучаемым популяциям этнических групп. Выдвинута гипотеза об участии гена АРОЕ в адаптации к климатическим условиям. Изменение частот аллелей АРОЕ коррелирует с вкладом охоты-собирательства в хозяйство: частота аллеля ε4 выше в популяциях охотников-собирателей. В популяциях европейской части России гиполактазия детерминируется преимущественно или исключительно генотипом C/C LCT Выявлено расхождение частот генотипа C/C и частот гиполактазии в азиатских популяциях, что указывает на возможное наличие в них других генетических детерминантов гиполактазии/персистенции лактазы у взрослых. 5

8 Впервые для русских получена оценка возраста (22 года) фенотипического проявления различий между носителями генотипа C/C LCT и аллеля Т. На основе сравнения частот аллеля CCR5del32 в современных и исторических популяциях Евразии выдвинута гипотеза о том, что фактор отбора этого аллеля действовал на протяжении нескольких тысяч лет. Гетерозиготное носительство аллеля CCR5del32 обладает слабым (OR=1.22), но статистически значимым протективным эффектом в отношении ВИЧ-инфицирования, что показано на основе данных мета-анализа. Дана оценка возможных межпопуляционных различий инфицируемости ВИЧ и выживаемости ВИЧ-инфицированных в зависимости от различий в популяционных частотах аллеля CCR5del32. На популяционном уровне вклад аллеля CCR5del32 в выживаемость и инфицируемость ВИЧ относительно невелик. На основе собственных экспериментальных и опубликованных данных о частоте протективного в отношении алкоголизма аллеля ALDH2*504Lys распределение частот этого аллеля в Евразии. Во всех исследованных популяциях РФ частота этого аллеля не превышает 1-2%. Таким образом, вклад носительства аллеля ALDH2*504Lys в генетически обусловленное снижение риска развития алкоголизма на популяционном уровне не может быть значительным для населения РФ. Частота встречаемости аллеля ADH1B*48His, обладающего протективным действием в отношении алкоголизма, экспериментально установлена в 27 популяциях, представляющих 20 этнических групп Евразии. На основе собственных и литературных данных для 172 популяций определен характер географического распределения его частот в Евразии. Для исследованных популяций РФ частота этого аллеля варьирует от 3-8% для населения европейской части страны до более 30% для коренного населения Южной Сибири и Дальнего Востока Показано, что по частотам аллелей ADH1B*48His и ALDH2*504Lys генов алкогольдегидрогеназы и альдегиддегирогеназы, а следовательно и по особенностям метаболизма этанола, определяемым ферментами, кодируемыми этими генами, русские не отличаются от других народов Европы. Показано, что носительство аллеля ADH1B*48His у русских является протективным в отношении запоев. На основе анализа корреляций частот аллеля ADH1B*48His с распространенностью эндемичных инфекций в тех же популяциях выдвинута гипотеза о протективном действии этого аллеля в отношении филяриозов; указаны методы экспериментальной проверки предложенной гипотезы АПРОБАЦИЯ РАБОТЫ Основные результаты были доложены на следующих семинарах, конференциях и конгрессах: 31st Annual Meeting Society for Cross-Cultural Research, Santa Fe, США, 2002; Molecular Evolution, Genomics and Bioinformatics, Sorrento, Италия, 2002; Human Origin and Disease Meeting, Cold Spring Harbor, США, 2002; Семинаре Нью-йоркского музея Естественной истории (Museum of Natural History), October 29, 2002, New York, США; Международная конференция "Новые информационные технологии в медицине и экологии", Ялта-Гурзуф, Украина, 2002; BGRS, Novosibirsk, 2002; 32 nd Annual Meeting of Society for Cross-Cultural Research, Charleston, SC, США, 2003; Актуальные проблемы генетики, Москва, 2003; I Украинский конгресс по клинической генетике с международным участием Метаболические наследственные заболевания. Харьков, Украина, 2003; 33rd Annual Meeting of Society for Cross-Cultural Research, San Jose, California, США, 2004; International workshop on nutrition and health of indigenous people of the North (NUHIP), Oulu, Финляндия, 2004; III Съезде Вавиловского общества генетиков и селекционеров, Москва, 2004; 14 th Congress of European Anthropological Association Human variability: A bridge between sciences and humanities. Komotini, Греция, 2004; 4th International Iran and Russia Conference Agriculture and Natural Resources ShahrKord, Иран, 2004;Научной сессии Отделения информационных технологий и вычислительных 6

9 систем РАН (ОИТВС РАН) «Информационные технологии в биологии» («Биоинформатика») 20 января 2004 г., Москва; 34th Annual Meeting of the Society for Cross Cultural Research and First General Scholarly Meeting of the Society for Anthropological Sciences. Santa Fe, New Mesico, США, 2005; Human Genome Meeting-2005, Kyoto, Япония, 2005; V съезд Российского общества медицинских генетиков, Уфа, 2005; VI Конгресс этнографов и антропологов России. Санкт-Петербург, 2005; Human Genome Meeting-2006, Helsinki, Финляндия, 2006; 7th Balkan Meeting of Human Genetics. Skopje, Республика Македония, 2006; Международная Школа-конференция «Поведение человека и животных: психологические, эволюционные и генетико-физиологические аспекты». Новосибирск, 2008; 39th European Human Genetics Conference (EHGC), Nice, Франция, 2007; Международная конференция, посвященная 90-летию академика Д.К.Беляева "Современные эволюционные представления в биологии, медицине и социологии". Новосибирск, 2007; Всероссийская конференция «Науки о жизни и образование. Фундаментальные проблемы интеграции» памяти профессора М.В. Гусева, Москва, 2009; Пятый Северный социально-экологический конгресс Москва, 2009; Пятый съезд Вавиловского общества генетиков и селекционеров, Москва, 2009; Международная научная конференция «Чарльз Дарвин и современная биология», Санкт-Петербург, 2009; Human Genome Meeting-2011, Dubai, ОАЕ, World Congress of Epidemiology, Edinburgh, Шотландия, Публикации Материал диссертации опубликован в 58 работах в международных и отечественных научных журналах и сборниках, из них 32 статьи по теме диссертации (в том числе 20 в журналах списка ВАК). Личный вклад автора Все результаты, представленные в работе, получены при непосредственном участии автора в период с 2002 по 2011 год. При постановке проблемы диссертационного исследования, формулировке целей и задач участие автора было определяющим. Автор участвовал в планировании и проведении экспедиций по сбору популяционных коллекций образцов, руководил генотипированием, лично проводил сбор литературных данных,создание баз данных, филогенетический анализ, интерпретацию и описание результатов. Большинство публикаций, приведенных в списке работ по теме диссертации, написаны лично автором. Внедрение результатов работы. Результаты диссертационного исследования внедрены в научно-педагогическую практику Биологического факультета Московского государственного университета им. М.В. Ломоносова (Москва, Ленинские горы, д.1, стр. 12), Государственном университете «Московский физико-технический институт» (Московская область, г. Долгопрудный, Институтский переулок, 9). Структура и объем диссертации Диссертационная работа состоит из введения, описания материалов и методов, четырех глав, посвященных изучаемым генам с обзором литературы, описанием экспериментальных результатов и обсуждением для каждого гена, заключения, выводов и списка литературы. Материал диссертации изложен на страницах машинописного текста, включая рисунков и таблиц. Список литературы содержит работ, из них на иностранных языках. 7

10 МАТЕРИАЛЫ И МЕТОДЫ Материалом для экспериментального исследования послужили биологические образцы неродственных индивидов, представляющих различные популяции России и других стран Евразии (табл. 1). Образцы были собраны в период г под руководством или с участием автора. Сбор образцов проводился с соблюдением процедуры информированного согласия под контролем этической комиссии ИОГен РАН. Для индивидов, представляющих российские популяции, собиралась информация об этнической принадлежности предков двух поколений. Исследованные популяции представлены в разделах, описывающих экспериментальные результаты. Ряд популяционных коллекций биологических образцов или ДНК был предоставлен для исследования Е.И.Рогаевым (туркмены, москвичи), Э.К.Хуснутдиновой (татары, удмурты Пургинского р-на), В.А.Степановым (нивхи, удэгейцы, нанайцы, буряты агинские и курумканские), А.Р. Максимовым (калмыки), С. И. Куцевым (русские Ростовской обл). Сбор образцов, представляющих население арабских стран (студенты РУДН), проводился совместно с В.А.Кошечкиным под контролем этического комитета РУДН. Образцы для исследования ассоциации генотипов по гену LCT с минеральной плотностью кости (МПК) были предоставлены В.Н. Петриным и С.Д. Арутюновым (МГМСУ), образцы ВИЧинфицированных пациентов - М.М. Гараевым (НИИ вирусологии), образцы для исследования влияния генов метаболизма алкоголя на потребление алкоголя и индивидуальные характеристики потребления алкоголя - Д. Леоном (ЛШГТМ). Протоколы исследования были утверждены этическими комитетами организаций, предоставивших образцы, либо этическим комитетом ИОГен РАН. Табл.1. Общее количество проанализированных образцов Название гена Кол-во популяций Кол-во образцов в популяционных коллекциях 8 Кол-во образцов в исследовании ассоциации с фенотипами Всего образцов прогенотипировано APOE LCT CCR ALDH ADH1B Выделение ДНК из образцов венозной крови проводилось фенол-хлороформным методом либо с помощью коммерческих наборов DNAPrep (Изоген, Москва) или QIAamp DNA Blood Mini Kit (QIAgen, Нидерланды-Германия). ДНК из образцов крови ВИЧинфицированных выделяли и в лаборатории биотехнологии НИИ вирусологии РАМН, оборудованной для работы с инфицированными образцами. Концентрация ДНК определялась спектрофотометрически. Генотипирование проводилось с помощью методов ПЦР-ПДРФ для гена АРОЕ как описано в статье [Боринская и др., 2007], ПЦР «в реальном времени» для гена LCT [Боринская и др., 2006], ПЦР для CCR5del32 [Сломинский и др., 1997], методом дуплексной четырехпраймерной ПЦР для генов ADH1B и ALDH [Tamakoshi et al., 2003]. Определение генотипов индивидов по STR-локусам проводилось с помощью набора PowerPlex (Promega) в сотрудничестве с ЭКЦ МВД (А.А. Рыбакова). Сбор и анализ опубликованных данных описан для каждого гена в разделе «Результаты и обсуждение». "Этнографический атлас" Дж.П. Мёрдока (далее «Атлас») был использован в качестве источника описаний факторов среды. «Атлас» содержит описания 1267 этнических групп мира, преимущественно доиндустриальных обществ, по состоянию на вторую половину XIX начало XX века. Описания даны по более чем 100 этнографическим характеристикам, представленным в виде формализованных (кодированных) переменных, что позволяет проводить статистическую обработку данных.

11 «Атлас» был опубликован в виде серии статей в журнале Ethnology в период с 1960 по 1973 гг.,и дополнен описаниями народов России с участием автора [Korotayev, Kazankov, Borinskaya, Khaltourina, Bondarenko, Ethnology, 2004]. «Атлас» ранее использовался в популяционно-генетических исследованиях, но лишь как компендиум сведений о языковой принадлежности или экологической классификации среды [Guglielmino et al., 1995] либо наличии или отсутствии отдельного признака (например, молочного животноводства [Bersaglieri et al., 2004]). Насколько нам известно, количественные характеристики, представленные в "Этнографическом атласе", ранее для корреляционного анализа с генетическими данными не использовались. Для оценки статистической значимости выявленных корреляций между частотами аллелей и средовыми факторами использовали критерии Пирсона или Спирмана (двусторонний тест). Поправку на множественное тестирование делали по Бонферрони если не указано иначе. Статистическую значимость частотных различий оценивали с использованием критерия хи-квадрат либо двустороннего точного критерия Фишера. Анализ внутрипопуляционной дифференциации по нейтральным STR-маркерам проводили с использованием точного теста Фишера в программе «Статистика» 6.0. Метаанализ проводили с использованием свободно распространяемой компьютерной программы для эпидемиологов WinPepi v. 10 (2010). Программа позволяет оценить среднее значение OR согласно модели с фиксированными эффектами (оценка Мантеля Хензеля) и модели со случайными эффектами (оценка по DerSimonian-Laird). Выбор между моделями производится на основе анализа гетерогенности совокупности данных (Q-тест Кохрена). Множественное выравнивание аминокислотных последовательностей гена APOE различных видов млекопитающих проводили с помощью программы ClustalX ( При реконструкции предковой последовательности гена APOE приматов в качестве внешней группы (outgroup) была использована последовательность гена тупайи (Tupaia glis). Наиболее вероятная предковая последовательность для приматов была реконструирована с помощью программы PHYLIP 4.0 (Felsenstein J., PHYLIP (Phylogenetic Inference package), Version 4.0). Филогенетическое древо было построено с использованием программы DAMBE [Xia, X., and Z. Xie DAMBE: Software package for data analysis in molecular biology and evolution. J. Hered. 92: ]. Соотношение Ka/Ks для каждой ветви рассчитывали по методу Li, 1993 [Li, W.-H. Unbiased estimation of the rates sof synonymous and nonsynonimous substitution. J.Mol.Evol. 36, 96-99, 1993], используя калькулятор [Zhang Z, Li J, Zhao XQ, Wang J, Wong GK, Yu J: KaKs Calculator: Calculating Ka and Ks through model selection and model averaging.genomics Proteomics Bioinformatics 2006, 4: ]. Расчет индекса ускорения при анализе накопления аминокислотных замен в белке APOE приведен в описании результатов. Определение минеральной плотности кости (МПК) проводили врачи МГСМУ (А.Н.Сафонова под руководством С.А.Арутюнова, при участии автора данной работы в планировании эксперимента и обработке результатов) с использованием рентгеновской двухфотонной абсорбциометрии дистального отдела предплечья при помощи аппаратаденситометра DTX 200 DXA BONE [Osteometer, Дания США]. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ Для исследования были выбраны гены, отвечающие следующим требованиям: 1) показана ассоциация с важными для здоровья признаками; 2) известны частоты аллелей для большого количества популяций; 3) установлены значительные межпопуляционные различия по частотам аллелей этих генов; 4) имеются указания на то, что различия частот аллелей обусловлены действием отбора. Среди проанализированных генов этим требованиям отвечали следующие гены: аполипопротеина Е APOE, лактазы LCT, хемокинового рецептора CCR5, алкогольдегидрогеназы ADH1B, альдегиддегирогеназы ALDH2. В нижеследующих разделах дана краткая характеристика каждого из этих генов и 9

12 описаны ход исследования и полученные результаты в соответствии с поставленными задачами. 1. Ген аполипопротеина Е APOE (19q13.2), полиморфизмы Cys112Arg (rs429358) и Arg158Cys (rs7412) 1.1. Определение частот генотипов и аллелей в популяциях России и др. стран Евразии Белок аполипопротеин Е (АРОЕ) играет ключевую роль метаболизме липопротеинов плазмы крови и транспорте липидов в тканях, регуляции уровня холестерина [Mahley, Rall, 2000; Wellington, 2004]. Ген APOE полиморфен и имеет три общераспространенных аллеля, отличающихся аминокислотами в позициях 112 и 158 зрелого белка. Предковая форма (аллель ε4) кодирует белок с Arg 112, Arg 158, именно эти аминокислоты выявлены в соответствующих позициях у высших приматов и других исследованных животных. Аллелю ε3 соответствует замена в позиции 112 аргинина на цистеин, давая сочетание Cys 112, Arg 158. Эволюционно наиболее «молодой» аллель ε2 детерминирует Cys 112, Cys 158. Носители генотипа ε4/ε4 имеют более высокий уровень общего холестерина и ЛПНП по отношению к носителям других генотипов, а носители ε2/ε2 - самый низкий, хотя в отдельных этнических группах последнее соотношение может варьировать [Bennet et al., 2007]. Аллель ε4 является фактором риска болезней сердечно-сосудистой системы, болезни Альцгеймера, ассоциирован с ухудшенным восстановлением после травм головы, инсульта, церебральных кровоизлияний [Bennet et al., 2007; Воевода и др., 2006; Corder et al., 1993; Рогаев, 1999]. Однако у бушменов и некоторых других народов Африки этот аллель не является фактором риска, что предположительно связано и с их генетическими особенностями и/или с иными условиями жизни. Это послужило основанием для предположения, что аллель является «экономичным» («thrifty») аллелем [Corbo, Scacchi, 1999]. К началу данного исследования ген APOE был одним из наиболее интенсивно изучаемых генов человека (в настоящее время более статей в базе данных PubMed), частоты его были известны более чем для 200 популяций мира. Однако лишь для немногих российских популяций были установлены частоты аллелей гена APOE [Скобелева и др., 1997; Коровайцева и др., 2001; Мустафина и др., 2001]. Нами установлены генотипы 1103 индивидов из 16 популяций, представляющих 12 этнических групп России и сопредельных стран. Для всех исследованных групп распределение частот генотипов соответствует равновесному по Харди-Вайнбергу. Полученные результаты сопоставлены с опубликованными данными (табл. 2). Установленные нами частоты близки к опубликованным данным для тех же или близких популяций за исключением марийцев (частота аллеля ε4-14.9% в нашем исследовании и 6.5% в исследовании [Мустафина и др., 2001]), что может объясняться различием в локализации исследованных групп и относительно небольшим размером изученных выборок Характеристика географического распределения частот аллелей гена APOE в популяциях мира Географическое распределение частоты аллеля ε4 было известно к началу данной работы лишь для Европы [Gerdes et al., 1992; Corbo et al., 1995; Lucotte et al., 1997; Mastana et al., 1998; Corbo, Scacchi, 1999; Schiel et al., 2000] и характеризовалось увеличением частоты аллеля с юга на север, то есть распределение частоты являлось широтным. Широтное распределение частот аллелей интерпретируется как отражение адаптации к климатическим факторам [Cavalli-Sforza et al., 1994]. Известное к началу работы широтное распределение частот аллеля е4 в Европе могло быть частью картины такого распределения во всем мире либо отражением направлений основных потоков миграций с Юго-Востока на Северо-Запад. Для проверки справедливости гипотезы о широтном распределении аллеля е4 не только в Европе, но и других регионах мира, мы собрали информацию частотах е4 и других аллелей APOE в популяциях мира, для которых были доступны данные о географической локализации. Поиск проводился в базе данных по 10

13 Табл. 2. Частоты аллелей гена APOE в популяциях России и сопредельных стран Популяция Регион N Частоты аллелей APOE ε2 ε3 ε4 Литература Арктика и Субарктика Чукчи Чукотский АО Собственные данные Чукчи и эскимосы Чукотский АО Воевода и др., 2006 Эскимосы Канада Hegele et al., 1997 Аборигены Аляски Аляска Scheer et al., 1995 Ханты и манси Зап. Сибирь Воевода и др., 2006 Саамы Финляндия Lehtinen et al., 1994 Саамы Кольский п-ов Собственные данные Коми-ижемцы Ижемский район Республики Коми Собственные данные Волго-уральский регион Коми-зыряне южные районы Республики Коми Собственные данные Коми Мустафина и др., 2001 Удмурты Мустафина и др., 2001 Удмурты Игринский р-н Собственные данные Удмуртской республики Коми-пермяки Пермь Собственные данные Мордва Мустафина и др., 2001 Мари Мустафина и др., 2001 Мари горные Мари Эл Собственные данные Чуваши Мустафина и др., 2001 Татары Мустафина и др., 2001 Башкиры Мустафина и др., 2001 Сибирь и Средняя Азия Эвенки Сибирь Kamboh et al., 1996 Эвенки пос. Ванавара, Эвенкия Собственные данные Якуты сельские районы Якутии Григорьева, 2006 Якуты Якутия Parfenov et al., 2007 Шорцы Горная Шория Воевода и др., 2006; Хакасы Хакасия Воевода и др., 2006 Алтайцы Сев.Алтай Воевода и др., 2006 Буряты Улан-Удэнский р-н Республики Бурятия Собственные данные Буряты Вост. Монголия Tsunoda et al., 2002 Казахи Алма-Ата, Казахстан Байтасова и др., 2001 Уйгуры Алма-Ата, Казахстан, Байтасова и др., 2001 Горцы Памира Московская диаспора, Собственные данные уроженцы Горно- Бадахшанской АО Иранцы Уроженцы различных регионов Ирана Собственные данные Иранцы Иран, Тегеран Raygani et al., 2005 Иранцы Иран, Керманшах Kharrazi et al., Восточнославянские группы разных регионов Русские Новосибирск Воевода и др, 2006 Русские Кострома Собственные данные Русские Санкт-Петербург Скобелева и др., 1997 Русские Москва Коровайцева и др., 2001 Москвичи Москва Собственные данные Русские Башкирия Мустафина и др., 2001 Русские Краснодар Собственные данные Русские Ростов и Ростовский р-н Собственные данные Украинцы Восточная Украина Собственные данные Белорусы Разл. районы Белоруссии Собственные данные 11

14 ключевым словам Apolipoprotein E, APOE в сочетании с allele, genotype, polymorphism. Найденные статьи были дополнены сведениями из базы данных ALFRED, ссылками из обзоров по различным тематикам, связанным с аллелями гена APOE. Русскоязычные статьи были найдены в профильных русскоязычных журналах и по запросам авторам. Всего были отобраны данные для 298 популяций из 167 публикаций (по состоянию на 2009 г.). Из дальнейшего исследования были исключены выборки, представляющие некоренное население (русские Сибири, европеоиды ЮАР, Австралии и т.п.) или смешанное население, а также выборки численностью менее 30 человек. Для анализа географического распределения частот аллелей гена APOE из собранных данных были отобраны 175 популяций, представляющие автохтонное население. Распределение частот аллелей гена APOE относительно широты приведено на рис. 1А. Результаты проведенного анализа показывают, что частоты аллелей ε3 и ε4 в исследованных популяциях имеют широтное распределение не только в Европе, но и в других Частях Света. Частоты аллеля ε4 варьируют от 2-3% в некоторых популяциях Северной Африки, Индии и Бразилии до 40% у охотников-собирателей Африки и Ю.Америки. Диапазон вариаций частот аллеля ε3 составил от 50% до 98%. Аллель ε2 отсутствует в некоторых популяциях, достигая частоты более 30% у эве и мосси в Западной Африке. Для аллеля ε2 закономерности географического распределения не выявлены. Коэффициенты корреляции между частотами аллелей составили R=0.720 для ε4 и ε3, R=0.459 для ε2 и ε3 (p< в обоих случаях), корреляция между частотами ε2 и ε4 незначима. Так как проведенный анализ показал, что все выявленные корреляции частот аллелей со всеми проверенными средовыми показателями (см ниже) сильнее для аллеля ε4, чем для аллеля ε3 (данные не приведены), что соответствует результатам [Eisenberg et al., 2010] по корреляции частот этих аллелей с широтой и средними температурными показателями; дальнейшие результаты приводятся только для аллеля ε4. Более детальный анализ показывает, что частота аллеля ε4 минимальна (менее 5%) в популяциях, проживающих на широте от 13 до 38 град. с.ш. для Старого Света (близ Северного Тропика) (рис. 1А), тогда как для популяций Америки от 13 до 25 град. ю.ш. Эта особенность игнорируется в работе [Eisenberg et al., 2010], в которой со ссылкой на нашу гипотезу об участие аллелей гена APOE в адаптации к климату исследованы корреляции частот аллелей с широтой и различными температурными показателями. При построении графиков и анализе корреляций Эйзенберг с соавт. использовали абсолютную широту, «перегнув» график по экватору (рис. 1Б) и не проводя детального анализа особенностей распределения аллелей на различных континентах. В нашей работе более детальный анализ показывает, что при таком подходе особенности распределения частоты аллелей гена APOE в популяциях, проживающих в различных широтных зонах Старого и Нового Света, остаются невыявленными. Полученные [Eisenberg et al., 2010] результаты свидетельствуют о наличии негативной корреляции между абсолютной широтой и частотой аллеля. В работе [Eisenberg et al., 2010] проконтролировано влияние генетической структурированности популяций (отражающей сходство в результате расселения или притока генов из соседних популяций) на распределение частот аллелей гена APOE. Для этого использованы данные о SNP для 43 популяций панели HGDP [Cann et al. 2002]. На основе этих данных рассчитаны главные компоненты. Главные компоненты были включены в регрессионную модель. Показано, что вариации в популяционных частотах аллеля ε4 не отражают популяционную структуру, что свидетельствует о роли отбора в их формировании [Eisenberg et al., 2010]. Более высокая частота аллеля ε4 в высоких и низких широтах, по мнению Эйзенберга с соавт., может отражать более высокие энергозатраты как в холодном, так и в жарком климате по сравнению с умеренным. Авторы проверили ассоциацию частот аллелей APOE с температурой (среднегодовая температура по данным 12

15 за 30 лет, дневным и годовым перепадом температур), полагая что температура может быть более строгим предиктором частоты, так как она более тесно связана с интенсивностью метаболизма. Однако экспериментальная проверка не подтвердила это предположение ассоциация частот аллеля ε4 с широтой гораздо сильнее, чем со среднегодовой температурой [Eisenberg et al., 2010]. Географическая широта может быть кумулятивным показателем, отражающим не только температурные характеристики, но и другие особенности климата и иные факторы окружающей среды (доступные биоресурсы, тип хозяйства, эндемичные инфекции и т.д.). Мы использовали «Атлас» как источник сведений о представленности различных видов хозяйственной деятельности и оценили корреляцию этих переменных с частотой аллеля ε4 для проверки «thrifty»-гипотезы [Corbo, Scacchi, 1999]. Из популяций, для которых известны частоты аллелей гена APOE, 77 имеют соответствия в «Атласе», из них 63 популяции Старого Света и 14 Америки. Популяции Америки характеризуются значительной вариацией частот аллелей в соседствующих популяциях, что может объясняться небольшим размером многих изученных выборок и/или сильным эффектом основателя в ряде популяций. Это послужило основанием для проведения дальнейшего анализа только на популяциях Старого Света Scatterplot (APOE_no5-6 7v*63c) apoe4 = 19,8138-0,5063*x+0,0084*x^2 lat:apoe4: r = -0,1916, p = 0, apoe А lat Б Рис. 1. Распределение частот аллеля ε4 гена APOE относительно широты проживания популяции. А популяции Старого Света, включенные в анализ «thrifty»- гипотезы (собственные данные), Б рисунок из статьи [Eisenberg et al., 2010] Связь частот аллелей гена APOE с типом хозяйства Гипотезу [Corbo and Scacchi, 1999] о повышенной адаптивной ценности аллеля ε4 у охотников-собирателей можно проверить, показав, что частота аллеля ε4 выше в группах охотников-собирателей, чем у проживающих в тех же регионах земледельцев. Однако какие именно популяции следует отнести к охотникам собирателям, при этом остается неясным те, у которых вклад охоты-собирательства в хозяйство превышает 50%, или 15%, или выбрать какую-то иную границу. Более весомым свидетельством в пользу этой гипотезы было бы обнаружение корреляции между частотой аллеля е4 и вкладом охотысобирательства в хозяйство. Для анализа были использованы данные из «Атласа», характеризующие вклад охоты-собирательства в хозяйства для каждого общества. Эта переменная варьировала от менее 5% до более 85% в изучаемой группе обществ. В исследованной нами выборке 63 популяций Старого Света частота аллеля ε4 позитивно коррелирует с вкладом охоты-собирательства в хозяйство (R=0.638, p<0.001) (рис. 2). Интенсивность охоты-собирательства варьирует в зависимости от широты, и достигает максимума в высоких широтах, где земледелие невозможно, т.е. именно в тех регионах, в которых частота аллеля е4 высока. Поэтому корреляция частоты аллеля ε4 может быть просто отражением корреляции обоих параметров с широтой. Мы более 13

16 детально исследовали корреляции частоты аллеля ε4 с теми же независимыми переменными в северной (севернее 22 о с.ш.) и южной подгруппах. В табл. 3 представлены результаты регрессионного анализа модели ε4

охота-собирательство + широта + климатическиe факторы (температура, влажность) В табл. 3 представлены значимые предикторы, отобранные алгоритмом с пошаговым включением факторов. Приведены также приращения коэффициента детерминации (R 2 ), соответствующие каждому предиктору. R 2 интерпретируется как доля изменчивости зависимого признака, обусловленная изменчивостью предиктора. Вклад охоты-собирательства в хозяйство объясняет большую долю изменчивости частот аллеля е4. Температурные показатели не вошли в состав значимых предикторов. Табл. 3. Результаты регрессионного анализа связи факторов среды и частот аллеля ε4 B Стд. Бетакоэффициент R 2 Изменение t P ошибка Все данные (Константа) E -16 Охотасобирательство E Широта E Итого R lat 22 (N=35) (Константа) Охотасобирательство E Широта Итого R lat < 22 (N=28) (Константа) E -9 Охотасобирательство Итого R Результаты более детального анализа показывают, что корреляция частоты аллеля ε4 с охотой-собирательством особенно сильна в крайней южной (южнее экватора) и северной (выше 46 o с.ш.) подвыборках (данные представлены в рукописи диссертации). Можно полагать, что внутри широтной зоны, в которой уже установлен соответствующий ей диапазон частота аллеля, действуют средовые факторы, модулирующие аллельные частоты. И охота-собирательство оказывается таким фактором. Однако какие именно параметры влияют на адаптивную ценность аллелей ε4 и ε3 особенности диеты, уровень физической активности, уровень энергозатрат или иные, остается неизвестным и это может быть предметом дальнейших исследований. Полученные результаты могут быть причиной выявленного Эйзенбергом с соавт. эффекта: более сильной корреляции частот аллеля ε4 с широтой, а не со среднегодовой температурой, так как общества могут отличаться по вкладу охоты-собирательства. Таким образом, при исследовании популяций Старого Света показано, что в обществах с высоким вкладом охоты-собирательства в хозяйство высока частота предкового аллеля ε4, тогда как в обществах с производящим хозяйством доля его носителей ниже. 14

📎📎📎📎📎📎📎📎📎📎