научная статья по теме ГЕНОФОНД ЭТНИЧЕСКИХ ГРУПП КАВКАЗА ПО ДАННЫМ КОМПЛЕКСНОГО ИССЛЕДОВАНИЯ Y-ХРОМОСОМЫ, МИТОХОНДРИАЛЬНОЙ ДНК И ПОЛНОГЕНОМНОГО АНАЛИЗА Биология
Текст научной статьи на тему «ГЕНОФОНД ЭТНИЧЕСКИХ ГРУПП КАВКАЗА ПО ДАННЫМ КОМПЛЕКСНОГО ИССЛЕДОВАНИЯ Y-ХРОМОСОМЫ, МИТОХОНДРИАЛЬНОЙ ДНК И ПОЛНОГЕНОМНОГО АНАЛИЗА»
ГЕНЕТИКА, 2012, том 48, № 6, с. 750-761
ГЕНОФОНД ЭТНИЧЕСКИХ ГРУПП КАВКАЗА ПО ДАННЫМ КОМПЛЕКСНОГО ИССЛЕДОВАНИЯ Y-ХРОМОСОМЫ, МИТОХОНДРИАЛЬНОЙ ДНК И ПОЛНОГЕНОМНОГО АНАЛИЗА
© 2012 г. Э. К. Хуснутдинова1' 2, С. С. Литвинов1, И. А. Кутуев1, Б. Б. Юнусбаев1, 3, Р. И. Хусаинова1, 2, В. Л. Ахметова1, 2, Ф. С. Ахатова2, Э. Метспалу3, С. Роотси3, Р. Виллемс3, 4
1 Учреждение Российской академии наук Институт биохимии и генетики Уфимского научного центра РАН, Уфа 450054 e-mail: elzakh@rambler.ru, ekkh@anrb.ru 2 Башкирский государственный университет, кафедра генетики и фундаментальной медицины, Уфа 450074 3 Эстонский биоцентр, Тартуский университет, Тарту 51010, Эстония 4 Эстонская академия наук, Таллинн 10130, Эстония Поступила в редакцию 11.09.2011 г.
Проведен анализ генетического разнообразия 22 этнических групп Кавказа с использованием маркеров Y-хромосомы, митохондриальной ДНК, а также данных полногеномного анализа аутосом-ных однонуклеотидных полиморфных локусов. За исключением ногайцев в изученных этнических группах Кавказа показано наличие преимущественно переднеазиатского компонента. Также обнаружено, что характерный для популяций Кавказа переднеазиатский предковый компонент практически полностью отсутствует у непосредственных северных соседей — народов Восточно-Европейской равнины. Тюркоязычные этносы, за исключением ногайцев, не демонстрировали повышенного содержания типичных восточно-евразийских гаплогрупп мтДНК и Y-хромосомы по сравнению с некоторыми представителями абхазо-адыгских народов (адыгейцы, кабардинцы). Существенные отличия ногайцев от изученной совокупности этносов Кавказа отмечены и по результатам полногеномного анализа SNP полиморфизма. Однако выявленные особенности ногайцев были не столь однозначны с позиций гаплогрупп R1a1a-M17(M198) и R1b1b1-M73 Y-хромосомы, оценка статуса которых в тюркоязычных популяциях Кавказа требует проведения дальнейших исследований.
В течение последних двух десятилетий, в связи с бурным развитием популяционной генетики и этногеномики, был сделан большой шаг вперед в отношении изучения генетической структуры различных народов мира и их этнической истории, что было связано, в первую очередь, с появлением значительного числа филогенетически информативных маркеров Y-хромосомы и мтДНК [1, 2]. В настоящее время широкое распространение получило проведение так называемых полногеномных (genome-wide) исследований, позволяющих одновременно анализировать сотни тысяч однонуклеотидных замен (далее SNPs, single-nu-cleotide polymorphisms) по всему геному [3—6]. Однако ставшие уже классическими методы анализа полиморфизма Y-хромосомы и митохондриальной ДНК (мтДНК) до сих пор не утратили своей актуальности и активно используются генетиками, поскольку позволяют взглянуть на историю популяций с позиций вклада каждого из полов в становление генофонда и, таким образом, раскрывают дополнительные специфические аспек-
ты становления генетической структуры человечества [7—10].
Несмотря на то что многие популяции мира уже были изучены с привлечением разнообразных систем маркеров, комплексный подход с использованием маркеров различного типа позволяет более полно охарактеризовать структуру изученных ранее этносов. Не является исключением в этом отношении и Кавказ. Несмотря на подробную характеристику, данную ранее популяциям этого региона антропологами, лингвистами и этнографами, многие вопросы остаются дискуссионными, в частности вопрос о происхождении тюркоязычных народов Кавказа и их взаимоотношениях с представителями популяций, принадлежащих к другим языковым семьям в регионе [11—15]. Ранее была проведена целая серия гене-тико-адаптационных и генетико-эпидемиологи-ческих исследований в популяциях данного региона [16—22]. С другой стороны, несмотря на важность этих работ, появление филогенетически информативных маркеров У-хромосомы и мтДНК [18, 19, 23] указывало на необходимость проведе-
Лингвистическая классификация изученных этнических групп Кавказа, а также курдов (по [31])
Северо-Кавказская яз. семья Картвельская яз. семья Алтайская яз. семья Индо-европейская яз. семья
Абхазо-адыгская группа Нахско-дагестан-ская группа Тюркская группа Иранская группа Армянская группа
Абхазы Адыгейцы Кабардинцы Черкесы Абазины Андийцы Аварцы Багуалинцы Чамалинцы Даргинцы Лезгины Табасараны Чеченцы Ингуши Мегрелы Карачаевцы Балкарцы Кумыки Кубанские ногайцы Караногайцы Осетины Курды Армяне
ния новых работ по изучению генетической структуры Кавказа. Это тем более важно, что во многих случаях рассматривались выборочные регионы, например Дагестан [24, 25] или Западный Кавказ [26]. В одной из последних работ, посвященных изучению популяций Кавказа, основной акцент делался на рассмотрение вопроса о наличии генетического барьера между популяциями Кавказа и Восточно-Европейской равнины, однако аспекты о генетических взаимоотношениях представителей различных языковых семей в регионе не анализировались [27]. В еще одной работе, где анализировался У-хромосомный пул в популяциях Кавказа, среди изучаемых групп отсутствовали тюркоязычные популяции [28]. В настоящей работе нами был предпринят комплексный подход по отношению ко всему региону в целом с использованием как однородитель-ских маркеров (мтДНК и У-хромосомы), так и полногеномных данных. Также, по сравнению с вышеупомянутой работой Юнусбаева с соавт. [27], нами был проанализирован гипервариабельный сегмент I (ГВС1) мтДНК внутри выявленных гаплогрупп и проведен дополнительный анализ полногеномных данных.
МАТЕРИАЛЫ И МЕТОДЫ
Материалом для исследования служили собранные в результате экспедиционных выездов образцы ДНК 22 этнических групп Кавказа (абазины, абхазы, грузины (мегрелы), армяне, адыгейцы, карачаевцы, кабардинцы, балкарцы, черкесы, осетины, андийцы, аварцы, багуалинцы, чамалинцы, чеченцы, даргинцы, ингуши, кумыки, лезгины, табасараны, кубанские ногайцы, ка-раногайцы). Лингвистическая классификация изученных этнических групп Кавказа дана в таблице. Здесь, однако, следует учитывать, что неко-
торыми авторами, полагающими, что абхазо-адыгские и нахско-дагестанские языки достаточно сильно различаются, отрицается существование единой северокавказской языковой семьи
[29]. Также в полногеномный анализ были включены курды, проживающие в Казахстане, поскольку в данном регионе живут переселенные в середине XX в. курды Кавказа. Пробы крови были собраны у взрослых индивидов с заполнением анкеты и подписанием информированного согласия. Этническая принадлежность определялась путем анкетирования: в исследование включались лишь индивидуумы, в роду которых, до второго поколения включительно, отсутствовали межэтнические браки. Выделение ДНК из лейкоцитов периферической крови проводили стандартным методом фенольно-хлороформной экстракции
[30]. Для определения гаплогрупп мтДНК проводили идентификацию 49 мутаций в кодирующем регионе с помощью ПДРФ-анализа, а также се-квенирование ГВС1 (16094—16390) контрольного региона мтДНК (n = 1838). Гаплогруппы Y-хро-мосомы идентифицировали путем анализа 61 ди-аллельного маркера нерекомбинирующей области Y-хромосомы (n = 1567). Медианная сеть для гаплогруппы R1b1b1-M73 по данным 8 STR локу-сов была построена с помощью программы Network 4.6.0.0 (Fluxus Technology Ltd). Данные, полученные в результате полногеномного скрининга 175 индивидов на платформе Illumina, а также литературные данные были обработаны в программе Plink (1.05) [32]. В анализ методом главных компонент [33] и методом кластеризации на основе подходов Байеса [34], проведенный с помощью программы ADMIXTURE [35], были включены только аутосомные SNP с долей успешного генотипирования >97% и минимальной частотой аллеля >1% согласно методике, указанной в [6, 27]. Анализ контроля качества прово-
дился по отношению к суммарной выборке изученных и взятых для сравнения популяций. Для нейтрализации влияния неравновесия по сцеплению в анализ были включены лишь с попарными значениями величин неравновесия по сцеплению г2 < 0.2. Финальный набор анализируемых данных для анализа главных компонент состоял из 101542 8МР у 183 индивидов: абхазы (20), мегрелы (20), армяне (19), адыгейцы (17), балкарцы (19), осетины (15), чеченцы (20), кумыки (13), лезгины (18), кубанские ногайцы (16), курды (6). Данные для сравнения были взяты из литературных источников [3, 6], финальный набор данных состоял из 850 индивидов.
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
Анализ маркеров митохондриальной ДНК
Анализ мтДНК показал, что подавляющее большинство гаплогрупп (88.5%) относятся к западно-евразийским (НУ, Н, V, J, Т, и, N1, I, ^ X) и лишь 11.5% — к восточно-евразийским (А, В, С,
D, Д G, М, №а, У, Z). Важно также отметить, что ряд обнаруженных на Кавказе гаплогрупп, к примеру гаплогруппа и7 и некоторые субклады гап-логруппы и2, имеет высокую степень встречаемости в Южной Азии [36, 37]. Рассматривая результаты анализа маркеров мтДНК и учитывая лингвистическую характеристику изученных популяций, можно сделать некоторые выводы относительно распространения восточно-евразийских линий в тюркоязычных группах. Ранее уже была показана высокая доля восточно-евразийского компонента в популяциях ногайцев (около 40%) [38], что неудивительно, учитывая их цен-тральноазиатское происхождение. Предками ногайцев являются различные монгольские племена, входившие в состав улуса, созданного золотоор-дынским темником Ногаем, которые смешались с тюркоязычными половцами и переняли их язык [14, 39]. Наши результаты подтверждают полученные ранее данные — соотношение западно- и восточно-евразийских линий составляет 49.5% и 50.5% у караногайцев и 80.9% и 19.1% у кубанских ногайцев. Генетический пул последних, по всей видимости, испытал существенное влияние автохтонных популяций Кавказа, что сказалось на повышении доли западно-евразийского компонента. Интересно, что ранее для ногайцев Адыге-Хабльского района была показана принадлежность к адыгскому антропологическому типу [14]. Однако и у кубанских ногайцев доля западно-евразийских линий в популяции ниже, чем в других тюркоязычных популяциях Кавказа
Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.