на главную страницу
 > Обзоры > SNP.

  Методы детекции SNP. следующая часть


ВВЕДЕНИЕ
ИЗВЕСТНЫЕ МЕТОДЫ ДЕТЕКЦИИ SNP
Ферментативные методы
Химические методы
Дискриминация аллельных вариантов электрофорезом
Дискриминация аллельных вариантов на твёрдой фазе
Хроматографические методы дискриминации аллельных вариантов
Физические методы детекции SNP
СПИСОК ЛИТЕРАТУРЫ

Татьяна Бородина
,
Институт Биологии Гена.

    Введение

    Согласно принятому определению (Brookes 1999), SNPs (single nucleotide polymorphisms; произноситься {'С' 'Н' 'П'} или {'СНиП'}) - это однонуклеотидные позиции в геномной ДНК, для которых в некоторой популяции имеются различные варианты последовательностей (аллели), причём редкий аллель встречается с частотой не менее 1%. Иногда дополнительно определяются "распространённые SNPs", для которых частота встречаемости редкого аллеля больше 20%. Однако, весьма часто, вопреки формальному определению, все небольшие изменения геномных последовательностей, обнаруженные в ходе SNP скрининга, размещаются в одних и тех же базах данных. В одном списке с SNPs оказываются небольшие инсерции/делеции (indels) и изменения нескольких нуклеотидов.

    В принципе, возможно существование двух/би-, трёх- и четырёхаллельных полиморфизмов. Однако на практике чрезвычайно редки даже трёхаллельные SNP (менее 0.1% всех SNP человека (Lai 2001)). Биаллельные SNP могут быть четырёх различных типов: один вид транзиций C<=>T (<=>A) и три типа трансверсий: C<=>A (G<=>T), C<=>G (G<=>C) и T<=>A (A<=>T). Транзиции составляют две третьих SNPs человека. Возможно это связано с происхождением C<=>T (G<=>A) замен в реакции деаминирования 5-метилцитозина.

    Практический интерес к SNPs сильно возрос в ходе реализации проектов по определению полных нуклеотидных последовательностей ряда модельных организмов. В самом определении SNPs заложена ориентация на их использование в качестве генетических маркеров (ограничение по частоте встречаемости противопоставляет их редким мутациям). Огромное количество SNPs в геноме человека (по различным оценкам, 3 - 10 миллионов распространенных SNP) позволяет отобрать порядка 100,000 SNP маркеров, при среднем расстоянии между маркерами 30тпн (Lai 2001). При этом на каждый известный или предполагаемый ген приходится в среднем по два маркера. Никакой другой тип геномных различий не способен обеспечить такую плотность картирования.

    Высокая плотность маркеров - не самоцель. Маркеры, находящиеся друг от друга на среднем расстоянии 30тпн, необходимы для исследования природы полигенных заболеваний и признаков. Лишь при такой плотности появляется возможность путём систематического скрининга и сравнения больших выборок здоровых и больных индивидуумов выявлять гены, участвующие в проявлении полигенных признаков. Надежный метод геномного скрининга SNP позволил бы разработать стандартный подход к исследованию молекулярной природы предрасположенности к различным заболеваниям и предсказанию индивидуальной чувствительности к лекарственным средствам.

    Применение SNP генотипирования не ограниченно фармакогенетикой и медициной. Помимо высокой плотности, SNPs имеют очень низкий уровень мутаций на поколение (~10-8), что делает их удобными маркерами молекулярной эволюции (Crow 1995; Li et al. 1996). Подробные генетические карты и эффективные системы генотипирования могли бы значительно ускорить и исследования, проводимые на модельных организмах.

    Ещё пять лет назад генотипирование, основанное на анализе SNPs, было невозможно из-за недостатка известных маркеров. В 1997 году несколько биотехнологических компаний выступили с инициативой обнаружить >60,000 SNPs для создания геномной карты. В 1999 году 13 фармацевтических компаний и фонд Wellcome Trust организовали "The SNP Consotium" поставивший целью создать общедоступную базу данных из минимум 300,000 SNPs. Успешное развитие этих и других проектов привело к тому, что в настоящее время в общедоступных базах данных имеется >1,8 миллиона SNPs (Рис.1) (Database of Single Nucleotide Polymorphisms, release Sep 12 2001; http://www.ncbi.nlm.nih.gov/SNP/). Компания Celera Genomics объявила о наличии в её базе данных более 3,5 миллионов вероятных SNP.


    Карта SNPs первой хромосомы человека.

    Рис. 1. Карта SNPs первой хромосомы человека. Общее число различающихся локусов 137426. Карта построена базой данных dbSNP National Center for Biotechnology Information.


    В настоящее время эффективное использование SNP генотипирования зависит от разработки дешёвых и эффективных способов детекции. Высокая потребность в надёжной методике приводит к тому, что множество лабораторий и фирм разрабатывают и предлагают свои собственные системы. Ключевыми параметрами эффективного скрининга являются цена (<0,2$ на SNP в 2001); частота ошибок (должна быть <1%) и производительность (по крайней мере 50,000 в день).

    Известные методы детекции SNP

    Существующие подходы к детекции аллельных вариантов можно условно разделить на несколько групп (Таблица 1). Разделение условно прежде всего потому, что в большинстве случаев используются сочетания различных методов (например, все физические методы используют и ферментативные реакции).

    По определению, к SNP относятся только генетические варианты, встречающиеся с заметной частотой. Поэтому, поиск новых SNPs включает два этапа: (1) идентификация изменения первичной структуры ДНК одним из перечисленных в таблице 1 способов и (2) анализ частоты встречаемости этого изменения в исследуемой популяции. Выбор оптимального подхода для каждого этапа зависит от конкретной задачи. Некоторые методики, разработанные для скрининга уже локализованных полиморфных участков не подходят для поиска и характеристики еще неизвестных и наоборот (Таблица 2).


    Таблица 1. Различные подходы к идентификации генетических изменений.
    Ферментативные подходы:
    полиморфизм длин рестрикционных фрагментов (RFLP);
    полиморфизм длин аплифицированных фрагментов (AFLP);
    расщепление Clevase I (CFLP);
    расщепление резольвазой (EMD);
    анализы, основанные на лигазной реакции (LDR, LCR, Padlock);
    инвазивное расщепление олигонуклеотидов (Invader);
    случайная амплификация полиморфной ДНК (RAPD, AP-PCR);
    ПЦР с прямой терминацией синтеза (DT-PCR);
    аллель-специфический ПЦР (AS-PCR).

    Химические методы:
    химическое расщепление гетеродуплексов;
    химическое лигирование.

    Методы, основанные на различной электрофоретической подвижности полиморфных участков ДНК:
    анализ конформации одноцепочечных фрагментов (SSCP);
    гетеродуплексный анализ;
    секвенирование ДНК.

    Детекция на твёрдой фазе:
    гибридизация на олигонуклеотидных матрицах;
    оптиковолоконный ДНК гибридизационный анализ;
    элонгация иммобилизованных праймеров (минисеквенс);
    пиросиквенс.

    Хроматографические методы:
    денатурирующая HPLC.

    Физические методы:
    масс-спектрометрия;
    резонансное тушение флуоресценции (FRET);
    люминесценция зависящая от локального окружения.

    Анализ in silico:
    сравнение имеющихся в базах данных геномных и EST последовательностей.


     
     
    Таблица 2. Стратегии используемые для поиска новых и детекции известных генетических изменений.
    Анализ известных аллелейПоиск новых генетических вариантов
    RFLP;
    химическое лигирование;
    AS-PCR;
    Invader;
    LDR, LCR;
    FRET;
    микроматрицы (потеря сигнала);
    минисеквенирование;
    пиросиквенс.
    SSCP и гетеродуплексный анализ;
    химическое расщепление гетеродуплексов;
    секвенирование ДНК;
    RAPD, AP-PCR;
    DT-PCR;
    ALFP;
    CFLP;
    EMD;
    микроматрицы (поиск сигнала).

    Ферментативные методы

    Исторически первые широко использовавшиеся методы детекции полиморфных участков ДНК использовали ферменты рестрикции и ограничивались детекцией изменений в рестрикционных сайтах. Позже были разработаны другие ферментативные подходы. Несмотря на то, что в настоящее время не все они реализованы в высокопроизводительном варианте, многие данные свидетельствуют о возможности их расширения и автоматизации.


    AFLP анализ штаммов E.coli

    Полиморфизм длин рестрикционных фрагментов и полиморфизм длин амплифицированных фрагментов

    Определение полиморфного сайта рестрикции методом RFLP (restriction fragment length polymorphism) заключается в ПЦР-амплификации интересующего фрагмента и его последующем расщеплении соответствующей рестриктазой (Schumm et al. 1988). Благодаря простоте и надёжности метод получил широкое распространение и до сих пор популярен, хотя и имеет некоторые ограничения - во-первых, он позволяет детектировать только SNPs, расположенные в сайтах рестрикции, а во-вторых, годится лишь для детекции уже известных мутаций.

    Последнее ограничение удалось обойти, поменяв местами этапы амплификации и рестрикции (AFLP - amplification fragment length polymorphism) (Puc. 2). Сначала геномная ДНК обрабатывается набором рестриктаз (как правило, сочетанием двух рестриктаз, узнающих 6и и 4х нуклеотидные последовательности). К полученным фрагментам лигируются адапторы. Для последующей амплификации используются праймеры, комплементарные адапторной последовательности и заходящие за сайт рестрикции на три произвольно выбранных нуклеотида. Триплеты обеспечивают амплификацию лишь некоторой части рестрикционных фрагментов. Метод позволяет анализировать большое количество SNPs без знания их нуклеотидной последовательности (Vos et al. 1995).


    Рис. 2. AFLP анализ штаммов E.coli. По два независимых анализа штаммов BL21, BL21F'IQ, DH5[alpha], DH5[alpha]F'IQ, HB101. Стрелками отмечены полиморфные сайты. (Lin et al. 1996).


    Расщепление ДНК структуро-специфическими эндонуклеазами

    Многие подходы основаны на зависимости вторичной структуры одноцепочечной ДНК от её последовательности и от кинетики ренатурации. Гетеродуплексы, полученные после ренатурирации ДНК могут быть расщеплены конформационно-специфическими эндонуклеазами. Это приводит к появлению набора меченых фрагментов, которые разделяются в гель- или капиллярном электрофорезе (Sander et al. 1999). С использованием Cleavase I (Puc. 3) (Third Wave Technologies), узнающей и расщепляющей несовершенные шпильки, удалось детектировать ряд мутаций в гене ТР53 (Okamoto and Nagano 1999).


    Картирование мутации с помощью Cleavase I






    Рис. 3. Идентификация и картирование мутации ассоциированной с устойчивостью M. tuberculosis к изониазиду/isoniazid с помощью расщепления Cleavase I. Найденные различия (A, B,C) отмечены стрелками. (Brow et al. 1996).


    Другой фермент, резольваза (эндонуклеаза VII), выделенная из бактериофага Т4, также использовалась для энзиматической детекции мисматчей (Tito et al. 1998). In vivo этот фермент расщепляет ДНК-конкатемеры, возникающие при репликации фага Т4. Использование флуоресцентно-меченых праймеров при амплификации ДНК позволяет проводить анализ продуктов расщепления гетеродуплексов на автоматическом секвенаторе типа ABI 377 или ABI 310. Это существенно повышает производительность метода и позволяет его автоматизировать. Эндонуклеазные методы позволяют детектировать нуклеотидные замены, инсерции и делеции, однако очень чувствительны к качеству очистки ДНК.

    Кроме перечисленных выше ферментов, для расщепления и детекции гетеродуплексов используются S1 нуклеаза (Howard et al. 1999.), рибонуклеазы, новая эндонуклеаза растений (Oleykowski 1998), MutS (Sachadyn 2000) и MutY белки (Nurmi 2000; Smith and Modrich 1996.).



  Методы детекции SNP. следующая часть

"Практическая Молекулярная Биология" http://molbiol.edu.ru
e-mail: pmb@molbiol.edu.ru


Rambler's Top100