Приборы и биоинформатика

Как проводится NGS исследование?

NGS (Next-Generation Sequencing) — это высокотехнологичный метод массового параллельного секвенирования ДНК/РНК, позволяющий анализировать сотни генов одновременно с высочайшей точностью.

Исследование начинается с обработки биологического материала. Биоматериал представляет собой:

Зафиксированные в парафине образцы ткани
Замороженные образцы ткани
Кровь

После получения биоматериала, следует этап пробоподготовки.

Пробоподготовка

Auto-Pure 32A Allsheng – устройство для выделения и очистки нуклеиновых кислот методом магнитной хроматографии. Преимуществами системы являются высокая автоматизация, быстрая экстракция, стабильные результаты и простота эксплуатации.

Tecan — автоматизированная лабораторная платформа для автоматизации жидкостных манипуляций и повышения эффективности лабораторных исследований, особенно в условиях высоких объёмов работы.

Qsep400 BIOptic — это высокопроизводительный автоматизированный анализатор фрагментов полимеров. Это продукт с самыми высокими техническими характеристиками в серии Qsep, способный анализировать сотни образцов за один день.

Специальные автоматизированные станции выполняют выделение НК из биоматериала, её очистку и подготовку библиотек к секвенированию. Роботы минимизируют человеческий фактор, обеспечивают точность дозировок и полную воспроизводимость процедур.

На каждом этапе обрабатываемые образцы проходят контроль качества.

На этом этапе создаются библиотеки фрагментов ДНК — своеобразные «копии» исходного генетического материала, готовые к NGS.

Секвенирование

GeneMind SURFSeq 5000 — высокопроизводительная платформа для секвенирования с широкими возможностями применения, высокой скоростью секвенирования и хорошим качеством данных.

MGI DNBSEQ-G400 — универсальный секвенатор, разработанный для средних и крупных геномных проектов. Поддерживая различные длины прочтений и режимы секвенирования, он обеспечивает высокую производительность, точность и гибкость для таких приложений, как диагностика рака, транскриптомика и секвенирование всего генома. В МГС службе процессируется ~750 образцов в месяц, из них 100 – экзомы

Подготовленные библиотеки загружаются в секвенатор нового поколения (MGI DNBSEQ-G400 или GeneMind SURFSeq 5000).

Внутри прибора молекулы ДНК разделяются на миллионы коротких фрагментов, каждый из которых “прочитывается” с высокой точностью.

Результатом становится огромный поток данных — миллионы строк с последовательностями нуклеотидов (A, T, G, C). Это — цифровое представление генетического кода человека. Эти данные позволяют проводить анализ на уровне одной нуклеотидной замены, выявляя мутации, вариации структуры генома или транскриптома.

В МГС есть несколько панелей для целевого (таргетного) обогащения:

HRR Panel v1.0 [35 genes]

Анализ ДНК

Кодирующие области генов:

ATM, ATR, BARD1, BLM, BRCA1, BRCA2, BRIP1, CDK12, CHEK1, CHEK2, FANCA, FANCC, FANCD2, FANCE, FANCF, FANCG, FANCI, FANCL, FANCM, MRE11, NBN, PALB2, RAD50, RAD51, RAD51B, RAD51C, RAD51D, RAD52, RAD54L, RBBP8, RPA1, SLX4, XRCC2, TP53, PPP2R2A

HiSNP Ultra Panel v1.0

Анализ ДНК

Панель HiSNP Ultra Panel v1.0 разработана для анализа состава генома с высоким разрешением. Эта панель позволяет сканировать весь геном с интервалом в 50 кб, выявляя более 52 000 участков SNP с высоким MAF.

Используется для проверки статуса HRD (Homologous Recombination Deficiency, дефицит гомологичной рекомбинации) и CNV (Copy Number Variation, вариация числа копий)

NanOnco Plus Panel v3.0 [637 genes]

Анализ ДНК и/или РНК

Кодирующие области генов

ABL1, ABL2, ACVR1, ACVR1B, AGO2, AJUBA, AKT1, AKT2, AKT3, ALK, ALOX12B, AMER1, ANKRD1, APC, AR, ARAF, ARFRP1, ARHGAP35, ARID1A, ARID1B, ARID2, ARID5B, ASXL1, ASXL2, ATM, ATR, ATRX, AURKA, AURKB, AXIN1, AXIN2, AXL, B2M, BABAM1, BACH1, BAP1, BARD1, BBC3, BCL10, BCL2, BCL2L1, BCL2L11, BCL2L2, BCL6, BCOR, BCORL1, BIRC3, BLM, BMPR1A, BRAF, BRCA1, BRCA2, BRD4, BRIP1, BTG1, BTG2, BTK, CALR, CARD11, CARM1, CASP8, CBFB, CBL, CCND1, CCND2, CCND3, CCNE1, CD22, CD274, CD276, CD70, CD74, CD79A, CD79B, CDC42, CDC73, CDH1, CDK12, CDK4, CDK6, CDK8, CDKN1A, CDKN1B, CDKN2A, CDKN2B, CDKN2C, CEBPA, CENPA, CFTR, CHD2, CHD4, CHEK1, CHEK2, CIC, COL4A6, CREBBP, CRKL, CRLF2, CSDE, CSF1, CSF1R, CSF3R, CTCF, CTLA4, CTNNA, CTNNB1, CTSO, CUL3, CUL4A, CXCR4, CYLD, CYP17A1, CYP2D6, CYSLTR2, DAXX, DCUN1D1, DDR1, DDR2, DDX3X, DICER1, DIS3, DNAJB1, DNMT1, DNMT3A, DNMT3B, DOT1, DROSHA, DUSP4, E2F3, EED, EGFL7, EGFR, EIF1AX, EIF4A2, EIF4E, ELF3, EME1, EMSY, EP300, EPAS1, EPCAM, EPHA3, EPHA5, EPHA7, EPHB1, EPHB4, ERBB2, ERBB3, ERBB4, ERCC1, ERCC2, ERCC3, ERCC4, ERCC5, ERF, ERG, ERRFI1, ESR1, ETV1, ETV6, EWSR1, EXO1, EZH1, EZH2, EZR, FAAP20, FAM175A, FAM46C, FAM58A, FANCA, FANCC, FANCD2, FANCE, FANCF, FANCG, FANCI, FANCL, FANCM, FAS, FAT1, FAT2, FAT4, FBXW7, FGF10, FGF12, FGF14, FGF19, FGF23, FGF3, FGF4, FGF6, FGFR1, FGFR2, FGFR3, FGFR4, FH, FLCN, FLT1, FLT3, FLT4, FOXA1, FOXL2, FOXO1, FOXP1, FRS2, FUBP1, FYN, GABRA6, GALNT12, GATA1, GATA2, GATA3, GATA4, GATA6, GEN1, GID4, GLI1, GNA11, GNA13, GNAQ, GNAS, GPR124, GPS2, GREM1, GRIN2A, GRM3, GSK3B, GTF2I, H3F3A, H3F3B, H3F3C, HDAC1, HDAC2, HFM1, HGF, HIST1H1C, HIST1H2BD, HIST1H3A, HIST1H3B, HIST1H3C, HIST1H3D, HIST1H3E, HIST1H3F, HIST1H3G, HIST1H3H, HIST1H3I, HIST1H3J, HIST2H3C, HIST2H3D, HIST3H3, HLA-A, HLA-B, HLA-C, HLA-DMA, HLA-DMB, HLA-DOA, HLA-DOB, HLA-DPA1, HLA-DPB1, HLA-DQA1, HLA-DQA2, HLA-DQB1, HLA-DQB2, HLA-DRA, HLA-DRB1, HLA-DRB3, HLA-DRB4, HLA-DRB5, HMGA2, HNF1A, HOXB13, HRAS, HSD3B1, HSP90AA1, ICOSLG, ID3, IDH1, IDH2, IFNGR1, IGF1, IGF1R, IGF2, IKBKE, IKZF1, IL10, IL7R, INHA, INHBA, INPP4A, INPP4B, INPPL1, INSR, IRF2, IRF4, IRS1, IRS2, JAK1, JAK2, JAK3, JUN, KAT6A, KBTBD4, KDM5A, KDM5C, KDM6A, KDR, KEAP1, KEL, KIT, KLF, KLHL6, KMT2A, KMT2B, KMT2C, KMT2D, KNSTRN, KRAS, LATS1, LATS2, LMO1, LRP1B, LTK, LYN, LZTR1, MAF, MAGI2, MALT1, MAP2K1, MAP2K2, MAP2K4, MAP3K1, MAP3K13, MAP3K14, MAPK1, MAPK3, MAPKAP1, MAX, MC1R, MCL1, MDC1, MDM2, MDM4, MECOM, MED12, MEF2B, MEN1, MERTK, MET, MGA, MITF, MKNK1, MLH1, MLH3, MPL, MRE11, MSH2, MSH3, MSH6, MSI1, MSI2, MST1, MST1R, MTAP, MTOR, MUTYH, MYC, MYCL, MYCN, MYD88, MYH9, MYOD1, NBN, NCOA3, NCOR1, NEGR1, NF1, NF2, NFE2L2, NFKBIA, NKX2-1, NKX3-1, NOTCH1, NOTCH2, NOTCH3, NOTCH4, NPM1, NRAS, NRG1, NRIP1, NSD1, NT5C2, NTHL1, NTRK1, NTRK2, NTRK3, NUF2, NUP93, P2RY8, PAK1, PAK3, PAK7, PALB2, PARK2, PARP1, PARP2, PARP3, PARP4, PAX5, PBRM1, PDCD1, PDCD1LG2, PDGFB, PDGFRA, PDGFRB, PDK1, PDPK1, PEG3, PGR, PHOX2B, PIK3C2B, PIK3C2G, PIK3C3, PIK3CA, PIK3CB, PIK3CD, PIK3CG, PIK3R1, PIK3R2, PIK3R3, PIM1, PLCG2, PLK2, PMAIP1, PMS1, PMS2, PNRC1, POLD1, POLE, POT1, PPARG, PPM1D, PPP2R1A, PPP2R2A, PPP4R2, PPP6C, PRDM1, PRDM14, PREX2, PRKAR1A, PRKCI, PRKD1, PRKDC, PRSS1, PRSS8, PTCH1, PTEN, PTP4A, PTPN11, PTPRD, PTPRO, PTPRS, PTPRT, QKI, RAB35, RAC1, RAC2, RAD21, RAD50, RAD51, RAD51B, RAD51C, RAD51D, RAD52, RAD54B, RAD54L, RAF1, RANBP2, RARA, RASA1, RB1, RBBP8, RBM10, RECQL, RECQL4, REL, RET, RFWD2, RHBDF2, RHEB, RHOA, RIC8A, RICTOR, RINT1, RIT1, RNF43, ROBO2, ROS1, RPA1, RPA3, RPS6KA4, RPS6KB2, RPTOR, RRAGC, RRAS, RRAS2, RSPO, RTEL1, RUNX1, RUNX1T1, RXR4, RYBP, SDHA, SDHAF2, SDHB, SDHC, SDHD, SESN1, SESN2, SESN3, SETD2, SETD8, SF3B1, SGK1, SH2B3, SH2D1A, SHKBP1, SHOC2, SHQ1, SIN3A, SLFN11, SLIT2, SLX4, SMAD2, SMAD3, SMAD4, SMARCA4, SMARCB1, SMARCD1, SMO, SMYD3, SNCAIP, SOCS1, SOS1, SOX10, SOX17, SOX2, SOX9, SPEN, SPINK1, SPOP, SPRED1, SPTA1, SRC, SRSF2, STAG2, STAT3, STAT4, STAT5B, STK11, STK19, STK40, SUFU, SUZ12, SYK, TAF1, TAP1, TAP2, TBX3, TCEB1, TCF3, TCF7L2, TEK, TERC, TERT, TET1, TET2, TFE3, TGFBR1, TGFBR2, TIPARP, TMEM127, TMPRSS2, TNFAIP3, TNFRSF14, TOP1, TOP2A, TP53, TP53BP1, TP63, TRAF2, TRAF7, TSC1, TSC2, TSHR, TSPAN31, TTF1, TYRO3, U2AF1, UPF1, VEGFA, VHL, VTCN1, WHSC1, WHSC1L1, WISP3, WRN, WT1, WWTR1, XIAP, XPO1, XRCC2, XRCC3, YAP1, YES1, ZBTB2, ZFHX3, ZNF217, ZNF423, ZNF703;

Микросателлитные маркеры:

BAT-25, BAT-26, BAT-40, BAT-RII, NR-21, NR-22, NR-24, NR-27, MONO-27, D2S123, D5S346, D17S250, D17S261, D17S20, D18S34;

Клинически значимые полиморфизмы:

s1801133, rs1801268, rs56038477, rs78060119, rs10929302, rs3064744, rs25487, rs1051266, rs28371725, rs5030867, rs28371704, rs28371703, rs67376798, rs75017182, rs4148323, rs1135840, rs16947, rs201377835, rs1801160, rs72549306, rs1142345, rs75467367, rs5030656, rs1065852, rs3918290, rs1801266, rs1800584, rs74478221, rs72549352, rs769258, rs72549303, rs115232898, rs1800460, rs766507177, rs35742686, rs17376848, rs2297595, rs1800462, rs28371735, rs3892097, rs59086055, rs72549309, rs186364861, rs1135835, rs5030655, rs55886062, rs1801265, rs116855232, rs1135833, rs1058164, rs1801159, rs396991, rs147390019, rs1058172, rs61736512, rs1801158, rs4673993, rs45445694, rs59421388, rs28371706;

Отдельные интронные области:

ALK – intron 18–19	BCL2 – 3’UTR	BCR – intron 8,13–14	BRAF – intron 7–10	BRCA1 – intron2,7–8,12,16,19–20	BRCA2 – intron 2	CD74 – intron 6–8	EGFR – intron 7,15,24–27	ETV4 – intron 5–6	ETV5 – intron 6–7	ETV6 – intron 5–6
EWSR1 – intron 6–13	EZR – intron 9–12	FGFR1 – intron 1,5,17	FGFR2 – intron 1,17	FGFR3 – intron 17	FLI1 – intron 3–8	KIT – intron 16	KMT2A – intron 6–11	MET – intron 1,14	MSH2 – intron 5	MYB – intron 14
MYC – intron 1	NOTCH2 – intron 26	NTRK1 – intron 8–10	NTRK2 – intron 12,15	NTRK3 – intron 13–14	NUTM1 – intron 1	PDGFB – intron 1	PDGFRA – intron 7,9,11	RAF1 – intron 4–9	RARA – intron 2	RET – intron 7–11
ROS1 – intron 31–35	RSPO2 – Upstream,5’UTR, exon 1–2, intron 1	SDC4 – intron 2	SLC34A2 – intron 4	TMPRSS2 – intron 1–3

NEXome Plus Panel

Анализ ДНК

Эта панель охватывает весь экзом и позволяет анализировать 22 000 генов.

Кроме того:

9000 локусов с высокими значениями MAF для детекции изменения копийности и анализа HRD
Интроны для перестроек: 38 генов
Микросателлитные маркеры: BAT-25, BAT-26, BAT-40, BAT-RII, NR-21, NR-22, NR-24, NR-27, MONO-27, D2S123, D5S346, D17S261, D17S520, D17S250, D18S34

OncoFu Elite (for RNA) Panel v1.0 [105 genes]

Анализируется РНК

Список генов:

ABL1*†, ABL2, AKT3, ALK, ARHGAP26, AXL, BCL2†, BCOR*, BRAF, BRD3*, BRD4*, CAMTA1,CCNB3*, CCND1, CIC†, COL6A3, CSF1R, DNAJB1, EGFR, EML4, EPC1*, ERBB2†, ERG*, ESR1, ETS1, ETV1*, ETV4, ETV5*, ETV6*, EWSR1, FGFR1, FGFR2, FGFR3, FGR*, FLI1, FLT3, FOSB, FOXO1, FUS, GLI1, HMGA2, INSR, JAK2*, JAK3, JAZF1, KIF5B†, KIT†, KMT2A, MAML2, MAST1, MAST2, MEAF6, MET*, MLLT3, MSH2, MSMB†, MUSK, MYB, MYC, NCOA1*, NCOA2*, NOTCH1, NOTCH2, NOTCH3†, NR4A3*, NRG1, NTRK1, NTRK2, NTRK3, NUMBL, NUTM1, PAX3, PAX7, PDGFB, PDGFRA, PDGFRB†, PHF1*, PIK3CA*, PKN1, PLAG1*, PPARG*, PRKACA, PRKCA, PRKCB, RAF1, RARA*, RELA, RET, ROS1, RSPO2*, RSPO3, SS18, STAT6* , TAF15, TCF12†, TCF3, TERT, TFE3, TFEB, TFG, THADA, TMPRSS2*†, TP53*, USP6*, YWHAE*
* Covers all 5′-UTRs; †Covers all 3′-UTRs

HLA typing Panel v2.0 [11 genes ]

Анализируется ДНК

Панель HLAtyping Panel v2.0 основана на последней базе данных (версия 3.50) и предназначена для 11 генов HLA (класс I: HLA-A, B, C; класс II: HLADPA1, DPB1, DQA1, DAQB1, DRB1/3/4/5). Зонд охватывает всю последовательность генома всех аллелей и поддерживает высокоточное типирование до уровня четвёртого поля.

Биоинформатическая обработка

Обработка данных, полученных методом NGS, представляет собой многоэтапный процесс с применением специализированных вычислительных алгоритмов (пайплайнов) и программного обеспечения, направленных на выявление различных типов молекулярно-генетических изменений.

HLA-типирование осуществляется с использованием инструмента HLA-HD, обеспечивающего высокоточное определение аллелей генов главного комплекса гистосовместимости на основании данных секвенирования, полученных с помощью специализированной панели.
Герминальные однонуклеотидные варианты и индели (SNV, indel). Для высокоточного обнаружения наследуемых вариантов используются пайплайны на основе DeepVariant (Google) и HaplotypeCaller (GATK).
Соматические однонуклеотидные варианты и индели (SNV, indel). Выявление соматических вариантов выполняется с помощью инструмента Mutect2 (GATK), признанного стандартом для соматического анализа. Подход обеспечивает высокую точность как при работе с одиночными опухолевыми образцами, так и при наличии пар «опухоль–норма».
Варианты числа копий (CNV). Определение изменений числа копий в соматических образцах выполняется с применением инструментов CNVkit и PureCN, обеспечивающих детекцию амплификаций и делеций.
Перестройки (транслокации, химерные транскрипты). Выявление соматических химерных транскриптов осуществляется с использованием инструментов Arriba и STAR-Fusion, которые позволяют надежно обнаруживать транслокации, являющиеся важными предиктивными и диагностическими биомаркерами для многих онкологических заболеваний.
Дефицит гомологичной рекомбинации (HRD). Оценка дефицита гомологичной репарации осуществляется с использованием инструмента scarHRD, применяемого для анализа специализированной панели HiSNP Ultra Panel. Такой подход позволяет выявлять характерные геномные сигнатуры HRD, включая LOH, TAI и LST, что важно для стратификации пациентов и выбора таргетной терапии.
Мутационная нагрузка определяется как по числу миссенс-мутаций, отражающих возможные функциональные последствия, так и по совокупности всех обнаруженных соматических вариантов, включая синонимичные, что обеспечивает комплексную оценку уровня геномной нестабильности.
Доля опухолевых клеток в образце (tumor purity / cancer cell fraction, CCF) оценивается с использованием инструмента PureCN, который позволяет определять содержание опухолевых клеток на основе совокупного анализа CNV-профиля и аллельных частот вариантов.

Перечисленные этапы анализа сопровождаются комплексной оценкой качества секвенирования и последующей биологической аннотацией, интеграцией с клиническими данными и интерпретацией результатов. Все этапы обеспечиваются инфраструктурой высокопроизводительных вычислительных систем и требуют участия квалифицированных специалистов в области биоинформатики, программирования и молекулярной биологии.

Интерпретация

Объемные массивы геномных данных требуют тщательной и системной интерпретации.

Использование клинических и генетических баз данных позволяет достоверно различать нейтральные варианты и потенциально патогенные изменения. На этапе интерпретации формируется детальный генетический профиль образца, связывающий конкретные изменения ДНК или РНК с биологическими процессами и заболеваниями.

Для интерпретации соматических вариантов в МГС применяется следующая система:

1. Руководства: