Ma `lumot

Katta ketma-ketlikka ega mRNK ikkilamchi strukturasini qanday bashorat qilish mumkin?

Katta ketma-ketlikka ega mRNK ikkilamchi strukturasini qanday bashorat qilish mumkin?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

MRNA ikkilamchi tuzilishini taxmin qilish uchun ba'zi veb -serverlardan foydalansam, ular har doim kichik o'lchamli ketma -ketlikda talab qilinadi. Agar men uzoq ketma-ketlikni ishlatsam va uni kichik qismlarga ajratsam, bashorat qilishda bu kichik qismlar energiya yoki termodinamik ma'lumotlarni kelib chiqish ketma-ketligidan o'zgartiradimi? Uzoq ketma -ketlikni kesishda to'g'ri saytlarni topishning samarali usuli bormi?


Ha, ketma-ketlikni ajratish orqali bashorat qilingan tuzilma to'liq uzunlikdagi RNKning haqiqiy tuzilishini aks ettirmasligi mumkin. Oddiy faraziy holat RNKning 3' va 5' UTRlari o'zaro ta'sir qilishda aylanma hosil bo'lishiga olib keladi.

Qo'rqamanki, alohida -alohida ikkilamchi tuzilmalarni yig'ish haqiqiy tuzilishga eng yaqin bo'lgan ketma -ketlikni tanlashning aniq qoidasi yo'q.

Yaxshiroq hisoblash quvvati bilan ikkilamchi tuzilmani bashorat qilish uchun ketma-ketlik o'lchamidagi cheklovni engib o'tishni kutishimiz mumkin.

Biroq, haqiqiy ikkilamchi tuzilmani - SHAPE-seq (ver 2.0; Loughrey va boshq. 2014) va struktura-seqni (Ding va boshq. 2014) aniqlashi mumkin bo'lgan RNK ketma-ketligidan foydalangan holda eksperimental usullar mavjud. Struktura-sek aslida RNK ikkilamchi tuzilmalarini aniqlashga harakat qiladi jonli va shuning uchun yanada kuchli vosita bo'lishi mumkin.

Biroq, siz mRNA bilan ishlayotganingizni aytdingiz. O'ylaymanki, mRNKlar uchun siz UTR va CDS tuzilmalarini alohida taxmin qilishingiz mumkin. Aslida sizni qiziqtirgan narsangizga bog'liq. CDS odatda hech qanday tarkibiy motivga ega emas va har qanday ikkilamchi tuzilma odatda eIF4A ning helikaz faolligi bilan hal qilinadi. Biroq, ikkilamchi tuzilmalar tarjimaning cho'zilish tezligini sekinlashtirishi mumkin (Mao va boshq. 2010, Gorochovskiy va boshq. 2015).


  1. Loughrey, D., Watters, K. E., Settle, A. H., & Lucks, J. B. (2014). SHAPE-Seq 2.0: yangi avlod ketma-ketligi bilan RNK ikkilamchi tuzilishini yuqori o'tkazuvchanlik bilan kimyoviy tekshirishni tizimli optimallashtirish va kengaytirish.. Nuklein kislotalarini tadqiq qilish, 42(21) e165.

  2. Ding, Y., Tang, Y., Kvok, C. K., Chjan, Y., Bevilacqua, P. C. va Assmann, S. M. (2014). RNKning ikkilamchi tuzilishini genom bo'yicha in vivo jonli tarzda tuzish yangi tartibga solish xususiyatlarini ochib beradi. Tabiat, 505(7485), 696-700.

  3. Mao, Y., Liu, H., Liu, Y. va Tao, S. (2014). MRNA ikkilamchi tuzilish dinamikasi Saccharomyces cerevisiae -da tarjima samaradorligiga ta'sir ko'rsatadigan qoidalarni hal qilish.. Nuklein kislotalarini tadqiq qilish, 42(8), 4813-4822.

  4. Gorochowski, T. E., Ignatova, Z., Bovenberg, R. A., & Roubos, J. A. (2015). TRNA ko'pligi va mRNA ikkilamchi tuzilishi o'rtasidagi almashinuv tarjima cho'zilish tezligini yumshatishga yordam beradi. Nuklein kislotalarini tadqiq qilish, gkv199.


Yuqorida aytib o'tilgan yagona ketma-ketlik usullari, mumkin bo'lgan tuzilmalarning katta maydonidan oqilona ikkilamchi tuzilmalarning kichik namunasini aniqlash qiyin ishdir. Maydon hajmini kamaytirishning yaxshi usuli - evolyutsion yondashuvlardan foydalanish. Evolyutsiya tomonidan saqlanib qolgan tuzilmalar funktsional shakl bo'lish ehtimoli ko'proq. Quyidagi usullar ushbu yondashuvdan foydalanadi.

  1. ^Tartiblar soni: & ltany | raqam & gt.
  2. ^Moslash: tekislashni bashorat qiladi, & ltinput | ha | yo'q & gt.
  3. ^Tuzilishi: tuzilishini bashorat qiladi, & ltinput | ha | yo'q & gt.
  4. ^Tugunlar:Pseudoknot bashorati, & ltyes | yo'q & gt.

RNAsnap2 BLAST + INFERNAL (RNAsol bilan bir xil) dan yaratilgan evolyutsion xususiyatlarga ega kengaytirilgan konvolyutsion neyron tarmog'idan va RNK erituvchiga kirish imkoniyatini bashorat qilish uchun kirish sifatida LinearPartition-dan taxmin qilingan tayanch juftlik ehtimolidan foydalanadi. Bundan tashqari, RNAsnap2 ning bitta ketma-ket versiyasi, evolyutsion ma'lumotni ishlatmasdan, berilgan kirish RNK ​​ketma-ketligining hal qiluvchi imkoniyatlarini bashorat qilishi mumkin. manba kodi

RNAsol bashoratchisi BLASTN + INFERNAL dan olingan evolyutsion ma'lumotlarga ega va RNK erituvchining mavjudligini bashorat qilish uchun kirish sifatida RNAfolddan bashorat qilingan ikkilamchi tuzilishga ega bir tomonlama LSTM chuqur o'rganish algoritmidan foydalanadi. manba kodi

Ko'p ncRNKlar boshqa RNKlarga bog'lanib ishlaydi. Masalan, miRNKlar 3' UTR bilan bog'lanish orqali protein kodlovchi gen ekspressiyasini tartibga soladi, kichik nukleolyar RNKlar rRNK, U4 spliceosomal RNK va U6 spliceosomal RNK bir-biriga bog'lanib, spliceosoma va ko'plab kichik bakterial RNKlar bilan bog'lanib, post-transkripsiyadan keyingi o'zgarishlarni boshqaradi. antisensial o'zaro ta'sirlar orqali gen ekspressiyasini tartibga solish Masalan GcvB, OxyS va RyhB.

Ism Tavsif Ichki molekulyar tuzilish Qiyosiy Havola Ma'lumotnomalar
RNK-yirtqich RNApredator RNK-RNK o'zaro ta'sir qilish saytlarini hisoblash uchun dinamik dasturlash usulini qo'llaydi. Ha Yo'q veb-server [93]
GUUGle A-U, C-G va G-U bazaviy juftlashtirish orqali mukammal duragaylash bilan RNK-RNK mosligini tez aniqlash uchun yordamchi dastur. Yo'q Yo'q veb-server [94]
IntaRNK Maqsadli saytlarga kirish imkoniyatini o'z ichiga olgan maqsadni samarali bashorat qilish. Ha Yo'q manba kodli veb -server [95] [96] [97] [98] [99]
KopraRNK SRNA maqsadli bashorat qilish vositasi. U alohida butun genom IntaRNK bashoratlari aralashmasi orqali butun genom bashoratlarini hisoblab chiqadi. Ha Ha manba kodi veb-server [100] [96]
MINT RNK va DNK molekulalarining uch o'lchovli tuzilmalarini, ularning to'liq atomli molekulyar dinamika traektoriyalarini yoki boshqa konformatsiya to'plamlarini (masalan, rentgen nurlari yoki NMR-dan olingan tuzilmalar) tahlil qilish uchun avtomatik vosita. Har bir RNK yoki DNK konformatsiyasi uchun MINT vodorod bilan bog'lanish tarmog'ini aniqlab, asosiy juftlik sxemasini aniqlaydi, ikkilamchi tuzilish motiflarini (spirallar, birikmalar, halqalar va boshqalar) va psevdoknotlarni aniqlaydi. Shuningdek, stacking energiyasi va fosfat anion-asos o'zaro ta'sirini baholaydi. Ha Yo'q manba kodli veb -server [101]
NUPACK Suyultirilgan eritmadagi o'zaro ta'sir qiluvchi iplarning to'liq psevdoknotsiz bo'linish funktsiyasini hisoblaydi. Muayyan murakkablikdan pastda buyurtma qilingan komplekslarning konsentratsiyasini, mfesini va bazaviy juftlik ehtimolini hisoblab chiqadi. Shuningdek, psevdoknotli tuzilmalar sinfini o'z ichiga olgan yagona iplarning bo'linish funktsiyasi va tayanch juftligini hisoblaydi. Shuningdek, buyurtma qilingan komplekslarni loyihalash imkonini beradi. Ha Yo'q NUPACK [102]
OligoWalk/RNA tuzilishi Molekulyar tuzilishga ega va bo'lmagan bimolekulyar ikkilamchi tuzilmalarni bashorat qiladi. Shuningdek, u qisqa nuklein kislotaning RNK nishoniga gibridlanish yaqinligini ham bashorat qiladi. Ha Yo'q [1] [103]
piRNA RNK-RNK o'zaro ta'sirining bo'linish funktsiyasi va termodinamikasini hisoblab chiqadi. U pseudoknots, o'zaro ta'sir psevdoknotlari yoki zigzaglarni o'z ichiga olmaydigan ikkita o'zaro ta'sir qiluvchi nuklein kislotalarning mumkin bo'lgan qo'shma ikkilamchi tuzilishini ko'rib chiqadi. Ha Yo'q linuxbinary [104]
RNAripalign Strukturaviy hizalamalar asosida RNK-RNK o'zaro ta'sirining bo'linish funktsiyasi va termodinamikasini hisoblab chiqadi. Shuningdek, bitta ketma-ketliklar uchun RNK-RNK o'zaro ta'sirini bashorat qilishni qo'llab-quvvatlaydi. Boltsmann taqsimotiga asoslangan suboptimal tuzilmalarni chiqaradi. U ikkita o'zaro ta'sir qiluvchi nuklein kislotalarning barcha mumkin bo'lgan qo'shma ikkilamchi tuzilishini ko'rib chiqadi, ular tarkibida psevdoknotlar, o'zaro ta'sir psevdoknotlari yoki zigzaglar mavjud emas. Ha Yo'q [2] [105]
RactIP Butun sonli dasturlash yordamida RNK-RNK o'zaro ta'sirini tez va aniq bashorat qilish. Ha Yo'q manba kodli veb -server [106]
RNAalidupleks Covarying saytlari uchun bonuslar bilan RNAduplex asosida Yo'q Ha manba kodi [17]
RNAkofold RNAfold kabi ishlaydi, lekin ikkita RNK ketma -ketligini belgilashga imkon beradi, keyinchalik dimer tuzilishini yaratishga ruxsat beriladi. Ha Yo'q manba kodi [17] [107]
RNAduplex Gibridlanish uchun optimal va suboptimal ikkilamchi tuzilmalarni hisoblaydi. Hisoblash faqat molekulalararo tayanch juftliklariga ruxsat berish orqali soddalashtirilgan. Yo'q Yo'q manba kodi [17]
RNAgibrid Uzoq va qisqa RNK (≤ 30 nt) ning minimal erkin energiya gibridlanishini topish vositasi. Yo'q Yo'q manba kodi, veb -server [108] [109]
RNAup RNK-RNK o'zaro ta'sirining termodinamikasini hisoblab chiqadi. RNK-RNK bilan bog'lanish ikki bosqichga bo'linadi. (1) Birinchidan, ketma -ketlik oralig'i (masalan, bog'lash joyi) juftlanmagan bo'lib qolish ehtimoli hisoblanadi. (2) So'ngra, bog'lanish joyi ajratilmaganligi sababli, bog'lanish energiyasi barcha mumkin bo'lgan bog'lanish turlariga nisbatan optimal hisoblanadi. Ha Yo'q manba kodi [17] [110]

Quyidagi jadval UTR bilan chegaralanmagan o'zaro ta'sirlarni o'z ichiga oladi.

Ism Tavsif Turlararo Ichki molekulyar tuzilish Qiyosiy Havola Ma'lumotnomalar
comTAR MiRNA maqsadlarini bashorat qilish uchun veb -vosita, asosan o'simlik turlarining potentsial regulyatsiyasini saqlashga asoslangan. Ha Yo'q Yo'q Veb -vosita [111]
RNK 22 Birinchi havola (oldindan hisoblangan bashoratlar) inson, sichqoncha, dumaloq qurt va meva chivinlaridagi barcha protein kodlash transkriptlari uchun RNA22 bashoratlarini taqdim etadi. Bu cDNK xaritasidagi bashoratlarni vizuallashtirishga, shuningdek, bir nechta miRlar qiziqish uyg'otadigan transkriptlarni topishga imkon beradi. Ikkinchi veb-sayt havolasi (interaktiv/moslashtirilgan ketma-ketlik) avval qiziqish ketma-ketligida mikroRNK bilan bog'laydigan saytlarni topadi, so'ngra maqsadli mikroRNKni aniqlaydi. Ikkala vosita ham Tomas Jefferson Universitetining Hisoblash Tibbiyot Markazi tomonidan taqdim etilgan. Ha Yo'q Yo'q oldindan hisoblangan bashoratlar interaktiv/maxsus ketma-ketliklar [112]
RNAgibrid Uzoq va qisqa RNK (≤ 30 nt) ning minimal erkin energiya gibridlanishini topish vositasi. Ha Yo'q Yo'q manba kodi, veb-server [108] [109]
miRBooking Barqaror duplekslar to'plamini topish uchun Geyl-Shapley algoritmining hosilasi yordamida mikroRNKlarning stoxiometrik ta'sir qilish rejimini simulyatsiya qiladi. U mRNK va mikroRNK juftliklari bo'ylab sayohat qilish va saytlarni saralash va tayinlash uchun urug'larning bir -birini to'ldirish uchun miqdoriy ma'lumotlardan foydalanadi. Ha Yo'q Yo'q manba kodi, veb -server [113]

MicroRNA 3 "UTR" ga ulanish orqali oqsillarni kodlash genini ifodalashni tartibga soladi, bu o'zaro ta'sirlarni bashorat qilish uchun maxsus mo'ljallangan vositalar mavjud. Yuqori mahsuldorlikdagi eksperimental ma'lumotlar bo'yicha maqsadli bashorat qilish usullarini baholash uchun qarang (Baek va boshqalar., Tabiat 2008), [114] (Aleksiou va boshqalar., Bioinformatika 2009), [115] yoki (Ritchi va boshq., Tabiat usullari 2009) [116].


MATERIALLAR VA USLUBLAR

Biz kodlash sohasidagi nukleotidlarni aminokislotalar ketma-ketligini o'zgartirmagan holda kodlash va kodlash bo'lmagan mintaqalarga ega bo'lgan nukleotidlar ketma-ketligiga ega bo'lish va mumkin bo'lgan burmalardan kelib chiqadigan MFEni maksimal darajada oshirish muammosini ko'rib chiqamiz. Ikkilamchi strukturaning kuchi bilan chambarchas bog'liq bo'lgan energiya funktsiyasini maksimal darajada oshiradigan sinonimli genlar ketma -ketligini izlash uchun biz genetik kodning buzilishidan foydalanamiz.

Biz usullarni to'rt qismga bo'ldik: (i) eng yaxshi kodon kombinatsiyasini qidirish, (ii) tezkor psevdo-MFE hisoblash funktsiyasini ishlab chiqish, (iii) uning aniq MFE o'lchovi bilan o'zaro bog'liqligini oshirish uchun optimallashtirish. va (iv) psevdo-MFE qiymatlarini aniqroq chegaralarga aylantirish uchun chiziqli regressiya.

Sinonim genlarni o'rganish

Optimal sinonimik ketma -ketlikni topish - bu qidiruv maydonining hajmini hisobga olgan holda, tezkorlik bilan hal qilishning iloji bo'lmagan kombinatorial muammo (taxminan standart genetik kod yordamida kodonli ketma -ketlik uchun). Natijada, mumkin bo'lgan ketma -ketliklarni o'rganishni osonlashtiradigan, muammoning qiziqish doirasi bo'lgan hududlarni qidirishni boshqaradigan, genetik algoritmlar va simulyatsiya qilingan tavlanish kabi metauristika usullariga murojaat qilish jozibador bo'ladi.

MFE bahosiga sodda yaqinlashtirish

Ikkilamchi tuzilishni baholash uchun mavjud vositalar nukleotid zanjirining burilishidan kelib chiqadigan MFEni aniq o'lchashi mumkin. Biroq, bunday aniqlikka mumkin bo'lgan ikkilamchi tuzilmalarni sinchkovlik bilan tahlil qilish orqali erishiladi va bu jarayon ketma -ketlik hajmiga qarab bir necha soniya davom etadi. Garchi ular odatda bitta yugurish uchun etarlicha tez bo'lsa-da, bu ushbu vositalardan odatiy foydalanish hisoblanadi, lekin bir nechta qo'ng'iroqlarga ehtiyoj paydo bo'lganda, u imkonsiz darajada sekinlashadi, bu kodonlarning optimal konfiguratsiyasini izlayotganda va kerak bo'lganda sodir bo'ladi. ketma-ketlikni doimiy ravishda qayta ko'rib chiqing. Masalan, 1000 kodonli (kodlanmagan hududlarsiz) mRNKni ishlab chiqish uchun RNAfoldga 1500 ta qo'ng'iroq qilish gt6 soat davom etadi (RNAfoldga har bir qo'ng'iroq uchun o'rtacha 15 soniya hisobga olinadi, bu odatda zamonaviy shaxsiy kompyuterda past chegaradir) . Ushbu to'siqni engib o'tish uchun biz ikkinchi darajali tuzilmalarni tahlil qilishda, kamroq aniq natijalar hisobiga ancha tezroq bo'lgan va haqiqiy MFE energiyasi bilan yuqori darajada bog'liq bo'lgan baholash funktsiyasini ishlab chiqdik. MFE bahosidan vaqt murakkabligini kamaytirish uchun [ RNAfold va MFold uchun, ketma-ketliklar uchun N. nukleotidlar], biz 1-algoritmda tavsiflanganidek, barcha mumkin bo'lgan yagona poyali halqa konformatsiyasini hisobga oladigan va ularning o'zaro ta'sir energiyasini o'rtacha hisoblaydigan kvadratik murakkablik bilan soddalashtirilgan yondashuvni joriy qildik.

Algoritm mRNK ikkilamchi strukturasining barcha mumkin boʻlgan konformatsiyasini faqat bitta burma (taxminan ⁠ mavjud) yordamida koʻrib chiqadi va har bir konformatsiya uchun bogʻlovchi nukleotid juftlarini qidiradi (1-rasm). Har bir katlamning energiyasi o'zaro ta'sir zonalarida bo'linadigan vodorod aloqalarining soni. Keyin bu usul barcha burmalarning o'rtacha energiyasini qaytaradi. Bu taxmin murakkab tuzilmalarni talab qiladigan bir nechta ildiz halqali tuzilmalar yoki psevdo-tugunlarning murakkab konfiguratsiyasini hisobga olmaydi va aniq energiya qiymatini berishni xohlamaydi. Biroq, u MFEni ifodalovchi mavhum qiymatni molekulaning birlamchi burmalaridan olish mumkinligini taxmin qiladi va nukleotidlarning barcha mumkin bo'lgan o'zaro ta'sirini hisobga olgan holda, strukturaning kuchining global ko'rinishini ifodalash uchun ushbu qiymat yanada aniqlanadi. Natijada, algoritm asosan MFE murakkab bashoratlari bilan bog'liq bo'lgan qiymatni qaytaradi.

MFEni baholash algoritmining illyustratsiyasi. Bitta poyali halqaning barcha mumkin bo'lgan burmalari 3' uchidan boshlab hisobga olinadi. Har bir katlamda katlama hududiga yaqin bo'lgan nukleotidlar o'zaro ta'sir o'tkazmaydi deb hisoblanmaydi. Natijada, barcha burmalarning nukleotid-juftlik hissalari o'rtacha bo'ladi.

MFE baholash algoritmining tasviri. Bitta ildiz halqasining barcha mumkin bo'lgan burmalari 3 'uchidan boshlab ko'rib chiqiladi. Har bir burmada buklanish hududiga yaqin bo'lgan nukleotidlar o'zaro ta'sir qiladi deb hisoblanmaydi. Natija barcha burmalarning nukleotid-juft hissalarining o'rtacha ko'rsatkichidir.

Nukleotidlarning o'zaro ta'sirini nozik sozlash

Bu usul yordamida biz AU, GU va CG uchun (2, 2, 3) juftlik og'irliklarini (1, 1, 3.12) ga o'zgartirib, 0,73 ning dastlabki korrelyatsiyasini 0,91 ga oshirdik. Biz yana shaxsning mahsulot-moment korrelyatsiya koeffitsienti yordamida yuqori chiziqli bog'liqlikni tasdiqladik, u ham 0,91 ga qaytdi.

Chiziqli regressiya

Oldingi bosqichda katta chiziqli bog'liqlikni hisobga olgan holda, biz MFE baholash funktsiyasi tomonidan qaytarilgan qiymatlarni aniq MFE ko'rsatkichlariga o'xshash qilib osongina o'zgartira oldik. Garchi bu qadam shart emas va yakuniy korrelyatsiyani ham, optimallashtirish natijalarini ham o'zgartirmasa ham, o'zgartirilgan qiymatlar aniq o'lchovlar bilan taqqoslanadigan bo'lib, MFE qiymatlarini tez baholash va taqqoslashga imkon beradi.

Oddiy eng kichik kvadratlardan foydalanib, kirish o'zgaruvchisi sifatida 1-algoritmning energiya qiymatlari va kuzatilgan o'zgaruvchi sifatida RNAfold tomonidan berilgan MFE dan foydalangan holda oddiy chiziqli regressiyani amalga oshirdik. MFEni yaxshiroq taxmin qilish uchun biz ikkita regress yaratdik, birinchisi yovvoyi genlar uchun, ikkinchisi esa optimallashtirilgan genlar uchun (formulalar va natijalar uchun Qo'shimcha materialga qarang).


Kirish

MicroRNK (miRNK) ko'plab turlarning rivojlanishi uchun hal qiluvchi ahamiyatga ega bo'lgan va ko'pincha turli xil genetik kasalliklar, jumladan saraton [1], [2], [3], [4] bilan bog'liq bo'lgan kichik, kodlanmaydigan RNKlar sinfidir. ]. Umuman olganda, mikroRNKlar mRNKdagi maqsadli mexanizm orqali gen ekspressiyasini pastga regulyatsiya qilish orqali ishlaydi [5]. Sutemizuvchilar mikroRNK biogenezining umumiy mexanizmiga ega deb ishoniladi [6]. Birinchidan, birlamchi mikroRNKlar (pri-mikroRNKlar deb ataladi) genomdan transkripsiya qilinadi va Drosha (RNase III fermenti) [7] va uning kofaktori DGCR8 dan tashkil topgan mikroprotsessor kompleksi tomonidan yadrodagi prekursor mikroRNKlarga (mikroRNKdan oldingi) qayta ishlanadi. (Pasha nomi bilan ham tanilgan) [8]. Pre-mikroRNK hair 60-70 nt tipidagi soch tolasi tuzilishiga ega, bu 3 ′ uchida ∼2 nt oshishi bilan tavsiflanadi [9]. Pre-mikroRNK keyinchalik, RAN-GTP kofaktori [10], [11], [12] bilan birga keladigan, eksportin 5-mikroRNKga xos bo'lgan eksport tashuvchisi yordamida sitoplazmaga ko'chiriladi. Pre-mikroRNK keyinchalik Dicer (boshqa RNase III fermenti) tomonidan parchalanib, 3'-o'sish ~2 nt [13], [14], [15] bo'lgan mikroRNK dupleksini hosil qiladi. Odatda, dupleksning bitta ipi etuk mikroRNK bo'lib qoladi va RNK induktsiyali susturish kompleksiga (RISC) qo'shiladi. Keyin RISC qisman ketma -ketlikni to'ldirishga asoslangan mRNKlarni aniqlaydi [16]. Shubhasiz, etuk mikroRNK ketma-ketligi maqsadlarni aniqlashda asosiy rol o'ynaydi [17], [18], [19]. Yuqorida aytib o'tilgan qayta ishlash bosqichlari ko'pchilik mikroRNKlar tomonidan amalga oshiriladi, ammo ba'zi tadqiqotlar shuni ko'rsatdiki, qisqa intronlarda joylashgan mikroRNKlarning kichik kichik guruhi miRtron deb nomlangan boshqa yo'l orqali Drosha qadamini chetlab o'tishi mumkin [20].

Sekvensiya va klonlash kabi eksperimental yondashuvlar ko'plab mikroRNKlarni etuk holatida aniqlash uchun keng qo'llaniladi [21], [22], [23]. Biroq, bu turdagi usullar muqarrar ravishda mo'l-ko'l ifodalangan mikroRNKlarga qarama-qarshidir. Yaqinda o'tkazilgan chuqur ketma -ketlik texnikasi yangi mikroRNKlarni kashf qilishda samarali ekanligi isbotlangan, ammo Solexa yoki boshqa chuqur ketma -ketlikdagi mashinalarda ishlab chiqarilgan "o'qish" lardan haqiqiy mikroRNKlarni aniqlash yana bir qiyinchilik tug'diradi [24], [ 25].

Hozirgacha ishlab chiqilgan hisoblash usullarining aksariyati turli xil turlarning genomlaridan potentsial mikroRNK genlarini aniqlashga qaratilgan [9], [26], [27], [28], [29]. mikroRNKlar, mikroRNKlarning aniq etuk ketma -ketligini bashorat qilish o'rniga, ularning ba'zilari etuk ketma -ketlikni inline protsedura sifatida o'rganishni o'z ichiga oladi [9], [26], [30]. Misol uchun, etuk mikroRNKni qamrab oluvchi hududlarni aniqlash uchun miRseeker [26] da ketma-ketlikni moslashtirish jalb qilingan. ProMIR [9] da etuk mikroRNK hududini topish uchun yashirin Markov modeli (HMM) joriy etildi. Keyin SVM mikroprotsessori SVM tasniflagichi uchun 600 dan ortiq xususiyatlardan foydalanib, inson genomidagi etuk mikroRNKning bir uchini aniqlaydigan Drosha ishlov berish maydonini oldindan bashorat qilish uchun puxta ishlab chiqilgan [13]. Yaqinda, etuk mikroRNKni aniqlaydigan MatureBayes haqida xabar berildi [31].Ushbu vosita prekursorda etuk mikroRNKning boshlang'ich holatini bashorat qilish uchun Naive Bayes klassifikatoridan foydalanadi va keyin 22 nt uzunligi bo'yicha etuk ketma-ketlikni aniqlaydi.

Bu erda biz pri-mikroRNKda mavjud bo'lgan ildiz-halqa tuzilishidan etuk mikroRNK ketma-ketligini aniqlash uchun yangi MiRmat vositasini taqdim etamiz. Usul molekulalarning o'zaro ta'sirida erkin energiya printsipiga va etuk mikroRNK biogeneziga asoslangan. Birinchidan, pri-mikroRNKdan olingan ildiz halqali tuzilmaning erkin energiya taqsimlash sxemasi Drosha ishlov berish joylarini bashorat qilish uchun, ya'ni aniq mikroRNKdan oldingi prognoz uchun kiritiladi. So'ngra, mikro-RNKning oldingi xususiyatlari Dicerni qayta ishlash joyini bashorat qilish uchun ishlatiladi, shuning uchun etuk mikroRNK ketma-ketligi hosil bo'ladi.

Pri-mikroRNK ikkilamchi tuzilishga o'ralishi mumkin, uning tarkibida bir pog'onali halqa (yoki undan ko'p sopi-ilmoqlar) bor, bu odatda bir uchida halqa va ikkinchi uchida bir ipli yonboshli 33 bp. Odatda, pri-mikroRNKning aniq uzunligini bilish qiyin [32], [33], [34]. Qulaylik uchun, tegishli mikroRNKni o'z ichiga oladigan bunday ildizli tuzilmalar, odatda, mikroRNK soch qisqichi yoki mikroRNK ildiz halqasi deb ataladi. Ushbu maqolada biz terminal pastadirining yon tomonini yuqori oqim deb hisoblaymiz, teskari yo'nalish esa quyi oqim deb ataladi. Oldingi tadqiqotlarga ko'ra, Drosha dsRBD (ikki zanjirli RNK-bog'lovchi domen) orqali Drosha mikroprotsessor kompleksini pri-mikroRNK tuzilmasida to'g'ri pozitsiyaga bog'lashga yordam beradigan sherik molekulasi DGCR8 bilan bog'lanadi [35] ]. Xan, J. va boshqalar. (2006) primi-mikroRNK ikkilamchi tuzilmalarining termodinamik barqarorlik profillarini hisoblab chiqdi va poya-ssRNK birikmasidan quyi oqimga taxminan 11 bp masofa Drosha ishlov berish joyi bo'lishi mumkinligini taxmin qildi, halbuki strukturaning pastadir yaqinidagi yuqori oqim qismi unchalik ahamiyatli emas [36]. Shubhasiz, Drosha ishlov berish joylarini aniq aniqlash shunchaki bu qiymatga tayanib bo'lmaydi, chunki ketma-ketlik va tuzilmalardan hisoblangan haqiqiy profillar mikroRNK soch iplari orasida sezilarli darajada farq qiladi. MiRmat-da biz microRNK soch turmagining erkin energiya profilini tahlil qilish uchun yangi modelni yaratamiz va Drosha ishlov berish joyini aniqlash uchun Tasodifiy o'rmon (RF) algoritmini qo'llaymiz. 12 turdagi mikroRNKlar bo'yicha o'tkazilgan tahlilga ko'ra, bizning modelimizdan olingan erkin energiya modeli umurtqali hayvonlar orasida saqlanishi mumkinligini aniqladik.

Drosha ishlov beradigan joy etuk mikroRNK ketma -ketligining bir uchini aniqlasa, etuk mikroRNK ketma -ketligining ikkinchi uchi Dicer ishlov berish uchastkasi tomonidan aniqlanadi. Dicer-bu N-terminalli DexH qutisidagi RNK helikazaga o'xshash domen, PAZ domeni, ikkita RNase III domeni (RNase IIIa va RNase IIIb), dsRBD va noma'lum funktsiyali domen (DUF283) o'z ichiga olgan bir nechta domenlar fermenti [37 ]. Oldingi modelga ko'ra, Dicer dsRNK oxiridan bir nechta nukleotidlarni o'lchaydigan va ajratadigan molekulyar o'lchagich bo'lib xizmat qiladi [38]. Mahsulotlarning uzunligi RNase III va PAZ domenlari orasidagi masofa bilan belgilanadi, bu taxminan 65 Å dyuym. Giardia ichak va 25 bp RNK bilan qoplangan uzunlikka mos keladi [38]. Shunga qaramay, bu uzunlikka osonlikcha ta'sir ko'rsatiladi, chunki ferment tez-tez samarali va aniq bo'linish uchun ikki torli RNKning konformatsion o'zgarishini keltirib chiqaradi. MikroRNKdan oldingi ikkilamchi tuzilish va etuk mikroRNK ketma-ketligi uzunligiga oid statistik ma'lumotlar orqali biz ikki parametr o'rtasidagi mumkin bo'lgan munosabatlarni topdik. Shuning uchun, oldindan mikroRNKlarda Dicerni qayta ishlash joylarini aniqlash uchun Tasodifiy o'rmonni qo'llash uchun tizimli xususiyatlar to'plami tanlangan.

Mikro RNK ikkilamchi tuzilmalarining erkin energiya taqsimotini va etuk mikroRNK ketma -ketligini ifodalovchi tuzilish xususiyatlarini ketma -ket qo'llash orqali, MiRmat, MiRBase tomonidan berilgan izohli pozitsiyalarda, umurtqali mikroRNKlar uchun 31,9% Drosha saytlarini aniqlay oldi. va 45%stavkasi bilan Dicer ishlov berish sayti. Agar haqiqiy saytdan 2 nt chetga chiqishga yo'l qo'yilsa, Drosha uchun aniqlangan saytlar tezligi 80% ga yaqinlashadi, Dicer saytini bashorat qilish darajasi esa 90% dan oshadi. Xuddi shu ma'lumotlar to'plamining sinovlariga asoslanib, MiRmat boshqa mavjud usullarga qaraganda yaxshiroq ishlashini ko'rsatadi.


3 ta natija

RNATrackerning turli versiyalari ikkita mRNK subhujayrali lokalizatsiya ma'lumotlar to'plamida baholandi. Birinchisi CeFra-seq tomonidan HepG2 hujayralarida olingan va yadro, sitozolik, membranalar va erimaydigan fraktsiyalarda tahlil qilingan 11 373 ta transkriptni o'z ichiga oladi (Benoit Bouvrette) va boshqalar., 2018). Ikkinchisi HEK 293 T hujayralarida APEX-RIP yordamida ishlab chiqarilgan va tarkibida ER, mitoxondriyal, sitozolik va yadroviy fraktsiyalarda tahlil qilingan 13 860 mavjud (Kaewsapsak) va boshqalar., 2017). 3-rasmda to'rtta CeFra-seq subcellular fraktsiyalarining har biri uchun normallashtirilgan lokalizatsiya qiymatlarining taqsimlanishi ko'rsatilgan, bu ilgari o'tkazilgan kuzatuvni tasdiqlaydi, bu sitoplazmatik, yadroli va erimaydigan fraktsiyalarda membrana fraktsiyasiga nisbatan ko'proq kuchli mahalliylashtirilgan transkriptlar mavjud. Turli fraktsiyalarning normalizatsiya qilingan lokalizatsiya qiymatlari, odatda, salbiy korrelyatsiya qilinadi, faqat sitozolik va membrana fraktsiyalari bundan mustasno, ular fizik kolokatsiya tufayli ajablanarli darajada ijobiy korrelyatsiya qilinmagan (S2 -rasm). Bu keyinchalik taqdim etilgan natijalarga muhim ta'sir ko'rsatadi. Bundan tashqari, sitozolga joylashtirilgan transkriptlar qisqaroq bo'ladi. APEX-RIP ma'lumotlarini o'xshash tahlil qilish uchun S3 va S4 qo'shimcha raqamlariga qarang.

CeFra-Seq ma'lumotlar to'plami uchun umumiy statistika. (A) Har bir hujayra osti fraktsiyasi uchun normallashtirilgan lokalizatsiya qiymatlarining taqsimlanishi. (B) To'rt kasrning har birida ustun lokalizatsiya bo'lgan transkriptlarning soni va o'rtacha uzunligi

CeFra-Seq ma'lumotlar to'plamining qisqacha statistikasi. (A) Har bir hujayra osti fraktsiyasi uchun normallashtirilgan lokalizatsiya qiymatlarining taqsimlanishi. (B) To'rt kasrning har birida ustun lokalizatsiya bo'lgan transkriptlarning soni va o'rtacha uzunligi

3.1 RNATrackerning ishlashi

Biz CeFra-seq va APEX-RIP ma'lumotlar to'plamlarida RNATrackerning turli versiyalari va ikkita asosiy k-mer profili bashorat qiluvchilarining ishlashini baholash uchun 10 marta o'zaro tekshirishdan foydalandik. Hisoblash yukini cheklash uchun modelning ba'zi asosiy tarkibiy qismlari, masalan, e'tibor og'irliklari va o'rganilgan ketma-ketlik motivlari batafsil tahlillari faqat CeFra-Seq ma'lumotlar to'plamida amalga oshirildi.

4-rasmda haqiqiy lokalizatsiya qiymatlari ceFra-seq ma'lumotlar bazasida RNATracker tomonidan bashorat qilingan qiymatlar bilan taqqoslanadi (APEX-RIP ma'lumotlar bazasini tahlil qilish uchun S5-rasmga qarang). Olingan korrelyatsiya koeffitsientlari yadro va membrana fraktsiyalari uchun 0,54 dan sitoplazma fraktsiyasi uchun 0,705 gacha o'zgarib turadi va barchasi noldan sezilarli darajada farq qiladi (P.-qiymat ≈ 0). APEX-RIP ma'lumotlarida aniqlik biroz pastroq bo'lib, 0,456 (yadro fraktsiyasi) dan 0,626 (ER) gacha, lekin yana hammasi juda muhim (P.-qiymati 0).

RNATrackerketma -ket CeFra-Seq ma'lumotlar to'plami uchun kasrlar bo'yicha bashorat, to'liq uzunlikdagi transkriptlar bilan o'qitilgan. Har bir nuqta transkript bo'lib, uning haqiqiy lokalizatsiya qiymati ko'rsatilgan x-eksa va prognoz qilingan qiymatda ko'rsatilgan y-eksa. (ASitozolik fraktsiyaB) eritma fraktsiyasi (CMembran fraktsiyasiD) Yadro fraktsiyasi

RNATrackerseq to'liq uzunlikdagi transkriptlar bilan o'qitilgan kasrlar bo'yicha CeFra-Seq ma'lumotlar bazasi uchun bashoratlar. Har bir nuqta transkript bo'lib, uning haqiqiy lokalizatsiya qiymati ko'rsatilgan x-eksa va prognoz qilingan qiymatda ko'rsatilgan y-eksa. (ASitozolik fraktsiyaBEritma fraktsiyasi (CMembran fraktsiyasiD) Yadro fraktsiyasi

Jadval 1 turli xil bashoratchilar tomonidan olingan birlashtirilgan burmalarning eksperimental va bashorat qilingan lokalizatsiya qiymatlari o'rtasidagi Pirson korrelyatsiya koeffitsientlarini taqqoslaydi. Bu bir nechta kuzatuvlarni ochib beradi. Birinchidan, ikkala ma'lumotlar to'plami uchun ham, barcha fraktsiyalar bo'yicha eng yaxshi natijalar to'liq uzunlikdagi ketma-ketliklarga qo'llaniladigan (ya'ni, kesish/to'ldirish yo'q) va RNKning ikkilamchi tuzilishi haqida ma'lumotsiz qo'llaniladigan RNATracker yordamida olinadi. Bu korrelyatsion koeffitsientlar k-mer asosidagi neyron tarmog'iga qaraganda 10-25% yuqori va RNATracker sobit uzunlikdagi ketma-ketlikda ishlaydiganlarga qaraganda 2-14% yuqori. Belgilangan uzunlikdagi ketma-ketliklar bilan solishtirganda, yutuqlar, ayniqsa, membranalar fraktsiyasi (CeFra-seq) va ER (APEX-RIP) uchun juda muhimdir, bu shuni ko'rsatadiki, bu fraktsiyalarning lokalizatsiyasi ko'pincha transkriptning 5 'uchida joylashgan ketma-ketliklar orqali amalga oshirilishi mumkin. Bu mantiqiy, chunki ER membranasini nishonga olish sekretsiya qilingan oqsillarni kodlovchi mRNKlarda mavjud bo'lgan signal ketma -ketligi orqali amalga oshiriladi (Hermesh va Jansen, 2013). Shuningdek, biz RNKning ikkilamchi strukturasi ma'lumotlaridan foydalanadigan ikkita variant ketma-ketlik ma'lumotlarini ishlatadigan versiyaga qaraganda doimiy ravishda 1-3% yomonroq ishlashini kuzatamiz (tahlil faqat belgilangan uzunlikdagi sozlamalarda, ish vaqti sabablarga ko'ra amalga oshiriladi).

Pearson korrelyatsiya koeffitsientlari har xil model va kirish parametrlarining hujayradan kichik fraktsiyasi bo'yicha. Qalin harflar bilan yozilgan raqamlar ularning qatorining maksimal chegarasi

. . To'liq uzunlikdagi RNK kirishlari. Ruxsat etilgan uzunlikdagi kirish (4 kb). 5 ta ko'proq kirish.
Ma'lumotlar to'plami. Bo'lim. RNATrackerseq . NoLSTM. RNATrackerseq . Diqqat yo'q. Seq+Strukturasi. Tartib × tuzilishi. DNN-5Mer. NN-5Mer.
CeFra-sek Sitozol 0.7050.676 0.685 0.625 0.666 0.652 0.637 0.558
Erimaydigan 0.6410.626 0.619 0.557 0.604 0.591 0.552 0.478
Membran 0.5400.509 0.469 0.306 0.451 0.409 0.421 0.384
Yadroviy 0.5420.515 0.502 0.379 0.475 0.449 0.485 0.432
APEX-RIP ER 0.6260.554 0.485 0.150 0.469 0.394 0.407 0.368
Mitokondriyalar 0.4820.449 0.423 0.139 0.376 0.320 0.292 0.224
Sitozol 0.5610.522 0.501 0.259 0.493 0.423 0.446 0.363
Yadro 0.4560.402 0.397 0.235 0.384 0.338 0.332 0.238
. . To'liq uzunlikdagi RNK kirishlari. Ruxsat etilgan uzunlikdagi kirish (4 kb). 5 ta ko'proq kirish.
Ma'lumotlar to'plami. Bo'lim. RNATrackerseq . NoLSTM. RNATrackerketma -ket . Diqqat yo'q. Seq+Strukturasi. Tartib × tuzilishi. DNN-5Mer. NN-5Mer.
CeFra-sek Sitozol 0.7050.676 0.685 0.625 0.666 0.652 0.637 0.558
Erimaydigan 0.6410.626 0.619 0.557 0.604 0.591 0.552 0.478
Membran 0.5400.509 0.469 0.306 0.451 0.409 0.421 0.384
Yadroviy 0.5420.515 0.502 0.379 0.475 0.449 0.485 0.432
APEX-RIP ER 0.6260.554 0.485 0.150 0.469 0.394 0.407 0.368
Mitokondriya 0.4820.449 0.423 0.139 0.376 0.320 0.292 0.224
Sitozol 0.5610.522 0.501 0.259 0.493 0.423 0.446 0.363
Yadro 0.4560.402 0.397 0.235 0.384 0.338 0.332 0.238

Eslatma: NoLSTM va NoAttention ikki tomonlama LSTM yoki diqqat modulisiz ikkita ablasyon testidir.

Pearson korrelyatsiya koeffitsientlari har xil model va kirish parametrlarining hujayradan kichik fraktsiyasi bo'yicha. Qalin harflar bilan yozilgan raqamlar ularning qatorining maksimal chegarasi

. . To'liq uzunlikdagi RNK kirishlari. Ruxsat etilgan uzunlikdagi kirish (4 kb). 5Mer kirishlari.
Ma'lumotlar to'plami. Bo'lim. RNATrackerketma -ket . NoLSTM. RNATrackerketma -ket . Diqqat yo'q. Seq+Struct . Tartib × tuzilishi. DNN-5Mer. NN-5Mer.
CeFra-Seq Sitozol 0.7050.676 0.685 0.625 0.666 0.652 0.637 0.558
Erimaydigan 0.6410.626 0.619 0.557 0.604 0.591 0.552 0.478
Membrana 0.5400.509 0.469 0.306 0.451 0.409 0.421 0.384
Yadro 0.5420.515 0.502 0.379 0.475 0.449 0.485 0.432
APEX-RIP ER 0.6260.554 0.485 0.150 0.469 0.394 0.407 0.368
Mitokondriya 0.4820.449 0.423 0.139 0.376 0.320 0.292 0.224
Sitozol 0.5610.522 0.501 0.259 0.493 0.423 0.446 0.363
Yadro 0.4560.402 0.397 0.235 0.384 0.338 0.332 0.238
. . To'liq uzunlikdagi RNK kirishlari. Ruxsat etilgan uzunlikdagi kirish (4 kb). 5 ta ko'proq kirish.
Ma'lumotlar to'plami. Bo'lim. RNATrackerketma -ket . NoLSTM. RNATrackerseq . Diqqat yo'q. Seq+Strukturasi. Tartib × tuzilishi. DNN-5Mer. NN-5Mer.
CeFra-sek Sitozol 0.7050.676 0.685 0.625 0.666 0.652 0.637 0.558
Erimaydigan 0.6410.626 0.619 0.557 0.604 0.591 0.552 0.478
Membrana 0.5400.509 0.469 0.306 0.451 0.409 0.421 0.384
Yadro 0.5420.515 0.502 0.379 0.475 0.449 0.485 0.432
APEX-RIP ER 0.6260.554 0.485 0.150 0.469 0.394 0.407 0.368
Mitokondriya 0.4820.449 0.423 0.139 0.376 0.320 0.292 0.224
Sitozol 0.5610.522 0.501 0.259 0.493 0.423 0.446 0.363
Yadro 0.4560.402 0.397 0.235 0.384 0.338 0.332 0.238

Eslatma: NoLSTM va NoAttention - bu ikki tomonlama LSTM yoki e'tibor moduli bo'lmagan ikkita ablasyon testi.

Bizning LSTM-ga asoslangan RNATracker ham sof CNN modeli (NoLSTM) bilan taqqoslandi, bu LSTM komponenti tufayli korrelyatsiya koeffitsientlarining izchil 3-7% ga oshishini aniqladi. Xuddi shunday, e'tibor moduli bo'lmagan RNATracker versiyasi baholandi, lekin uning e'tiboriga asoslangan hamkasbidan ancha yomonroq ishladi (masalan, farq 25% dan 30% gacha bo'lgan APEX-RIP ma'lumotlarida). Ushbu natijalar shuni ko'rsatadiki, LSTM ham, diqqat qatlamlari ham bashorat qilishning aniqligi uchun zarurdir. Biroq, mashg'ulot vaqtining sezilarli darajada qisqarishi, cheklangan uzunlikdagi treningni resurslar cheklangan bo'lsa, muqobil variantga aylantiradi.

Keyinchalik biz RNATracker-ning transkript ifodasi eng yuqori bo'lgan fraktsiya sifatida belgilangan transkriptning ustun lokalizatsiyasini aniqlash qobiliyatini baholadik. Ushbu yangi tasniflash vazifasi uchun RNATracker-ni qayta tayyorlash o'rniga, biz bu regressorni eng yuqori taxmin qilingan lokalizatsiya qiymatiga ega bo'lgan fraktsiyani chiqarish orqali klassifikatorga aylantirdik. Qo'shimcha S6-rasmda to'rtta fraktsiya bo'yicha mikro-o'rtacha hisoblangan har bir bashoratchi uchun qabul qiluvchining ishlash xarakteristikasi (ROC) va aniqlikni qaytarish (PR) egri chiziqlari ko'rsatilgan. Regressiya topshirig'i bo'yicha natijalarga muvofiq, to'liq uzunlikdagi ketma-ketliklar bilan o'qitilgan RNATracker boshqa barcha modellardan biroz ustundir, garchi qattiq uzunlikdagi versiyaga nisbatan tor farq bilan. Bu natijalar, shuningdek, diqqat modulining kuchli foydasini va RNKning ikkilamchi tuzilishi haqidagi ma'lumotlarning ozgina zararli ta'sirini tasdiqlaydi. Shunga o'xshash kuzatuvlar APEX-RIP ma'lumotlar bazasi uchun ham amalga oshirilishi mumkin (Qo'shimcha rasm S7).

Turli xil modellar orasidagi farqni yaxshiroq ko'rsatish uchun biz R to'plamidan Delong testidan foydalandik pROC (Robin) va boshqalar., 2011) ROC egri chiziqlarini taqqoslash, bu ishlashning qattiq uzunlikdan to'liq metrajli versiyaga o'tish statistik jihatdan ahamiyatli ekanligini tasdiqlaydi (P.-value = 6,1 × 10 -9 ⁠), shuningdek, LSTM va e'tibor modulining afzalliklari (ikkalasi ham) P.-qiymatlari < 2,2 × 10 − 16 ⁠ ).

Biroz ustun ishlashini hisobga olgan holda, ushbu bo'limning qolgan qismida biz RNATracker-ni to'liq uzunlikdagi kirish ketma-ketligi bilan, lekin RNK ikkilamchi tuzilmasi bo'lmagan holda, LSTM va diqqat qatlamlari bilan tahlil qilishga e'tibor qaratamiz. Qo'shimcha S6 C va D rasmi hujayra osti fraktsiyasi uchun prognoz ko'rsatkichlarini ajratadi. Oldin 4 -rasmda ko'rsatilgan korrelyatsion natijalarga muvofiq, RNATracker sitozolik fraktsiya bo'yicha eng yaxshi ko'rsatkichga ega (ROC AUC = 0.851, PR AUC = 0.716), erimaydigan va yadroviy fraktsiyalar natijalaridan bir oz yaxshiroq va membranadagi natijalarga qaraganda ancha yaxshi. kasr Bu farqlarni bir necha omillar tushuntirishi mumkin. Birinchidan, juda kam sonli transkriptlar (∼1000) asosan membrana fraktsiyasida uchraydi va deyarli hech birida membrananing lokalizatsiya qiymati 0,5 dan oshmaydi (3A -rasmga qarang). Ikkinchidan, asosan sitoplazmatik fraktsiyada joylashgan transkriptlar boshqalarga qaraganda ancha qisqaroq bo'ladi (3B-rasmga qarang), bu bizning bashoratchimiz foydalanadigan maslahatdir.

3.2 Diqqat modulini ajratish

Yuqorida ko'rsatilgandek, diqqat mexanizmining lokalizatsiya profilini bashorat qilish foydalidir. Uning rolini yaxshiroq tushunish uchun biz e'tibor a ning og'irligini o'rganib chiqdiki belgilangan uzunlik sozlamalari bo'yicha ketma-ketlikda o'zgarib turadi. 5 -rasm shuni ko'rsatadiki, diqqat og'irligining ko'p qismi transkriptning 3 'oxirida "400 nt" ga jamlangan. Bu, ehtimol, ikkita omil bilan bog'liq. Birinchidan, bir nechta yaxshi xarakterli cis-amaldagi mahalliylashtirishni tartibga soluvchi elementlar odatda 3 ′ UTRda joylashgan (Chin va Lecuyer, 2017), shuning uchun bu erda eng mazmunli signal joylashgan bo'lishi mumkin. Ikkinchidan, 4 kb dan qisqa transkriptlarga kiritilgan nol to'ldirish har doim 5 ′ oxirida kiritiladi, bu esa bu mintaqani umuman ma'lumotsiz qiladi. Shuni ta'kidlash joizki, RNATracker ushbu mintaqadan tashqarida joylashgan pochta indekslarini to'liq aniqlay oladi (qarang. Qo'shimcha rasm S1).

Diqqat og'irliklari ai, qattiq uzunlikdagi kirishlarga ega RNATracker uchun, asosan to'rtta fraksiyaning har birida lokalizatsiya qilingan transkriptlar bo'yicha o'rtacha, transkriptdagi joylashuv funksiyasi sifatida

Diqqat og'irliklari ai, qattiq uzunlikdagi kirishlarga ega RNATracker uchun, asosan to'rtta fraksiyaning har birida lokalizatsiya qilingan transkriptlar bo'yicha o'rtacha, transkriptdagi joylashuv funksiyasi sifatida

3.3 ketma -ketlik motiflarini tahlil qilish

Birinchi CNN qatlamidan 32 ta filtr o'rgangan og'irliklar klassik ketma-ketlik tahlilida ishlatiladigan pozitsiya-og'irlik matritsalariga o'xshaydi. Biz weblogodan foydalandik (Crooks va boshqalar., 2004) o'rganilgan motiflarni tasavvur qilish uchun va Tomtom (Beyli va boshqalar., 2009) o'rganilgan motivlarni ma'lum RBP -larning majburiy imtiyozlariga moslashtirish (Ray va boshqalar., 2013) (bu tugallanmagan katalog va RBPga mos keladigan motiflar xatolarga moyilligi haqidagi ogohlantirishni yodda tuting). Ma'lum bo'lgan RBP -ning majburiy profiliga mos keladigan 30 ta konvolyutsion filtrlarning 9 tasi aniqlandi (Tomtom P.-qiymat < 0,05). Vakillik namunalari 6A-rasmda ko'rsatilgan, TIA1 RBPlariga kuchli mos keladi (P.-qiymat = 7.63 × 10 -4 ⁠) va BRUNOL5 (P.-qiymat = 1,64 × 10 -6 ⁠).

(A) Reydan ma'lum RBPlar (pastda) bilan taqqoslangan tanlangan ketma -ketlik motiflarini vizualizatsiya qilish (yuqorida). va boshqalar. (2013) - bu TIA1 (yuqoriga) va BRUNOL5 (pastga). (BO'rtacha faollashtirish qiymatlarining 1024 o'lchovli vektorlari orasidagi kosinus masofasidan foydalanib, 1024 ta kuchli mahalliylashtirilgan transkriptli 32 ta filtrni ierarxik klasterlash.

(A) Reydan ma'lum RBPlar (pastda) bilan taqqoslangan tanlangan ketma -ketlik motiflarini vizualizatsiya qilish (yuqorida). va boshqalar. (2013) ular TIA1 (yuqori) va BRUNOL5 (past). (B) 1024 ta kuchli lokalizatsiya qilingan transkriptga ega 32 ta filtrni ierarxik klasterlash (har bir fraktsiya uchun 256 ta transkript), transkript uzunligi bo'yicha o'rtacha hisoblangan o'rtacha faollashtirish qiymatlarining 1024 o'lchovli vektorlari orasidagi kosinus masofasidan foydalangan holda

RNATracker tomonidan o'rganilgan 32 ta motifning rolini va ularni bashorat qilish uchun qanday birlashtirganini yaxshiroq tushunish uchun biz ularni har birida eng kuchli lokalizatsiya qilingan 256 ta transkriptdan iborat 1024 ta transkriptning kichik to'plami bo'ylab birgalikda sodir bo'lishlari asosida guruhlarga ajratdik. to'rt kasrdan. Motiflarning ikkita keng to'plami paydo bo'ladi. Birinchi (issiqlik xaritasining yuqori yarmi) C/G ga boy bo'lgan bir nechta motiflarni, shuningdek, sitoplazmatik transkriptlar bilan chambarchas bog'liq bo'lgan murakkabroq motiflarni o'z ichiga oladi. Ikkinchisi (issiqlik xaritasining pastki yarmi) A/U ga boy naqshlar, shuningdek, A-G yoki U-G dinukleotidlarining takrorlanishi bilan tavsiflanadi, ular asosan yadroviy va erimaydigan fraksiyalarning transkriptlarida uchraydi.

RNATracker-ning lokalizatsiya bashoratini olish uchun individual ketma-ketlik motiflarini qanday ishlatishini o'rganish uchun biz filtrlardan bittasidan boshqasini takroriy ravishda o'chirib tashladik va to'liq va nolga tushirilgan modeldagi bashorat qilingan lokalizatsiya qiymatlari orasidagi Pirson korrelyatsiya koeffitsientini alohida hisobladik. har bir fraktsiya. Shunday qilib, biz har bir konvertatsiya filtrining yakuniy bashoratga qo'shgan hissasini qo'pol ravishda ajratib olamiz.

3.4 Transkriptlar ichida pochta indekslarini aniqlash

RNK hujayrali hujayrali lokalizatsiyasi, odatda, lokalizatsiya indekslari deb nomlanuvchi alohida -alohida tartibga soluvchi elementlarning mavjudligi bilan bog'liq deb ishoniladi. Transkriptning kichik qismlarini qayta -qayta niqoblab, lokalizatsiya qanday o'zgarishini bilib, maskalanish lokalizatsiya bashoratini sezilarli darajada o'zgartiradigan mintaqalar deb nomlangan nomzod pochta kodlarini aniqlash mumkin (2 -bo'lim va S1 -rasmga qarang).Nomzod pochta indeksiga ma'lum bir kasr uchun kuchaytiruvchi yoki repressiv yorliq berilishi mumkin, uning niqoblanishi ushbu fraksiya uchun taxmin qilingan lokalizatsiya ballining pasayishi yoki oshishiga olib keladimi? 7-rasmda turli xil qat'iylik darajalarida (KL chegarasi) aniqlangan ijobiy va salbiy indeksli mintaqalar soni ko'rsatilgan. KL 0,0075 chegarasida biz 374 ta noyob musbat pochta indekslarini aniqlaymiz, lekin faqat 167 ta noyob salbiy pochta indekslari.

Raqamlar (chapda) va turlararo saqlash

Raqamlar (chapda) va turlararo saqlash

Eksperimental tarzda tavsiflangan pochta indekslari soni juda kam bo'lgani uchun (odamlarda o'ndan kam), biz taxmin qilingan pochta indeks elementlarining haqiqiyligini baholash uchun bilvosita choralarga tayanishga majbur bo'ldik. To'g'ri gen ekspressiyasini tartibga solishda muhim rol o'ynaganligi sababli, biz ko'p pochta indekslari salbiy tanlanish ostida bo'lishini kutardik va shu tariqa ular qo'shni mintaqalarga qaraganda turlar orasida ko'proq saqlanib qoladi. Shunday qilib, biz PhyloP saqlanish reytingidan foydalandik ( Pollard va boshqalar., 2010), 100 ta umurtqali hayvonlarning bir nechta genomlari moslashuvidan hisoblangan va UCSC Genome brauzeridan (Haeussler) mavjud va boshqalar., 2019). Kuchli hujayra osti lokalizatsiyasini (maksimal lokalizatsiya qiymati >0,5) ko'rsatadigan 2392 ta transkriptga e'tibor qaratgan holda, biz eng yaxshi 541 bashorat qilingan pochta indekslari ichida o'rtacha PhyloP ballarining taqsimlanishini pochta indeksi bo'lishi taxmin qilinmagan 3' UTR mintaqalaridagi PhyloP ball taqsimoti bilan solishtirdik (2-rasm). 8). Ikkala taqsimot bir -biriga o'xshash bo'lsa -da, katta saqlash ballari (& gt1) nomzodlarning pochta kodlarida boshqa joylarga qaraganda qariyb ikki barobar tez -tez uchraydi va ikkita taqsimotda bir -biridan sezilarli darajada farq qiladigan vositalar mavjud [P.-Kolmogorov -Smirnov (KS) testidan foydalanib, 0 ga yaqin qiymat]. Bu shuni ko'rsatadiki, bashorat qilingan pochta indekslari qolgan 3' UTRlarga qaraganda kuchliroq salbiy tanlov ostida, ammo bunga mahalliylashtirishdan tashqari boshqa funktsiyalar sabab bo'lishi mumkin. Pochta indekslarini aniqlash uchun ishlatiladigan KL chegarasini har xil qilib, biz eng ishonchli bashorat qilish uchun yuqori KS statistikasi (ya'ni, turlararo saqlanish qiymatlari) yuqori bo'lishini kuzatamiz (7 -rasm). Yuqorida aytib o'tilgan ogohlantirishga ko'ra, bu RNATracker -ning KL ko'rsatkichidan pochta indekslarini bashorat qilish ishonchliligi ko'rsatkichlari sifatida foydalanish mumkinligini ko'rsatadi.

541 ta hudud uchun oʻrtacha PhyloP ballarining taqsimlanishi pochta indeksi elementlari (KL balli ≤ 0,0076, koʻk rangda) va 3688436 ta hudud boʻlmasligi bashorat qilingan (KL ball ≤ 0.0076, qizil rangda). Nuqtali vertikal chiziqlar ikkita taqsimot vositasini ko'rsatadi

541 ta hudud uchun oʻrtacha PhyloP ballarining taqsimlanishi pochta indeksi elementlari (KL balli ≤ 0,0076, koʻk rangda) va 3688436 ta hudud boʻlmasligi bashorat qilingan (KL ball ≤ 0.0076, qizil rangda). Nuqtali vertikal chiziqlar ikkita taqsimot vositasini ko'rsatadi


MATERIALLAR VA USLUBLAR

Ma'lumot yig'ish

Kodlash ketma-ketligi

Kodlash ketma -ketligi (CDS) Saccharomyces cerevisiae S288C Milliy Biotexnologiya Axborot Markazi FTP serveridan yuklab olingan. Uzoq ketma-ketlikning ikkilamchi tuzilmalari uchun bashorat qilish resurs talab qiladigan ekanligini hisobga olib, biz 2000 nt dan ortiq bo'lgan CDSlarni chiqarib tashladik. Hammasi bo'lib 5369 ta ketma -ketlik olingan.

Eksperimental tarzda aniqlangan mRNA ikkilamchi tuzilmalari

Ma'lumotlar Kertes tadqiqotidan olingan va boshqalar. (27), bu barcha saytlarda RNK strukturasi (PARS) skorlarining parallel tahlilini va PARS yordamida 3002 CDSning (2000 nt dan qisqaroq 2534 CDS) ikkilamchi tuzilmalarini ta'minladi. PARS balli nukleotidning ikki zanjirli konformatsiyada bo'lish ehtimolini o'lchaydi, bu minimal katlanadigan erkin energiya bilan sezilarli darajada bog'liqdir (Qo'shimcha rasm S1).

Proteinlarning ko'pligi

Proteinning ko'pligi haqidagi ma'lumotlar PaxDb (42) dan olingan. Hammasi bo'lib, 2974 ma'lumot S. cerevisiae PARS ko'rsatkichi va oqsil ko'pligi o'rtasidagi korrelyatsiyani tahlil qilishda foydalanilgan.

RNK genining nusxa ko'chirish raqamlarini o'tkazish

ning RNK (tRNK) gen nusxa ko'chirish raqamlari S. cerevisiae Genomik tRNK ma'lumotlar bazasidan yuklab olingan (43).

Hisoblash oldindan-mF kuchi va mF kuchi

oldindan-mF kuchi CDS ning taxmin qilingan o'rtacha bazaviy juftlik ehtimoli (PP) sifatida aniqlandi. CDS ning PP -lari RNAfold tomonidan Vena RNK paketida (44) standart parametrlar yordamida bashorat qilingan. Tarjima paytida mF kuchi ribosoma cheklovlari bilan CDS ning o'rtacha PP sifatida aniqlandi (quyidagi matnga qarang).

Ribozomal masofa va mF kuchi o'rtasidagi bog'liqlik

Biz tasodifiy tayinlagan ribosoma pozitsiyalarining ta'sirini istisno qilish uchun yuqorida aytilgan jarayonlar besh marta takrorlangan va bir xil masofadagi qiymatlarni o'rtacha hisoblab, berilgan ribosoma masofasining o'rtacha qiymati olingan. Bundan tashqari, barcha mRNAlar o'z guruhlariga ko'ra besh guruhga bo'lingan oldindan-mF kuchi pastdan pastgacha (G1-G5), bu biz taxmin qilgan naqsh ketma-ketligini aniqlash uchun ishlatilgan.

TRNA moslashuv indeksini hisoblash

Translyatsiya qiluvchi ribosomalar, kodon foydalanish va mRNK ikkilamchi tuzilmalari o'rtasidagi o'zaro ta'sirlarni hisobga olgan holda tarjima jarayonini simulyatsiya qilish

Model

O'tgan tadqiqotlardan ilhomlanib, CDS ning o'rtacha PARS ballari va oqsillar ko'pligi o'rtasida ijobiy korrelyatsiya (S2 qo'shimcha rasm) [17, 35], biz mRNA ikkilamchi tuzilishi tarjima samaradorligiga qanday ijobiy ta'sir ko'rsatishini o'rganishga qaror qildik. dalillar qatori in vitro mRNK ikkilamchi tuzilishining cho'zilish tezligini pasaytirishi. Shu maqsadda biz tarjima jarayonini simulyatsiya qilish uchun yangi hisoblash modelini ishlab chiqdik (2 -rasm). Tarjima jarayoni uch bosqichga bo'linadi: boshlash, uzaytirish va tugatish. Bizning modelimizda ribosomalar boshlang'ich joyiga boshlash tezligi bilan keladi. Oxirgi kodonda ribosomalar ajraladi va tugatish tezligi bilan oqsillarni chiqaradi. Uzayish paytida tarjima aylanishi ikki bosqichdan iborat. Birinchi qadam, qarindosh tRNK A tezligiga ega ribosoma A saytiga (kodon i) keladi va ribosoma i + L/2 kodonida (L 42 nt ga o'rnatiladi) bir vaqtning o'zida tezlik bilan joylashgan asosiy juftlarni ochadi. Ikkinchi bosqich - translokatsiya. Translokatsiya tezligi tez va kodonga bog'liq emas, shuning uchun doimiy tezlik ishlatilgan. Shunday qilib, ribosomaning joriy kodondan keyingi kodonga o'tish tezligi va bilan belgilanadi (batafsil ma'lumot uchun quyidagi bo'limga qarang). Bundan tashqari, agar keyingi kodonni oldingi ribosoma egallasa, ribosoma translokatsiya qila olmaydi. Bundan tashqari, ribosomalar keyingi kodonning bo'sh bo'lishini kutayotganda, qarindosh tRNKni ushlab olishlari mumkin.

Model. Bizning modelimizda ribosomalar tarjima boshlanish joyiga rate tezlik bilan keladi va oqsillarni tezlik bilan chiqaradi . Cho'zilish vaqtida translatsiya qiluvchi ribosomalar o'zlarining qarindosh tRNKlarini i pozitsiyasida kutadilar va bir vaqtning o'zida i + L/2 (L = 42 nt) pozitsiyasida joylashgan tayanch juftlarini echib tashlaydilar. (A) birinchi ribosoma uchraydigan tuzilishni ko'rsatadi (birinchi ribosoma ko'k rangda). (B) uchinchi ribosoma duch keladigan strukturani ko'rsatadi. mRNA ikkinchi darajali tuzilishi ribosomalarning cheklanishi tufayli zaiflashadi. Bizning modelimizda, har xil ribosomalar bir xil katlama kuchiga ega bo'lgan tuzilishga duch kelishi mumkin, deb taxmin qilamiz, chunki mRNKning katlama shakli ribosomalar mRNK bilan bog'langanida o'zgarishi mumkin (tafsilotlar uchun matnga qarang).

Model. Bizning modelimizda ribosomalar tarjima boshlanish joyiga rate tezlik bilan keladi va oqsillarni tezlik bilan chiqaradi . Uzayish paytida, tarjima qilingan ribosomalar o'z pozitsiyasidagi tRNKlarini kutishadi va bir vaqtning o'zida i + L/2 (L = 42 nt) pozitsiyasida joylashgan asosiy juftlarni bo'shatadilar. (A) birinchi ribosoma uchrashadigan strukturani ko'rsatadi (birinchi ribosoma ko'k rangda). (B) uchinchi ribosoma uchraydigan tuzilishni ko'rsatadi. mRNA ikkinchi darajali tuzilishi ribosomalarning cheklanishi tufayli zaiflashadi. Bizning modelimizda, har xil ribosomalar bir xil katlama kuchiga ega bo'lgan tuzilishga duch kelishi mumkin, deb taxmin qilamiz, chunki mRNKning katlama shakli ribosomalar mRNK bilan bog'langanida o'zgarishi mumkin (tafsilotlar uchun matnga qarang).

Muhimi, sobit mRNK ikkilamchi tuzilmalaridan foydalanadigan boshqa modellardan farqli o'laroq, bizning modelimiz tarjima paytida dinamik tuzilmalarni ko'rib chiqadi, ya'ni turli ribosomalar bir xil kodonda turli katlama kuchiga duchor bo'lishi mumkin (2-rasm). Bu taxmin, qo'shni ribosomalar orasidagi mintaqaning buklanish kuchi ribosoma masofasiga kuchli bog'liq degan xulosamizga asoslanadi (3 -rasm). Bundan tashqari, biz mRNKning ikkilamchi tuzilishining cho'zilishdagi burilish xatti -harakatlariga va uning ribosoma masofasiga ta'siriga e'tibor qaratamiz. Ribosoma masofasiga ta'sir qiluvchi boshqa omillar nazorat qilindi. Shuning uchun modelda mutlaq ko'rsatkich o'rniga nisbiy stavka ishlatilgan. ⁠ uchun ixtiyoriy qiymat o'rnatdik. Nisbatan cho'zilish tezligini olish uchun, ular mos ravishda og'irlik va by ga ko'paytirildi (batafsil ma'lumot uchun keyingi matnga qarang). Agar boshqacha ko'rsatilmagan bo'lsa, biz barcha simulyatsiyalar uchun 1-jadvalda keltirilgan qiymatlardan foydalandik.

MF kuchining ribosoma masofasiga nisbatan o'zgarishi. Barcha mRNKlar 5 guruhga bo'lingan (G1 -G5) oldindan-mF kuchi yuqoridan pastgacha. (A) Ribosomal masofa 5 nt dan ortiq bo'lsa, beshta guruh o'rtasida sezilarli farq yo'q (hisoblash uchun ⁠ "Materiallar va usullar" bo'limiga qarang). (B) Masofa 5 nt dan qisqa bo'lsa, qo'shni ribosomalar o'rtasida struktura bo'lmaydi, bu bilan aniqlanadi. oldindan-mF quvvat.

Ribosomal masofaga nisbatan mF kuchining o'zgarishi. Barcha mRNKlar 5 guruhga bo'lingan (G1 -G5) oldindan-mF kuchi yuqoridan pastgacha. (A) Ribosomal masofa 5 nt dan ortiq bo'lsa, beshta guruh o'rtasida sezilarli farq yo'q (hisoblash uchun ⁠ "Materiallar va usullar" bo'limiga qarang). (B) Masofa 5 nt dan qisqa bo'lsa, qo'shni ribosomalar o'rtasida struktura bo'lmaydi, bu bilan aniqlanadi. oldindan-mF kuchi.

Simulyatsiya uchun ishlatiladigan parametrlar

Parametr. Qiymat. Tavsiflar.
8 Boshlanish darajasi (lar).
0.1 Tugatish darajasi.
0.5 For uchun vazn.
1.0 uchun vazn.
0,12/Har xil Kodondan foydalanish (lar)dan kelib chiqqan kodonda turish vaqti. Kodondan foydalanish ta'sirini hisobga olmagan holda mRNK ikkilamchi tuzilish funktsiyasini o'rganishda barcha kodonlar uchun teng tezlik qo'llaniladi (0,12). Ikkilamchi mRNK tuzilishi va kodon ishlatilishining umumiy ta'sirini o'rganayotganda, bu qiymat kodon tAI (har xil) ga bog'liq.
Har xil MRNA ikkilamchi tuzilish (lar) dan kelib chiqqan kodonda turish vaqti. Turli xil, qiymat kodonning PP ga bog'liqligini anglatadi.
42 Viloyat uzunligi ribosoma bilan cheklangan (nt).
Doimiy Translokatsiya vaqti (lar). Translokatsiya vaqti ribosomaning joriy kodondan keyingisiga o'tish vaqtiga teng.
Parametr. Qiymat. Ta'riflar.
8 Boshlanish tezligi.
0.1 Tugatish darajasi.
0.5 uchun vazn.
1.0 For uchun vazn.
0,12/Har xil Kodondan foydalanish (lar)dan kelib chiqqan kodonda turish vaqti. Kodondan foydalanish ta'sirini hisobga olmagan holda mRNK ikkilamchi tuzilish funktsiyasini o'rganishda barcha kodonlar uchun teng tezlik qo'llaniladi (0,12). Ikkilamchi mRNK tuzilishi va kodon ishlatilishining umumiy ta'sirini o'rganayotganda, bu qiymat kodon tAI (har xil) ga bog'liq.
Har xil MRNA ikkilamchi tuzilish (lar) dan kelib chiqqan kodonda turish vaqti. Turli xil, qiymat kodonning PP ga bog'liqligini anglatadi.
42 Viloyat uzunligi ribosoma bilan cheklangan (nt).
Doimiy Translokatsiya vaqti. Translokatsiya vaqti ribosomaning hozirgi kodondan ikkinchisiga o'tish vaqtiga teng.

Simulyatsiya uchun ishlatiladigan parametrlar

Parametr. Qiymat. Ta'riflar.
8 Boshlanish tezligi.
0.1 Tugatish darajasi (lar).
0.5 For uchun vazn.
1.0 uchun vazn.
0.12/Har xil Kodondan foydalanish (lar)dan kelib chiqqan kodonda turish vaqti. Kodondan foydalanish ta'sirini hisobga olmagan holda mRNK ikkilamchi tuzilish funktsiyasini o'rganishda barcha kodonlar uchun teng tezlik qo'llaniladi (0,12). Ikkilamchi mRNK tuzilishi va kodon ishlatilishining umumiy ta'sirini o'rganayotganda, bu qiymat kodon tAI (har xil) ga bog'liq.
Har xil MRNA ikkilamchi tuzilish (lar) dan kelib chiqqan kodonda turish vaqti. Turli xil, qiymat kodonning PP ga bog'liqligini anglatadi.
42 Ribosoma (nt) bilan chegaralangan hududning uzunligi.
Doimiy Translokatsiya vaqti. Translokatsiya vaqti ribosomaning joriy kodondan keyingisiga o'tish vaqtiga teng.
Parametr. Qiymat. Ta'riflar.
8 Boshlanish darajasi (lar).
0.1 Tugatish darajasi.
0.5 uchun vazn.
1.0 For uchun vazn.
0,12/Har xil Kodondan foydalanish natijasida kodonda turish vaqti. mRNKning ikkilamchi strukturasi funksiyasini kodondan foydalanish ta'sirini hisobga olmagan holda o'rganayotganda barcha kodonlar uchun teng tezlik qo'llaniladi (0,12). mRNKning ikkilamchi tuzilishi va kodondan foydalanishning birgalikdagi ta'sirini o'rganayotganda, qiymati kodonning tAI (turli xil) ga bog'liq.
Har xil mRNK ikkilamchi tuzilmasi (lar) tufayli kelib chiqqan kodonda turish vaqti. Turli xil, bu qiymat kodonning PP ga bog'liqligini anglatadi.
42 Viloyat uzunligi ribosoma bilan cheklangan (nt).
Doimiy Translokatsiya vaqti. Translokatsiya vaqti ribosomaning joriy kodondan keyingisiga o'tish vaqtiga teng.

Simulyatsiya uchun zarur bo'lgan parametrlar

Biz tarjima jarayonini simulyatsiya qilish uchun Perl 5.12 (Qo'shimcha fayllar: Simulation.pl) dagi bir nechta iplardan foydalanganmiz (2 -rasm va S3 qo'shimcha rasm). Simulyatsiya uchun zarur bo'lgan parametrlar:

Boshlanish tezligi (⁠⁠): Garchi individual mRNKning boshlang'ich tezligi ribosomalar zichligi yoki kodondan foydalanishga asoslangan oldingi tadqiqotlar bilan baholangan bo'lsa -da (39, 48), biz ribosomaga boshlash tezligining ta'sirini istisno qilish uchun barcha mRNKlar uchun teng tezlikni o'rnatdik. zichlik.

Tugatish tezligi ( ⁠⁠ ): Tugatish jarayoni boshqa jarayonlar (masalan, cho'zilish) bilan solishtirganda tez bo'ladi deb taxmin qilinadi (49). Shuning uchun tugatish effekti e'tiborsiz qoldirildi. Barcha mRNKlar uchun doimiy tezlik (0,1 s) ishlatilgan.

kodon k ning moslashuvchanlik qiymati qayerda. Jumladan, CGA kodonining hajmi boshqalarga nisbatan juda katta (qo'shimcha jadval S1). Shuning uchun, biz har bir kodonni hisoblaganimizda, bu kodon chiqarib tashlangan. Ushbu kodonning maksimal qiymati (1.0, Qo'shimcha jadval S1) ga teng qilib o'rnatildi. Bundan tashqari, mRNKning ikkilamchi tuzilishining funktsiyalarini kodondan foydalanish ta'sirini hisobga olmaganda, barcha kodonlarning qiymatlari 0,12 ga teng bo'ladi (1 -jadval).

Translokatsiya tezligi (⁠⁠): Simulyatsiya paytida, translokatsiya tezligi ribosoma joriy kodondan keyingi kodonga o'tadigan ish vaqtiga teng qilib o'rnatildi. Vaqt juda qisqa (Qo'shimcha rasm S5) va shuning uchun "doimiy" deb hisoblanadi.

Parametrlarni baholash

Har bir mRNK uchun biz 60 ribosomaning tarjima jarayonlarini simulyatsiya qildik. Odatda, tarjima barqaror holatga keladi (mRNKdagi ribosomalar soni o'zgarishsiz qoladi, S6 qo'shimcha rasm) 10-ribosoma ajralganda. Biz parametrlarni o'rtacha 11 ribosomani (30 dan 40 gacha ribosomalar, Qo'shimcha fayllar: Para.pl va Pause.pl) qiymatlarini o'rtacha hisoblab baholadik. Parametrlar - mRNKdagi ribosomalar soni, qo'shni ribosomalar orasidagi masofa, har bir kodonda o'rtacha turish vaqti (mRNKlarning bir xil pozitsiyasidagi o'rtacha qiymatlar), ribosoma tarjima siklini tugatgan vaqt (tarjima vaqti), keyin o'tgan vaqt boshlash (cho'zish vaqti, mRNKlarning bir xil pozitsiyasidagi qiymatlarni o'rtacha), pauza joylari va to'qnashuv joylarining har bir kodondagi bayrog'i va bayrog'i (mRNKlarning bir xil pozitsiyasidagi o'rtacha qiymat). Bu erda biz cho'zilish paytida mRNK ikkilamchi strukturasi ishlatilishini qayd qilish uchun bayroqdan foydalandik. Agar mRNK ikkilamchi strukturasi kodondagi tezlikni aniqlasa ( ⁠⁠ , bu kodondagi bayroq 1 ga o'rnatiladi va agar determinant kodondan foydalanish bo'lsa ( ⁠⁠ ), bayroq 2 ga o'rnatiladi.

Korrelyatsiyani hisoblash

Ushbu tadqiqotda bildirilgan barcha korrelyatsiyalar Spearman darajasidagi korrelyatsiyalardir.


Nashriyot yozuvi: Springer Nature nashr etilgan xaritalar va institutsional birlashmalardagi yurisdiksiyaviy da'volarga nisbatan betaraf qoladi.

Qo'shimcha 1-rasm DMS-seq boshqaruvlari va mRNA tuzilishi MZT paytida o'zgaradi.

a, ning sxematik ko'rinishi in vivo va in vitro genom bo'ylab DMSni tekshirish. Qizil yulduzlar DMS-modifikatsiyalangan nukleotidlarni ifodalaydi. b, Multfilm DMS-seq protokolini ko'rsatadi. Chiziqli chiziqlar DMS modifikatsiyalari tufayli muddatidan oldin to'xtaydigan teskari transkripsiya mahsulotlarini oladigan ikkinchi o'lchamli tanlovni ajratib ko'rsatadi. c, DMS-seqning nisbati DMS-modifikatsiyalangan nukleotidlardan o'qiladi in vivo 2 ot kuchida (+DMS) (qarang. Usullar). d, e, DMS-seq ma'lumotlari har bir transkriptda biologik replikatsiyalar bo'yicha takrorlanadi (dva har bir nukleotid (e) qarorlar in vivo 2 ot kuchida. f, Tasdiqlangan ikkinchi darajali tuzilma Tetraximana ribozim (Rz) (Uolter, N., Vudson, R.T & amp Batey, R.T. Protein bo'lmagan kodlovchi RNKlar. (Springer Science & amp Business Media, 2008). Kattalashtirilgan panellarda (P2, P9 va P4-5-6 hududlariga mos keladi), DMS-seq imkoniyatlari ma'lum ikkilamchi tuzilmalar ustiga qo'yilgan. Rasmning yuqori o'rta qismida quti chizig'i nukleotidlarning juftlik holati va imkoniyatlari o'rtasidagi muvofiqlikni ifodalaydi. P.-bir tomonlama Mann-Uitni yordamida hisoblangan qiymat U-test (ss, n = 66 ds, n = 89). Qutilar birinchi kvartillardan to oxirigacha cho'zilgan va mo'ylovlar choraklik oralig'ini 1,5 marta tashkil qiladi. g, Vivo jonli mavjudlik profili dgcr8 mRNA. Izohli saqlangan ikkilamchi tuzilmalarga (kulrang to'rtburchaklar) mos keladigan imkoniyatlar ajratilgan. Batafsil ikkilamchi tuzilma ham ko'rsatiladi, bu erda in vivo "A" va "C" bazalari uchun imkoniyatlar yopilgan, Gs va Us oq rangda tasvirlangan. h, Taqsimlanishini taqqoslaydigan quti uchastkasi in vivo nazorat sifatida ishlatiladigan uchta saqlangan ikkilamchi tuzilmada topilgan A va C bazalarining imkoniyatlari va juftlashish holati (selt1a, Selt2 va dgcr8). P.-bir tomonlama Mann-Uitni yordamida hisoblangan qiymat U-test (ss, n = 41 ds, n = 59). Quti birinchidan oxirgi kvartillarni o'z ichiga oladi va mo'ylovlar kvartillararo diapazonning 1,5 × ni tashkil qiladi. i, Replikatlar orasidagi transkript bo'yicha global DMS-seqning imkoniyatlarini taqqoslash (chapda, n = 899) va rivojlanish bosqichlarida (o'ngda, n = 1,309). Spearman korrelyatsiya koeffitsientlari (rho) va P.-qiymatlar ko'rsatiladi. j, Rivojlanishning 3 bosqichidagi differentsial tuzilgan oynalar nisbati (Usullarga qarang), differensial tuzilgan oynalarning umumiy tahlil qilingan oynalarga nisbatan ulushi (qora) va ushbu oynalarni o'z ichiga olgan tahlil qilingan mRNKlar ulushi (kulrang). k, Jini indeksidagi o'zgarish yo'nalishiga qarab, har bir juft taqqoslash uchun, RNK strukturasida o'sadigan (to'q sariq) yoki kamayuvchi (turkuaz) differentsial tuzilgan oynalar ulushi. O'zgarish yo'nalishi har bir juft taqqoslash uchun rivojlanishning oxirgi bosqichiga qarab belgilanadi. l, Tarjima samaradorligi va har bir transkript mintaqasi uchun kirish imkoniyatining o'zgarishi o'rtasidagi o'zaro bog'liqlik (5'-UTR (663), CDS (1,337) va 3'-UTR (1,050)) 2 va 6 ot kuchiga teng. Spearman korrelyatsiya koeffitsientlari (rho) va P.-qiymatlari ko'rsatilgan

Qo'shimcha 2 -rasm Ribosomalar 5 'UTR va CDSda, shu jumladan AUG atrofidagi hududda RNK tuzilmalarini bo'shatadi.

a, AUG (2,110), CDS (2,526) yoki STOP kodonining (2,364) quyi oqimidagi 50 nukleotidlarning 50 ta nukleotidlarining global imkoniyatlarining umumiy taqsimoti ko'rsatilgan. in vivo (yuqorida), in vitro (o'rtada) va in vivo va boshqalar in vitro (pastki) namunalar 2 hpf. mRNAlar tarjima samaradorligiga (TE) ko'ra kvintillarga bo'linadi. P.-qiymatlar ikki tomonlama Wilcoxon imzolangan darajali testi va bir tomonlama Mann-Uitni yordamida hisoblangan. U-test, mos ravishda tarjima maqomlari ichidagi va o'zaro taqqoslash uchun. b, c, Tarjima samaradorligi va CDS (chapda) va 3'-UTR (o'ngda) imkoniyatlari o'rtasidagi bog'liqlik, ikkalasi uchun in vivo (b) va in vitro (c) shartlar (CDS in vivo (n = 2,507) va in vitro (n = 2,523) 3’-UTR in vivo (n = 2,263) va in vitro (n = 2,374)). Spearman korrelyatsiya koeffitsientlari (rho) va P.-qiymatlar ko'rsatiladi. d, Multfilm RNKning ikkilamchi tuzilishini bashorat qilish uchun ishlatiladigan AUG boshlanish kodonini o'rab turgan hududni ko'rsatadi va Kozak mintaqasini (5'-NNNNAUGNNN-3 ') ajratib ko'rsatadi. e, Har ikkisi uchun AUG boshlash kodonidagi tarjima samaradorligi va foydalanish imkoniyatlari o'rtasidagi korrelyatsiya in vivo (chapda) va in vitro (o'ng) shartlar. Spearman korrelyatsiya koeffitsientlari (rho) va P.-qiymatlar ko'rsatiladi. f, RNK ikkilamchi tuzilishi va Gibbsning erkin energiyasi (DG') har bir AUG boshlash kodoni uchun hisoblab chiqilgan. Kozak mintaqasini (DG) ochish uchun zarur bo'lgan energiya, Kozak ketma-ketligi bir ipli bo'lishga majbur bo'lgan strukturaning energiyasidan DG 'ni olib tashlash yo'li bilan hisoblab chiqilgan. g, Tarjima samaradorligi va ikkalasi uchun DAG o'rtasidagi korrelyatsiya in vivo (chapda) va in vitro (o'ng) shartlar. Ikkala holatda ham korrelyatsiya kuzatilmadi, bu shuni ko'rsatadiki, Kozak ketma -ketligining tuzilishi embrionning erta rivojlanishida asosiy omil emas. Spearman korrelyatsiya koeffitsientlari (rho) va P.-qiymatlar ko'rsatiladi. AUG boshlash kodonlarining strukturaviy tahlillari (d-g) 2360 boshlang'ich kodon to'plamida bajarilgan

Qo'shimcha 3 -rasm Ribosomalar hujayrada barqarorligi pasaygan holda muqobil RNK konformatsiyasini rag'batlantiradi.

a, PatA bilan ishlov berilgan va ishlov berilmagan namunalarda 5'-UTR (659), CDS (763) va 3'-UTR (736) global foydalanish imkoniyatlarining umumiy taqsimoti. P.-qiymatlar Wilcoxon imzolangan darajali ikki tomonlama test yordamida hisoblab chiqilgan. b, DMS-seq boshqariladigan RNK ikkilamchi tuzilishining boshq uchastkalari yuqori ribosomalar bilan band bo'lish mintaqalarini bashorat qiladi. nsun2 va ddit4 genlar, turli sharoitlar/namunalar uchun. c, Gibbsning erkin energiya farqlarini juftlik taqqoslashlari (DAG ishlov berilmagan-in vitro, PatA-in vitro va CHX-in vitro) oyog'ining izlari zichligi yuqori bo'lgan derazalar (728, 332 genni qamrab olmaydigan derazalar, kul rangda) va izlari bo'lmagan (728, 312 genni qoplaydigan, oq rangda). Ijobiy DG birinchi holatdagi (ishlov berilmagan, PatA yoki CHX) barqaror bo'lmagan strukturani ko'rsatadi. in vitro, manfiy DG esa birinchi holatga qaraganda ancha barqaror tuzilishni ko'rsatadi in vitro. Tozalanmagan va CHX bilan ishlov berilgan namunalarda ribosomaga boy hududlar (kulrang) tomonidan hosil qilingan tuzilmalar uchun barqarorlikning pasayishiga e'tibor bering, lekin ribosomasiz PatA bilan ishlov berilgan namunada yoki ribosomasiz (oq) hududlarda emas. Skripka uchastkasida yadro zichligi baholanadi va chiziqlar taqsimotning kvartillarini ifodalaydi. P.-qiymatlar ikki tomonlama Wilcoxon imzolangan darajali testi va bir tomonlama Mann-Uitni yordamida hisoblangan. U- test, mos ravishda bir xil guruh uchun tekshirish shartlari bo'yicha va ma'lum bir shart doirasidagi guruhlar o'rtasida taqqoslash uchun. d, CHX ta'sirini aks ettiruvchi multfilm tasviri va unga mos keladigan CDS kirish nisbati (ishlov berilmagan/CHX) yuqori darajada (n = 356) va past (n = 356) mRNA ni 2 ot kuchiga tarjima qilgan. CHX bilan davolashdan keyin past tarjima qilingan mRNKlarda foydalanish imkoniyatining biroz oshishiga e'tibor bering (ko'k o'q). P.-qiymat bir tomonlama Mann-Uitni yordamida aniqlandi U-test. e, DMS-seq boshqariladigan RNKning ikkilamchi tuzilishining to'liq uzunlikdagi prognozlarining yoy chizmalari. ctcf, maea va nsun2 Turli sharoitlar/namunalar uchun SeqFold-dan foydalanadigan mRNKlar. CDS mintaqasi kul rangga bo'yalgan

Qo'shimcha 4-rasm, uORF tarjimasi 5′-UTR tuzilishini o'zgartiradi.

a, 5'-UTR RNK tuzilishini qayta ko'rib chiqish sxemasi, yuqoridagi ochiq o'qish ramkalarini (uORF) tarjima qilishda yuzaga keladi. b, Kümülatif taqsimotlari in vivo (yuqorida) va in vitro (pastda) uORF imkoniyatlari yuqori (qizil, n = 196) va past (ko'k, n = 196) tarjima qilingan uORFlar. P.-qiymatlar bir tomonlama Mann-Uitni yordamida aniqlandi U-testlar. c, Ribo-seq o'qishlarining taqsimlanishi (yuqori panel) va mavjudlik farqlari (in vivoin vitro) (pastki panel) uchun cdc25 5'-UTR, unda ikkita tarjima qilingan uORF (kul rangda ajratilgan) mavjud. Kirish imkoniyati oshdi in vivo qizil rangda ko'rsatiladi, kirish imkoniyati kamayadi in vivo ko'k rangda ko'rsatilgan. d, Bashorat qilingan tasvirlangan boshq uchastkasi cdc25 5'-UTR ikkilamchi tuzilmasi, ulardan birini boshqaradi in vivo (sariq) yoki in vitro (yashil) DMS-seq imkoniyatlari. Har bir yoy asosiy juftlik o'zaro ta'sirini ifodalaydi

Qo'shimcha 5 -rasm Poly (A) dumining uzunligiga bog'liq mRNK tuzilishini qayta o'zgartirish tarjimaga bog'liq.

a, Mintaqalar bo‘yicha foydalanish imkoniyatlarini (CDS yuqori panellari va 3’-UTR pastki panellari) va har bir transkript poli(A) dum uzunligini 2 ot/s (chap panellar) va 4 ot/s (o‘ng panellar) (CDS 2 hpf) bilan taqqoslashn = 1,238) va 4 ot kuchi (n = 1,138 3’-UTR 2 hpf (n = 1,221) va 4 ot kuchi (n = 1,014)). Spearman korrelyatsiya koeffitsientlari (rho) va P.-qiymatlari ko'rsatilgan. b, c, PatA bilan ishlov berilganda CDS imkoniyatlari va har bir transkript uchun poli(A) dum uzunligini solishtirish (b, n = 1,671) va in vitro qayta to'ldirilgan namunalar (c, n = 1,663) 2 ot kuchiga ega embrionlardan. Spearman korrelyatsiya koeffitsientlari (rho) va P.-qiymatlar ko'rsatiladi. d, 483 miR-430 nishonlari (qizil) va 483 tasodifiy tanlangan 483 ta miR-430 bo'lmagan maqsadli mRNK (kulrang) da topilgan, har xil tuzilgan (DS) oynalarni (2 va 4 ot kuchiga) solishtirish.

Qo'shimcha 6 -rasm in vivo va in vitro RNK tuzilmalari o'rtasidagi farqlar transkriptlar bo'ylab bir tekis taqsimlanmagan.

a, Global 5'-UTR (837), CDS (1,122) va 3'-UTR (1,051) imkoniyatlarining umumiy taqsimoti. in vivo va in vitro 2 ot kuchiga ega embrionlarning transkriptomidan. Faqat As va Cs ning kamida 85% qamrab olingan va har ikkala As va C uchun oʻrtacha kamida 10 ta oʻqilgan transkriptlar. in vivo va in vitro DMS-seq tajribalari ko'rsatilgan. P.-qiymatlar Wilcoxon imzolangan darajali ikki tomonlama testlar yordamida hisoblangan. b, 2 ot kuchiga ega embrionlarning transkriptlari bo'yicha differentsial tuzilgan oynalarni taqsimlash, solishtirish in vivo va in vitro shartlar. Kengaytirilgan tuzilishga ega Windows in vivo to'q sariq rangda tasvirlangan, tuzilishi pasayganlar in vivo turkuaz rangda tasvirlangan. Har bir transkript maydoni (5'-UTR, CDS, 3'-UTR) uzunligi bo'yicha, shuningdek har bir mintaqada tahlil qilingan oynalar soni bo'yicha normallashtirilgan. Transkriptlar ribosoma profili ma'lumotlari yordamida aniqlangan tarjima samaradorligi asosida kvintillarga ajratilgan.

Qo'shimcha 7-rasm DMS-seq signali ikki xil trans faktorni bog'lashda afzal qilingan RNK konformatsiyasi haqida ma'lumot beradi.

a, iCLIP yordamida aniqlangan KHSRP ning ketma-ketlik logotipi. b, KHSRPning nishonga majburiy maqomi tasvirlangan multfilm in vitro va in vivo. c, Foydalanish imkoniyatini solishtirish (in vivo / in vitro) KHSRP bilan bog'langan mintaqalar (ko'k) va mos kelmaydigan boshqaruv elementlari (kulrang), bu KHSRP bilan bog'lanish hujayradagi bitta zanjirli RNK konformatsiyasini saqlashga yordam beradi. KHSRP ulanish joylari iCLIP tajribalari yordamida aniqlangan va 3-UTR ichida topilganlar bilan cheklangan (qarang. Usullar). P.-bir tomonlama Mann-Uitni yordamida hisoblangan qiymat U-test. Quti birinchidan oxirgi kvartillarni o'z ichiga oladi va mo'ylovlar kvartillararo diapazonning 1,5 × ni tashkil qiladi. d, KHSRP ulanishining RNK tuzilishiga ta'sirining sxematik tasviri in vivo bog'langan RNKni bir zanjirli konformatsiyada ushlab turish. e, Ago2-miR-430 kompleksining turli sharoitlarda o'z maqsadiga bog'langan holati tasvirlangan multfilm. f, MiR-430 urug'lari (ko'k rang) va mos keladigan boshqaruv elementlari (kulrang) uchun mavjudlik nisbatlarini (shartlar va vaqt nuqtalari bo'yicha) taqqoslash. miR-430 urug'lari miR-430 nishonlarining 3'-UTRida topilgan 8 va 7-mers miR-430 ulanish joylariga mos keladi (qarang. Usullar). 8-nt nazorat zonalari tasodifiy ravishda 3'-UTRlarni o'z ichiga olgan miR-430 urug'ida tanlangan (qarang. Usullar). MiR-430 urug 'va nazorat qilish imkoniyatlari har 8-nt ketma-ketlikda topilgan A va C asoslarining o'rtacha mavjudligini hisoblash yo'li bilan hisoblab chiqilgan. P.-bir tomonlama Mann-Uitni yordamida hisoblangan qiymatlar U-testlar. Qutilar birinchi kvartillardan to oxirigacha cho'zilgan va mo'ylovlar choraklik oralig'ini 1,5 marta tashkil qiladi g, MiR-430 urug '(n = 74, chap panellar) va nazorat (n = 75, o'ng panellar) har bir pozitsiyasida 2 va 4 ot kuchiga (yuqori panellar) va nukleotidlar tarkibiga (pastki panellar) o'rtacha kirish imkoniyatlarining meta-tahlili. . Har bir mintaqa mos ravishda ko'k va kul rangda ajratilgan 8-nt miR-430 urug 'yoki nazorat ketma-ketligiga asoslangan 100 ntli oynaga to'g'ri keladi. Nuqtali chiziqlar har bir rivojlanish bosqichi uchun metaplotning o'rtacha kirish imkoniyatiga mos keladi. Xato satrlari s.e.m ni bildiradi

Qo'shimcha 8-rasm In vivo, o'ziga xos 3'-UTR tuzilmalari miRNK faolligi va gen ekspressiyasiga ta'sir qiladi.

a, b, Vivo jonli va in vitro miR-430 bo'lmagan maqsadlarda topilgan miR430 maqsadli maydonida joylashgan 200-nt mintaqaning taxmin qilingan ikkilamchi tuzilmalari va barqarorligi (DG)rab33ba, zgc: 55733 va pgk1 a) va miR-430 nishonlari (fam171a1, znf706 va rtkn2a b). miR-430 urug'ini to'ldiruvchi hududlar va uning 3'-UTR doirasidagi to'ldiruvchi bog'lovchi hududi mos ravishda zangori va qizil rangda ko'rsatilgan. Yovvoyi tabiat sharoitida (qora) yoki miR-430 faolligi miR-430 urug'iga (yashil) qo'shimcha bo'lgan tinyLNA tomonidan inhibe qilingan sharoitda, endogen transkriptlarning MZT paytida mRNKning ko'pligi har bir gen uchun ko'rsatiladi. MiR-430 nishonlari miR-430 faolligi pasayganda (-miR-430) 6 ot/s barqarorlikni oshirish bilan tavsiflanadi.b). O'rtacha 2 ta mustaqil RNK-sekundlik kurs tajribasi WT sharoitida ko'rsatiladi, -miR-430 shartlarining qiymatlari bitta RNK-sekv vaqtli kurs tajribasidan kelib chiqadi.

Qo'shimcha 9-rasm Dinamik 3'-UTR tuzilmalari MZT paytida parchalanish elementlarini ko'rsatadi.

a, 4 va 6 hpf (6v4) o'rtasidagi dinamik tuzilishga ega 3'-UTR mintaqalarida saqlangan ketma-ketliklarni boyitish, tahlil qilingan barcha 3'-UTR hududlariga nisbatan. Dinamik tuzilmalar KS testiga ega bo'lganlarga mos keladi P.-qiymati & lt 0,05. Quti birinchidan oxirgi kvartillarni o'z ichiga oladi va mo'ylovlar kvartillararo diapazonning 1,5 × ni tashkil qiladi. P.-bir tomonlama Mann-Uitni yordamida hisoblangan qiymat U-test. b, Dinamik tuzilishga ega (chap ustun, qizil) va statik tuzilishga (o'ng ustun, qora) ega bo'lgan mintaqalarning parchalanish faolligi RESA tajribasidan hisoblangan bir xil 3'-UTRdan kelib chiqqan. c, RESA eksperimentidan etarli o'qilgan 200-nt 3'-UTR mintaqalarining parchalanishi (ko'k) va stabillashtiruvchi (to'q to'q sariq) faoliyati (qarang. Usullar). Parchalanish elementlari (ko'k) orasida dinamik tuzilishga ega bo'lgan hududlarning boyishiga e'tibor bering. d, Per-transkript KS testi P.-qiymat profili (yuqorida) va saqlash (pastda). igf2bp3 mRNK, 4 va 6 hpf ni solishtirish. Profillar transkript davomida 100 nt toymasin oynalarni tahlil qilish orqali hisoblab chiqilgan (Usullarga qarang). Dinamik tuzilishga ega (qizil) va tarkibiy o'zgarishsiz (qora) saqlanib qolgan 3'-UTR mintaqalariga misollar ta'kidlangan. P.-1 dan 0,2 gacha bo'lgan qiymatlar kul rangda, 0,2 dan 0,05 gacha sariq rangda va & lt0,05 qizil rangda ko'rsatilgan. e, Topilgan dinamik (qizil) va o'zgarmas (qora) tuzilmalar uchun parchalanish faolligining miqdori igf2bp3 RESA tomonidan hisoblangan 3'-UTR. Ma'lumotlar o'rtacha ± SD (n = 3 ta mustaqil nusxa). Talaba t-sinov P.-qiymatlar ** & lt 0.01 sifatida ko'rsatilgan. f, MRNK darajasini ifodalovchi RNK-sekv vaqtli kurs tajribalarining genom izlari ccna1 (tepada) va nanog (pastki) yovvoyi turdagi (chapda) va alfa-amanitin (o'ngda) sharoitida 2, 4 va 6 hpf da transkriptlar. Alfa-amanitin zigotik genom faollashuvini inhibe qiladi, bu zigotik omillarning klirensiga ta'sirini ko'rsatadi. ccna1 va qisman, nanog mRNAlar


5' mintaqada to'liq mRNK kodlash ketma-ketligini olishda qiyinchilik (5' end mRNK artefakt): Biologiya va tibbiyotdagi sabablar, oqibatlar va oqsillarning haqiqiy aminokislotalar ketma-ketligini olish uchun mumkin bo'lgan echimlar (Ko'rib chiqish)

1990 -yillarning oxiridan boshlab genlar, gen mahsulotlari (RNK va oqsillar), genomlar va molekulyar funktsiyalar haqida o'sib borayotgan ma'lumotlarni o'z ichiga olgan ommaviy, katta ma'lumotlar bazalarining mavjudligi genlarni kashf qilish va tavsiflashga an'anaviy yondashuvni tubdan o'zgartirib yubordi. Ko'p turlardan olingan ma'lumot molekulalari (1,2) to'g'risidagi ma'lumotlarni birlashtirish organizm genlari va gen mahsulotlarining tuzilishi haqida tezkor ma'lumotga ega bo'lishning oddiy usuli bo'lib, bu o'z navbatida har birining funktsiyasi haqida ma'lumot olish uchun ishlatilishi mumkin. individual gen. Garchi bu imkoniyat genomgacha bo'lgan davrda ishlatilgan klassik molekulyar biologiya usullari bilan solishtirilmaydigan ma'lumotlarning ko'pligini yaratishga imkon bergan bo'lsa-da (3), individual gen uchun mavjud bo'lgan ma'lumotlarning sifati va darajasi o'zgarishi mumkin. kamayishi kamroq seziladi. Misol uchun, agar biz odam lokusi tomonidan ifodalangan xabarchi RNK (mRNK) ning xarakteristikasini hisobga oladigan bo'lsak, 1980-1990 yillar mobaynida shimoliy blot tahlillari va transkripsiya boshlanishi bilan mRNKning umumiy hajmi va to'qima taqsimoti to'g'risida aniq ma'lumot olish odatiy hol edi. saytlar S1 nukleaza xaritalash, primer kengaytmasi va oqim tahlillari (4). Keyingi yillarda mRNK to'liq uzunlikdagi ketma-ketliklari polimeraza zanjiri reaktsiyasi (PCR) bilan DNKni RNK (cDNK) uchlari [cDNA uchlarini tezlik bilan kuchaytirish (RACE)] amplifikatsiyasi, cDNA orqali in vivo muqobil biriktirish uchun mo'ljallangan maxsus tajribalar natijasida olingan. in vitro transkriptsiya va polipeptid biokimyoviy tahlil orqali individual RNK izoformlari va oqsil ketma -ketligini in vitro klonlash. Darhaqiqat, genlar odatda birma-bir o'rganilgan va turli usullar yordamida berilgan ma'lumotlarni o'zaro tekshirish imkoniyati mavjud edi (5). Masalan, shimoliy blotdan olingan mRNK uzunligini (poliadenillangan dumni hisobga olgan holda) va izolyatsiya qilingan cDNK dan birini (6) solishtirish yoki ma'lum protein (7) va bitta molekulyar og'irlikni taqqoslash mumkin. polipeptidning nisbiy cDNA ning ochiq o'qish ramkasi (ORF)/kodlash ketma -ketligi (CDS) bilan kodlanishi taxmin qilingan.

Yangi keng ko'lamli usullar har doim ham avvalgilarining qaroriga erisha olmaydi, shuning uchun ular genetikada qo'llaniladigan usullarda yangi standartni o'rnatgan bo'lsalar-da, gen haqida to'liq yoki noto'g'ri ma'lumotga ega bo'lmaslik uchun har bir alohida genni tavsiflashga qaratilgan batafsil tahlil zarur bo'lib qolaveradi. tuzilishi va funktsiyasi. Ammo, genom miqyosidagi ma'lumot, o'z navbatida, har bir genomik lokus uchun zarur bo'lgan qo'shimcha tadqiqotlarni klassik usullar yordamida samarali boshqarishda bebahodir. Bu, xususan, inson genomida, ma'lum to'qimalarning RNKidan cDNA klonlarining qisman, bir martalik ketma-ketligi natijasida olingan, millionlab qisqa ketma-ketlikdagi (bir necha yuz asosiy juftlik) katta korpus tomonidan ko'rsatildi. 8). Ular ma'lumotlar bazasida (EST) yaratilganidan beri to'plangan & gt20 yil oldin (9). Keyinchalik ESTga asoslangan turli xil usullar (10,11) genlarni silika klonlashda (12), differensial gen ekspressiyasini aniqlashda (13), muqobil splicingdan olingan transkriptlarning muqobil shakllarini tavsiflashda (14,15) ishlatilgan. va har bir mRNK uchun kamida bitta to'liq ORF (16) ni aniqlash. Ushbu oxirgi nuqta molekulyar biologiya va genomikada taniqli masala bo'lib, gen mahsuloti tuzilishi va funktsiyasini bashorat qilish uchun tegishli oqibatlarga olib keladi va ushbu sharhda batafsil tahlil qilinadi.

2. 5 -sonli mRNA artefakt

Klassik molekulyar biologiyaning markaziy dogmasiga ko'ra, genetik ma'lumotlarning yakuniy ta'siri ma'lum bir gendan kodlangan protein (aminokislotalar zanjiri) bo'lib, shuning uchun oqsilning asosiy, birlamchi tuzilishini (uning aminokislotalar ketma-ketligini) bilish juda muhimdir. ). Bu sohadagi muhim nuqta Sanger tomonidan inson insulinini tashkil etuvchi ikkita aminokislotalar zanjirining ketma -ketligi edi (17). Polipeptidlar ketma-ketligi, ftorodinitrobenzolning zanjirning bir uchida N-terminalli aminokislotalar bilan reaksiyaga kirishish qobiliyati tufayli, polipeptid zanjirining tabiiy birlamchi tuzilishini, xususan, ketma-ketlikning birinchi birinchi aminokislotasini aniqlashning afzalliklariga ega.Keyingi asosiy yutuqlar nuklein kislotalari va oqsillarning o'zaro bog'liqligi va mRNKning tarjima mexanizmlari tufayli aminokislotali aminokislotalar mRNKning 5 'uchi bilan kodlanganligini tan olish edi. Shu sababli, Sanger va boshqalar DNKni ketma-ketlashtirishning yangi samarali usulini taklif qilganlarida (19), oqsillarni emas, balki nuklein kislotalarni ketma-ketlashtirish ancha qulayroq ekanligi va gen mahsulotlarining aminokislotalar ketma-ketligini qulay tarzda aniqlash mumkinligi ma'lum bo'ldi. nisbiy klonlangan cDNA ning nukleotidlar ketma -ketligidan. Eksperimental paradigmaning bunday o'zgarishi "teskari genetika" ga olib keldi (20), nuklein kislotasi ketma -ketligidan klassik genetika kabi emas, balki o'z vazifalariga o'tishi va 1970 -yillarning oxiridan buyon asosiy oqibatlarga olib keldi. Proteinlar ketma-ketligi endi aniqlanmagan, lekin nisbiy cDNA-larning boshlang'ich kodonini (birinchi AUG qoidasi, optimal ketma-ketlik konteksti) va genetik kodni (21) tanib olish qoidalariga muvofiq ketma-ketlikdan so'ng bashorat qilingan.

Bu taraqqiyot oqsil ketma -ketligi mavjudligini tezlashtirdi, shuni yodda tutish kerakki, cDNA klonlashning barcha standart eksperimental usullari mRNKning 5 'mintaqasini to'liq klonlashning mumkin emasligidan ta'sirlanadi. 22). Bu teskari transkriptaza (RT) ning birinchi zanjirli cDNA ni mRNK shablonining to'liq uzunligi bo'ylab uning 5 ′ (22) (1-rasm) ga cho'zilmasligi bilan bog'liq. ferment, shuningdek, uning sifati, RNKning yaxlitligi, mRNKning 5' mintaqasi tomonidan qabul qilingan ikkilamchi tuzilmalar RT rivojlanishiga to'sqinlik qiladigan va reaktsiya sharoitlari (23).

1-rasm

5'-oxirgi mRNK artefakti. cDNA odatda teskari transkriptaza yordamida mRNKning 3 'mintaqasidan boshlang'ich polimerizatsiyasi orqali olinadi. Fermentning tabiiy ishlov berish qobiliyati, shuningdek uning sifati, RNK va mRNKning 5 'mintaqasi tomonidan qabul qilingan ikkilamchi tuzilmalarning yaxlitligi transkriptazaning teskari rivojlanishiga to'sqinlik qilishi mumkin, bu esa birinchi zanjirli cDNA polimerizatsiyasida muvaffaqiyatsizlikka olib kelishi mumkin. mRNA shablonining to'liq uzunligi bo'ylab 5 'oxirigacha, barcha boshqa tajribalarga, shu jumladan birinchi AUG kodonining tayinlanishiga ta'sir qiladi. ss, bitta torli ds, ikki qatorli.

Shuni ta'kidlash kerakki, mRNKlarning DNK nusxalarini ishlab chiqarishga qodir bo'lgan polimerazalarning o'ziga xos funktsional mexanizmlari tufayli cDNK odatda mRNKning 3 'mintaqasidan (masalan, poli (dT) oligonukleotiddan primer boshlang'ich polimerizatsiyasi orqali olinadi). mRNKlarning ko'pchiligida mavjud bo'lgan poli (dA) dumi bilan bog'lanish]. Bu shuni anglatadiki, cDNK to'plami ta'rifi bo'yicha mRNKlarning 3' mintaqalarida boyitilgan va shuning uchun gen mahsulotining karboksi terminalidagi aminokislotalar ketma-ketligini bashorat qilish aminokislotalar qatoriga qaraganda aniqroq bo'lishi kutilmoqda. . Bu muammo 1977 yilda gemoglobinning b zanjiri bo'lgan birinchi ketma-ketlikli inson cDNKsi nashrida erta e'tirof etildi, o'shanda 5'-tarjima qilinmagan mintaqa (UTR) dekabr oyida (24) xabar qilingan oxirgi mintaqa edi. aprelda 3'-UTR (25) va iyul oyida CDS (26): 'cDNA ni klonlash mRNKni tartiblash uchun eng qimmatli usul ekanligini isbotladi [27,28]. Ikki torli cDNKni qurish jarayonida esa, 5′-kodlanmagan mintaqa ketma-ketliklarining katta qismi yo'qoladi. Shunday qilib, ushbu mintaqaning mustaqil ketma-ketligi har qanday mRNKning asosiy tuzilishi haqidagi bilimlarimizni to'ldirish uchun zarur qadam bo'ladi (24) Okayama va Berg 1982 yilda aniq yozgan: "to'liq 5'-UTR va oqsil kodlash ketma-ketliklari bilan klonlangan cDNKlarni olish. kamdan -kam uchraydi, ayniqsa mRNK katta oqsilni kodlasa. Bunday kesilgan cDNKlar hali ham gibridizatsiya zondlari sifatida foydali bo'lsa-da, ular bakterial yoki sutemizuvchilar hujayralariga kiritilgandan so'ng, tegishli ekspressiya vektorlari orqali to'liq oqsillar sintezini boshqara olmaydi (23).

1980-yillardagi hisobotlarning gullab-yashnashi ko'plab inson genlari uchun "cDNA to'liq uzunlikdagi ketma-ketlik" ni aniqlashni taqdim etdi. Ko'rib chiqilgan sabablarga ko'ra, "to'liq uzunlikdagi ketma-ketlik" tushunchasi de-fakto "mRNK ketma-ketligining 5' uchida to'liqligi" tushunchasiga ekvivalent bo'lib qoladi va molekulyar biologiyada ochiq masala bo'lib qolmoqda, chunki cDNK 5' uchini to'liq ifodalamaydi. nisbiy mRNK birinchi AUG kodonining noto'g'ri tayinlanishiga olib kelishi mumkin. Bunday hollarda, agar to'liqroq mRNK 5' uchida qo'shimcha yuqori oqim AUG - oldindan aniqlangan ramkada - aniqlangan bo'lsa, u haqiqiy translatsiyaning boshlang'ich kodoni deb hisoblanardi va shu bilan prognoz qilingan amino terminallar ketma-ketligini kengaytiradi. mahsulot. Noto'g'ri boshlang'ich kodonni tayinlash nisbiy cDNKni eksperimental o'rganishda bir qator keyingi tegishli xatolarga olib keladi. Shunday qilib, biz mRNKda birinchi tarjima kodonining (AUG ketma -ketligi) 5 -sonli ketma -ketligining to'liq aniqlanmaganligi sababli noto'g'ri tayinlanishini bildirish uchun "5" end mRNA artefakt "atamasini kiritdik.

Eksperimental nuqtai nazardan qaraganda, bu texnik muammoning tan olinishi, garchi ko'pincha uning genom izohlanishi uchun mumkin bo'lgan oqibatlarini tizimli tekshirmasdan, keng miqyosli mRNK ketma -ketligini aniqlashning bir qancha usullarini ishlab chiqishga olib keldi. Ba'zilar mRNKning 5 'uchida "qopqoq" mavjudligiga asoslangan [[30] da ko'rib chiqilgan], masalan, 5' qopqog'ini ushlash (31) va gen ekspresiyasini qopqog'ini tahlil qilish (CAGE) (32). 5 ′ RACE (33) yordamida transkripsiya mahsulotlari majmuasining tizimli empirik anotatsiyasi, shuningdek, mikroarray asosidagi platformalar kiritilgandan so'ng, yuqori zichlikdagi rezina plitkali massivlarda RNK gibridizatsiyasi qo'llanildi [34]. Biroq, bu usullar eksperimental ravishda ko'p mehnat talab qiladigan deb topildi va ular muntazam ravishda qo'llanilmadi.

Shu bilan birga, individual cDNA va keng miqyosli ketma-ketlik loyihalaridan olingan ma'lumotlarning, shu jumladan mRNA 5 ′ uchini (31,35,36) tavsiflash uchun maxsus ishlab chiqilgan ma'lumotlarning tobora ko'payib borishi 5-zonada doimiy ravishda takomillashtirish va to'liqlikni yaxshilashga olib keldi. yotqizilgan va tasdiqlangan mRNK mos yozuvlar ketma-ketliklari (masalan, RefSeq, https://www.ncbi.nlm.nih.gov/refseq/), shuningdek, tegishli oqsil kodlash ketma-ketliklari haqida. Shunday qilib, ma'lum mRNKlarning 5 'hududining kengayishini va natijada aminokislotalar ketma-ketligini aniqlash uchun ketma-ketlik tahlilini optimallashtirish mumkinligini tekshirish uchun EST yoki boshqa keng ko'lamli RNK sekansirovkalash loyihalaridagi ma'lumotlarni ishlatish mumkin bo'ldi. kodlangan mahsulotlar.

So'nggi paytlarda transkriptomlar ketma-ketligi ma'lumotlar bazalarini yaratish uchun RNK-sekans (RNK-Seq) massiv usullarining mavjudligi (37) bu muammoni hal qilishning yangi potentsial vositasini taklif qilmoqda, garchi hozircha bu maqsadda tizimli ishlatilmagan bo'lsa. Bundan tashqari, mRNKning 5 'uchi haqidagi bilimlarni kengaytirishi mumkin bo'lgan ketma-ketliklar to'g'risidagi ma'lumotlar, EST asosidagi yondashuvga qaraganda, RNK-Seq ma'lumotlaridan osonlikcha olinmaydi. to'liq metrajli transkript tuzilmalarini qurish.

Bundan tashqari, ribosoma bilan himoyalangan mRNK fragmentlarini yuqori o'tkazuvchanlik bilan ketma-ketlashtirishga asoslangan ribosoma izlari profilini yaratish strategiyasi ishlab chiqildi, bu translatsiyani genom bo'ylab tekshirish imkonini beradi (38). Tarjima boshlanishiga xos bo'lgan ingibitorlar bilan birgalikda qo'llaniladigan bu usul subkodon yoki hatto bitta nukleotidli rezolyutsiya bilan tarjima boshlanishini aniqlash imkonini beradi va qo'shimcha AUG kodonlarini oldindan bashorat qilish uchun muvaffaqiyatli ishlatilgan (39-41).

Nihoyat, biz asosiy kodlash hududining (42) yuqori qismida 5'-UTRda joylashgan ORF va ramkadan tashqari AUGlar mavjudligini ta'kidlashimiz kerak. Bu holatlar maʼlum boʻlgan artefaktdan farq qiladi, chunki ular maʼlum kodlash hududini kengaytirmaydi, lekin mRNK barqarorligi va tarjimasini modulyatsiya qilish orqali gen ekspressiyasini tartibga solishda ishtirok etadi (42,43).

3. Odamlarga ma'lum bo'lgan mRNKlarda 5 'tugallanmagan tugallangan hududni tizimli aniqlash

mRNK 5' yakuniy ketma-ketligi to'g'risida aniqroq ma'lumotlarning mavjudligi oldindan qabul qilingan bashorat qilingan mahsulotni oqibatda tuzatishga olib kelishi mumkin bo'lgan nazariy imkoniyat batafsil o'rganilayotgan yagona genlar uchun tasodifiy topilgan anekdot dalillari ko'rinishidagi bir nechta hisobotlarda paydo bo'ldi. Misol uchun, mRNK CDS shu tarzda RANBP9 / RanBPM geni uchun kengaytirildi (RAN bog'lovchi protein 9, 6p23 da), bu erda Nishitani va boshqalar (44) tomonidan o'tkazilgan tadqiqot 230 ta yangi aminokislotalarni qo'shish imkonini berdi. Yadro omili bo'lsa, eritroid 2-ga o'xshash 3 (NFE2L3) geni (7p15.2 da), Kobayashi va boshqalar (45) dan olingan uzunligi 2174 bp bo'lgan tegishli #AB010812.1 mRNK ketma-ketligi # ketma-ketligi bilan almashtirildi. AF134891.1 2,618 bp, bu prognoz qilingan oqsilga 294 ta yangi aminokislotalarning qo'shilishiga olib keladi. Nomura va boshqalar (46) tomonidan SP2 geni uchun o'tkazilgan tadqiqot (Sp2 transkripsiyasi faktori, 17q21.32 da), D28588.1 mRNK ketma -ketligi yozuvini chiqarishga ruxsat berdi, bu esa 3288 bp CDS yozib, 111 yangi aminokislotalar qo'shilishiga olib keldi. oldingi #M97190 bilan solishtirganda, Kingsley va Winoto tomonidan taqdim etilgan 2,063 bp (47). Ushbu kengaytmalarning kodlash tabiati, shuningdek, tegishli murin hortologlari bilan juda o'xshashlik bilan qo'llab -quvvatlandi [29]. Ushbu va boshqa shunga o'xshash hisobotlar CDSdagi barcha to'liqliklarni aniqlash uchun yuqori o'tkazuvchanlik yondashuvi maqsadga muvofiqligini ko'rsatdi (I-jadval).

I-jadval

MRNA 5 "CDS mintaqasining to'liqligini tizimli qidirishning asosiy nashr qilingan natijalari.

Jadval I

mRNK 5' CDS mintaqasining to'liqligini tizimli qidirishning asosiy nashr etilgan natijalari.

Ref. Yil Organizm Usul mRNAlar Kengaytirilgan 5 ′ CDSa
(35) 2000 H. sapiens Oligo qopqog'i 954 68 (7.1%)
(29) 2003 H. sapiens Qo'l va avtomatlashtirilgan ketma -ketlikni tahlil qilish 13,124 556 (4.2%)
(53) 2007 D. rerio Avtomatik ketma -ketlikni tahlil qilish 8,528 285 (3.3%)
(39) 2011 Sichqoncha embrion ildiz hujayralari Ribosoma izlarini aniqlash va qo'llab-quvvatlash vektorli mashinasi (SVM) asosida mashinani o'rganish strategiyasi 4,994 570 (11.4%)
(54) 2012 H. sapiens To'liq avtomatlashtirilgan ketma-ketlikni tahlil qilish 18,665 477 (2.6%)
(40) 2012 H. sapiens Ribosoma izlarini aniqlash va neyron tarmoqlarini bashorat qilish 5,062 6 AUG (0,1%) va 540 AUG bo'lmagan (10,7%)
(55) 2014 M. muskullari To'liq avtomatlashtirilgan ketma-ketlikni tahlil qilish 20,221 351 (1.7%)
(41) 2014 H. sapiens Ribozomlarning izini aniqlash va qo'lda tahlil qilish 1,255 17 (1.4%)
M. muskullari Ribozomlarning izini aniqlash va qo'lda tahlil qilish 930 4 AUG (0,4%) va 13 AUG bo'lmagan (1,4%)

a baholash. CDS, kodlash ketma -ketligi H. sapiens, Homo sapiens D. rerio, Danio rerio (zebrafish) M. musculus, Mus musculus (sichqon).

Bizning guruhga kelsak, masalaning birinchi yondashuvi sifatida, trisomiya 21 (Daun sindromi) uchun yangi patogenezga asoslangan terapevtik yondashuvlarni aniqlashning yaxlit yo'nalishiga bo'lgan qiziqishimiz tufayli, biz ma'lum, yaxshi tavsiflangan narsalarga e'tibor qaratdik. Hattori va boshq. (50) tomonidan "toifasi: ma'lum" deb nomlangan 109 RefSeq mRNA ketma -ketligini qo'lda tahlil qilib, inson xromosomasi 21 (Hsa21) ning asl xaritasida mavjud bo'lgan genlar. -tasvirlangan ATG oqimining yuqorisida to'xtash kodoni. 49 holatda, bunday to'xtash kodonining topilishi, yozilgan 5'-UTR ketma-ketligi, aslida, uzoqroq CDSning bir qismi bo'lishi mumkinligini istisno qilishga imkon berdi [51]. Qolgan 60 mRNA-larning ketma-ketligi 5'-UTR asoslari, aksincha, tarjima qilingan kodonlarning mavjudligiga mos kelishi mumkin, mahalliy mahalliy moslashtirishni qidirish vositasi (BLAST, http: //) yordamida ma'lumotlar banklarida mavjud ketma-ketliklar bilan muntazam ravishda moslashtirildi. www.ncbi.nih.gov/BLAST/), EST (yoki EST bo'lmagan RNK ketma-ketligi) gomologiyasi 5 'terminalda to'liqroq mRNK mavjudligini taklif qilgan jami 20 ta genning kashf qilinishiga olib keldi. Ta'riflangani bilan birga va undan yuqori oqimda oldindan noma'lum bo'lgan boshlang'ich kodoni mavjudligi sababli ular protein mahsulotlarini aminokislotalarida uzoqroq kodlaydilar (2-rasm). Nihoyat, RT-PCR va ketma-ketlikdan so'ng beshta lokus uchun ushbu transkriptlarning mavjudligi to'g'risida eksperimental dalillar aniqlandi: 1-darajali Down sindromi kritik mintaqasi (DSCR1) [hozirda kalsineurin 1 (RCAN1) regulyatori], 2-homolog A (DIP2A) KIAA0184), URB1 ribosoma biogen-ez 1 homologi (URB1 KIAA0539I), SON DNKni bog'lovchi oqsil (SON) va trefoil omil 3 (TFF3) (29). Bunday hollarda, ikkala shart ham ro'y berdi: ta'riflangan exon 1 kengaytmasi ma'lum bo'lgan AUG oqimining yuqorisida yangi kodlash kodonlarini bashorat qildi va bu kodonlarning tepasida, yuqorida ta'riflangan AUG bilan bir qatorda va to'xtash kodonisiz, yangi AUG paydo bo'ldi. . Bu shuni ko'rsatadiki, tarjimani boshlash qoidalariga rioya qilgan holda [Kozak (21) tomonidan ko'rib chiqilgan), haqiqiy CDSni "birinchi AUG" romani va ma'lum to'xtash oralig'iga kiritilgan deb hisoblash kerak (2-rasm). Hech qanday ma'lum mexanizm yangi aniqlangan boshlang'ich kodoni haqiqiy tarjima nuqtasi emasligi ehtimoliga xalaqit bermasligi kuzatildi, chunki "ichki" AUGlardan foydalanish, ba'zi mRNKlarda quyi oqim AUG kodonlarida qo'shimcha boshlash hodisalarini faqat uchta quduqda sodir bo'lishiga imkon beradi. aniqlangan holatlar (21): qayta boshlash, bu yondashuvda o'rganilgan mRNKlarga taalluqli emas, chunki yangi aniqlangan AUG asosiy ORFdan to'xtash kodonli kontekstga bog'liq oqish skanerlashi bilan ajratilgan kichik yuqori oqimdagi ORFning bir qismi emas, AUG (29) romanining ishlatilishining to'liq (ba'zan yaxshiroq) muvofiqligini kuzatib, AUG romanlari uchun Kozak ketma -ketligi (21,52) bilan muvofiqlikni ko'rib chiqdik, bu uchinchi mexanizm, ya'ni ichki mexanizmdan foydalanish. faqat ma'lum virusli mRNKlar tomonidan qabul qilingan ribosoma kirish joyi (IRES) ketma -ketlik modullari.

2 -rasm

To'liq bo'lmagan 5 ′ sonli hududlarni aniqlash va tuzatish. Ma'lum bo'lgan mRNK 5'-kodlash hududini kengaytirish uchun mumkin bo'lgan EST ketma-ketligi nomzodlari yuqori oqim ichidagi AUG kodonining mavjudligi va ilgari ma'lum bo'lgan va yangi aniqlangan AUG kodonlari o'rtasida hech qanday to'xtash kodonining yo'qligi uchun tanlanadi. Yuqori oqimdagi AUG kodoni haqiqiy tarjimaning boshlang'ich kodoniga aylanadi, shu bilan yangi Metni kodlaydi va mRNK mahsulotining bashorat qilingan amino terminallar ketma-ketligini kengaytiradi. EST, ifodalangan ketma -ketlik belgisi Met, metionin.

Ushbu ijobiy natijalar tasvirlangan 5' da ramka ichidagi to'xtash mavjudligi yoki yo'qligini aniqlash uchun oddiy dastur yordamida avtomatlashtirilgandan so'ng, o'sha paytda ma'lum bo'lgan (n = 13,124) inson RefSeq mRNKlarining butun to'plamiga yondashuvni kengaytirishni taklif qildi. -mRNKning UTR. To'plamdagi ikkinchi turdagi mRNKning ulushi (51%) Hsa21 genlar to'plamiga (55%) juda o'xshash edi, shuning uchun 556 ta ma'lum bo'lgan inson mRNKlarining CDS mutanosib ravishda to'liq bo'lmagan bo'lishi mumkinligini taxmin qildi. 5 -sonli (29).

Ushbu yondashuv har qanday mRNK nomzodini 5 'mintaqasida to'liq bo'lmagan CDSga ega bo'lishini ketma -ket taqqoslash orqali batafsil tahlil qilish uchun qo'lda kuratorlikni talab qildi. Algoritmni takomillashtirish chop etildi va zebrafish uchun muvaffaqiyatli qo'llanildi [pastda (53) ga qarang), shuni ko'rsatadiki, ketma -ket taqqoslashning bir nechta natijalari ishlab chiqilgandan so'ng, mRNK majmuasining ma'lum 5 'uchida qo'shimcha asoslarni avtomatik aniqlash. tahlil qilish (BLAST vositasi yordamida) mumkin edi. Qo'llaniladigan muhitning ba'zi texnik cheklovlari bu quvur liniyasini amalga oshirishni ancha murakkablashtirdi, bu esa bir muncha vaqt bu yo'nalishda taraqqiyotga to'sqinlik qildi. EST-ga asoslangan avtomatlashtirilgan yondashuvni yanada takomillashtirish (5′_ORF_Extender 2.0, http://apollo11.isto.unibo.it/software/ saytida erkin mavjud) nihoyat 5-sonli CDS-larning tizimli identifikatsiyasini (2-rasm) amalga oshirdi. insonga ma'lum bo'lgan barcha mRNKlarning 7 million BLAT moslashuvini tahlil qilish va shu bilan tahlil qilingan 18665 ta odamdan 477 tasini topish (I-jadval), ularning RNK 5' CDS kengaytmasi batafsil aniqlangan (54). Bundan tashqari, ushbu tadqiqotda in vitro klonlash va ba'zi misol genlar uchun sekansirovka qilish orqali kontseptsiyani isbotlash tasdiqlandi: GNB2L1 [hozirda faol kinaz 1 (RACK1) retseptorlari], glutaminil-tRNK sintetaza (QARS) va tirozil -DNK fosfodiesteraza 2 (TDP2) cDNAlari. Boshqa tomondan, 20 775 ta inson mRNKlari ro'yxati yaratilgan bo'lib, unda ma'lum bo'lgan boshlang'ich kodonning yuqori oqimida ramka ichidagi to'xtash kodonining mavjudligi joriy shakldagi 5' oxirida CDSning to'liqligini ko'rsatadi (54). Bu yondashuv har xil 5'-UTR ketma-ketligini aniqlashga ham qaratilgan bo'lishi mumkin, lekin AUG romanining yuqorisida joylashgan bazalarning uzunligi, odatda, bu turdagi tergovga imkon bermaydi. Bundan tashqari, agar uzunlik etarlicha uzun bo'lsa, tahlil ushbu turdagi mRNK izoformlarini ajrata oladigan maxsus algoritmni talab qiladi, shu jumladan yangi aniqlangan 5'-UTR ni genomga xaritalash uchun javob beradigan alternativ transkripsiya/splaysing hodisalarini olish uchun. turli 5′-UTR ketma-ketliklari.

Bu sharh tibbiyotda yuzaga kelishi mumkin bo'lgan inson mRNK -lariga ko'proq qaratilgan bo'lsa -da, shuni ta'kidlash kerakki, umumiy molekulyar texnikaning almashinuvi tufayli boshqa organizmlarning genomlari uchun ham shunga o'xshash natijalar kutilmoqda. artefakt. Aslida, inson genomini o'rganish uchun eng ko'p qo'llaniladigan ikkita model organizmlar - Danio rerio (zebrafish) va Mus musculus (uy sichqonchasi) ustida olib borilgan tadqiqotlar bu taxminni tasdiqladi. Yangi taklif qilingan avtomatlashtirilgan yondashuv (5′_ORF_Extender 1.0) mavjud ESTlarni zebrafishlarning eksperimental tarzda aniqlangan mRNK ketma -ketligi bilan muntazam taqqoslashi, 5 'mintaqasida qo'shimcha ketma -ketlikni aniqlashi va yangi, kengaytirilganni aniqlash uchun zarur bo'lgan barcha sharoitlarning mavjudligini tekshirishi mumkin edi. taxminiy ORF. Asbob 5 'mintaqasida 285 ta (3,3%) mRNA ni to'liq bo'lmagan ORF bilan aniqladi va uchta misolda tanlangan holatlarda (selt1a, unc119.2 va nppa yoki selenoprotein T 1a, non-119 lipidli bog'lovchi chomonone B homolog 2 va natriuretik peptid). A, mos ravishda), 5' oxirida kengaytirilgan kodlash hududi eksperimental ravishda ko'rsatildi (53). Sichqoncha mRNKlariga kelsak, inson transkripsiyasi uchun qo'llaniladigan takomillashtirilgan usulni qo'llash (54) shuni ko'rsatdiki, tahlil qilingan 20,221 tadan 351 ta sichqoncha lokusida mRNA 5'-kodlash hududining kengayishini aniqlash mumkin. Adenomatoz polipozis coli 2 (Apc2) va MAP kinaz bilan o'zaro ta'sirli serin/treonin kinaz 2 (Mknk2) cDNAs uchun in vitro klonlash va sekansirovka qilish orqali eksperimental tasdiq olingan va 16,330 sichqonchani mRNKlari ro'yxati berilgan. 55).Shunisi e'tiborga loyiqki, natijalarning 82% original bo'lib, sichqonchaning asosiy genom ma'lumotlar bazalarida va genom brauzerida qo'llaniladigan annotatsiya quvurlari tomonidan aniqlanmagan (55). Shunday qilib, 5'-oxirgi mRNK artefaktining tarqalishini pastki umurtqali hayvonlardan odamlarga taxminan doimiy deb hisoblash mumkin, chunki nisbiy mRNKlarni tavsiflash uchun ishlatiladigan usullar bir xil yoki juda o'xshash (I-jadval).

Yuqori oqimning eng aniqlanishi mumkin bo'lgan boshlang'ich kodonining identifikatsiyasi quyi oqimdagi AUG kodonidan ribosoma tomonidan ham foydalanish mumkinligini istisno qilmaydi, bu hodisa alternativ tarjima deb nomlanadi (56). Muqobil tarjima boshlang'ich saytlari eukaryotik genomlarda saqlanib qolishi ko'rsatildi, bu tarjima samaradorligini oshirish va/yoki turli xil N-terminalli oqsil variantlarini olish uchun tanlangan funktsional mexanizmni ta'minlaydi [57]. Bundan tashqari, ushbu turdagi tahlil kengaytirilgan ORF ning alternativ transkripsiyaning boshlang'ich joyidan (muqobil promouterdan foydalanish tufayli) va/yoki tekshirilayotgan joyning birlashmasidan kelib chiqishi mumkinligini rasman istisno qila olmasligi ta'kidlangan (53). Shu bilan birga, u har qanday holatda ham ilgari aniqlanmagan qo'shimcha kodlash ketma -ketligi mavjudligini ko'rsatadi, buni aminokislotalar darajasida filogenetik taqqoslash bilan tasdiqlash mumkin [53]. Boshqa har qanday kompyuter bashoratida bo'lgani kabi, taxminiy modelning aniq tavsifi uchun silico, ayniqsa in vitroda qo'shimcha tekshirish talab etiladi.

Nashr qilingan yondashuvlar boshlang'ich kodoni AUG ketma-ketligiga ega bo'lgan algoritmlarni ko'rib chiqqan bo'lsa-da, shuni ta'kidlash kerakki, mRNK CDS larning oz foizida boshlang'ich kodoni muqobil ketma-ketliklarga ega bo'lishi mumkin, xususan, CUG, UUG, GUG, ACG, AUA va AUU ( 58). Darhaqiqat, yaqinda o'tkazilgan tajribalar bu hodisani tasdiqladi va u ilgari taxmin qilinganidan ko'ra tez-tez sodir bo'lishi mumkinligini ko'rsatdi. Shuning uchun, agar AUG bo'lmagan kodondan foydalanish ma'lum bo'lsa yoki shubha qilinsa, AUG bo'lmagan yuqori oqimdagi boshlang'ich kodonlarni aniqlash uchun standart quvur liniyalariga kiritilmagan qo'shimcha tahlillarni o'tkazish kerak. ilgari tasvirlanganlar.

4. Biologiya va tibbiyotda 5′ end mRNK artefaktining oqibatlari

5' end mRNK artefakti biotibbiyot tadqiqotlarida oqibatlar zanjirini keltirib chiqarishi kutilmoqda va ko'rsatilgan, ular hozir sanab o'tiladi va muhokama qilinadi (2-jadval). Artefakt bilan bog'liq birinchi aniq masala mahsulot tuzilishi va funktsiyasini o'rganishdagi salbiy oqibatdir (59). Katta hajmdagi tadqiqotlar noto'g'ri boshlang'ich ma'lumotlarga asoslanganligi haqiqatdir. Masalan, bu uning prognoz qilingan to'liq bo'lmagan DNKsidan (60) ifodalangan polipeptidning funktsional xarakteristikasida va sitokin interleykin 16 (IL16) (61) ni funktsional o'rganishda sodir bo'ldi, bu erda mahsulot to'liq bo'lmagan cDNK dan ifodalanganga o'xshaydi (61). II jadval).

II-jadval

mRNK 5' CDS mintaqasini to'liq aniqlamaslikning mumkin bo'lgan oqibatlari, masalan, inson genlari.

II-jadval

MRNA 5 "CDS mintaqasini, masalan, inson genlarini to'liq aniqlashning mumkin bo'lmagan oqibatlari.

Belgi Ref. AAsa Ref. 2018-05-01 xoxlasa buladi 121 2
Protein darajasida
3D oqsil tuzilishini aniqlashdagi xatolar ALDOC (59) 87 (54)
To'liq bo'lmagan polipeptidni bashorat qilish QARS (60) 18 (54)
To'liq bo'lmagan polipeptid ishlab chiqarish IL16 (61) 47 (54)
Funktsional oqsil domenlari tavsifining yo'qligi O'G'LI http://www.ncbi.nlm.nih.gov/gene/6651 968 (29)
Protein lokalizatsiyasini aniqlashdagi xatolar RANBP9/RanBPM (63) 230 (44)
Muqobil polipeptidlarni bashorat qilmaslik UMOD http://www.ncbi.nlm.nih.gov/gene/7369 49 yoki 28 (54)
Ortologik mahsulotlarni aniqlashda xatolar DSCR1.1 (66) 55 (29)
Belgi Ref. ntsa Ref. 2018-05-01 xoxlasa buladi 121 2
cDNK darajasida
Mutatsiyalar uchun to'liq CDSni ko'rib chiqmaslik ADAR http://omim.org/entry/146920 48 (54)
Funktsiya uchun ikkita gibrid testda to'liq bo'lmagan cDNK DSCR1 (65) 55 (29)
Morfolino oligoslarni loyihalashda mumkin bo'lgan xatolar unc-119.2 (Danio rerio) (77) 58 (53)
Gen tuzilishi darajasida
Genlarning to'liq kengayishini/genlararo bo'shliq sifatida belgilanmasligini DIP2A (71) 82,895 (29)
Haqiqiy targ'ibotchi hududlarni aniqlay olmaslik TFF3 (72) 170 (29)

Ref sifatida keltirilgan tahlildan so'ng, mos ravishda ilgari qayd etilgan oqsil yoki nuklein kislotalar ketma-ketligiga qo'shilgan AA yoki nts. 2. CDS, kodlash ketma-ketligi AAs, aminokislotalar nts, nukleotidlar ALDOC, Aldolaz, Fruktoza-Bisfosfat C QARS, glutaminil-tRNK sintetaza IL16, interleykin 16 SON, SON DNKni bog'lovchi oqsil RANBP9, RAN9UMDS proteini, RAN9UMDS daundin, RAN9UMOD tanqidiy hudud 1 ADAR, adenozin deaminaza, RNKga xos DIP2A, diskoteka o'zaro ta'sir qiluvchi protein 2 gomolog A TFF3, trefoil omil 3.

Genomik ma'lumotlar bazalarida ularning aminokislotalarida to'liq bo'lmagan oqsil ketma-ketligini qayd etish, shuningdek, funktsional jihatdan ajoyib protein domeni ketma-ketliklarini aniqlab bo'lmasligiga olib kelishi mumkin (II-jadval), xususan, oqsillarning aminokislotalarida joylashgan ketma-ketliklar etkazib berishni boshqaradigan signal peptidlari ketma-ketligi bilan ifodalanishi mumkin. oqsilni yakuniy manzilga (62,63) olib boradi va uning yarim yemirilish davriga ham ta'sir qilishi mumkin (64).

Bundan tashqari, genlarning 5 ′ terminalida muqobil qo'shilishni kam baholamaslik va mos keladigan muqobil protein gen mahsulotlarini bashorat qilmaslik imkoniyati mavjud (2-jadval). Okayama va Bergning klassik maqolasidagi bayonot hanuzgacha to'g'ri keladi: "Haqiqatan ham, bu klonlangan cDNKlar va ularning genomik hamkasblari o'rtasidagi oraliq ketma-ketliklar va birlashmalarning mavjudligini ochib berdi" (23). Bundan tashqari, kodlash ketma-ketligidagi patologik o'zgarishlarni aniqlashga qaratilgan mutatsiya skriningining dizayni CDS to'g'risida to'liq ma'lumotga ega bo'lmaganligi sababli ta'sir qilishi mumkin, bu holat vaqti-vaqti bilan nomzod yoki o'rnatilgan kasallik genlarida kutilgan mutatsiyalarning topilmasligini tushuntirishi mumkin va ehtimol noto'g'ri genotip / fenotip korrelyatsiyasiga olib keladi (II-jadval). Funktsional nuqtai nazardan, yangi aminokislotalar ketma-ketligi yangi shovqinlar uchun javobgar bo'lishi mumkin. To'liq bo'lmagan cDNKlardan ikki gibrid testda o'lja sifatida ifodalangan oqsillar bilan bog'lanishga asoslangan farmakologik faollikka ega molekulalarni loyihalash imkoniyati (65) oqsilning haqiqiy asosiy tuzilishini bilish muhimligini ta'kidlaydi. Va nihoyat, genomik ma'lumotlar bazalarida kesilgan oqsillar ketma-ketligining mavjudligi boshqa turlardagi ortologlarni bashorat qilishda xatolar zanjirining kelib chiqishida ham bo'lishi mumkin. Xususan, genom annotatsiyasi quvurlari taxmin qilingan model oqsillarida kesilgan ketma-ketlikni targ'ib qilishga moyil bo'ladi. Masalan, juda o'xshash DSCR1 ortologini aniqlashdagi xato (66), insonning to'liq bo'lmagan ma'lumotlaridan kelib chiqadigan burilish DSCR1 murining mahsulot ketma -ketligini modellashtirishga salbiy ta'sir ko'rsatganini ta'kidlaydi.

Odam lokuslarining murakkab tuzilishi (67-70) tufayli, aniq cDNK ketma-ketligini o'rnatishdagi xatolar, shuningdek, DNK va RNK o'rtasidagi qattiq bog'liqlik tufayli genning genomik tashkil etilishini o'rganishda kamchiliklarga olib kelishi mumkin (II-jadval). Agar lokusning genomik tuzilishini aniqlash uchun 5 -sonli tugallanmagan cDNA ishlatilsa, bu lokusning bir qismi sifatida genomik ketma -ketlikni tan olmaslikka olib kelishi mumkin [71]. Ikkilamchi natija sifatida, genetik mintaqani genlararo deb tasniflash sun'iy ravishda yangi genlarni qidirish maydonini saqlab qolishi mumkin [71]. Gen promotor mintaqasi va mos keladigan mRNK 5' mintaqasining jismoniy yaqinligi tufayli transkripsiyaning boshlang'ich joyiga proksimal bo'lishi kerak bo'lgan va promotor sifatida izohlangan ketma-ketlik TFF3 da ko'rsatilganidek, aslida uzunroq mRNKning bir qismi bo'lishi mumkin (72, 29). Ushbu muammo CDS sifatida muntazam boshlash va to'xtash signallari yoki xarakterli o'zaro bog'liq saqlanishlarga ega bo'lmagan promotor ketma-ketliklarini aniqlashda qiyinchiliklarni yanada kuchaytirishi mumkin va hatto funktsional jihatdan saqlanib qolgan holda uzoq turlar orasida ajralib turadigan ketma-ketliklar bilan namoyon bo'lishi mumkin (73). Boshqa tomondan, 5'-UTR va CDS o'rtasidagi aniq bo'lmagan chegaralanish 5'-UTR ketma-ketligini bilishda va tarjimani boshqarishdagi rolini talqin qilishda xatolarga olib kelishi mumkin (74). Ushbu oxirgi oqibatlar klassi CDS prognoziga bevosita ta'sir qilmasa ham, ularni gen ekspressiyasini tartibga solish yo'llarida 5 "terminalining markaziy roli tufayli ushbu artefaktning ahamiyatini e'tiborsiz qoldirmaslik uchun qo'shimcha rag'bat sifatida ko'rib chiqish kerak. Haqiqiy mRNK oxiri haqidagi ma'lumot, shuningdek, markaziy, kodlovchi mintaqadan ko'ra, xuddi shu lokusning o'xshash lokuslari yoki izoformlari o'rtasida o'zgaruvchan bo'lishi mumkin bo'lgan, bu mintaqaga xos bo'lgan problarni loyihalashda ham foydalidir. Bu oddiy (75) yoki patologik (76) transkriptomlar genlarining to'liq komplektatsiyasining ekspressiv qiymatlari uchun mikrorayonlarning ma'lumotlar to'plamidan miqdoriy mos yozuvlar o'lchovlarini olish imkoniyati bilan bog'liq. mRNK 5' hududi to'g'risida aniq ma'lumot, shuningdek, morfolinoligonükleotidlarni tanlashga ta'sir qiladi, xususan, zebrafishlarda (77), nokdaun tajribalarida qo'llaniladi (II-jadval).

Artifakt genomik tahlilning boshqa turlaridagi xatolar uchun ham manba bo'lishi mumkin, garchi bu holatlarda oqibatlar ahamiyatsiz bo'lishi kutiladi, chunki hisob-kitoblarning o'zgarishi ularni darhol tibbiy qo'llash uchun emas, balki kichik og'ishlarni ko'rsatishi mumkin. tahlillar [masalan, genomik miqyosda kodondan foydalanishni baholash (78), garchi cDNKdagi barcha kodonlar to'plamini bilish xostda tarjima qilingan mahsulotni ishlab chiqarish texnologiyasiga ta'sir qilishi mumkin (79)].

5. mRNKdagi 5'-kodlash hududlari haqidagi bilimlarni yaxshilash uchun mumkin bo'lgan echimlar

5' mRNK uchini aniqroq bilish maqsadida bir nechta usullar tasvirlangan, shuning uchun uning CDS to'liq bashorat qilinishi mumkin emas. Birinchisi 1990-yillarda ishlab chiqilgan va DNK dan transkripsiya qilingan birinchi asoslarni yoki etuk mRNKlardagi qopqoqdan keyingi birinchi asoslarni aniqlash uchun maxsus texnikalar imkoniyatlaridan foydalangan holda eksperimental protokollarga asoslangan. Ushbu usullar Kirish bo'limida keltirilgan va ular ko'pincha mehnat talab qiladigan va muntazam foydalanilmagan bo'lsa-da, o'z kuchini saqlab qoladi.

Usullarning ikkinchi guruhi hisoblash biologiyasi yondashuvlariga asoslangan bo'lib, birinchi tizimli skriningni ta'minlash afzalligi bilan tegishli miqdordagi genlarni 5'-oxirgi mRNK artefaktiga nomzod sifatida chiqarib tashlashga olib keladi. Ushbu turdagi ESTga asoslangan yondashuvning (54) o'tkazuvchanlik natijalari mavjudligi sababli, bashorat qilingan mahsulot joriy yilda qayd etilgan deb taxmin qilishdan oldin, bu natijalarga nisbatan qiziqish geniga nisbatan oddiy birinchi tekshiruvni o'tkazish tavsiya etiladi. ma'lumotlar bazalarining versiyasi. Vaqt o'tishi bilan inson mRNK ketma-ketligini doimiy ravishda takomillashtirish 259 ta nukleotidni o'rtacha 5'-UTR hajmi (80) sifatida baholashga olib keldi, shuning uchun kengaytirilgan protein kodlash ketma-ketliklarini aslida 5' uzoqroqda yashirish mumkin bo'lgan aniq imkoniyat mavjud. -UTRlar. Yuqori o'tkazuvchan cDNK ketma-ketlik usullarini (RNK-Seq) hisoblash tahlilining keyingi ishlanmalari, shuningdek, inson transkriptlarining butun ketma-ketligini tavsiflashni oshirish uchun vositani ta'minlashi kerak. MRNK 5 ′ ni profillashning RNK-Seq usullarini Drosophila melanogasterda qo'llash bo'yicha bir qancha tadqiqotlar o'tkazildi [81,82].

Nihoyat, proteomik tadqiqotlarning so'nggi ishlanmalari muammoga boshqacha, aniq yondashuv uchun yo'l ochadi. Polipeptid yadro magnit-rezonansi (NMR) yoki mass-spektrometriya (MS) spektrlarini, xususan, N-terminallar sekansiga (83,84) katta tahlil qilish natijasida olingan oqsil ketma-ketliklarini bilish, genomik ketma-ketlikni teskari qidirish uchun ishlatilishi mumkin. tegishli aniqlangan oqsil ketma-ketlikda tarjima qilinishi kerak. Shunday qilib, bu birinchi protein-DNK eksperimental oqimiga o'xshaydi, lekin genomik miqyosda va asosan hisoblash usullariga asoslangan.

Xulosa qilib aytganda, biz genomik tadqiqotlarning hozirgi usullari mRNK 5' mintaqasi ketma-ketligini aniq aniqlash va bu annotatsiyaga olib kelishi mumkin bo'lgan oqibatlarga bog'liq bo'lishi mumkin bo'lgan artefaktga duchor bo'lishi haqida dalillarni taqdim etdik. genlar va gen mahsulotlari. Ushbu muammoni hal qilish uchun bir nechta strategiyalar mavjud bo'lsa-da, eng muhim masala, molekulyar biologiya va genetika bo'yicha tajribalarni rejalashtirishda e'tiborga olinishi uchun bu imkoniyatni ilmiy jamoatchilik e'tiboriga havola etadi.

Minnatdorchilik

MCning stipendiyasi Fondazione Umano Progresso (Milano, Italiya) xayriya va Fondazione del Monte di Bologna e Ravenna (Bolonya, Italiya) granti hisobidan birgalikda moliyalashtirildi. MCP stipendiyasi Fondazione Umano Progresso xayriya va Vittoria Aiello va Massimiliano Albanese (Vashington, Kolumbiya okrugi, AQSh) tomonidan xalqaro mablagʻ yigʻish tashabbusi ortidan xayriyalar orqali birgalikda moliyalashtirildi - ushbu tashabbusga hissa qoʻshayotgan donorlar saytida keltirilgan: http ://www.massimilianoalbanese.net/ds-research/?lang=en. AP uchun stipendiya asosan Eksperimental, diagnostika va ixtisoslashtirilgan tibbiyot bo'limi (DIMES), Bolonya universiteti (Bolonya, Italiya) tomonidan moliyalashtiriladi va Fondazione Umano Progresso tomonidan birgalikda moliyalashtiriladi. Biz Kirsten Uelterga qo'lyozmani ekspertiza bilan qayta ko'rib chiqqani uchun minnatdormiz.

Ma'lumotnomalar

Borsani G, Ballabio A va Banfi S: O'zingizni genom ma'lumotlar bazalari labirintiga yo'naltirish uchun amaliy qo'llanma. Hum Mol Genet. 7: 1641–1648. 1998. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Pandey A va Lewitter F: Nukleotidlar ketma-ketligi ma'lumotlar bazalari: biologlar uchun oltin koni. Trends Biochem Sci. 24:276–280. 1999. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Baxevanis AD va Bateman A: Biologik kashfiyotda biologik ma'lumotlar bazalarining ahamiyati. Curr Protoc Bioinformatika. 50: 1.1.1–1.1.8. 2015. Maqolani ko'rish : Google Scholar

Tropp BE: Molekulyar biologiya: oqsillarga genlar. 3-nashr. Jons va Bartlett nashriyoti, Sudberi, MA: 2008

Sambrook J va Russel DW: Molekulyar klonlash: Laboratoriya qo'llanmasi. 2. 3-nashr. Cold Spring Spring Harbor laboratoriya matbuoti, Cold Spring Spring Harbor NY: 2001

Vitale L, Casadei R, Canaider S, Lenzi L, Strippoli P, D'Addabbo P, Giannone S, Carinci P va Zannotti M: Sistein va tirozinga boy 1 (CYYR1), inson 21-xromosomasida oldindan aytib bo'lmaydigan yangi gen (21q21. 2), sistein va tirozinga boy proteinni kodlaydi va yuqori darajada saqlanib qolgan umurtqali hayvonlarga xos genlarning yangi oilasini belgilaydi. Gen. 290:141–151. 2002. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Chjan J, Lou X, Shen X, Zellmer L, Sun Y, Liu S, Xu N va Liao DJ: Yovvoyi turdagi oqsillarning izoformlari ko'pincha SDS-PAGE da past molekulyar og'irlikdagi bantlar sifatida ko'rinadi. Biotechnol J. 9: 1044–1054. 2014. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Adams MD, Kelley JM, Gocayne JD, Dubnik M, Polymeropoulos MH, Xiao H, Merril CR, Wu A, Olde B, Moreno RF va boshqalar: Qo'shimcha DNK ketma -ketligi: ifodalangan ketma -ketlik teglari va inson genomining loyihasi. Fan. 252: 1651–1656. 1991. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Boguski MS, Lowe TM va Tolstoshev CM: dbEST - "ifodalangan ketma-ketlik teglari" uchun ma'lumotlar bazasi. Nat Genet. 4:332–333. 1993. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Nagaraj SH, Gasser RB va Ranganathan S: Avtostopchining ketma -ketlik yorlig'ini (EST) tahlil qilish bo'yicha qo'llanmasi. Qisqacha bioinform. 8:6–21. 2007. Maqolani ko'rish : Google Scholar

Parkinson J va Blaxter M: ifodalangan ketma -ketlik teglari: umumiy nuqtai. Usullari Mol Biol. 533:1–12. 2009. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Gill RW va Sanseau P: ifodalangan ketma-ketlik teglari (EST) yordamida genlarni silika klonlashda tez. Biotechnol Annu Rev. 5:25–44. 2000. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Carulli JP, Artinger M, Swain PM, Root CD, Chee L, Tulig C, Guerin J, Osborne M, Stein G, Lian J va boshqalar: Differensial gen ifodasining yuqori o'tkazuvchanlik tahlili. J hujayra biokimyoviy ta'minoti. 30–31:286–296. 1998. Maqolani ko'rish: Google Scholar

Sorek R, Shamir R va Ast G: Inson genomida funktsional muqobil qo'shilish qanchalik keng tarqalgan? Trends Genet. 20:68–71. 2004. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Bonizzoni P, Rizzi R va Pesole G: Muqobil splicing bashorati uchun hisoblash usullari. Funktsional genomikaning qisqacha proteomikasi. 5:46–51. 2006. Maqolani ko'rish : Google Scholar

Brent MR: O'tmish, hozirgi va kelajak genom annotatsiyasi: Har bir lokusda ORFni qanday aniqlash mumkin. Genom Res. 15:1777–1786. 2005. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Sanger F: Insulin tuzilishi. Bull Soc Chim Biol (Parij). 37:23–35. 1955. Fransuz tilida.

Yanofsky C, Carlton BC, Guest JR, Helinski DR va Henning U: Gen tuzilishi va oqsil tuzilishining kolinearligi haqida. Proc Natl Acad Sci AQSh. 51:266–272. 1964. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Sanger F, Nicklen S va Coulson AR: zanjirni tugatuvchi inhibitorlar bilan DNK ketma-ketligi. Proc Natl Acad Sci AQSh. 74:5463–5467. 1977. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Ruddle FH: Uilyam Allan Memorial mukofoti manzili: Teskari genetika va undan tashqari. Men J Hum Genetman. 36:944–953. 1984. PubMed/NCBI

Kozak M: Tarjimani boshlash uchun skanerlash mexanizmining chegaralarini surish. Gen. 299:1–34. 2002. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Sambrook J va Russel DW: 5 ′ cDNK tugaydigan tez kuchaytirilishi. Molekulyar klonlash: laboratoriya qo'llanmasi. 3. 3-nashr. Cold Spring Harbor Laboratory Press, Cold Spring Harbor NY: 8.54–8.60-betlar. 2001 yil

Okayama H va Berg P: to'liq uzunlikdagi cDNKni yuqori samarali klonlash. Mol hujayrali biol. 2:161–170. 1982. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Baralle F: inson alfa-va beta-globin mRNKsining 5' kodlanmagan mintaqasining to'liq nukleotidlar ketma-ketligi. Hujayra. 12:1085–1095. 1977. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Proudfoot NJ: quyon va odamning beta-globin messenjer RNKlarining 3' kodlanmagan mintaqalar ketma-ketligini to'ldiring. Hujayra. 10: 559-570. 1977. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Marotta CA, Wilson JT, Forget BG va Weissman SM: Insonning beta-globin xabarchi RNKsi. III komplementar DNKdan olingan nukleotidlar ketma-ketligi. J Biol kimyosi. 252:5040–5053. 1977. PubMed/NCBI

Efstratiadis A, Kafatos FC va Maniatis T: klonlangan DNKdan aniqlangan quyon beta-globin mRNKsining asosiy tuzilishi. Hujayra. 10:571–585. 1977. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Ullrich A, Shine J, Chirgwin J, Pictet R, Tischer E, Rutter WJ va Gudman HM: Sichqoncha insulin genlari: kodlash ketma-ketligini o'z ichiga olgan plazmidlarning qurilishi. Fan. 196:1313–1319. 1977. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Casadei R, Strippoli P, D'Addabbo P, Canaider S, Lenzi L, Vitale L, Giannone S, Frabetti F, Facchin F, Carinci P va boshqalar: mRNK 5 ′ mintaqasi ketma-ketligi to'liq emas: tarjimada tizimli xatolarning potentsial manbai inson mRNKlarida boshlang'ich kodon tayinlanishi. Gen. 321: 185-193. 2003. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Harbers M: cDNK klonlashning hozirgi holati. Genomika. 91:232–242. 2008. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Carninci P, Kvam C, Kitamura A, Ohsumi T, Okazaki Y, Itoh M, Kamiya M, Shibata K, Sasaki N, Izawa M va boshqalar: Biotinylated CAP tuzoqchisi tomonidan yuqori samarali to'liq uzunlikdagi cDNK klonlash. Genomika. 37:327–336. 1996. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Kodzius R, Kojima M, Nishiyori H, Nakamura M, Fukuda S, Tagami M, Sasaki D, Imamura K, Kai C, Harbers M, va boshqalar: CAGE: Gen ifodasini qopqoq tahlili. Nat usullari. 3:211–222. 2006. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Frohman MA, Dush MK va Martin GR: Nodir transkriptlardan to'liq uzunlikdagi cDNKlarni tez ishlab chiqarish: bitta genga xos oligonükleotid primeri yordamida kuchaytirish. Proc Natl Acad Sci AQSh. 85:8998–9002. 1988. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Denoeud F, Kapranov P, Ucla C, Frankish A, Castelo R, Drenkow J, Lagade J, Alioto T, Manzano C, Chrast J, va boshqalar: Distal 5 ′ transkripsiyani boshlash joylaridan mashhur foydalanish va ko'p sonli qo'shimcha ma'lumotlarni topish KODLASH mintaqalaridagi ekzonlar. Genom Res. 17:746–759. 2007. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Suzuki Y, Ishihara D, Sasaki M, Nakagava H, Xata H, Tsunoda T, Vatanabe M, Komatsu T, Ota T, Isogai T va boshqalar: "Oligo-qopqoq" yordamida inson mRNKsining 5' tarjima qilinmagan hududini statistik tahlil qilish cDNK kutubxonalari. Genomika. 64:286–297. 2000. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Porcel BM, Delfour O, Castelli V, De Berardinis V, Fridlander L, Cruaud C, Ureta-Vidal A, Scarpelli C, Wincker P, Schächter V va boshq. yakuniy boyitilgan cDNK to'plami. Genom Res. 14:463–471. 2004. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Metzker ML: Navbat texnologiyalari - keyingi avlod. Nat Rev Genet. 11: 31-46. 2010. Maqolani ko'rish : Google Scholar

Ingolia NT, Ghaemmaghami S, Newman JR va Weissman JS: Ribosoma profilini qo'llash orqali nukleotid rezolyutsiyasi bilan translatsiyaning in vivo genom bo'yicha tahlili. Fan. 324:218–223. 2009. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Ingolia NT, Lareau LF va Weissman JS: Sichqoncha embrion ildiz hujayralarining ribozomli profilaktikasi sutemizuvchilar proteomlarining murakkabligi va dinamikasini ochib beradi. Hujayra. 147:789–802. 2011. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Fritsch C, Herrmann A, Nothnagel M, Szafranski K, Huse K, Schumann F, Schreiber S, Platzer M, Krawczak M, Hampe J, va boshqalar: Ribosomal izlar yordamida yangi inson uORFlari va N-terminal oqsil kengaytmalari uchun genom bo'yicha qidiruv. . Genom Res. 22:2208–2218. 2012. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Van Damme P, Gawron D, Van Criekinge W va Menschaert G: N-terminal proteomikasi va ribosoma profili sichqonlar va erkaklarda muqobil tarjimani boshlash landshaftining to'liq ko'rinishini ta'minlaydi. Mol hujayra proteomikasi. 13:1245–1261. 2014. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Iacono M, Mignone F va Pesole G: inson va kemiruvchilardagi uAUG va uORFs 5' tarjima qilinmagan mRNK. Gen. 349:97–105. 2005. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Barbosa C, Peixeiro I va Romão L: Yuqori oqimdagi ochiq o'qish ramkalari va inson kasalliklari bilan gen ifodasini tartibga solish. PLoS Genet. 9: e10035292013. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Nishitani H, Xirose E, Uchimura Y, Nakamura M, Umeda M, Nishii K, Mori N va Nishimoto T: To'liq o'lchamli RanBPM cDNK N-terminal hududida prolin va glutaminning uzoq cho'zilgan qismiga ega bo'lgan oqsilni kodlaydi, bu katta qismdan iborat. protein kompleksi. Gen. 272:25–33. 2001. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Kobayashi A, Ito E, Toki T, Kogame K, Takahashi S, Igarashi K, Hayashi N va Yamamoto M: molekulyar klonlash va yangi Cap'n' yoqasi oilasi Nrf3 transkripsiya faktorining funktsional tavsifi. J Biol kimyosi. 274:6443–6452. 1999. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Nomura N, Nagase T, Miyajima N, Sazuka T, Tanaka A, Sato S, Seki N, Kawarabayasi Y, Ishikawa K va Tabata S: noma'lum inson genlarining kodlash ketma-ketligini bashorat qilish. II 40 ta yangi genning kodlash ketma-ketligi (KIAA0041-KIAA0080) KG-1 inson hujayra chizig'idan cDNK klonlarini tahlil qilish natijasida olingan. DNK Res. 1:223–229. 1994. Maqolani ko'rish: Google Scholar

Kingsley C va Winoto A: GT qutisini bog'laydigan oqsillarni klonlash: T-hujayra retseptorlari gen ifodasini tartibga soluvchi yangi Sp1 multigen oilasi. Mol hujayrali biol. 12:4251–4261. 1992. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Strippoli P, Pelleri MC, Caracausi M, Vitale L, Piovesan A, Locatelli C, Mimmi MC, Berardi AC, Ricotta D, Radeghieri A, va boshqalar: Trisomiya 21 (Daun sindromi) uchun yangi patogenezga asoslangan terapevtik yondashuvlarni aniqlashning integratsiyalashgan yo'nalishi ) Jérom Lejeune fikriga ergashib. Ilmiy postprint. 1: e000102013. Maqolani ko'rish: Google Scholar

Pelleri MC, Cicchini E, Locatelli C, Vitale L, Caracausi M, Piovesan A, Rocca A, Poletti G, Seri M, Strippoli P, va boshqalar: Daun sindromi bo'lgan yoki bo'lmagan qisman trisomiya 21 holatlarini tizimli qayta tahlil qilish kichik hududni taklif qiladi. 21q22.13 fenotip uchun juda muhim. Hum Mol Genet. 25:2525–2538. 2016.PubMed/NCBI

Xattori M, Fujiyama A, Teylor TD, Vatanabe H, Yada T, Park HS, Toyoda A, Ishii K, Totoki Y, Choi DK va boshqalar Xromosoma 21 xaritalash va sekvensiya konsortsiumi: Inson xromosomasining DNK ketma-ketligi 21. Tabiat. 405:311–319. 2000. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Reymond A, Camargo AA, Deutsch S, Stivenson BJ, Parmigiani RB, Ucla C, Bettoni F, Rossier C, Lyle R, Guipponi M va boshqalar: Inson xromosomasidan o'n to'qqizta qo'shimcha oldindan aytib bo'lmaydigan transkript 21. Genomika. 79: 824-832. 2002. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Pesole G, Gissi C, Grillo G, Licciulli F, Liuni S va Saccone C: eukariotik mRNKlarda oligonükleotid AUG boshlang'ich kodon kontekstini tahlil qilish. Gen. 261:85–91. 2000. Maqolani ko'rish: Google Scholar

Frabetti F, Casadei R, Lenzi L, Canaider S, Vitale L, Facchin F, Carinci P, Zannotti M va Strippoli P: Danio rerioda mRNK 5' kodlash ketma-ketligining to'liqsizligini tizimli tahlil qilish: Avtomatlashtirilgan ESTga asoslangan yondashuv. Biol Direct. 2:342007. Maqolani ko'rish: Google Scholar

Casadei R, Piovesan A, Vitale L, Facchin F, Pelleri MC, Canaider S, Bianconi E, Frabetti F va Strippoli P: ifodalangan ketma-ketlik yorlig'i (EST) ma'lumotlar bazasiga asoslangan inson mRNK 5' kodlash ketma-ketligini genom miqyosda tahlil qilish. Genomika. 100:125–130. 2012. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Piovesan A, Caracausi M, Pelleri MC, Vitale L, Martini S, Bassani C, Gurioli A, Casadei R, Soldà G va Strippoli P: Sichqoncha genomidagi mRNK 5 ′ kodlash ketma-ketligini aniqlashni takomillashtirish. Mamm genomi. 25:149–159. 2014. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Kochetov AV, Sarai A, Rogozin IB, Shumny VK va Kolchanov NA: Inson oqsillari xilma-xilligini yaratishda muqobil tarjimani boshlash joylarining roli. Mol genetik genomikasi. 273:491–496. 2005. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Bazykin GA va Kochetov AV: Alternativ tarjimani boshlash joylari eukaryotik genomlarda saqlanadi. Nuklein kislotalari Res. 39:567–577. 2011. Maqolani ko'rish : Google Scholar :

Ivanov IP, Firth AE, Mishel AM, Atkins JF va Baranov PV: Inson kodlash ketma-ketligida evolyutsion tarzda saqlanib qolgan AUG tomonidan boshlanmagan N-terminal kengaytmalarini aniqlash. Nuklein kislotalari Res. 39:4220–4234. 2011. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Arakaki TL, Pezza JA, Cronin MA, Xopkins CE, Zimmer DB, Tolan DR va Allen KN: Inson miyasi fruktoza 1,6- (bis) fosfat aldolazasining tuzilishi: Izozim tuzilishini funksiyasi bilan bog'lash. Protein fanlari. 13:3077–3084. 2004. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Lamour V, Quevillon S, Diriong S, N'Guyen VC, Lipinski M va Mirande M: Glx-tRNK sintetaza oilasining evolyutsiyasi: gorizontal gen o'tkazilishi holati sifatida glutaminil fermenti. Proc Natl Acad Sci AQSh. 91: 8670–8674. 1994. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Hermann E, Darcissac E, Idziorek T, Capron A va Bahr GM: Rekombinant interleykin-16 makrofaglar va dendritik hujayralardagi sirt retseptorlari ifodasini va sitokinlarning chiqarilishini tanlab modulyatsiya qiladi. Immunologiya. 97:241–248. 1999. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Schatz G va Dobberstein B: membranalar bo'ylab oqsil translokatsiyasining umumiy tamoyillari. Fan. 271: 1519-1526. 1996. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Nakamura M, Masuda H, Xorii J, Kuma K, Yokoyama N, Ohba T, Nishitani H, Miyata T, Tanaka M va Nishimoto T: haddan tashqari oshganda, yangi sentrosomal oqsil, RanBPM, gamma-tubulinga o'xshash ektopik mikrotubulalar yadrosini keltirib chiqaradi. J Cell Biol. 143:1041–1052. 1998. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Varshavskiy A: N-son qoidasi: funktsiyalar, sirlar, foydalanish. Proc Natl Acad Sci AQSh. 93: 12142–12149. 1996. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Rothermel B, Vega RB, Yang J, Vu H, Bassel-Duby R va Uilyams RS: Daun sindromining kritik mintaqasida kodlangan oqsil chiziqli mushaklar bilan boyitiladi va kalsinevrin signalizatsiyasini inhibe qiladi. J Biol kimyosi. 275:8719–8725. 2000. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Strippoli P, Petrini M, Lenzi L, Karinchi P va Zannotti M: Sichqoncha DSCR1-ga o'xshash (Daun sindromi nomzod 1-mintaqa) genlar oilasi: Odamlarning ortologik genlari bilan saqlanib qolgan sintez. Gen. 257:223–232. 2000. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Vitale L, Frabetti F, Huntsman SA, Canaider S, Casadei R, Lenzi L, Facchin F, Carinci P, Zannotti M, Koppola D va boshqalar: CYYR1 (sistein/tirozin-) ning ketma-ketligi, "nozik" muqobil biriktirilishi va ifodasi boy 1) odamning neyroendokrin o'smalarida mRNK. BMC saratoni. 7:662007. Maqolani ko'rish: Google Scholar

Facchin F, Canaider S, Vitale L, Frabetti F, Griffoni C, Lenzi L, Casadei R va Strippoli P: Inson RCAN3 (DSCR1L2) mRNK va oqsil izoformlarini aniqlash va tahlil qilish. Gen. 407:159–168. 2008. Maqolani ko'rish : Google Scholar

Facchin F, Vitale L, Bianconi E, Piva F, Frabetti F, Strippoli P, Casadei R, Pelleri MC, Piovesan A va Canaider S: Inson RCAN3 lokusida ikki tomonlama transkripsiyaning murakkabligi va muqobil biriktirilishi. PLoS One. 6: e245082011. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Casadei R, Pelleri MC, Vitale L, Facchin F, Canaider S, Strippoli P, Vian M, Piovesan A, Bianconi E, Mariani E, va boshqalar: CYYR1 inson geni lokusining xarakteristikasi: Murakkab ko'p transkript tizimi. Mol Biol Rep. 41:6025–6038. 2014. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Nagase T, Seki N, Ishikawa K, Tanaka A va Nomura N: noma'lum inson genlarining kodlash ketma-ketligini bashorat qilish. V 40 ta yangi genning kodlash ketma-ketligi (KIAA0161-KIAA0200) KG-1 inson hujayra chizig'idan cDNA klonlarini tahlil qilish natijasida olingan. DNK Res. 3:17–24. 1996. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Ribieras S, Lefèbvre O, Tomasetto C va Rio MC: Sichqoncha Trefoil omil genlari: Genomik tashkilot, ketma-ketliklar va metilatsiya tahlillari. Gen. 266:67–75. 2001. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Doglio L, Goode DK, Pelleri MC, Pauls S, Frabetti F, Shimeld SM, Vavouri T va Elgar G: Rivojlanish uchun chordate cis-regulyatsiya kodining parallel evolyutsiyasi. PLoS Genet. 9: e10039042013. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Hinnebusch AG, Ivanov IP va Sonenberg N: Eukaryotik mRNKlarning 5'-tarjima qilinmagan hududlari tomonidan tarjima nazorati. Fan. 352:1413–1416. 2016. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Caracausi M, Vitale L, Pelleri MC, Piovesan A, Bruno S va Strippoli P: Oddiy odam miyasining miqdoriy transkriptomli ma'lumot xaritasi. Neyrogenetika. 15: 267-287. 2014. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Pelleri MC, Piovesan A, Caracausi M, Berardi AC, Vitale L va Strippoli P: Daun sindromi (DS) bo'lgan yoki bo'lmagan bolalarda o'tkir megakaryoblastik leykemiya (AMKL) ning integratsiyalangan differentsial transkriptom xaritalari. BMC Med Genomics. 7:632014. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Manning AG, Crawford BD, Waskiewicz AJ va Pilgrim DB: zebrafish asab tizimining normal rivojlanishi uchun zarur bo'lgan unc-119 homologi. Ibtido. 40:223–230. 2004. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Piovesan A, Vitale L, Pelleri MC va Strippoli P: kodon va RNK kodonlari havzasining (kodonom) universal qattiq korrelyatsiyasi: genom transkriptomda gen ekspressiya qiymatlarining bakteriyalardan odamlarga har qanday taqsimlanishini ta'minlash uchun optimallashtirilgan. Genomika. 101:282–289. 2013. Maqolani ko'rish : Google Scholar : PubMed/NCBI

Komar AA: Kodondan foydalanishning Yin va Yang. Hum Mol Genet. 25(R2): R77–R85. 2016. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Piovesan A, Karakauzi M, Antonaros F, Pelleri MC va Vitale L: GeneBase 11: NCBI gen ma'lumotlar to'plamidan olingan ma'lumotlarni umumlashtirish va uni inson genlari statistikasini yangilash uchun qo'llash vositasi. Ma'lumotlar bazasi (Oksford). 2016. pii: baw153. 2016, Maqolani ko'rish: Google Scholar

Ahsan B, Saito TL, Hashimoto S, Muramatsu K, Tsuda M, Sasaki A, Matsushima K, Aigaki T va Morishita S: MachiBase: Drosophila melanogaster 5′-end mRNK transkripsiya ma'lumotlar bazasi. Nuklein kislotalari Res. 37 (Ma'lumotlar bazasi): D49–D53. 2009. Maqolani ko'rish : Google Scholar

Machida RJ va Lin YY: Illumina sekvensiyasi platformasidan foydalangan holda mRNK 5 ′ so'nggi kutubxonalarini tayyorlashning to'rtta usuli. PLoS One. 9: e1018122014. Maqolani ko'rish: Google Scholar

Helbig AO, Gauci S, Raijmakers R, van Breukelen B, Slijper M, Mohammed S va Heck AJ: N-asetillangan oqsil termini profilini yaratish proteomaning N-terminal tabiati haqida chuqur ma'lumot beradi. Mol hujayra proteomikasi. 9:928–939. 2010. Maqolani ko'rish: Google Scholar: PubMed/NCBI

Doucet A va umumiy CM: Substratlarning amino-terminalga yo'naltirilgan massa spektrometriyasi (ATOMS) miqdoriy massa spektrometriyasi orqali oqsillar va proteolitik parchalanish joylarining N-terminal ketma-ketligi. Usullari Enzimol. 501: 275-293. 2011. Maqolani ko'rish: Google Scholar: PubMed/NCBI


Abstrakt

Protein konsentratsiyasi nafaqat mRNK darajasiga, balki tarjima tezligiga va degradatsiyaga ham bog'liq. mRNKning tarjima tezligini bashorat qilish tarjima mexanizmi va dinamik proteomani chuqur tushunish uchun qimmatli ma'lumotlarni beradi. Ushbu tadqiqotda biz tarjima tezligini bashorat qilish uchun yangi hisoblash modelini ishlab chiqdik, bunda (1) turli ketma-ketlikdan kelib chiqadigan va funktsional xususiyatlarni birlashtirish, (2) maksimal aloqadorlik va minimal ishdan bo'shatish usuli va optimallashtiriladigan xususiyatlarni tanlash uchun qo'shimcha funktsiyalarni tanlash. bashorat qilish modeli va (3) RNKning yuqori yoki past tarjima tezligi toifasiga tarjima tezligini taxmin qilish imkoniyati. Boy va ochlik sharoitida bashorat qilishning aniqligi mos ravishda 68,8% va 70,0% bo'lib, jackknife cross-validation orqali baholanadi. Quyidagi xususiyatlar tarjima tezligi bilan bog'liqligi aniqlandi: kodondan foydalanish chastotasi, ba'zi gen ontologiyasini boyitish ko'rsatkichlari, mRNK mahsulotini bog'lash uchun ma'lum bo'lgan RNK bog'lovchi oqsillar soni, kodlash ketma-ketligi uzunligi, oqsil ko'pligi va 5'UTR bo'sh energiya. Ushbu topilmalar tarjima va dinamik proteoma mexanizmlarini tushunish uchun foydali ma'lumot berishi mumkin. Bizning tarjima tezligini bashorat qilish modelimiz mRNKlarning katta hajmdagi tarjima tezligini izohlash uchun yuqori o'tkazuvchanlik vositasiga aylanishi mumkin.

Iqtibos: Huang T, Wan S, Xu Z, Zheng Y, Feng K-Y, Li H-P va boshqalar. (2011) mRNKning ketma-ketligi va funktsional xususiyatlariga asoslangan tarjima tezligini tahlil qilish va bashorat qilish. PLoS ONE 6 (1): e16036. https://doi.org/10.1371/journal.pone.0016036

Muharrir: Grzegorz Kudla, Edinburg universiteti, Buyuk Britaniya

Qabul qildi: 2010 yil 5 avgust Qabul qilingan: 2010 yil 6 dekabr Nashr etilgan: 2011 yil 6 yanvar

Mualliflik huquqi: © 2011 Huang va boshqalar. Bu Creative Commons Attribution License shartlari asosida tarqatiladigan ochiq maqola boʻlib, asl muallif va manba hisoblangan holda har qanday vositada cheksiz foydalanish, tarqatish va koʻpaytirishga ruxsat beradi.

Moliyalash: Bu ish Xitoy Fanlar Akademiyasi Bilimlarni Innovatsion Dasturi (KSCX1-YW-R-74), Shanxay universiteti tizim biologiyasini tadqiq qilish jamg'armasi, Shanxay fan va texnologiya qo'mitasi (09DZ227180), Shanxay fan va texnologiya qo'mitasi (09DZ227180) tomonidan qo'llab-quvvatlandi. ), Xitoyning Milliy asosiy tadqiqot dasturi (2011CB510102, 2011CB510101). Moliyalashtiruvchilar o'quv dizaynida, ma'lumotlarni yig'ish va tahlil qilishda, nashr etish to'g'risida qaror qabul qilishda yoki qo'lyozmani tayyorlashda hech qanday rol o'ynamadilar.

Raqobatli manfaatlar: Mualliflar hech qanday raqobatdosh manfaatlar yo'qligini e'lon qilishdi.


Munozara

Psevdoknotlar katta RNKlarda nisbatan kam uchraydi, lekin muhim funktsional hududlarda juda ko'p ifodalanadi (2, 3, 6, 7). Ularning ahamiyatiga qaramay, eng ko'p qo'llaniladigan RNK tuzilishini bashorat qilish algoritmlari psevdoknotlarga ruxsat bermaydi, chunki psevdoknotlarga ruxsat berish algoritmik murakkablikni ham, mumkin bo'lgan tuzilmalar sonini ham oshiradi. Psevdoknotlarni qayta tiklashga imkon beruvchi joriy algoritmlar qabul qilingan umumiy tayanch juftliklarning faqat �% ni tashkil qiladi. Psevdoknotlarni maxsus tashkil etuvchi tayanch juftliklarni bashorat qilish sezgirligi algoritm va etalon RNKga qarab o'zgaradi, lekin ko'plab noto'g'ri-musbat bashoratlarga ega bo'lgan o'rtacha atigi 5% ni tashkil qiladi (ref. 13 va S3 va S4 jadvallari). Shunday qilib, psevdoknotlarni bashorat qilish algoritmlarining hozirgi avlodi tekshirilishi mumkin bo'lgan biologik gipotezalarni loyihalash uchun juda mos emas.

ShapeKnots iterativ psevdoknotni kashf qilish algoritmini eksperimental SHAPE ma'lumoti va psevdoknot shakllanishining entropik narxi uchun oddiy energiya modeli bilan birlashtiradi. ShapeKnots -dagi psevdoknot jazosi faqat ikkita sozlanishi parametrga ega (1 -rasm va tenglama). 2Uzoq bitta torli mintaqalar va ko'plab ichki spiralli psevdoknotlarning shakllanishini cheklaydigan va chiziqli spirallar uchun optimal geometriyani ta'minlaydigan. ShapeKnots shuningdek, standart erkin energiya shartlariga eksperimental tuzatish kiritish imkonini beradi. SHAPE ma'lumotlarini o'z ichiga olishi mumkin bo'lgan tuzilmalar sonini cheklaydi va RNKning katlanishini barqarorlashtiruvchi yashirin xususiyatlarni, shu jumladan metall ioni va ligand bog'lanishining muhim ta'sirini hisobga oladigan ma'lumotlarni taqdim etadi.

Bizning o'quv tuzilmalarimiz to'plami ma'lum tuzilishga ega 16 ta RNKdan iborat bo'lib, ularning uzunligi 34 dan 530 nt gacha bo'lgan psevdoknotlar 16 RNKning 9 tasida uchraydi. Bashorat qilishning aniqligi doimiy ravishda yuqori edi (1-jadval va S1 ma'lumotlar to'plami). ShapeKnots hozirda mavjud bo'lgan psevdoknotli prognozlash algoritmlaridan sezilarli darajada ustun keldi va bu test to'plami bilan umumiy va#x0003e90% sezgirlikka erishish uchun yagona algoritmdir (S3 va S4 jadvallarga qarang) Usullari qo'shimcha muhokama uchun). Pseudoknotning o'ziga xos energiya jazosi va SHAPE ma'lumotlaridan foydalanish ShapeKnots yondashuvining aniqligiga hissa qo'shadi. Ehtimol, SHAPE ma'lumotlarining kiritilishi psevdoknotlarni bashorat qilish algoritmlarining aniqligini yaxshilaydi.

Biz RNKning to'rtta sinfini ta'kidlab, modellashtirish natijalarini umumlashtiramiz: (i) ShapeKnots juda aniq bashorat qiladigan tuzilmalarga ega bo'lgan qisqa psevdoknotli RNKlar (ii) ShapeKnots yaxshi aniqlik bilan bashorat qiladigan katta, qiyin RNKlar (iii) ShapeKnots aniq bashorat qilgan soxta ijobiy yoki o'tkazib yuborilgan soxta ma'lumot bilan noto'g'ri tavsiflanish ehtimoli yuqori bo'lgan RNKlar va (iv) Noyob qiyinchiliklarni keltirib chiqaradigan ligandlar, oqsillar va metall ionlari kabi boshqa molekulalar bilan o'zaro ta'sir qiluvchi RNKlar. Bu erda tahlil qilingan ko'pgina RNKlar uchun ShapeKnots tomonidan yaratilgan modellar va hozirda qabul qilingan tuzilmalar o'rtasidagi farqlar unchalik katta bo'lmagan va odatda qisqa masofali o'zaro ta'sirlarni yoki spirallarning uchlaridagi tayanch juftlarini o'z ichiga olgan. Ba'zi hollarda, farqlar eritmadagi muvozanatdagi termodinamik jihatdan mavjud bo'lgan holatlarni aks ettiradi.

Qisqa soxta ma'lumotli RNKlar.

Birinchi sinfga H tipidagi psevdoknotlarni o'z ichiga olgan kichik RNKlar kiradi: Q1dan oldingi riboswitch, odam telomerazasi, ftorli riboswitch va og'ir o'tkir respirator sindromi (SARS) korona virusi. Ko'p qo'llaniladigan dinamik dasturlash algoritmlari H tipidagi psevdoknotda tayanch juftliklarni bashorat qila olmasligi sababli, an'anaviy algoritm (14) yordamida bashorat qilish sezgirligi aksincha, juda yomon edi, ShapeKnots har bir holatda mukammal yoki mukammal bashoratlarni berdi (3-rasm, 3-rasm). solishtiring Chapga va To'g'ri ustunlar). Qabul qilingan tuzilmalarda yuzaga kelmaydigan yagona ShapeKnots tomonidan bashorat qilingan tayanch juftliklari ftorid riboswitch va SARS domenidagi alohida spirallarning uchlarida joylashgan 2 yoki undan kam bp to'plamlarini o'z ichiga oladi. Bu natijalar shuni ko'rsatadiki, ShapeKnots qisqa RNKli H tipidagi psevdoknotlarni bashorat qilish kuchli.

H tipidagi to'rtta psevdoknot uchun bashoratlarning qisqacha mazmuni. Baza juftligi bashoratlari 2-rasmda ko'rsatilganidek, sezgirlik (sezgi) va har bir tuzilma uchun ppv ko'rsatilgan. Chapga va To'g'ri ustunlar an'anaviy mfold-sinf algoritmi va ShapeKnots (eksperimental SHAPE cheklovlari bilan) uchun bashoratlarni ko'rsatadi.

Katta, murakkab RNKlar.

Ikkinchi sinfga to'g'ri buklanish uchun ligandlar yoki oqsil kofaktorlarini talab qilmaydigan katta RNKlar kiradi. Katta RNKlar mumkin bo'lgan tuzilmalarning ko'pligi va o'xshash katlamali erkin energiya o'zgarishlariga ega bo'lgan ko'p sonli tuzilmalar tufayli modellashtirish algoritmlarini qiyinlashtiradi. Misol uchun, eksperimental tuzilmani tekshirish ma'lumotlari mavjud bo'lmaganda, ikkita vakili RNK, the Azoarkus I guruh introni va gepatit C virusi ichki ribosoma kirish ketma-ketligi (IRES) domeni mos ravishda 73% va 39% sezgirlik bilan bashorat qilinadi. Noto'g'ri taxminlar, birinchi navbatda, soch turmagining ikkita motifida uchraydi Azoarkus RNK, lekin asosan butun gepatit C virusi (HCV) IRES RNKni qamrab oladi (4-rasm). SHAPE ma'lumotlarini kiritish har bir holatda deyarli mukammal bashoratlarni berdi, shu jumladan har bir RNKdagi psevdoknotni to'g'ri aniqlash (4-rasm, solishtiring). Chapga va To'g'ri ustunlar).


Videoni tomosha qiling: Turkiyada 4 yil yashab yurtiga qaytgan Diyora bilan Ochiq suhbat! (Sentyabr 2022).