المعالج متعدد النواة على RNA-SEQ السريعة المعالجة

محتوى المقالة الرئيسي

Lee Jia Bin
https://orcid.org/0000-0002-8203-8111
Nor Asilah Wati Abdul Hamid
https://orcid.org/0000-0001-8095-7678
Zurita Ismail
https://orcid.org/0000-0002-2102-6563
Mohamed Faris Laham
https://orcid.org/0000-0002-1787-4754

الملخص

هو تسلسل وتحليل الترنسكيبتوم  RNA SEQUENCING (RNA-Seq)الغرض الرئيسي من التحليلات RNA-Seq هو معرفة وجود وكمية من RNA في عينة تجريبية تحت ظروف معينة.  بشكل أساسي، كانت بيانات التسلسل RNA الخام ضخمة. يمكن أن يصل حجمه إلى مئات الجيجابايت (GB). تعمل هذه البيانات الضخمة دائما على جعل وقت المعالجة أطول ويستغرق عدة أيام.  يمكن للمعالج متعدد النواة (multicore processor) تسريع البرنامج عن طريق فصل المهام وتشغيل مهام المهام بشكل متزامن.  وبالتالي، سيكون المعالج متعدد النواة (multicore processor) خيارا مناسبا للتغلب على هذه المشكلة.  لذلك، تهدف هذه الدراسة إلى استخدام Intel multicore processor لتحسين سرعة ًRNA-Seq وتحليل أداء تحليل RNA-Seq باستخدام معالجات متعددة (multiprocessor). عالجت هذه الدراسة RNA-Seq فقط من تحليل مراقبة الجودة حتى فرز محتوى ملف . BAM (Binary Allignment/Map) تم استخدام ثلاثة أحجام مختلفة من نهاية اقتران RNA لإجراء المقارنة. - أظهرت نتائج التجربة النهائية أن تنفيذ RNA-Seq على معالج Intel Multicore يمكن أن يحقق سرعة أعلى في العملية. انخفض إجمالي وقت المعالجة لبيانات تسلسل RNA الخام (66.3 ميغابايت) من 317.638 ثانية إلى 211.916 ثانية. كان وقت المعالجة المخفض 105 ثانية، أي ما يقرب من دقيقتين.  وعلاوة عل ذلك، بالنسبة لأصغر حجم لبيانات تسلسل RNA الخام، انخفض إجمالي وقت المعالجة من 212.380 ثانية إلى 163.961 ثانية والذي تم تقليله بمقدار 48 ثانية. 

تفاصيل المقالة

كيفية الاقتباس
1.
المعالج متعدد النواة على RNA-SEQ السريعة المعالجة. Baghdad Sci.J [انترنت]. 20 ديسمبر، 2021 [وثق 7 فبراير، 2025];18(4(Suppl.):1413. موجود في: https://bsj.uobaghdad.edu.iq/index.php/BSJ/article/view/6642
القسم
article

كيفية الاقتباس

1.
المعالج متعدد النواة على RNA-SEQ السريعة المعالجة. Baghdad Sci.J [انترنت]. 20 ديسمبر، 2021 [وثق 7 فبراير، 2025];18(4(Suppl.):1413. موجود في: https://bsj.uobaghdad.edu.iq/index.php/BSJ/article/view/6642

المراجع

Van De Walle G. 9 Important Functions of Protein in Your Body. Healthline. Retrieved September 1, 2020, from https://www.healthline.com/nutrition/functions-of-protein.

Chen F, Li, Y, Qin, N, Wang, F, Du, J, Wang, C, Du, F, Jiang, T, Jiang, Y, Dai, J, Hu, Z, Lu, C, Shen, H. RNA-seq analysis identified hormone-related genes associated with prognosis of triple negative breast cancer. J Biomed Res. 2020. 34(2), 129–138.

Wrighton KH. The diagnostic power of RNA-seq. Nature Reviews Genetics. 2017. 18(7), 392-392.

Chatterjee K. and Wan Y. RNA. Encyclopedia Britannica. 2018, July 13. Retrived from https://www.britannica.com/science/RNA.

Firesmith D. Multicore Processing. Software Engineering Institute. 2017, August 21. Retrieved from https://insights.sei.cmu.edu/sei_blog/2017/08/multicore-processing.html.

Martínez, H., Barrachina, S., Castillo, M., Tárraga, J., Medina, I., Dopazo, J., Quintana-Ortí, E. S. Scalable RNA sequencing on clusters of multicore processors. 2015 IEEE Trustcom/BigDataSE/ISPA. IEEE. 2015. 3, 190-195.

Al-Ars, Z., Wang, S., & Mushtaq, H. SparkRA: enabling big data scalability for the GATK RNA-seq pipeline with apache spark. Genes. 2020. 11(1), 53.

Cascitti, J., Niebler, S., Müller, A., Schmidt, B. RNACache: Fast Mapping of RNA-Seq Reads to Transcriptomes Using MinHashing. In International Conference on Computational Science. Springer, Cham. 2021. 367-381.

Tran, S. S., Zhou, Q., Xiao, X. Statistical inference of differential RNA-editing sites from RNA-sequencing data by hierarchical modeling. Bioinformatics, 2020. 36(9), 2796-2804.

Andrews, S. FastQC: a quality control tool for high throughput sequence data [WWW document]. URL http://www. bioinformatics. babraham. ac. uk/projects/fastqc. 2010.

Roehr JT, Dieterich C, Reinert K.Flexbar 3.0–SIMD and multicore parallelization. Bioinformatics. 2017. 33(18), 2941-2942.

Kim D, Langmead B, Salzberg SL. HISAT: a fast spliced aligner with low memory requirements. Nature methods, 2015. 12(4), 357-360.

Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R. The sequence alignment/map format and SAMtools. Bioinformatics, 2009. 25(16), 2078-2079.

Griffith M, Walker JR, Spies NC, Ainscough BJ, Griffith OL. Informatics for RNA-seq: A web resource for analysis on the cloud. PLoS Comp Biol. 2010. 11(8).