المعالج متعدد النواة على RNA-SEQ السريعة المعالجة
محتوى المقالة الرئيسي
الملخص
هو تسلسل وتحليل الترنسكيبتوم RNA SEQUENCING (RNA-Seq)الغرض الرئيسي من التحليلات RNA-Seq هو معرفة وجود وكمية من RNA في عينة تجريبية تحت ظروف معينة. بشكل أساسي، كانت بيانات التسلسل RNA الخام ضخمة. يمكن أن يصل حجمه إلى مئات الجيجابايت (GB). تعمل هذه البيانات الضخمة دائما على جعل وقت المعالجة أطول ويستغرق عدة أيام. يمكن للمعالج متعدد النواة (multicore processor) تسريع البرنامج عن طريق فصل المهام وتشغيل مهام المهام بشكل متزامن. وبالتالي، سيكون المعالج متعدد النواة (multicore processor) خيارا مناسبا للتغلب على هذه المشكلة. لذلك، تهدف هذه الدراسة إلى استخدام Intel multicore processor لتحسين سرعة ًRNA-Seq وتحليل أداء تحليل RNA-Seq باستخدام معالجات متعددة (multiprocessor). عالجت هذه الدراسة RNA-Seq فقط من تحليل مراقبة الجودة حتى فرز محتوى ملف . BAM (Binary Allignment/Map) تم استخدام ثلاثة أحجام مختلفة من نهاية اقتران RNA لإجراء المقارنة. - أظهرت نتائج التجربة النهائية أن تنفيذ RNA-Seq على معالج Intel Multicore يمكن أن يحقق سرعة أعلى في العملية. انخفض إجمالي وقت المعالجة لبيانات تسلسل RNA الخام (66.3 ميغابايت) من 317.638 ثانية إلى 211.916 ثانية. كان وقت المعالجة المخفض 105 ثانية، أي ما يقرب من دقيقتين. وعلاوة عل ذلك، بالنسبة لأصغر حجم لبيانات تسلسل RNA الخام، انخفض إجمالي وقت المعالجة من 212.380 ثانية إلى 163.961 ثانية والذي تم تقليله بمقدار 48 ثانية.
Received 14/10/2021
Accepted 14/11/2021
تفاصيل المقالة
هذا العمل مرخص بموجب Creative Commons Attribution 4.0 International License.
كيفية الاقتباس
المراجع
Van De Walle G. 9 Important Functions of Protein in Your Body. Healthline. Retrieved September 1, 2020, from https://www.healthline.com/nutrition/functions-of-protein.
Chen F, Li, Y, Qin, N, Wang, F, Du, J, Wang, C, Du, F, Jiang, T, Jiang, Y, Dai, J, Hu, Z, Lu, C, Shen, H. RNA-seq analysis identified hormone-related genes associated with prognosis of triple negative breast cancer. J Biomed Res. 2020. 34(2), 129–138.
Wrighton KH. The diagnostic power of RNA-seq. Nature Reviews Genetics. 2017. 18(7), 392-392.
Chatterjee K. and Wan Y. RNA. Encyclopedia Britannica. 2018, July 13. Retrived from https://www.britannica.com/science/RNA.
Firesmith D. Multicore Processing. Software Engineering Institute. 2017, August 21. Retrieved from https://insights.sei.cmu.edu/sei_blog/2017/08/multicore-processing.html.
Martínez, H., Barrachina, S., Castillo, M., Tárraga, J., Medina, I., Dopazo, J., Quintana-Ortí, E. S. Scalable RNA sequencing on clusters of multicore processors. 2015 IEEE Trustcom/BigDataSE/ISPA. IEEE. 2015. 3, 190-195.
Al-Ars, Z., Wang, S., & Mushtaq, H. SparkRA: enabling big data scalability for the GATK RNA-seq pipeline with apache spark. Genes. 2020. 11(1), 53.
Cascitti, J., Niebler, S., Müller, A., Schmidt, B. RNACache: Fast Mapping of RNA-Seq Reads to Transcriptomes Using MinHashing. In International Conference on Computational Science. Springer, Cham. 2021. 367-381.
Tran, S. S., Zhou, Q., Xiao, X. Statistical inference of differential RNA-editing sites from RNA-sequencing data by hierarchical modeling. Bioinformatics, 2020. 36(9), 2796-2804.
Andrews, S. FastQC: a quality control tool for high throughput sequence data [WWW document]. URL http://www. bioinformatics. babraham. ac. uk/projects/fastqc. 2010.
Roehr JT, Dieterich C, Reinert K.Flexbar 3.0–SIMD and multicore parallelization. Bioinformatics. 2017. 33(18), 2941-2942.
Kim D, Langmead B, Salzberg SL. HISAT: a fast spliced aligner with low memory requirements. Nature methods, 2015. 12(4), 357-360.
Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R. The sequence alignment/map format and SAMtools. Bioinformatics, 2009. 25(16), 2078-2079.
Griffith M, Walker JR, Spies NC, Ainscough BJ, Griffith OL. Informatics for RNA-seq: A web resource for analysis on the cloud. PLoS Comp Biol. 2010. 11(8).