You are on page 1of 12

‫مقدمه‬

‫رشد سریع و توسعه فناوری رایانه‌ای‪ ،‬همراه با پیشرفت‌های چشمگیر در درک ما از‪ ‬زیست‬
‫شناسی‪ ‬انسانی حاصل از پروژه‪ ‬ژنوم‪ ‬انسانی و سرمایه گذاری‌های الهام گرفته از آن‪ ،‬رشد‬
‫اخیر در بیوانفورماتیک را تسهیل کرده است‪ .‬بیوانفورماتیک‪ ،‬علوم کامپیوتر‪ ‬را با زیست‬
‫شناسی ادغام می‌کند تا داده‌های مربوط به سیستم‌های بیولوژیکی‪ 0‬را ذخیره‪ ،‬تجزیه و تحلیل‬
‫و به اشتراک بگذارد که اغلب این داده‌ها مربوط به‪ DNA ‬و توالی‪ ‬اسیدهای آمینه‪ ‬است‪.‬‬

‫بیوانفورماتیک چیست؟‬
‫بیوانفورماتیک ترکیبی از زیست شناسی و فناوری اطالعات است‪ .‬اساساً‪،‬‬
‫بیوانفورماتیک علمی است که اخیراً توسعه یافته و از فناوری اطالعات برای‬
‫درک پدیده بیولوژیکی استفاده می‌کند‪ .‬بیوانفورماتیک به طور گسترده‌ای شامل‬
‫ابزارها و روش‌های محاسباتی است که برای مدیریت‪ ،‬تجزیه و تحلیل و ادراه‬
‫کردن داده‌های حجیم بیولوژیکی استفاده می‌شود‪ .‬بیوانفورماتیک همچنین ممکن‬
‫است به عنوان بخشی از زیست شناسی محاسباتی در نظر گرفته شود‪ .‬زیست‬
‫شناسی محاسباتی با استفاده از تکنیک‌های تحلیلی کمی در مدل‌سازی و حل‬
‫مشکالت در سیستم‌های بیولوژیکی درگیر است‪ .‬بیوانفورماتیک یک رویکرد‬
‫میان رشته‌ای است که به دانش پیشرفته علوم کامپیوتر‪ ،‬ریاضیات و روش‌های‬
‫آماری برای درک پدیده‌های بیولوژیکی در سطح مولکولی نیاز دارد‪.‬‬
‫تاریخچه‬
‫پایه‌های بیوانفورماتیک در اوایل دهه ‪ 1960‬با استفاده از روش‌های محاسباتی‬
‫برای تجزیه و تحلیل توالی پروتئین به ویژه‪ ،‬مونتاژ توالی‌های جدید‪ ،‬پایگاه‬
‫داده‌های توالی بیولوژیکی و مدل‌های جایگزینی گذاشته شد‪ .‬بعدا از آن‪ ،‬تجزیه و‬
‫تحلیل ‪ DNA‬نیز به دلیل پیشرفت موازی روش‌های زیست شناسی مولکولی (که‬
‫دستکاری آسان‌تر ‪ DNA‬و همچنین توالی آن را فراهم می‌کند) و همچنین پیشرفت‬
‫در علوم کامپیوتر و ظهور رایانه‌های کوچک (که قدرتمندتر بوده و دارای نرم‬
‫افزارهای جدیدتر و مناسب‌تر برای انجام کارهای بیوانفورماتیک بود) ساده‌تر شد‪.‬‬
‫اصطالح بیوانفورماتیک‪ ،‬برای اولین بار در دهه ‪ 1990‬مطرح شد‪ .‬در اصل‪،‬‬
‫این کار با مدیریت و تجزیه و تحلیل داده‌های مربوط به توالی ‪ DNA ، RNA‬و‬
‫پروتئین بود‪.‬‬

‫از آنجایی که داده‌های بیولوژیکی با سرعت بی سابقه‌ای تولید می‌شوند‪ ،‬مدیریت و‬


‫تفسیر آن‌ها به بیوانفورماتیک نیازمند است‪ .‬بنابراین‪ ،‬بیوانفورماتیک اکنون انواع‬
‫مختلفی از داده‌های بیولوژیکی را نیز شامل می‌شود‪ .‬اولین پایگاه اطالعاتی‬
‫بیوانفورماتیک ‪ /‬بیولوژیکی چند سال پس از در دسترس بودن اولین توالی‌های‬
‫پروتئینی ساخته شد‪ .‬اولین توالی پروتئین گزارش شده مربوط به انسولین گاوی‬
‫در سال ‪ 1956‬بود که از ‪ 51‬اسیدآمینه تشکیل شده بود‪ .‬تقریبا ً یک دهه بعد‪،‬‬
‫اولین توالی یابی اسید نوکلئیکی گزارش شد که مربوط به ‪ tRNA‬آالنین مخمر با‬
‫‪ 77‬باز بود‪ .‬فقط یک سال بعد‪ ،‬مارگارت دیلوف (‪ )1983–1925‬که یک شیمی‬
‫– فیزیک دان آمریکایی بود تمام داده‌های توالی‌های موجود را برای ایجاد اولین‬
‫پایگاه داده بیوانفورماتیک جمع آوری کرد‪ .‬پروتئین ‪ Data Bank‬در سال ‪1972‬‬
‫با جمع آوری ده پروتئین کریستالوگرافی شده با اشعه ایکس توالی‌یابی شد و در‬
‫سال ‪ 1987‬تاسیس اولین پایگاه داده توالی پروتئین به نام ‪The SWISS PROT‬‬
‫آغاز شد‪.‬‬

‫همانطور که پیش‌تر بیان شد بیوانفورماتیک یک دانش نوین بین رشته‌ای است که‬
‫در آن با استفاده از علوم کامپیوتر‪ ،‬ریاضی‪ ،‬ژنتیک‪ ،‬شیمی‪ ،‬فیزیک‪ ،‬آمار و‬
‫احتماالت در شاخه زیست شناسی مولکولی اهداف مختلفی دنبال می‌شود‪.‬‬
‫پیشرفت‌های انجام شده در زیست شناسی و فناوری‌های جدید در ذخیره و بازیابی‬
‫اطالعات زیستی موجب شده این دو علم به هم گره بخورند‪ .‬در این راستا فرادرس‬
‫دوره‌های متعدد بیوانفورماتیکی را با همکاری مدرسین برجسته کشوری تهیه و‬
‫تدوین کرده است‪.‬‬

‫این فرادرس توسط آقای دکتر فرشید شیرافکن دانشجوی دکتری تخصصی‬
‫بیوانفورماتیک دانشگاه تهران (ایشان از مدرسین نمونه در زمینه ارائه و آموزش‬
‫دروس دانشگاهی انتخاب‪ P‬شده اند) تدریس شده است‪ .‬این دوره شامل ‪ ۹‬فصل تحت‬
‫عناوین مروری بر زیست مولکولی‪ ،‬مقدمات بیوانفورماتیک (‬
‫‪ ،)Bioinformatics‬پایگاه داده‌های زیستی‪ ،‬انطباق دوتایی توالی‌ها‪ ،‬جستجوی‬
‫تشابه در پایگاه داده‌ها‪ ،‬انطباق چندگانه توالی‌ها‪ – HMM – PSSM ،‬پیشگویی‬
‫دمین و موتیف‪ ،‬فیلوژنتیک (‪ )Phylogenetics‬و آموزش برنامه نویسی ‪ R‬تهیه‬
‫و تدوین شده است و برای تمامی دانشجویان رشته‌های بیوانفورماتیک‪،‬‬
‫زیست‌شناسی‪ ،‬مهندسی کامپیوتر و تمام عالقمندان به این حوزه پرکاربرد مناسب‬
‫است‬

‫‪ .‬داده های بیوانفورماتیکی‬


‫داده‌های کالسیک بیوانفورماتیک شامل توالی ‪ DNA‬ژن‌ها یا ژنوم‌های کامل‪،‬‬
‫توالی اسیدهای آمینه پروتئین‌ها‪ ،‬ساختارهای سه بعدی پروتئین‌ها و اسیدهای‬
‫نوکلئیک و مجموعه‌های اسید نوکلئیک – پروتئین است‪ .‬جریان داده‌های فرعی یا‬
‫‪ omics‬عبارتند از‪ Transcriptomics :‬که به معنی الگوی سنتز ‪ RNA‬از‬
‫‪ DNA‬است‪ ،‬پروتئومیکس که توزیع پروتئین در سلول‌ها بوده‪ ،‬‬
‫‪ Interactomics‬که الگوهای فعل و انفعاالت پروتئین – پروتئین و پروتئین –‬
‫اسید نوکلئیک و ‪ Metabolomics‬که طبیعت و الگوهای ترافیکی تبدیل‬
‫مولکول‌های کوچک توسط مسیرهای بیوشیمیایی فعال در سلول‌ها تعریف شده‬
‫است‪ .‬در هر حالت عالقه به دستیابی به داده‌های دقیق و جامع برای انواع خاصی‬
‫از سلول‌ها و شناسایی الگوهای تغییر در داده‌ها وجود دارد‪.‬‬

‫به عنوان مثال‪ ،‬بسته به نوع سلول‪ ،‬زمان جمع آوری اطالعات (در طول‪ ‬چرخه‬
‫سلولی‪ ‬یا تغییرات روزانه‪ ،‬فصلی یا ساالنه)‪ ،‬مرحله رشد و شرایط مختلف محیطی‬
‫ممکن است داده‌ها در نوسان باشند‪ .‬متاژنومیکس و متاپروتومیکس این اندازه‬
‫گیری‌ها را به شرح جامعی از ارگانیسم‌های موجود در یک نمونه گرفته شده از‬
‫محیط مانند یک سطل آب اقیانوس یا یک نمونه‪ ‬خاک‪ ‬گسترش می‌دهد‪.‬‬
‫بیوانفورماتیک با شتاب زیاد فرآیندهای تولید داده در زیست شناسی را به جلو‬
‫می‌برد‪ .‬روش‌های تعیین توالی ژنوم شاید بارزترین اثرات آن را نشان دهند‪ .‬در‬
‫سال ‪ 1999‬بایگانی توالی اسید نوکلئیک حاوی ‪ 3/5‬میلیارد نوکلئوتید بود که کمی‬
‫بیشتر از طول یک ژنوم انسانی است‪ .‬یک دهه بعد این اطالعات حاوی بیش از‬
‫‪ 283‬میلیارد نوکلئوتید یعنی طولی به اندازه ‪ 95‬عدد ژنوم انسانی بودند‪.‬‬

‫ذخیره و بازیابی داده ها‬


‫در بیوانفورماتیک‪ ،‬از بانک‌های داده برای ذخیره و سازماندهی داده‌ها استفاده‬
‫می‌شوند و محققان توالی ‪ DNA‬و ‪ RNA‬بسیاری از این موجودات را از مقاالت‬
‫علمی و پروژه‌های ژنوم جمع آوری می‌کنند‪ .‬بسیاری از پایگاه‌های اطالعاتی در‬
‫اختیار کنسرسیوم‌های بین المللی است‪ .‬به عنوان مثال‪ ،‬یک کمیته مشورتی متشکل‬
‫از اعضای بانک اطالعاتی توالی نوکلئوتید آزمایشگاه زیست شناسی مولکولی‬
‫اروپا (‪ )EMBL-Bank‬در انگلستان‪ ،‬بانک داده ‪ DNA‬ژاپن (‪ ،)DDBJ‬و‬
‫‪ GenBank‬از مرکز ملی اطالعات‪ ‬بیوتکنولوژی‪ ‬در ایاالت متحده (‪ )NCBI‬بر‬
‫«همکاری بین المللی بانک اطالعات توالی نوکلئوتیدی» (‪ )INSDC‬نظارت‬
‫می‌کنند‪.‬‬

‫برای اطمینان از در دسترس بودن و آزاد بودن داده‌های‪ ‬توالی‌یابی‪ ،‬مجالت علمی‬


‫الزم است که توالی‌های نوکلئوتیدی جدید افراد را به عنوان شرط انتشار مقاله در‬
‫یک پایگاه داده در دسترس عموم قرار دهند‪ .‬شرایط مشابه در اسیدهای نوکلئیک‬
‫برای ساختارهای پروتئینی نیز اعمال می‌شود‪ ،‬همچنین مرورگرهای ژنوم وجود‬
‫دارند و پایگاه داده‌هایی که تمام اطالعات ژنومی و مولکولی موجود‪ ،‬در مورد‬
‫یک گونه خاص را با هم جمع می‌کنند‪ .‬پایگاه داده اصلی ساختار ماکرومولکولی‬
‫بیولوژیکی بانک اطالعات پروتئین در سراسر جهان ‪ PDB‬است که حاصل یک‬
‫بیوانفورماتیک ساختاری (‪ )RCSB‬در ایاالت‬
‫ِ‬ ‫تالش و همکاری مشترک تحقیقات‬
‫متحده‪ ،‬بانک اطالعات پروتئین (‪ )PDBe‬در انستیتوی بیوانفورماتیک اروپا در‬
‫انگلستان و بانک اطالعات پروتئین ژاپن در دانشگاه اُساکا است‪.‬‬

‫صفحات اصلی همکار ‪ PDB‬حاوی پیوندهایی به خود فایل‌های داده و مطالب گویا‬
‫و آموزشی (از جمله اخبار)‪ ،‬تسهیالت برای ذخیره مطالب جدید و نرم افزار‬
‫جستجوی تخصصی برای بازیابی ساختارها هستند‪ .‬بازیابی اطالعات از بایگانی‬
‫داده‌ها از ابزارهای استاندارد برای شناسایی داده توسط کلمه کلیدی استفاده می‌کند‪.‬‬
‫الگوریتم های دیگر‪ ،‬بانک های داده را جستجو می کنند تا شباهت‌های موردی‬
‫داده‌ها را تشخیص دهند‪ .‬به عنوان مثال‪ ،‬یک مسئله قابل کاوش در یک پایگاه‬
‫توالی داده‪ ،‬استفاده از توالی ژنی یا پروتئینی مورد نظر به منظور شناسایی‬
‫موجوداتی با توالی مشابه است‪.‬‬

‫اهداف بیوانفورماتیک‬

‫توسعه الگوریتم‌های کارآمد برای اندازه گیری تشابه توالی‪ ،‬هدف مهم‬
‫بیوانفورماتیک است‪ .‬الگوریتم ‪ ،Needleman – Wunsch‬که مبتنی بر‬
‫برنامه نویسی پویا است‪ ،‬یافتن چینش بهینه جفت توالی‌ها را تضمین می‌کند‪ .‬این‬
‫الگوریتم اساسا ً یک مسئله بزرگ (دنباله کامل) را به مجموعه‌ای از مسائل‬
‫کوچک‌تر (بخش‌های توالی کوتاه) تقسیم می‌کند و از راه حل‌های مسئله‌های‬
‫کوچک‌تر برای راه حل مسئله بزرگ استفاده می‌کند‪ .‬شباهت در توالی‌ها در یک‬
‫ماتریکس امتیاز بندی می‌شوند و الگوریتم امکان تشخیص شکاف‌ها در «تراز‬
‫بندی توالی‌ها» (‪ )Sequence Alignment‬را فراهم می‌کند‪ .‬اگرچه الگوریتم‬
‫‪ Needleman – Wunsch‬موثر است‪ ،‬اما به عنوان کاوش یک پایگاه داده‬
‫توالی‌یابی بزرگ بسیار کند است‪.‬‬

‫بنابراین‪ ،‬توجه زیادی به یافتن الگوریتم‌های بازیابی سریع اطالعات شده است که‬
‫می‌توانند با مقادیر زیادی از داده‌ها در بایگانی‌ها سر و کار داشته باشند‪ .‬که برنامه‬
‫«بالست» (‪ )BLAST‬یا ‪ Basic Local Alignment Search Tool‬یکی‬
‫از آن‌ها است‪ .‬یک بخش پیشرفته از ‪ ،BLAST‬شناخته شده به عنوان موقعیت‬
‫خاص تکرار شونده یا ‪ PSIBLAST‬که برگرفته از ‪position-specific‬‬
‫‪ iterated BLAST‬است‪ ،‬باعث استفاده از الگوهای حفاظت‌شده در توالی‌های‬
‫مرتبط می‌شود و ترکیبی از سرعت باالی ‪ BLAST‬همراه حساسیت بسیار باال‬
‫برای یافتن توالی‌های مرتبط است‪.‬‬

‫هدف دیگر بیوانفورماتیک‪ ،‬گسترش داده‌های تجربی توسط پیش‌بینی‌ها است‪ .‬یک‬
‫هدف اساسی از زیست شناسی محاسباتی‪ ،‬پیش بینی ساختار پروتئین از یک توالی‬
‫اسید آمینه است‪ .‬پیشرفت در توسعه روش‌های پیش بینی «حاالت قرارگیری‬
‫فضایی» (‪ )Folding‬پروتئین توسط برنامه‌های ارزیابی حیاتی‪ ،‬پیش بینی‬
‫ساختار (‪ )CASP‬طی دو سال اندازه‌گیری می‌شود که شامل آزمون‌های کور‬
‫روش‌های پیش بینی ساختار است‪ .‬از بیوانفورماتیک برای پیش بینی تعامالت بین‬
‫پروتئین‌ها با توجه به ساختارهای فردی آمینواسیدها نیز استفاده می‌شود‪ .‬این نوع‬
‫پژوهش به عنوان داکینگ پروتئین‌ها شناخته می‌شود‪ .‬مجموعه‌های پروتئین –‬
‫پروتئین مکمل بودن خوبی با هم در شکل سطحی و قطبیت دارند و عمدتا توسط‬
‫فعل و انفعاالت ضعیف مانند پیوندهای سطح آبگریز‪ ،‬پیوندهای هیدروژنی و‬
‫نیروهای وان در والس تثبیت می‌شوند‪.‬‬

‫برنامه‌های نرم افزاری رایانه‌ای این تعامالت را برای پیش بینی رابطه فضایی‬
‫مطلوب بین زیرواحدهای متصل به هم شبیه‌سازی می‌کند‪ .‬یک چالشی که می‌تواند‬
‫کاربردهای درمانی مهمی داشته باشد‪ ،‬طراحی آنتی بادی‌هایی است که با میل زیاد‬
‫به پروتئین هدف متصل شوند‪ .‬در ابتدا‪ ،‬بسیاری از تحقیقات‪ P‬بیوانفورماتیک‪،‬‬
‫تمرکز نسبتا ً کمی بر الگوریتم‌هایی برای تجزیه و تحلیل انواع خاصی از داده‌ها‪،‬‬
‫مانند توالی ژن‌ها یا ساختارهای پروتئینی داشته است‪ .‬با این حال‪ ،‬اکنون‪ ،‬اهداف‬
‫بیوانفورماتیکی یکپارچه هستند و هدف آن‌ها این است که دریابند چگونه می‌توان‬
‫از ترکیب انواع مختلف داده‌ها برای درک بهتر پدیده‌های طبیعی‪ ،‬از جمله‬
‫ارگانیسم‌ها و بیماری‌ها استفاده کرد‪.‬‬

‫پایگاه های داده‬


‫پایگاه‌های داده برای تحقیقات و کاربردهای بیوانفورماتیک‪ ،‬ضروری هستند‪.‬‬
‫بسیاری از پایگاه‌های داده‌ای وجود دارند که انواع مختلفی از اطالعات را در بر‬
‫می‌گیرند به عنوان مثال‪ ،‬توالی ‪ DNA‬و پروتئین‪ ،‬ساختارهای‬
‫مولکولی‪ ،‬فنوتیپ‌ها‪ ‬و اطالعات تنوع‌های زیستی‪ .‬پایگاه‌های اطالعاتی ممکن‬
‫است حاوی داده‌های تجربی (مستقیما ً از آزمایشات بدست آمده)‪ ،‬داده‌های پیش بینی‬
‫شده (حاصل از تجزیه و تحلیل) یا هر دو باشد‪ .‬این اطالعات ممکن است‬
‫مخصوص ارگانیسم‪ ،‬مسیر یا مولکول مورد عالقه خاص باشند یا آن‌ها می‌توانند‬
‫داده‌های جمع آوری شده از چندین پایگاه داده دیگر را ترکیب کنند‪ .‬این پایگاه‌های‬
‫داده از نظر قالب‪ P،‬سازوکار دسترسی و عمومی بودن یا نبودن متفاوت هستند‪.‬‬
‫برخی از پایگاه‌های اطالعاتی که معموالً مورد استفاده قرار می‌گیرند در ادامه‬
‫توضیح داده شده اند‪.‬‬

‫نرم افزارهای بیوانفورماتیک‬

‫نرم افزارهای بیوانفورماتیک از ابزارهای پیرو خط فرمان کوتاه‪ ،‬تا برنامه‌های‬


‫گرافیکی پیچیده‌تر متفاوت هستند‪ .‬این نرم‌افزارها شامل انواع رایگان و نیازمند‬
‫پرداخت هزینه و همچنین نرم افزارهای تحت وب هستند که هر کدام کاربردهای‬
‫مختلفی بر عهده دارند‪ .‬در ادامه به همه آن‌ها پرداخته‌ایم‪.‬‬

‫نرم افزارهای منبع باز‬


‫بسیاری از ابزارهای نرم افزاری رایگان و با منبع آزاد از دهه ‪ 1980‬تاکنون‬
‫وجود داشته و در حال رشد هستند‪ .‬ترکیبی از نیاز مستمر به الگوریتم های جدید‬
‫برای تجزیه و تحلیل انواع نوظهور بازخوانی‌های بیولوژیکی‪ ،‬پتانسیل ابتکاری در‬
‫آزمایشات «درون رایانه‌ای» (‪ )In Silico‬و پایگاه‌های «کد – باز» (– ‪Open‬‬
‫‪ )Code‬در دسترس که به ایجاد فرصت برای همه گروه‌های تحقیقاتی کمک‬
‫کرده‌اند تا صرف نظر از تمهیدات مالی آن‌ها هم به بیوانفورماتیک و هم به دامنه‬
‫نرم افزار منبع باز موجود کمک کنند‪ .‬ابزارهای رایگان اغلب به عنوان‬
‫پرورش‌دهنده ایده‌ها یا پالگین‌های پشتیبانی شده توسط جامعه در نرم‌افزارهای‬
‫تجاری عمل می‌کنند‪ .‬طیف وسیعی از بسته‌های نرم افزاری رایگان شامل موارد‬
‫زیر هستند‪.‬‬

‫‪ .Bioconductor‬یک پروژه نرم افزاری توسعه یافته و رایگان برای تجزیه و‬


‫تحلیل و درک داده‌های ژنومی تولید شده توسط تست‌های آزمایشگاهی در زیست‬
‫شناسی مولکولی است‪ Bioconductor .‬بر اساس زبان آماری برنامه نویسی ‪R‬‬
‫استوار است‪ ،‬اما حاوی سایر زبان‌های برنامه نویسی دیگر نیز است‪.‬‬
‫‪ .BioPerl‬یک پروژه نرم افزاری فعال است که توسط بنیاد ‪Open‬‬
‫‪ Bioinformatics‬پشتیبانی می‌شود‪ .‬از این پایگاه برای رفع اشکاالت موجود‬
‫در پروژه توالی‌یابی ژنوم انسان استفاده شد‪.‬‬

‫‪ .Biopython‬پروژه ‪ Biopython‬مجموعه‌ای از ابزارهای غیر تجاری‬


‫‪ Python‬برای زیست شناسی محاسباتی و بیوانفورماتیک است که توسط یک‬
‫انجمن بین المللی توسعه دهندگان ایجاد شده است‪ .‬این ابزار شامل طبقه‌بندی‌هایی‬
‫برای نشان دادن توالی‌های بیولوژیکی و حاشیه نویسی توالی‌ها است و قادر به‬
‫خواندن و نوشتن در انواع قالب‌های فایل‌ها است‪ .‬همچنین این ابزار امکان دستیابی‬
‫بصورت برنامه‌ای برای راه‌یابی به پایگاه داده‌های آنالین اطالعات بیولوژیکی‪،‬‬
‫مانند آن‌هایی که در ‪ NCBI‬وجود دارد را فراهم می‌کند‪.‬‬

‫‪ .BioJava‬یک پروژه نرم افزاری است که برای ارائه ابزارهای جاوا برای‬
‫پردازش داده‌های بیولوژیکی اختصاص داده شده است‪ .‬این ابزار مجموعه‌ای از‬
‫توابع کتابخانه‌ای است که در زبان برنامه نویسی جاوا برای دستکاری توالی‌ها‪،‬‬
‫ساختارهای پروتئینی‪ ،‬سیستم توزیع حاشیه نویسی (‪ ،)DAS‬دسترسی به‬
‫‪ ،AceDB‬برنامه نویسی پویا و سیستم‌های آماری ساده نوشته شده است‪.‬‬

‫‪ .BioJS‬یک پروژه برای داده‌های بیوانفورماتیک در وب است‪ ،‬هدف آن توسعه‬


‫یک کتابخانه منبع باز از اجزای ‪ JavaScript‬برای تجسم داده‌های بیولوژیکی‬
‫است‪.‬‬

‫‪ .BioRuby‬مجموعه ای از کد روبی (یک زبان برنامه نویسی پیشرفته) است که‬


‫شامل کالس‌هایی برای زیست شناسی مولکولی محاسباتی و بیوانفورماتیک است‪.‬‬
‫این ابزار شامل کالس‌هایی برای تجزیه و تحلیل توالی ‪ DNA‬و پروتئین‪،‬‬
‫ترازبندی توالی‪ ،‬تجزیه پایگاه داده بیولوژیکی‪ ،‬زیست شناسی ساختاری و سایر‬
‫کارهای بیوانفورماتیک است‪.‬‬
‫‪ .Bioclipse‬یک پلتفرم بصری مبتنی بر جاوا‪ ،‬منبع باز و بر پایه شیمی و‬
‫بیوانفورماتیک در بستر نرم افزاری )‪ Eclipse Rich Client (RCP‬است‪.‬‬

‫‪ .EMBOSS‬یک نرم افزار تجزیه و تحلیل رایگان بوده که برای نیازهای جامعه‬
‫کاربران زیست شناسی مولکولی و بیوانفورماتیک تهیه شده است‪ .‬این نرم افزار به‬
‫طور خودکار با داده‌ها در قالب‌های‪ P‬مختلف کنار می‌آید و حتی امکان بازیابی‬
‫شفاف داده‌های توالی را از وب فراهم می‌کند‪.‬‬

‫‪ .NET Bio‬یک کتابخانه بیوانفورماتیک و ژنومیک منبع باز است که برای‬


‫امکان بارگذاری‪ ،‬ذخیره و تجزیه و تحلیل داده‌های بیولوژیکی ایجاد شده است‪.‬‬

‫‪ .Orange‬یک مجموعه ابزار تجسم داده‌ها‪ ،‬یادگیری ماشین و داده کاوی است‪.‬‬
‫این نرم افزار دارای یک برنامه نویسی بصری ‪ front-end‬برای تجزیه و‬
‫تحلیل سریع داده‌های کیفی و تجسم داده‌های تعاملی است‪.‬‬

‫‪ .UGENE‬یک نرم افزار رایانه‌ای برای بیوانفورماتیک بوده که بر روی انواع‬


‫سیستم عامل‌ها قابل استفاده است‪ UGENE .‬به زیست شناسان کمک می‌کند تا‬
‫داده‌های مختلف ژنتیکی بیولوژیک‪ ،‬مانند توالی‌ها‪ P،‬حاشیه نویسی‌ها‪ ،‬ترازبندی‌های‬
‫متعدد‪ ،‬درختان فیلوژنتیک‪ ،‬سرهم بندی‌های ‪ NGS‬و موارد دیگر را تجزیه و‬
‫تحلیل کنند‪.‬‬

‫‪ .GenoCAD‬یکی از اولین ابزارهای طراحی به کمک رایانه برای زیست‬


‫شناسی مصنوعی است که در طراحی وکتورهای بیانی انتقال ژن‪ ،‬شبکه‌های‬
‫مصنوعی ژنی و سایر ساختارهای مورد استفاده در مهندسی ژنتیک کاربرد دارد‪.‬‬
‫نرم افزار ‪ Clustal X‬می‌تواند با هم ردیف سازی توالی‌های ژن‪ ،‬میزان تشابه یا‬
‫تفاوت دو موجود را از نظر یک ناحیه ژنی نشان دهد‪ .‬عالوه بر این‪ ،‬اگر محقق‬
‫بخواهد ناحیه ژنی مناسب برای تکثیر ژن را پیدا کند‪ ،‬این نرم افزار بسیار سودمند‬
‫خواهد بود‪ .‬گاهی پژوهشگران نیاز دارند تا روابط بین گروهی از موجودات زنده‬
‫را به صورت درخت فیلوژنتیکی نشان دهند‪ .‬در این صورت نیز این نرم افزار می‬
‫تواند کمک کننده باشد‪.‬‬

You might also like