سنجابی بیو

‫مقدمه‬
‫رشد سریع و توسعه فناوری رایانه‌ای‪ ،‬همراه با پیشرفت‌های چشمگیر در درک ما از‪ ‬زیست‬
‫شناسی‪ ‬انسانی حاصل از پروژه‪ ‬ژنوم‪ ‬انسانی و سرمایه گذاری‌های الهام گرفته از آن‪ ،‬رشد‬
‫اخیر در بیوانفورماتیک را تسهیل کرده است‪ .‬بیوانفورماتیک‪ ،‬علوم کامپیوتر‪ ‬را با زیست‬
‫شناسی ادغام می‌کند تا داده‌های مربوط به سیستم‌های بیولوژیکی‪ 0‬را ذخیره‪ ،‬تجزیه و تحلیل‬
‫و به اشتراک بگذارد که اغلب این داده‌ها مربوط به‪ DNA ‬و توالی‪ ‬اسیدهای آمینه‪ ‬است‪.‬‬
‫بیوانفورماتیک چیست؟‬
‫بیوانفورماتیک ترکیبی از زیست شناسی و فناوری اطالعات است‪ .‬اساساً‪،‬‬
‫بیوانفورماتیک علمی است که اخیراً توسعه یافته و از فناوری اطالعات برای‬
‫درک پدیده بیولوژیکی استفاده می‌کند‪ .‬بیوانفورماتیک به طور گسترده‌ای شامل‬
‫ابزارها و روش‌های محاسباتی است که برای مدیریت‪ ،‬تجزیه و تحلیل و ادراه‬
‫کردن داده‌های حجیم بیولوژیکی استفاده می‌شود‪ .‬بیوانفورماتیک همچنین ممکن‬
‫است به عنوان بخشی از زیست شناسی محاسباتی در نظر گرفته شود‪ .‬زیست‬
‫شناسی محاسباتی با استفاده از تکنیک‌های تحلیلی کمی در مدل‌سازی و حل‬
‫مشکالت در سیستم‌های بیولوژیکی درگیر است‪ .‬بیوانفورماتیک یک رویکرد‬
‫میان رشته‌ای است که به دانش پیشرفته علوم کامپیوتر‪ ،‬ریاضیات و روش‌های‬
‫آماری برای درک پدیده‌های بیولوژیکی در سطح مولکولی نیاز دارد‪.‬‬
‫تاریخچه‬
‫پایه‌های بیوانفورماتیک در اوایل دهه ‪ 1960‬با استفاده از روش‌های محاسباتی‬
‫برای تجزیه و تحلیل توالی پروتئین به ویژه‪ ،‬مونتاژ توالی‌های جدید‪ ،‬پایگاه‬
‫داده‌های توالی بیولوژیکی و مدل‌های جایگزینی گذاشته شد‪ .‬بعدا از آن‪ ،‬تجزیه و‬
‫تحلیل ‪ DNA‬نیز به دلیل پیشرفت موازی روش‌های زیست شناسی مولکولی (که‬
‫دستکاری آسان‌تر ‪ DNA‬و همچنین توالی آن را فراهم می‌کند) و همچنین پیشرفت‬
‫در علوم کامپیوتر و ظهور رایانه‌های کوچک (که قدرتمندتر بوده و دارای نرم‬
‫افزارهای جدیدتر و مناسب‌تر برای انجام کارهای بیوانفورماتیک بود) ساده‌تر شد‪.‬‬
‫اصطالح بیوانفورماتیک‪ ،‬برای اولین بار در دهه ‪ 1990‬مطرح شد‪ .‬در اصل‪،‬‬
‫این کار با مدیریت و تجزیه و تحلیل داده‌های مربوط به توالی ‪ DNA ، RNA‬و‬
‫پروتئین بود‪.‬‬
‫از آنجایی که داده‌های بیولوژیکی با سرعت بی سابقه‌ای تولید می‌شوند‪ ،‬مدیریت و‬

‫تفسیر آن‌ها به بیوانفورماتیک نیازمند است‪ .‬بنابراین‪ ،‬بیوانفورماتیک اکنون انواع‬
‫مختلفی از داده‌های بیولوژیکی را نیز شامل می‌شود‪ .‬اولین پایگاه اطالعاتی‬
‫بیوانفورماتیک ‪ /‬بیولوژیکی چند سال پس از در دسترس بودن اولین توالی‌های‬
‫پروتئینی ساخته شد‪ .‬اولین توالی پروتئین گزارش شده مربوط به انسولین گاوی‬
‫در سال ‪ 1956‬بود که از ‪ 51‬اسیدآمینه تشکیل شده بود‪ .‬تقریبا ً یک دهه بعد‪،‬‬
‫اولین توالی یابی اسید نوکلئیکی گزارش شد که مربوط به ‪ tRNA‬آالنین مخمر با‬
‫‪ 77‬باز بود‪ .‬فقط یک سال بعد‪ ،‬مارگارت دیلوف (‪ )1983–1925‬که یک شیمی‬
‫– فیزیک دان آمریکایی بود تمام داده‌های توالی‌های موجود را برای ایجاد اولین‬
‫پایگاه داده بیوانفورماتیک جمع آوری کرد‪ .‬پروتئین ‪ Data Bank‬در سال ‪1972‬‬
‫با جمع آوری ده پروتئین کریستالوگرافی شده با اشعه ایکس توالی‌یابی شد و در‬
‫سال ‪ 1987‬تاسیس اولین پایگاه داده توالی پروتئین به نام ‪The SWISS PROT‬‬
‫آغاز شد‪.‬‬
‫همانطور که پیش‌تر بیان شد بیوانفورماتیک یک دانش نوین بین رشته‌ای است که‬
‫در آن با استفاده از علوم کامپیوتر‪ ،‬ریاضی‪ ،‬ژنتیک‪ ،‬شیمی‪ ،‬فیزیک‪ ،‬آمار و‬
‫احتماالت در شاخه زیست شناسی مولکولی اهداف مختلفی دنبال می‌شود‪.‬‬
‫پیشرفت‌های انجام شده در زیست شناسی و فناوری‌های جدید در ذخیره و بازیابی‬
‫اطالعات زیستی موجب شده این دو علم به هم گره بخورند‪ .‬در این راستا فرادرس‬
‫دوره‌های متعدد بیوانفورماتیکی را با همکاری مدرسین برجسته کشوری تهیه و‬
‫تدوین کرده است‪.‬‬
‫این فرادرس توسط آقای دکتر فرشید شیرافکن دانشجوی دکتری تخصصی‬
‫بیوانفورماتیک دانشگاه تهران (ایشان از مدرسین نمونه در زمینه ارائه و آموزش‬
‫دروس دانشگاهی انتخاب‪ P‬شده اند) تدریس شده است‪ .‬این دوره شامل ‪ ۹‬فصل تحت‬
‫عناوین مروری بر زیست مولکولی‪ ،‬مقدمات بیوانفورماتیک (‬
‫‪ ،)Bioinformatics‬پایگاه داده‌های زیستی‪ ،‬انطباق دوتایی توالی‌ها‪ ،‬جستجوی‬
‫تشابه در پایگاه داده‌ها‪ ،‬انطباق چندگانه توالی‌ها‪ – HMM – PSSM ،‬پیشگویی‬
‫دمین و موتیف‪ ،‬فیلوژنتیک (‪ )Phylogenetics‬و آموزش برنامه نویسی ‪ R‬تهیه‬
‫و تدوین شده است و برای تمامی دانشجویان رشته‌های بیوانفورماتیک‪،‬‬
‫زیست‌شناسی‪ ،‬مهندسی کامپیوتر و تمام عالقمندان به این حوزه پرکاربرد مناسب‬
‫است‬
‫‪ .‬داده های بیوانفورماتیکی‬

‫داده‌های کالسیک بیوانفورماتیک شامل توالی ‪ DNA‬ژن‌ها یا ژنوم‌های کامل‪،‬‬
‫توالی اسیدهای آمینه پروتئین‌ها‪ ،‬ساختارهای سه بعدی پروتئین‌ها و اسیدهای‬
‫نوکلئیک و مجموعه‌های اسید نوکلئیک – پروتئین است‪ .‬جریان داده‌های فرعی یا‬
‫‪ omics‬عبارتند از‪ Transcriptomics :‬که به معنی الگوی سنتز ‪ RNA‬از‬
‫‪ DNA‬است‪ ،‬پروتئومیکس که توزیع پروتئین در سلول‌ها بوده‪ ،‬‬
‫‪ Interactomics‬که الگوهای فعل و انفعاالت پروتئین – پروتئین و پروتئین –‬
‫اسید نوکلئیک و ‪ Metabolomics‬که طبیعت و الگوهای ترافیکی تبدیل‬
‫مولکول‌های کوچک توسط مسیرهای بیوشیمیایی فعال در سلول‌ها تعریف شده‬
‫است‪ .‬در هر حالت عالقه به دستیابی به داده‌های دقیق و جامع برای انواع خاصی‬
‫از سلول‌ها و شناسایی الگوهای تغییر در داده‌ها وجود دارد‪.‬‬
‫به عنوان مثال‪ ،‬بسته به نوع سلول‪ ،‬زمان جمع آوری اطالعات (در طول‪ ‬چرخه‬
‫سلولی‪ ‬یا تغییرات روزانه‪ ،‬فصلی یا ساالنه)‪ ،‬مرحله رشد و شرایط مختلف محیطی‬
‫ممکن است داده‌ها در نوسان باشند‪ .‬متاژنومیکس و متاپروتومیکس این اندازه‬
‫گیری‌ها را به شرح جامعی از ارگانیسم‌های موجود در یک نمونه گرفته شده از‬
‫محیط مانند یک سطل آب اقیانوس یا یک نمونه‪ ‬خاک‪ ‬گسترش می‌دهد‪.‬‬
‫بیوانفورماتیک با شتاب زیاد فرآیندهای تولید داده در زیست شناسی را به جلو‬
‫می‌برد‪ .‬روش‌های تعیین توالی ژنوم شاید بارزترین اثرات آن را نشان دهند‪ .‬در‬
‫سال ‪ 1999‬بایگانی توالی اسید نوکلئیک حاوی ‪ 3/5‬میلیارد نوکلئوتید بود که کمی‬
‫بیشتر از طول یک ژنوم انسانی است‪ .‬یک دهه بعد این اطالعات حاوی بیش از‬
‫‪ 283‬میلیارد نوکلئوتید یعنی طولی به اندازه ‪ 95‬عدد ژنوم انسانی بودند‪.‬‬
‫ذخیره و بازیابی داده ها‬

‫در بیوانفورماتیک‪ ،‬از بانک‌های داده برای ذخیره و سازماندهی داده‌ها استفاده‬
‫می‌شوند و محققان توالی ‪ DNA‬و ‪ RNA‬بسیاری از این موجودات را از مقاالت‬
‫علمی و پروژه‌های ژنوم جمع آوری می‌کنند‪ .‬بسیاری از پایگاه‌های اطالعاتی در‬
‫اختیار کنسرسیوم‌های بین المللی است‪ .‬به عنوان مثال‪ ،‬یک کمیته مشورتی متشکل‬
‫از اعضای بانک اطالعاتی توالی نوکلئوتید آزمایشگاه زیست شناسی مولکولی‬
‫اروپا (‪ )EMBL-Bank‬در انگلستان‪ ،‬بانک داده ‪ DNA‬ژاپن (‪ ،)DDBJ‬و‬
‫‪ GenBank‬از مرکز ملی اطالعات‪ ‬بیوتکنولوژی‪ ‬در ایاالت متحده (‪ )NCBI‬بر‬
‫«همکاری بین المللی بانک اطالعات توالی نوکلئوتیدی» (‪ )INSDC‬نظارت‬
‫می‌کنند‪.‬‬
‫برای اطمینان از در دسترس بودن و آزاد بودن داده‌های‪ ‬توالی‌یابی‪ ،‬مجالت علمی‬

‫الزم است که توالی‌های نوکلئوتیدی جدید افراد را به عنوان شرط انتشار مقاله در‬
‫یک پایگاه داده در دسترس عموم قرار دهند‪ .‬شرایط مشابه در اسیدهای نوکلئیک‬
‫برای ساختارهای پروتئینی نیز اعمال می‌شود‪ ،‬همچنین مرورگرهای ژنوم وجود‬
‫دارند و پایگاه داده‌هایی که تمام اطالعات ژنومی و مولکولی موجود‪ ،‬در مورد‬
‫یک گونه خاص را با هم جمع می‌کنند‪ .‬پایگاه داده اصلی ساختار ماکرومولکولی‬
‫بیولوژیکی بانک اطالعات پروتئین در سراسر جهان ‪ PDB‬است که حاصل یک‬
‫بیوانفورماتیک ساختاری (‪ )RCSB‬در ایاالت‬
‫ِ‬ ‫تالش و همکاری مشترک تحقیقات‬
‫متحده‪ ،‬بانک اطالعات پروتئین (‪ )PDBe‬در انستیتوی بیوانفورماتیک اروپا در‬
‫انگلستان و بانک اطالعات پروتئین ژاپن در دانشگاه اُساکا است‪.‬‬
‫صفحات اصلی همکار ‪ PDB‬حاوی پیوندهایی به خود فایل‌های داده و مطالب گویا‬
‫و آموزشی (از جمله اخبار)‪ ،‬تسهیالت برای ذخیره مطالب جدید و نرم افزار‬
‫جستجوی تخصصی برای بازیابی ساختارها هستند‪ .‬بازیابی اطالعات از بایگانی‬
‫داده‌ها از ابزارهای استاندارد برای شناسایی داده توسط کلمه کلیدی استفاده می‌کند‪.‬‬
‫الگوریتم های دیگر‪ ،‬بانک های داده را جستجو می کنند تا شباهت‌های موردی‬
‫داده‌ها را تشخیص دهند‪ .‬به عنوان مثال‪ ،‬یک مسئله قابل کاوش در یک پایگاه‬
‫توالی داده‪ ،‬استفاده از توالی ژنی یا پروتئینی مورد نظر به منظور شناسایی‬
‫موجوداتی با توالی مشابه است‪.‬‬
‫اهداف بیوانفورماتیک‬
‫توسعه الگوریتم‌های کارآمد برای اندازه گیری تشابه توالی‪ ،‬هدف مهم‬
‫بیوانفورماتیک است‪ .‬الگوریتم ‪ ،Needleman – Wunsch‬که مبتنی بر‬
‫برنامه نویسی پویا است‪ ،‬یافتن چینش بهینه جفت توالی‌ها را تضمین می‌کند‪ .‬این‬
‫الگوریتم اساسا ً یک مسئله بزرگ (دنباله کامل) را به مجموعه‌ای از مسائل‬
‫کوچک‌تر (بخش‌های توالی کوتاه) تقسیم می‌کند و از راه حل‌های مسئله‌های‬
‫کوچک‌تر برای راه حل مسئله بزرگ استفاده می‌کند‪ .‬شباهت در توالی‌ها در یک‬
‫ماتریکس امتیاز بندی می‌شوند و الگوریتم امکان تشخیص شکاف‌ها در «تراز‬
‫بندی توالی‌ها» (‪ )Sequence Alignment‬را فراهم می‌کند‪ .‬اگرچه الگوریتم‬
‫‪ Needleman – Wunsch‬موثر است‪ ،‬اما به عنوان کاوش یک پایگاه داده‬
‫توالی‌یابی بزرگ بسیار کند است‪.‬‬
‫بنابراین‪ ،‬توجه زیادی به یافتن الگوریتم‌های بازیابی سریع اطالعات شده است که‬
‫می‌توانند با مقادیر زیادی از داده‌ها در بایگانی‌ها سر و کار داشته باشند‪ .‬که برنامه‬
‫«بالست» (‪ )BLAST‬یا ‪ Basic Local Alignment Search Tool‬یکی‬
‫از آن‌ها است‪ .‬یک بخش پیشرفته از ‪ ،BLAST‬شناخته شده به عنوان موقعیت‬
‫خاص تکرار شونده یا ‪ PSIBLAST‬که برگرفته از ‪position-specific‬‬
‫‪ iterated BLAST‬است‪ ،‬باعث استفاده از الگوهای حفاظت‌شده در توالی‌های‬
‫مرتبط می‌شود و ترکیبی از سرعت باالی ‪ BLAST‬همراه حساسیت بسیار باال‬
‫برای یافتن توالی‌های مرتبط است‪.‬‬
‫هدف دیگر بیوانفورماتیک‪ ،‬گسترش داده‌های تجربی توسط پیش‌بینی‌ها است‪ .‬یک‬
‫هدف اساسی از زیست شناسی محاسباتی‪ ،‬پیش بینی ساختار پروتئین از یک توالی‬
‫اسید آمینه است‪ .‬پیشرفت در توسعه روش‌های پیش بینی «حاالت قرارگیری‬
‫فضایی» (‪ )Folding‬پروتئین توسط برنامه‌های ارزیابی حیاتی‪ ،‬پیش بینی‬
‫ساختار (‪ )CASP‬طی دو سال اندازه‌گیری می‌شود که شامل آزمون‌های کور‬
‫روش‌های پیش بینی ساختار است‪ .‬از بیوانفورماتیک برای پیش بینی تعامالت بین‬
‫پروتئین‌ها با توجه به ساختارهای فردی آمینواسیدها نیز استفاده می‌شود‪ .‬این نوع‬
‫پژوهش به عنوان داکینگ پروتئین‌ها شناخته می‌شود‪ .‬مجموعه‌های پروتئین –‬
‫پروتئین مکمل بودن خوبی با هم در شکل سطحی و قطبیت دارند و عمدتا توسط‬
‫فعل و انفعاالت ضعیف مانند پیوندهای سطح آبگریز‪ ،‬پیوندهای هیدروژنی و‬
‫نیروهای وان در والس تثبیت می‌شوند‪.‬‬
‫برنامه‌های نرم افزاری رایانه‌ای این تعامالت را برای پیش بینی رابطه فضایی‬
‫مطلوب بین زیرواحدهای متصل به هم شبیه‌سازی می‌کند‪ .‬یک چالشی که می‌تواند‬
‫کاربردهای درمانی مهمی داشته باشد‪ ،‬طراحی آنتی بادی‌هایی است که با میل زیاد‬
‫به پروتئین هدف متصل شوند‪ .‬در ابتدا‪ ،‬بسیاری از تحقیقات‪ P‬بیوانفورماتیک‪،‬‬
‫تمرکز نسبتا ً کمی بر الگوریتم‌هایی برای تجزیه و تحلیل انواع خاصی از داده‌ها‪،‬‬
‫مانند توالی ژن‌ها یا ساختارهای پروتئینی داشته است‪ .‬با این حال‪ ،‬اکنون‪ ،‬اهداف‬
‫بیوانفورماتیکی یکپارچه هستند و هدف آن‌ها این است که دریابند چگونه می‌توان‬
‫از ترکیب انواع مختلف داده‌ها برای درک بهتر پدیده‌های طبیعی‪ ،‬از جمله‬
‫ارگانیسم‌ها و بیماری‌ها استفاده کرد‪.‬‬
‫پایگاه های داده‬

‫پایگاه‌های داده برای تحقیقات و کاربردهای بیوانفورماتیک‪ ،‬ضروری هستند‪.‬‬
‫بسیاری از پایگاه‌های داده‌ای وجود دارند که انواع مختلفی از اطالعات را در بر‬
‫می‌گیرند به عنوان مثال‪ ،‬توالی ‪ DNA‬و پروتئین‪ ،‬ساختارهای‬
‫مولکولی‪ ،‬فنوتیپ‌ها‪ ‬و اطالعات تنوع‌های زیستی‪ .‬پایگاه‌های اطالعاتی ممکن‬
‫است حاوی داده‌های تجربی (مستقیما ً از آزمایشات بدست آمده)‪ ،‬داده‌های پیش بینی‬
‫شده (حاصل از تجزیه و تحلیل) یا هر دو باشد‪ .‬این اطالعات ممکن است‬
‫مخصوص ارگانیسم‪ ،‬مسیر یا مولکول مورد عالقه خاص باشند یا آن‌ها می‌توانند‬
‫داده‌های جمع آوری شده از چندین پایگاه داده دیگر را ترکیب کنند‪ .‬این پایگاه‌های‬
‫داده از نظر قالب‪ P،‬سازوکار دسترسی و عمومی بودن یا نبودن متفاوت هستند‪.‬‬
‫برخی از پایگاه‌های اطالعاتی که معموالً مورد استفاده قرار می‌گیرند در ادامه‬
‫توضیح داده شده اند‪.‬‬
‫نرم افزارهای بیوانفورماتیک‬
‫نرم افزارهای بیوانفورماتیک از ابزارهای پیرو خط فرمان کوتاه‪ ،‬تا برنامه‌های‬

‫گرافیکی پیچیده‌تر متفاوت هستند‪ .‬این نرم‌افزارها شامل انواع رایگان و نیازمند‬
‫پرداخت هزینه و همچنین نرم افزارهای تحت وب هستند که هر کدام کاربردهای‬
‫مختلفی بر عهده دارند‪ .‬در ادامه به همه آن‌ها پرداخته‌ایم‪.‬‬
‫نرم افزارهای منبع باز‬

‫بسیاری از ابزارهای نرم افزاری رایگان و با منبع آزاد از دهه ‪ 1980‬تاکنون‬
‫وجود داشته و در حال رشد هستند‪ .‬ترکیبی از نیاز مستمر به الگوریتم های جدید‬
‫برای تجزیه و تحلیل انواع نوظهور بازخوانی‌های بیولوژیکی‪ ،‬پتانسیل ابتکاری در‬
‫آزمایشات «درون رایانه‌ای» (‪ )In Silico‬و پایگاه‌های «کد – باز» (– ‪Open‬‬
‫‪ )Code‬در دسترس که به ایجاد فرصت برای همه گروه‌های تحقیقاتی کمک‬
‫کرده‌اند تا صرف نظر از تمهیدات مالی آن‌ها هم به بیوانفورماتیک و هم به دامنه‬
‫نرم افزار منبع باز موجود کمک کنند‪ .‬ابزارهای رایگان اغلب به عنوان‬
‫پرورش‌دهنده ایده‌ها یا پالگین‌های پشتیبانی شده توسط جامعه در نرم‌افزارهای‬
‫تجاری عمل می‌کنند‪ .‬طیف وسیعی از بسته‌های نرم افزاری رایگان شامل موارد‬
‫زیر هستند‪.‬‬
‫‪ .Bioconductor‬یک پروژه نرم افزاری توسعه یافته و رایگان برای تجزیه و‬

‫تحلیل و درک داده‌های ژنومی تولید شده توسط تست‌های آزمایشگاهی در زیست‬
‫شناسی مولکولی است‪ Bioconductor .‬بر اساس زبان آماری برنامه نویسی ‪R‬‬
‫استوار است‪ ،‬اما حاوی سایر زبان‌های برنامه نویسی دیگر نیز است‪.‬‬
‫‪ .BioPerl‬یک پروژه نرم افزاری فعال است که توسط بنیاد ‪Open‬‬
‫‪ Bioinformatics‬پشتیبانی می‌شود‪ .‬از این پایگاه برای رفع اشکاالت موجود‬
‫در پروژه توالی‌یابی ژنوم انسان استفاده شد‪.‬‬
‫‪ .Biopython‬پروژه ‪ Biopython‬مجموعه‌ای از ابزارهای غیر تجاری‬

‫‪ Python‬برای زیست شناسی محاسباتی و بیوانفورماتیک است که توسط یک‬
‫انجمن بین المللی توسعه دهندگان ایجاد شده است‪ .‬این ابزار شامل طبقه‌بندی‌هایی‬
‫برای نشان دادن توالی‌های بیولوژیکی و حاشیه نویسی توالی‌ها است و قادر به‬
‫خواندن و نوشتن در انواع قالب‌های فایل‌ها است‪ .‬همچنین این ابزار امکان دستیابی‬
‫بصورت برنامه‌ای برای راه‌یابی به پایگاه داده‌های آنالین اطالعات بیولوژیکی‪،‬‬
‫مانند آن‌هایی که در ‪ NCBI‬وجود دارد را فراهم می‌کند‪.‬‬
‫‪ .BioJava‬یک پروژه نرم افزاری است که برای ارائه ابزارهای جاوا برای‬
‫پردازش داده‌های بیولوژیکی اختصاص داده شده است‪ .‬این ابزار مجموعه‌ای از‬
‫توابع کتابخانه‌ای است که در زبان برنامه نویسی جاوا برای دستکاری توالی‌ها‪،‬‬
‫ساختارهای پروتئینی‪ ،‬سیستم توزیع حاشیه نویسی (‪ ،)DAS‬دسترسی به‬
‫‪ ،AceDB‬برنامه نویسی پویا و سیستم‌های آماری ساده نوشته شده است‪.‬‬
‫‪ .BioJS‬یک پروژه برای داده‌های بیوانفورماتیک در وب است‪ ،‬هدف آن توسعه‬

‫یک کتابخانه منبع باز از اجزای ‪ JavaScript‬برای تجسم داده‌های بیولوژیکی‬
‫است‪.‬‬
‫‪ .BioRuby‬مجموعه ای از کد روبی (یک زبان برنامه نویسی پیشرفته) است که‬

‫شامل کالس‌هایی برای زیست شناسی مولکولی محاسباتی و بیوانفورماتیک است‪.‬‬
‫این ابزار شامل کالس‌هایی برای تجزیه و تحلیل توالی ‪ DNA‬و پروتئین‪،‬‬
‫ترازبندی توالی‪ ،‬تجزیه پایگاه داده بیولوژیکی‪ ،‬زیست شناسی ساختاری و سایر‬
‫کارهای بیوانفورماتیک است‪.‬‬
‫‪ .Bioclipse‬یک پلتفرم بصری مبتنی بر جاوا‪ ،‬منبع باز و بر پایه شیمی و‬
‫بیوانفورماتیک در بستر نرم افزاری )‪ Eclipse Rich Client (RCP‬است‪.‬‬
‫‪ .EMBOSS‬یک نرم افزار تجزیه و تحلیل رایگان بوده که برای نیازهای جامعه‬
‫کاربران زیست شناسی مولکولی و بیوانفورماتیک تهیه شده است‪ .‬این نرم افزار به‬
‫طور خودکار با داده‌ها در قالب‌های‪ P‬مختلف کنار می‌آید و حتی امکان بازیابی‬
‫شفاف داده‌های توالی را از وب فراهم می‌کند‪.‬‬
‫‪ .NET Bio‬یک کتابخانه بیوانفورماتیک و ژنومیک منبع باز است که برای‬

‫امکان بارگذاری‪ ،‬ذخیره و تجزیه و تحلیل داده‌های بیولوژیکی ایجاد شده است‪.‬‬
‫‪ .Orange‬یک مجموعه ابزار تجسم داده‌ها‪ ،‬یادگیری ماشین و داده کاوی است‪.‬‬
‫این نرم افزار دارای یک برنامه نویسی بصری ‪ front-end‬برای تجزیه و‬
‫تحلیل سریع داده‌های کیفی و تجسم داده‌های تعاملی است‪.‬‬
‫‪ .UGENE‬یک نرم افزار رایانه‌ای برای بیوانفورماتیک بوده که بر روی انواع‬

‫سیستم عامل‌ها قابل استفاده است‪ UGENE .‬به زیست شناسان کمک می‌کند تا‬
‫داده‌های مختلف ژنتیکی بیولوژیک‪ ،‬مانند توالی‌ها‪ P،‬حاشیه نویسی‌ها‪ ،‬ترازبندی‌های‬
‫متعدد‪ ،‬درختان فیلوژنتیک‪ ،‬سرهم بندی‌های ‪ NGS‬و موارد دیگر را تجزیه و‬
‫تحلیل کنند‪.‬‬
‫‪ .GenoCAD‬یکی از اولین ابزارهای طراحی به کمک رایانه برای زیست‬

‫شناسی مصنوعی است که در طراحی وکتورهای بیانی انتقال ژن‪ ،‬شبکه‌های‬
‫مصنوعی ژنی و سایر ساختارهای مورد استفاده در مهندسی ژنتیک کاربرد دارد‪.‬‬
‫نرم افزار ‪ Clustal X‬می‌تواند با هم ردیف سازی توالی‌های ژن‪ ،‬میزان تشابه یا‬
‫تفاوت دو موجود را از نظر یک ناحیه ژنی نشان دهد‪ .‬عالوه بر این‪ ،‬اگر محقق‬
‫بخواهد ناحیه ژنی مناسب برای تکثیر ژن را پیدا کند‪ ،‬این نرم افزار بسیار سودمند‬
‫خواهد بود‪ .‬گاهی پژوهشگران نیاز دارند تا روابط بین گروهی از موجودات زنده‬
‫را به صورت درخت فیلوژنتیکی نشان دهند‪ .‬در این صورت نیز این نرم افزار می‬
‫تواند کمک کننده باشد‪.‬‬

سنجابی بیو

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

سنجابی بیو

Uploaded by

Copyright:

Available Formats

‫مقدمه‬

‫از آنجایی که داده‌های بیولوژیکی با سرعت بی سابقه‌ای تولید می‌شوند‪ ،‬مدیریت و‬

‫‪ .‬داده های بیوانفورماتیکی‬

‫ذخیره و بازیابی داده ها‬

‫برای اطمینان از در دسترس بودن و آزاد بودن داده‌های‪ ‬توالی‌یابی‪ ،‬مجالت علمی‬

‫پایگاه های داده‬

‫نرم افزارهای بیوانفورماتیک‬

‫نرم افزارهای بیوانفورماتیک از ابزارهای پیرو خط فرمان کوتاه‪ ،‬تا برنامه‌های‬

‫نرم افزارهای منبع باز‬

‫‪ .Bioconductor‬یک پروژه نرم افزاری توسعه یافته و رایگان برای تجزیه و‬

‫‪ .Biopython‬پروژه ‪ Biopython‬مجموعه‌ای از ابزارهای غیر تجاری‬

‫‪ .BioJS‬یک پروژه برای داده‌های بیوانفورماتیک در وب است‪ ،‬هدف آن توسعه‬

‫‪ .BioRuby‬مجموعه ای از کد روبی (یک زبان برنامه نویسی پیشرفته) است که‬

‫‪ .NET Bio‬یک کتابخانه بیوانفورماتیک و ژنومیک منبع باز است که برای‬

‫‪ .UGENE‬یک نرم افزار رایانه‌ای برای بیوانفورماتیک بوده که بر روی انواع‬

‫‪ .GenoCAD‬یکی از اولین ابزارهای طراحی به کمک رایانه برای زیست‬

You might also like