Professional Documents
Culture Documents
سنجابی بیو
سنجابی بیو
رشد سریع و توسعه فناوری رایانهای ،همراه با پیشرفتهای چشمگیر در درک ما از زیست
شناسی انسانی حاصل از پروژه ژنوم انسانی و سرمایه گذاریهای الهام گرفته از آن ،رشد
اخیر در بیوانفورماتیک را تسهیل کرده است .بیوانفورماتیک ،علوم کامپیوتر را با زیست
شناسی ادغام میکند تا دادههای مربوط به سیستمهای بیولوژیکی 0را ذخیره ،تجزیه و تحلیل
و به اشتراک بگذارد که اغلب این دادهها مربوط به DNA و توالی اسیدهای آمینه است.
بیوانفورماتیک چیست؟
بیوانفورماتیک ترکیبی از زیست شناسی و فناوری اطالعات است .اساساً،
بیوانفورماتیک علمی است که اخیراً توسعه یافته و از فناوری اطالعات برای
درک پدیده بیولوژیکی استفاده میکند .بیوانفورماتیک به طور گستردهای شامل
ابزارها و روشهای محاسباتی است که برای مدیریت ،تجزیه و تحلیل و ادراه
کردن دادههای حجیم بیولوژیکی استفاده میشود .بیوانفورماتیک همچنین ممکن
است به عنوان بخشی از زیست شناسی محاسباتی در نظر گرفته شود .زیست
شناسی محاسباتی با استفاده از تکنیکهای تحلیلی کمی در مدلسازی و حل
مشکالت در سیستمهای بیولوژیکی درگیر است .بیوانفورماتیک یک رویکرد
میان رشتهای است که به دانش پیشرفته علوم کامپیوتر ،ریاضیات و روشهای
آماری برای درک پدیدههای بیولوژیکی در سطح مولکولی نیاز دارد.
تاریخچه
پایههای بیوانفورماتیک در اوایل دهه 1960با استفاده از روشهای محاسباتی
برای تجزیه و تحلیل توالی پروتئین به ویژه ،مونتاژ توالیهای جدید ،پایگاه
دادههای توالی بیولوژیکی و مدلهای جایگزینی گذاشته شد .بعدا از آن ،تجزیه و
تحلیل DNAنیز به دلیل پیشرفت موازی روشهای زیست شناسی مولکولی (که
دستکاری آسانتر DNAو همچنین توالی آن را فراهم میکند) و همچنین پیشرفت
در علوم کامپیوتر و ظهور رایانههای کوچک (که قدرتمندتر بوده و دارای نرم
افزارهای جدیدتر و مناسبتر برای انجام کارهای بیوانفورماتیک بود) سادهتر شد.
اصطالح بیوانفورماتیک ،برای اولین بار در دهه 1990مطرح شد .در اصل،
این کار با مدیریت و تجزیه و تحلیل دادههای مربوط به توالی DNA ، RNAو
پروتئین بود.
همانطور که پیشتر بیان شد بیوانفورماتیک یک دانش نوین بین رشتهای است که
در آن با استفاده از علوم کامپیوتر ،ریاضی ،ژنتیک ،شیمی ،فیزیک ،آمار و
احتماالت در شاخه زیست شناسی مولکولی اهداف مختلفی دنبال میشود.
پیشرفتهای انجام شده در زیست شناسی و فناوریهای جدید در ذخیره و بازیابی
اطالعات زیستی موجب شده این دو علم به هم گره بخورند .در این راستا فرادرس
دورههای متعدد بیوانفورماتیکی را با همکاری مدرسین برجسته کشوری تهیه و
تدوین کرده است.
این فرادرس توسط آقای دکتر فرشید شیرافکن دانشجوی دکتری تخصصی
بیوانفورماتیک دانشگاه تهران (ایشان از مدرسین نمونه در زمینه ارائه و آموزش
دروس دانشگاهی انتخاب Pشده اند) تدریس شده است .این دوره شامل ۹فصل تحت
عناوین مروری بر زیست مولکولی ،مقدمات بیوانفورماتیک (
،)Bioinformaticsپایگاه دادههای زیستی ،انطباق دوتایی توالیها ،جستجوی
تشابه در پایگاه دادهها ،انطباق چندگانه توالیها – HMM – PSSM ،پیشگویی
دمین و موتیف ،فیلوژنتیک ( )Phylogeneticsو آموزش برنامه نویسی Rتهیه
و تدوین شده است و برای تمامی دانشجویان رشتههای بیوانفورماتیک،
زیستشناسی ،مهندسی کامپیوتر و تمام عالقمندان به این حوزه پرکاربرد مناسب
است
به عنوان مثال ،بسته به نوع سلول ،زمان جمع آوری اطالعات (در طول چرخه
سلولی یا تغییرات روزانه ،فصلی یا ساالنه) ،مرحله رشد و شرایط مختلف محیطی
ممکن است دادهها در نوسان باشند .متاژنومیکس و متاپروتومیکس این اندازه
گیریها را به شرح جامعی از ارگانیسمهای موجود در یک نمونه گرفته شده از
محیط مانند یک سطل آب اقیانوس یا یک نمونه خاک گسترش میدهد.
بیوانفورماتیک با شتاب زیاد فرآیندهای تولید داده در زیست شناسی را به جلو
میبرد .روشهای تعیین توالی ژنوم شاید بارزترین اثرات آن را نشان دهند .در
سال 1999بایگانی توالی اسید نوکلئیک حاوی 3/5میلیارد نوکلئوتید بود که کمی
بیشتر از طول یک ژنوم انسانی است .یک دهه بعد این اطالعات حاوی بیش از
283میلیارد نوکلئوتید یعنی طولی به اندازه 95عدد ژنوم انسانی بودند.
صفحات اصلی همکار PDBحاوی پیوندهایی به خود فایلهای داده و مطالب گویا
و آموزشی (از جمله اخبار) ،تسهیالت برای ذخیره مطالب جدید و نرم افزار
جستجوی تخصصی برای بازیابی ساختارها هستند .بازیابی اطالعات از بایگانی
دادهها از ابزارهای استاندارد برای شناسایی داده توسط کلمه کلیدی استفاده میکند.
الگوریتم های دیگر ،بانک های داده را جستجو می کنند تا شباهتهای موردی
دادهها را تشخیص دهند .به عنوان مثال ،یک مسئله قابل کاوش در یک پایگاه
توالی داده ،استفاده از توالی ژنی یا پروتئینی مورد نظر به منظور شناسایی
موجوداتی با توالی مشابه است.
اهداف بیوانفورماتیک
توسعه الگوریتمهای کارآمد برای اندازه گیری تشابه توالی ،هدف مهم
بیوانفورماتیک است .الگوریتم ،Needleman – Wunschکه مبتنی بر
برنامه نویسی پویا است ،یافتن چینش بهینه جفت توالیها را تضمین میکند .این
الگوریتم اساسا ً یک مسئله بزرگ (دنباله کامل) را به مجموعهای از مسائل
کوچکتر (بخشهای توالی کوتاه) تقسیم میکند و از راه حلهای مسئلههای
کوچکتر برای راه حل مسئله بزرگ استفاده میکند .شباهت در توالیها در یک
ماتریکس امتیاز بندی میشوند و الگوریتم امکان تشخیص شکافها در «تراز
بندی توالیها» ( )Sequence Alignmentرا فراهم میکند .اگرچه الگوریتم
Needleman – Wunschموثر است ،اما به عنوان کاوش یک پایگاه داده
توالییابی بزرگ بسیار کند است.
بنابراین ،توجه زیادی به یافتن الگوریتمهای بازیابی سریع اطالعات شده است که
میتوانند با مقادیر زیادی از دادهها در بایگانیها سر و کار داشته باشند .که برنامه
«بالست» ( )BLASTیا Basic Local Alignment Search Toolیکی
از آنها است .یک بخش پیشرفته از ،BLASTشناخته شده به عنوان موقعیت
خاص تکرار شونده یا PSIBLASTکه برگرفته از position-specific
iterated BLASTاست ،باعث استفاده از الگوهای حفاظتشده در توالیهای
مرتبط میشود و ترکیبی از سرعت باالی BLASTهمراه حساسیت بسیار باال
برای یافتن توالیهای مرتبط است.
هدف دیگر بیوانفورماتیک ،گسترش دادههای تجربی توسط پیشبینیها است .یک
هدف اساسی از زیست شناسی محاسباتی ،پیش بینی ساختار پروتئین از یک توالی
اسید آمینه است .پیشرفت در توسعه روشهای پیش بینی «حاالت قرارگیری
فضایی» ( )Foldingپروتئین توسط برنامههای ارزیابی حیاتی ،پیش بینی
ساختار ( )CASPطی دو سال اندازهگیری میشود که شامل آزمونهای کور
روشهای پیش بینی ساختار است .از بیوانفورماتیک برای پیش بینی تعامالت بین
پروتئینها با توجه به ساختارهای فردی آمینواسیدها نیز استفاده میشود .این نوع
پژوهش به عنوان داکینگ پروتئینها شناخته میشود .مجموعههای پروتئین –
پروتئین مکمل بودن خوبی با هم در شکل سطحی و قطبیت دارند و عمدتا توسط
فعل و انفعاالت ضعیف مانند پیوندهای سطح آبگریز ،پیوندهای هیدروژنی و
نیروهای وان در والس تثبیت میشوند.
برنامههای نرم افزاری رایانهای این تعامالت را برای پیش بینی رابطه فضایی
مطلوب بین زیرواحدهای متصل به هم شبیهسازی میکند .یک چالشی که میتواند
کاربردهای درمانی مهمی داشته باشد ،طراحی آنتی بادیهایی است که با میل زیاد
به پروتئین هدف متصل شوند .در ابتدا ،بسیاری از تحقیقات Pبیوانفورماتیک،
تمرکز نسبتا ً کمی بر الگوریتمهایی برای تجزیه و تحلیل انواع خاصی از دادهها،
مانند توالی ژنها یا ساختارهای پروتئینی داشته است .با این حال ،اکنون ،اهداف
بیوانفورماتیکی یکپارچه هستند و هدف آنها این است که دریابند چگونه میتوان
از ترکیب انواع مختلف دادهها برای درک بهتر پدیدههای طبیعی ،از جمله
ارگانیسمها و بیماریها استفاده کرد.
.BioJavaیک پروژه نرم افزاری است که برای ارائه ابزارهای جاوا برای
پردازش دادههای بیولوژیکی اختصاص داده شده است .این ابزار مجموعهای از
توابع کتابخانهای است که در زبان برنامه نویسی جاوا برای دستکاری توالیها،
ساختارهای پروتئینی ،سیستم توزیع حاشیه نویسی ( ،)DASدسترسی به
،AceDBبرنامه نویسی پویا و سیستمهای آماری ساده نوشته شده است.
.EMBOSSیک نرم افزار تجزیه و تحلیل رایگان بوده که برای نیازهای جامعه
کاربران زیست شناسی مولکولی و بیوانفورماتیک تهیه شده است .این نرم افزار به
طور خودکار با دادهها در قالبهای Pمختلف کنار میآید و حتی امکان بازیابی
شفاف دادههای توالی را از وب فراهم میکند.
.Orangeیک مجموعه ابزار تجسم دادهها ،یادگیری ماشین و داده کاوی است.
این نرم افزار دارای یک برنامه نویسی بصری front-endبرای تجزیه و
تحلیل سریع دادههای کیفی و تجسم دادههای تعاملی است.