You are on page 1of 31

Biyoinformatik ve Biyolojideki

Uygulamaları
Biyoinformatik nedir?

• Günümüzde biyolojik veriler olağanüstü bir hızda artış gösterirken bu


verilerin kullanılabilir hale getirilerek işlenmesi ihtiyacı, bilgi teknolojisine
dayanan, çok geniş bir çalışma alanına sahip multidisipliner bir bilim dalı
olan biyoinformatiğin ortaya çıkışını sağlamıştır.

• Biyoinformatik; DNA, RNA ve protein gibi biyolojik makromoleküllerle


ilgili bilginin depolama, erişim, kullanım ve dağıtımı için bilgisayarın
kullanıldığı teknolojidir.

İstatistik
• Biyoinformatik biliminin
gelişimini son 30- 40 yılı aşkın
bir süredir bilgisayar bilimi ve Matematik Biyoinformatik
Bilgisayar
Bilimleri
moleküler biyolojide yaşanan
gelişmeler tetiklemiştir.
Biyoloji
Biyoinformatiğin tarihçesi

• Biyoinformatik için başlangıç kabul edilebilecek bazı çalışmalar 1951


yılında yapılmış olsa da “Biyoinformatik” terimi 1980’li yılların ortalarından
sonra kullanılmaya başlanmıştır.

• Temel moleküler ve genetik süreçlerin anlaşılmasında ve karmaşık


verilerin analizi ve yorumlanması için yeni yöntemler geliştirilmesinde en
etkin kurum olan “National Center for Biotechnology Information (NCBI)”
1988’de kurulmuştur.

• Biyoinformatik alanındaki en önemli projelerden biri olan İnsan Genom


Projesi (İGP) ise Ekim 1990 da başlamıştır.

• Gerçekleştirilen diğer genom projeleri ile 1000’den fazla organizmanın


gen dizileri elde edilmiştir. Böylece, farklı canlı türlerinin gen dizilimlerini
karşılaştıran çalışmalar da yapılmaya başlanmıştır.
Biyoinformatiğin amaçları
• Biyoinformatiğin hedefleri üç temel bölümden oluşmaktadır. İlk hedefi,
mevcut verilerin araştırmacıların ulaşabileceği ve yenilerini oluşturdukça da
yükleyebileceği şekilde düzenlenmesidir. Diğer bir ifadeyle veritabanı
oluşturmaktır.
• Veri bankalarında depolanan bilgiler bunların incelemesi yapılana kadar
kullanışsızdırlar. Bu yüzden biyoinformatiğin ikinci amacı bu verilerin
anlamlı duruma gelmesini sağlayan araçlar ve kaynaklar
geliştirmektir. Örneğin; aminoasit dizisi belirli bir proteinin, dizi özellikleri
belirlenmiş başka bir proteinle karşılaştırılmasında kullanılacak bir yazılım
geliştirilmesi.
• Biyoinformatiğin üçüncü amacı ise üretilen bu araçları kullanarak verileri
analiz etmek ve biyolojik olarak anlamlı bilgiler haline dönüştürmektir.
Biyoinformatik bu amaçla biyoistatistikten faydalanmaktadır.
• Toplanan veriyi düzenleyerek analiz edilebilir hale getirmek, bilinen
faktörlere göre değerlendirmek, değişkenler arası ilişkileri belirlemek ve
modellemek, veri içindeki örüntüleri bulmak, sonuçları yorumlamak ve
genelleştirmek için biyoistatistik yöntemler kullanılmaktadır.
Biyoinformatiğin alt çalışma alanları
Biyoinformatik çalışmalara bazı örnekler

• Genom projelerinden elde edilen verinin düzenlenmesi


• Hastalıklara ait genlerin keşfedilmesi ve toplumdaki sıklığının
belirlenmesi
• Hastalıkların altında yatan genetik temellerin araştırılması
• Bir DNA dizisinin hangi gene ve canlıya ait olduğunun bulunması
• Bir protein dizisinin hangi gene ve canlıya ait olduğunun bulunması
• Büyük ölçekli gen ifade analizleri
• Protein dizisinden 3 boyutlu yapı tahmini
• İlaç etkileşimlerinin araştırılması>Moleküler etkileşimler
• Yeni ilaçların keşfi (Bilgisayar destekli ilaç tasarımı)
• Karşılaştırmalı genomiks/proteomiks> Moleküler evrim, moleküler
filogenetik
Veritabanları

Literature

Nucleotide

Protein

Organism

Function

Structure
Veritabanlarında depolanan bilgi deneyler sonucunda elde
edilen verilerden gelmektedir

PubMed

Araştırmacılar deney Araştırmacılar verileri analiz Veriler dergilerde


yapar eder ve makale yazar yayımlanır

Biyoinformatik bilimciler bilgisayar bilimleriyle ilgilenen uzmanlarla birlikte


çalışarak veritabanı yapısını oluştururlar.
Moleküler biyolojide kullanılan veritabanları
Biyoinformatikte nükleotid dizi bilgilerinin organizasyonu ve depolanması
görevini üstlenmiş 3 ana kuruluş vardır.
• GenBank (Gen Bankası; ABD-Maryland)
• EMBL ( Avrupa Moleküler Biyoloji Laboratuarı; İngiltere-Hinxton)
• DDBJ ( DNA Japonya Veritabanı; Japonya-Mishima)

Protein dizi verileri ile ilgili başlıca hizmet sağlayanlar ise;


• GenBank
• EMBL
• PIR International
(Protein Identification Resource)
• Swiss-Prot’tur
NCBI üzerinden birçok veritabanına ulaşmak mümkündür. En
yaygın olarak kullanılan 3 veritabanı: PubMed, protein ve nükleotid
veritabanlarıdır.
Çalışma 1: DNA dizi bilgisine ulaşma
Bu çalışmada insandaki plasma retinol binding protein 4’ün DNA dizisine
ulaşmaya çalışacagız.

https://www.ncbi.nlm.nih.gov/ web sitesine giriş yapın


Veri tabanındaki her bir DNA dizisi, RNA dizisi ve protein dizisi için özgün
erişim numaraları vardır. Erişim numaraları harflerden ve numaralardan
oluşur ve başındaki harflerin özelliğine göre, hangi çeşit molekül olduğu
bilgisini de içinde barındırır.
Accession numarası
ve versiyonu

Referanslar ve ilişkili
bilgiler
FASTA tuşuna tıklayarak nükleotid dizilerini metin formatında
görüntüleyebilirsiniz.
İkili Hizalama
(BLAST)
• Bir gen ya da protein ile ilgili en temel sorulardan biri başka bir gen ya da
protein ile ilişkili olup olmadığıdır.

• Birbirleri ile ilişkili olan proteinler aynı zamanda aynı fonksiyona da sahip
olabiliriler.

• İlişkilendirme analizleri sekansları hizalayarak gerçekleştirilir.

• Protein sekans hizalamaları DNA sekans hizalamalarına kıyasla daha


bilgilendiricidir.

• Protein sekans kıyaslamaları 1 milyar yıl önce ortak soy paylaşmış


homolog sekansları belirleyebilirken DNA sekansları 600 milyon yıl
öncesine uzanabilmektedir.

• DNA sekans hizalamaları polimorfizmleri belirlemek ya da primerlerin


özgünlüğünü kontrol etmek için kullanılır.
Homoloji

• Eğer sekanslar ortak evrimsel bir soydan geliyorlarsa bu


sekanslar homologdur.

• Protein sekanslarının %25’i benzer ise homolog olarak


adlandırılırlar.

• DNA için %70 benzerlik gereklidir


İkili hizalama
• İkili hizalama iki sekans arasındaki benzerlik ya da aynılık yüzdesini
belirlemeye yardım eder. BLAST bu amaçla kullanılablecek bir
algoritmadır.

• BLAST (Basic Local Alignment Search Tool) bir sekans sorgusunun bir
veritabanındaki DNA veya protein sekansı ile kıyaslanmasını sağlar.

• BLAST algoritması hızlı, güvenli ve web üzerinden ulaşılabilirdir.

• BLAST uygulama alanlarından bazıları:

– Homoloji gösteren genlerin belirlenmesi


– Yeni genler veya proteinlerin tanımlanması
– Gen veya proteinlerin varyantlarının belirlenmesi
– Proteinlerin yapı ve fonksiyonlarının tanımlanması
BLAST çeşitleri

Program Girdi Veritabanı


blastn DNA DNA
blastp protein protein
blastx DNA protein
tblastn protein DNA
tblastx DNA DNA
Çalışma 2: Nükleotid BLAST (blastn)
Bu çalışmada elimizdeki bir primer dizisinin özgünlüğünü blastn aracılığıyla
kontrol edeceğiz.

Solanum tuberosum elongation factor 1 alpha (ef1α) geni için primer dizimiz:
5’ ATTGGAAACGGATATGCTCCA 3’
5’ TCCTTAACCTGAACG CCTGT CA 3’
BLAST arama sonuclarının karşılaştırılmasında önemli olan bazı
parametreler vardır. Bu parametreler ve bu parametreler arasındaki ilişki
incelenerek, sonuçların güvenirliliğini sorgulamak veya sorulan bilimsel
soruya göre, arama sonuçlarını seçmek mümkündür. BLAST arama
sonuçlarının karşılastırılmasında kullanılan değişkenler;

• Maksimum Skor (Maximum Score)


• Toplam Skor (Total Score)
• Sorgulama Kapsamı (Query Coverage)
• E-Değeri (E-Value)
• Maksimum Benzerlik (Maximum Identity)
BLAST sonucunda elde edilen parametrelerin hepsi sonuçların
değerlendirilmesi için kullanılmaktadır. Ancak bunlar arasındaki en önemli
parametre E-değeridir. E-değeri, yaptığımız hizalamaların şans eseri olma
ihtimalinin hesaplanması ile sonuçların istatistiksel önemini
değerlendirmemizi sağlayan bir parametredir. Bu durumda E-değerimiz 0 ‘a
eşit ise, sorguladığımız dizi, çıkan sonuç ile bire bir eşleşmis demektir ve bu
eslesmede şans faktörü 0 ‘dır.

Sorgulama kapsamı, sorgulatılan dizi ile diğer dizilerin uzunluk bazında


eşleşme oranını belirtmektedir.

Maksimum benzerlik ise, sorgulatılan dizi ile diğer diziler arasındaki dizi
benzerliğinin yüzde olarak oranını belirtmektedir.

Çıkan sonuçların değerlendirilmesinde, en düsük E-değerine sahip olan,


maksimum benzerliği ve sorgulama kapsamı en yüksek olan sonuçlara
öncelik verilir.

You might also like