İçeriğe atla

Biyoenformatik

Vikipedi, özgür ansiklopedi
İnsan X kromozomunun haritası

Biyobilişim veya Biyoenformatik, biyolojinin çeşitli dalları, ancak özellikle moleküler biyoloji ile bilgisayar teknolojisini ve bununla ilişkili veri işleme aygıtlarını bünyesinde barındıran disiplinlerarası bir bilim alanıdır. Bir diğer tanımla, karmaşık biyolojik verilerin derlenmesi ve analiz edilmesi bilimidir[1] Modern yaşam bilimlerinde üretilen büyük ölçekli verilerin artmasıyla birlikte biyoenformatik, genomik, proteomik, transkriptomik ve sistem biyolojisi araştırmalarının temel bileşeni hâline gelmiştir.[2] Biyoenformatik dünya genelinde bağımsız bir lisans, yüksek lisans ve doktora programı olarak okutulmaktadır. Türkiye’de biyoenformatik lisans düzeyinde verilen eğitim kapsamında, Kadir Has Üniversitesi’nde program 2013 yılında açılmış ve 2025 yılına kadar mezun vermeyi sürdürmüştür.[3] Ayrıca birçok üniversitede de biyoenformatik yüksek lisans programları bulunmakta olup, moleküler biyoloji, genetik ve bilgisayar bilimi temelli dersleri içermektedir.

1960'larda başlayan bilgisayar uygulamalarının biyolojide kullanılması girişimi, her iki alandaki teknolojik gelişime paralel olarak hızla ilerlemiş ve böylelikle ortaya çıkan Biyobilişim dalı bugün en popüler akademik ve endüstriyel sektörlerin başına geçmiştir. Biyoenformatik kavramı 1970’lerin sonunda moleküler dizilerin bilgisayarlarla karşılaştırılmaya başlanmasıyla doğmuştur. Paulien Hogeweg ve Ben Hesper, terimi ilk kez 1970'lerde biyolojik sistemlerin enformasyon süreçlerini tanımlamak için kullanmıştır.[4] 1980’lerde DNA dizileme teknolojilerinin gelişmesi, 1990’larda ise İnsan Genomu Projesi’nin başlaması biyoenformatiğe olan ihtiyacı hızla artırmıştır. Bilgisayarların moleküler biyolojide kullanımı üç boyutlu moleküler yapıların grafik temsili, moleküler dizilimler ve üç boyutlu moleküler yapı veritabanları oluşturulması ile başlamıştır. Kısa sürede çok yüksek miktarlarda veri üreten, endüstri düzeyinde gen ekspresyonu, protein-protein ilişkisi, biyolojik olarak aktif molekül araştırmaları, bakteri, maya, hayvan ve insan genom projeleri gibi biyolojik deneylerin doğurduğu talep sonucunda, bu alandaki bilişim uygulamaları neredeyse takip edilemez bir hızda gelişmiştir. Biyobilişim dalının ayrı bir (disiplinlerarası) bilim dalı olarak tanınması da 2000'li yıllarda gerçekleşmiştir.[5]

Bugün alan, hem akademik araştırmalarda hem de biyoteknoloji ve tıpta kritik bir rol oynamaktadır. 1960'larda başlayan bilgisayar uygulamalarının biyolojide kullanılması girişimi, her iki alandaki teknolojik gelişime paralel olarak hızla ilerlemiş ve böylelikle ortaya çıkan Biyoenformatik dalı bugün en popüler akademik ve endüstriyel sektörlerin başına geçmiştir.

Erken dönem biyoenformatik, deneysel olarak belirlenmiş, birbiriyle ilişkili bir protein sınıfına ait dizilerin hesaplamalı olarak hizalanmasıdır.

Biyoenformatiğin temel amaçları şunlardır:

  • Biyolojik verilerin standartlaştırılması ve depolanması
  • Genom, protein, RNA ve metabolik ağlar gibi sistemlerin analiz edilmesi
  • Moleküler diziler arasındaki ilişkilerin belirlenmesi
  • Gen ve protein fonksiyonlarının tahmin edilmesi
  • Klinik varyantların değerlendirilmesi
  • Büyük ölçekli omics verilerinin yorumlanması
  • Hesaplamalı modellerin geliştirilmesi
MUSCLE kullanılarak gerçekleştirilen bir çoklu dizi hizalamasında (MSA) karşılaştırılan dizilerdir. En soldaki sütunda yer alan her bir dizi adı farklı bit türlerine aittir; dizilerin kendisi ise ikinci sütunda gösterilmektedir.

Uygulama alanları

[değiştir | kaynağı değiştir]

Genom dizileme verilerinin hizalanması, varyant analizi, anotasyon ve karşılaştırmalı genomik çalışmaları biyoenformatiğin merkezinde yer alır.[6]

RNA-seq verilerinin işlenmesi, ifade seviyelerinin hesaplanması ve diferansiyel gen ekspresyonu analizleri biyoenformatiğin en yaygın uygulamalarındandır.

Protein dizisi analizi, üç boyutlu yapı tahmini, protein–protein etkileşim ağları ve kütle spektrometrisi verilerinin yorumlanması alanın önemli çalışma konularıdır.

Sistem Biyolojisi

[değiştir | kaynağı değiştir]

Metabolik ağ modelleri, hücresel süreçlerin dinamik simülasyonları ve çok katmanlı biyolojik sistemlerin entegrasyonu biyoenformatik yöntemlerle yapılır.[7]

Klinik ve Tıbbi Biyoenformatik

[değiştir | kaynağı değiştir]

Klinik varyant analizi, kanser genomikleri, farmakogenomik ve kişiselleştirilmiş tıp (precision medicine) çalışmaları için kritik role sahiptir.

Yapısal Biyoenformatik

[değiştir | kaynağı değiştir]

Proteinlerin üç boyutlu yapılarının modellenmesi ve enerji hesaplamaları moleküler modelleme araçlarıyla gerçekleştirilir.

Kullanılan araçlar ve veritabanları

[değiştir | kaynağı değiştir]

Biyoenformatikte kullanılan bazı temel araçlar ve platformlar şunlardır:

  • NCBI veri tabanları (GenBank, RefSeq, ClinVar, SRA)
  • BLAST: Dizi karşılaştırma
  • HISAT2, STAR: Hizalama
  • Hizalama çalışmasına ait bir örnek
    DESeq2, EdgeR: Transkriptomik analiz
  • UniProt: Protein veri tabanı
  • PDB: Protein yapıları
  • Ensembl: Genom anotasyon sistemi
  • Galaxy platformu: Birçok analiz aracını grafik arayüzle sunar

Veri analizi süreçleri

[değiştir | kaynağı değiştir]

Biyoenformatik analiz genellikle şu aşamalardan oluşur:

  1. Veri toplama
  2. Kalite kontrol
  3. Ön işleme
  4. Hizalama
  5. Varyant veya ifade analizi
  6. Fonksiyonel zenginleştirme
  7. Görselleştirme
  8. Yorumlama

Bu süreçler yüksek hesaplama kapasitesi gerektirdiğinden genellikle high-performance computing (HPC) altyapıları kullanılır.

Çalışma alanları

[değiştir | kaynağı değiştir]

Biyobilişim genel olarak biyolojik problemlerin çözümünde bilişim teknolojilerinin kullanılması olarak tanımlanabilir. En dar tanımı ile genomik sekansları destekleyen biyolojik veritabanlarının oluşturulması ve işletilmesi, en geniş tanımı ile de mevcut tüm bilgisayar uygulamalarının biyolojik problemlerin çözümünde kullanılması olarak anlaşılır.

Biyobilişim modern biyolojinin iki temel bilgi akışını kapsar:

  1. Genetik bilgi akışı: Bir organizmanın DNAsı incelenerek özelliklerinin belirlenmesinden, incelenen bu organizma türünün oluşturduğu toplulukların karakteristik özelliklerine kadar olan bilgi akışı. Elde edilen DNA bilgisi tekrar genetik havuzun tanımlanması için kullanılır.
  2. Deneysel bilgi akışı: Biyolojik olaylar gözlenerek elde edilen enformasyon, açıklayıcı matematiksel modeller ile tarif edilir, daha sonra bu modellerin doğruluğu yeni deneyler ile test edilir.

Son yirmi yılda temel biyolojik araştırmaların klinik tıp uygulamaları ve klinik tıp bilgi sistemleri üzerindeki etkisi daha da belirleyici olmuş ve bugün yeni kuşak epidemiyolojik, tanı, teşhiş ve tedavi amaçlı modüllerin ortaya çıkmasına yol açmıştır. Biyobilişim çalışmalar temel bilimsel araştırmalara yönelik görünmekle beraber önümüzdeki on yıl içinde klinik bilişim için vazgeçilmez olacaktır. Örneğin hastaların tıbbi kayıtlarında giderek artan bir sıklıkla DNA dizilim bilgileri yer almaya başlayacaktır. Bugün ABD'de bazı sigorta şirketleri, risk primleri belirlenirken mevcut genetik tarama test sonuçlarını talep edebilmektedir. Biyobilişim araştırmalar için geliştirilen algoritmaların çok yakında klinik bilişim sistemlerine entegre olması beklenmektedir.

Bu alanı kısaca tanımlamanın bir yolu da, Biyobilişim araçların kullanıldığı genel araştırma konularını özetlemek olabilir:

Bu tür üç boyutlu protein yapıları, biyoenformatik analizlerde sıkça incelenen yapılardır.

Metodolojik çalışmalar

[değiştir | kaynağı değiştir]
  1. DNA sıra ve dizilimi araştırmaları
  2. Protein sıra ve dizilimi araştırmaları
  3. Makromoleküler yapıların (DNA, RNA, protein) üç boyutlu yapı araştırmaları
  4. Küçük moleküllerin (potansiyel terapötik maddeler, aktif peptidler, ribozimler vs.) ligandlarıyla etkileşiminin araştırılması
  5. Heterojen biyolojik veritabanlarının entegrasyonu
  6. Biyolojik enformasyonun paylaşımının kolaylaştırılması
  7. Bilgisayar ile otomize edilmiş veri analizi ve iletimi
  8. Etkileşimde bulunan gen ürünleri için bilgi ağları oluşturulması
  9. Kimyasal reaksiyonlardan hücrelerarası iletişime kadar pek çok biyolojik faaliyet sürecinin matematiksel modellenmesi ve simülasyonu
  10. Büyük çaplı biyolojik deneylerden (GENOM projeleri gibi) çıkan sonuçların analizi

Biyolojik çalışmalar

[değiştir | kaynağı değiştir]
  1. Proteinlerin yapılarının ve fonksiyonlarının belirlenmesi
  2. Herhangi bir biyolojik fonksiyonu arttıran ya da engelleyen küçük moleküllerin tasarlanması
  3. Karmaşık genetik fonksiyon ya da regülasyon faaliyetlerinin tanımlanması
  4. Tıbbi ya da endüstriyel amaçlı yeni makromoleküller üretilmesi
  5. Genetik faktörlerin hastalık yatkınlığına etkilerinin ortaya çıkarılması
  1. ^ "Arşivlenmiş kopya" (PDF). 24 Eylül 2020 tarihinde kaynağından arşivlendi (PDF). Erişim tarihi: 1 Şubat 2020. 
  2. ^ "The origins of bioinformatics". Nature (İngilizce). 2008. doi:10.1038/nature07412. 
  3. ^ "Biyoenformatik ve Genetik". bologna.khas.edu.tr. Erişim tarihi: 2025-11-18. 
  4. ^ "The Roots of Bioinformatics in Theoretical Biology". Biological Theory (İngilizce). 2011. doi:10.1007/s13752-011-0003-9. 
  5. ^ Bayat, Ardeshir (2002-04-27). "Science, medicine, and the future: Bioinformatics". BMJ (Clinical research ed.). 324 (7344): 1018–1022. doi:10.1136/bmj.324.7344.1018. ISSN 1756-1833. PMC 1122955 $2. PMID 11976246. 
  6. ^ "Genomics: A Global Perspective". Nature Reviews Genetics (İngilizce). 2020. doi:10.1038/s41576-020-00272-w. 
  7. ^ "National Human Genome Research Institute Home | NHGRI". www.genome.gov. Erişim tarihi: 2025-11-18.