BIOINFORMATIKA
Bioinformatika
merupakan ilmu terapan yang lahir dari perkembangan teknologi informasi
dibidang molekular. Pembahasan dibidang bioinformatik ini tidak terlepas dari
perkembangan biologi molekular modern, salah satunya peningkatan pemahaman
manusia dalam bidang genomic yang terdapat dalam molekul DNA. Kemampuan untuk
memahami dan memanipulasi kode genetik DNA ini sangat didukung oleh teknologi
informasi melalui perkembangan hardware dan soffware. Baik pihak pabrikan
sofware dan harware maupun pihak ketiga dalam produksi perangkat lunak. Salah
satu contohnya dapat dilihat pada upaya Celera Genomics, perusahaan
bioteknologi Amerika Serikat yang melakukan pembacaan sekuen genom manusia yang
secara maksimal memanfaatkan teknologi informasi sehingga bisa melakukan
pekerjaannya dalam waktu yang singkat (hanya beberapa tahun). Perkembangan
teknologi DNA rekombinan memainkan peranan penting dalam lahirnya
bioinformatika. Teknologi DNA rekombinan memunculkan suatu pengetahuan baru
dalam rekayasa genetika organisme yang dikenala bioteknologi. Perkembangan
bioteknologi dari bioteknologi tradisional ke bioteknologi modren salah satunya
ditandainya dengan kemampuan manusia dalam melakukan analisis DNA organisme,
sekuensing DNA dan manipulasi DNA. Sekuensing DNA satu organisme, misalnya
suatu virus memiliki kurang lebih 5.000 nukleotida atau molekul DNA atau
sekitar 11 gen, yang telah berhasil dibaca secara menyeluruh pada tahun 1977.
Kemudia Sekuen seluruh DNA manusia terdiri dari 3 milyar nukleotida yang menyusun
100.000 gen dapat dipetakan dalam waktu 3 tahun, walaupun semua ini belum
terlalu lengkap. Saat ini terdapat milyaran data nukleotida yang tersimpan
dalam database DNA, GenBank di AS yang didirikan tahun 1982. Bioinformatika
ialah ilmu yang mempelajari penerapan teknik komputasi untuk mengelola dan menganalisis informasi hayati. Bidang
ini mencakup penerapan metode-metode matematika, statistika, dan informatika untuk memecahkan masalah-masalah biologi, terutama yang
terkait dengan penggunaan sekuens DNA dan asam
amino. Contoh topik utama bidang ini
meliputi pangkalan
data untuk mengelola informasi hayati,
penyejajaran sekuens (sequence alignment), prediksi struktur untuk
meramalkan struktur protein atau pun struktur sekunder RNA, analisis filogenetik, dan analisis ekspresi gen.
Sejarah
Istilah bioinformatics mulai dikemukakan pada pertengahan era 1980-an
untuk mengacu pada penerapan komputer dalam biologi. Namun, penerapan
bidang-bidang dalam bioinformatika (seperti pembuatan basis data dan
pengembangan algoritma untuk analisis sekuens biologis) sudah dilakukan sejak
tahun 1960-an. Kemajuan teknik biologi molekular dalam mengungkap sekuens
biologis dari protein (sejak awal 1950-an) dan asam nukleat (sejak 1960-an)
mengawali perkembangan basis data dan teknik analisis sekuens biologis. Basis
data sekuens protein mulai dikembangkan pada tahun 1960-an di Amerika Serikat,
sementara basis data sekuens DNA dikembangkan pada akhir 1970-an di Amerika
Serikat dan Jerman (pada European Molecular Biology Laboratory, Laboratorium
Biologi Molekular Eropa). Penemuan teknik sekuensing DNA yang lebih cepat pada
pertengahan 1970-an menjadi landasan terjadinya ledakan jumlah sekuens DNA yang
berhasil diungkapkan pada 1980-an dan 1990-an, menjadi salah satu pembuka jalan
bagi proyek-proyek pengungkapan genom, meningkatkan kebutuhan akan pengelolaan
dan analisis sekuens, dan pada akhirnya menyebabkan lahirnya bioinformatika.
Perkembangan Internet juga mendukung berkembangnya bioinformatika. Basis data
bioinformatika yang terhubung melalui Internet memudahkan ilmuwan mengumpulkan
hasil sekuensing ke dalam basis data tersebut maupun memperoleh sekuens
biologis sebagai bahan analisis. Selain itu, penyebaran program-program
aplikasi bioinformatika melalui Internet memudahkan ilmuwan mengakses
program-program tersebut dan kemudian memudahkan pengembangannya.
Penerapan utama bioinformatika
Basis data sekuens biologis
Sesuai dengan jenis informasi biologis yang disimpannya, basis data
sekuens biologis dapat berupa basis data primer untuk menyimpan sekuens primer
asam nukleat maupun protein, basis data sekunder untuk menyimpan motif sekuens
protein, dan basis data struktur untuk menyimpan data struktur protein maupun
asam nukleat. Basis data utama untuk sekuens asam nukleat saat ini adalah
GenBank (Amerika Serikat), EMBL (Eropa), dan DDBJ(Inggris) (DNA Data Bank of
Japan, Jepang). Ketiga basis data tersebut bekerja sama dan bertukar data
secara harian untuk menjaga keluasan cakupan masing-masing basis data. Sumber
utama data sekuens asam nukleat adalah submisi langsung dari periset
individual, proyek sekuensing genom, dan pendaftaran paten. Selain berisi
sekuens asam nukleat, entri dalam basis data sekuens asam nukleat umumnya
mengandung informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme
sumber asam nukleat tersebut, dan pustaka yang berkaitan dengan sekuens asam nukleat
tersebut. Sementara itu, contoh beberapa basis data penting yang menyimpan
sekuens primer protein adalah PIR (Protein Information Resource, Amerika
Serikat), Swiss-Prot (Eropa), dan TrEMBL (Eropa). Ketiga basis data tersebut
telah digabungkan dalam UniProt (yang didanai terutama oleh Amerika Serikat).
Entri dalam UniProt mengandung informasi tentang sekuens protein, nama
organisme sumber protein, pustaka yang berkaitan, dan komentar yang umumnya
berisi penjelasan mengenai fungsi protein tersebut. BLAST (Basic Local
Alignment Search Tool) merupakan perkakas bioinformatika yang berkaitan erat
dengan penggunaan basis data sekuens biologis. Penelusuran BLAST (BLAST search)
pada basis data sekuens memungkinkan ilmuwan untuk mencari sekuens asam nukleat
maupun protein yang mirip dengan sekuens tertentu yang dimilikinya. Hal ini
berguna misalnya untuk menemukan gen sejenis pada beberapa organisme atau untuk
memeriksa keabsahan hasil sekuensing maupun untuk memeriksa fungsi gen hasil
sekuensing. Algoritma yang mendasari kerja BLAST adalah penyejajaran sekuens.
PDB (Protein Data Bank, Bank Data Protein) adalah basis data tunggal yang
menyimpan model struktural tiga dimensi protein dan asam nukleat hasil
penentuan eksperimental (dengan kristalografi sinar-X, spektroskopi NMR dan
mikroskopi elektron). PDB menyimpan data struktur sebagai koordinat tiga
dimensi yang menggambarkan posisi atom-atom dalam protein ataupun asam nukleat.
Penyejajaran sekuens
Penyejajaran sekuens (sequence alignment) adalah proses penyusunan/pengaturan
dua atau lebih sekuens sehingga persamaan sekuens-sekuens tersebut tampak
nyata. Hasil dari proses tersebut juga disebut sebagai sequence alignment atau
alignment saja. Baris sekuens dalam suatu alignment diberi sisipan (umumnya
dengan tanda "–") sedemikian rupa sehingga kolom-kolomnya memuat
karakter yang identik atau sama di antara sekuens-sekuens tersebut. Berikut
adalah contoh alignment DNA dari dua sekuens pendek DNA yang berbeda,
"ccatcaac" dan "caatgggcaac" (tanda "|"
menunjukkan kecocokan atau match di antara kedua sekuens).
ccat---caac
| || ||||
caatgggcaac
Sequence alignment merupakan metode dasar dalam analisis sekuens.
Metode ini digunakan untuk mempelajari evolusi sekuens-sekuens dari leluhur
yang sama (common ancestor). Ketidakcocokan (mismatch) dalam alignment
diasosiasikan dengan proses mutasi, sedangkan kesenjangan (gap, tanda
"–") diasosiasikan dengan proses insersi atau delesi. Sequence
alignment memberikan hipotesis atas proses evolusi yang terjadi dalam sekuens-sekuens
tersebut. Misalnya, kedua sekuens dalam contoh alignment di atas bisa jadi
berevolusi dari sekuens yang sama "ccatgggcaac". Dalam kaitannya
dengan hal ini, alignment juga dapat menunjukkan posisi-posisi yang
dipertahankan (conserved) selama evolusi dalam sekuens-sekuens protein, yang
menunjukkan bahwa posisi-posisi tersebut bisa jadi penting bagi struktur atau
fungsi protein tersebut. Selain itu, sequence alignment juga digunakan untuk
mencari sekuens yang mirip atau sama dalam basis data sekuens. BLAST adalah
salah satu metode alignment yang sering digunakan dalam penelusuran basis data
sekuens. BLAST menggunakan algoritma heuristik dalam penyusunan alignment.
Prediksi struktur protein
Secara kimia/fisika, bentuk struktur protein diungkap dengan
kristalografi sinar-X ataupun spektroskopi NMR, namun kedua metode tersebut
sangat memakan waktu dan relatif mahal. Sementara itu, metode sekuensing
protein relatif lebih mudah mengungkapkan sekuens asam amino protein. Prediksi
struktur protein berusaha meramalkan struktur tiga dimensi protein berdasarkan
sekuens asam aminonya (dengan kata lain, meramalkan struktur tersier dan
struktur sekunder berdasarkan struktur primer protein). Secara umum, metode
prediksi struktur protein yang ada saat ini dapat dikategorikan ke dalam dua
kelompok, yaitu metode pemodelan protein komparatif dan metode pemodelan de
novo. Pemodelan protein komparatif (comparative protein modelling) meramalkan
struktur suatu protein berdasarkan struktur protein lain yang sudah diketahui.
Salah satu penerapan metode ini adalah pemodelan homologi (homology modelling),
yaitu prediksi struktur tersier protein berdasarkan kesamaan struktur primer
protein. Pemodelan homologi didasarkan pada teori bahwa dua protein yang
homolog memiliki struktur yang sangat mirip satu sama lain. Pada metode ini,
struktur suatu protein (disebut protein target) ditentukan berdasarkan struktur
protein lain (protein templat) yang sudah diketahui dan memiliki kemiripan
sekuens dengan protein target tersebut. Selain itu, penerapan lain pemodelan
komparatif adalah protein threading yang didasarkan pada kemiripan struktur
tanpa kemiripan sekuens primer. Latar belakang protein threading adalah bahwa
struktur protein lebih dikonservasi daripada sekuens protein selama evolusi;
daerah-daerah yang penting bagi fungsi protein dipertahankan strukturnya. Pada
pendekatan ini, struktur yang paling kompatibel untuk suatu sekuens asam amino
dipilih dari semua jenis struktur tiga dimensi protein yang ada. Metode-metode
yang tergolong dalam protein threading berusaha menentukan tingkat
kompatibilitas tersebut.
Analisis ekspresi gen
Ekspresi gen dapat ditentukan dengan mengukur kadar mRNA dengan
berbagai macam teknik (misalnya dengan microarray ataupun Serial Analysis of
Gene Expression. Teknik-teknik tersebut umumnya diterapkan pada analisis
ekspresi gen skala besar yang mengukur ekspresi banyak gen (bahkan genom) dan
menghasilkan data skala besar. Metode-metode penggalian data (data mining)
diterapkan pada data tersebut untuk memperoleh pola-pola informatif. Sebagai
contoh, metode-metode komparasi digunakan untuk membandingkan ekspresi di
antara gen-gen, sementara metode-metode klastering (clustering) digunakan untuk
mempartisi data tersebut berdasarkan kesamaan ekspresi gen.
sumber : wikipedia
Abdul Majid Rija/50411020/4IA24
No comments:
Post a Comment
silahkan komentar disini