BIOINFORMATIKA
1.
Pengertian
bioinformatika
Bioinformatika
berasal dari kata bioinformatics (inggris) yakni ilmu yang mempelajari penerapan teknik komputasional untuk mengelola
dan menganalisis informasi biologis. Bionformatika sendiri merupakan
ilmu yang lahiir dari perkembangan biologi molecular modern yang merupakan
salah satu bentuk peningkatan pemahaman manusia dalam bidang genomic yang
terdapat dalam molekul DNA. Bidang bioinformatika mencakup penerapan metode-metode
matematika, statistika, dan informatika untuk memecahkan masalah biologis,
penyejajaran sekuens, prediksi struktur protein, analisis filogenetik, analisis
ekspresi gen, sampai struktur sekunder RNA.
2.
Sejarah
perkembangan bioinformatika
Istilah
bioinformatics mulai dikemukakan pada pertengahan era 1980-an untuk mengacu pada penerapan komputer dalam biologi. Namun demikian,
penerapan bidang-bidang dalam bioinformatika (seperti pembuatan basis data dan
pengembangan algoritma untuk analisis sekuens biologis) sudah
dilakukan sejak tahun 1960-an.
Kemajuan
teknik biologi molekular dalam mengungkap sekuens
biologis dari protein (sejak awal 1950- an) dan asam nukleat (sejak 1960-an) mengawali
perkembangan basis data dan teknik analisis sekuens biologis. Basis data
sekuens protein mulai dikembangkan pada tahun 1960-an di Amerika Serikat, sementara basis data
sekuens DNA dikembangkan pada akhir 1970-an di Amerika Serikat dan Jerman (pada
European Molecular Biology
Laboratory, Laboratorium Biologi Molekular Eropa). Penemuan teknik sekuensing DNA yang lebih cepat pada
pertengahan 1970-an menjadi landasan terjadinya ledakan jumlah sekuens DNA yang
berhasil diungkapkan pada 1980-an dan 1990-an, menjadi salah satu pembuka
jalan bagi proyek-proyek pengungkapan genom, meningkatkan kebutuhan akan
pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan lahirnya
bioinformatika.
3.
Bidang-bidang
terkait bioinformatika
- Biophysics
Biologi
molekul sendiri merupakan pengembangan yang lahir dari biophysics. Biophysics
adalah sebuah bidang yang mengaplikasikan teknik- teknik dari ilmu Fisika untuk
memahami struktur dan fungsi biologi (British Biophysical Society). Sesuai
dengan definisi tersebut, bidang ini merupakan suatu bidang yang luas. Namun
secara langsung disiplin ilmu ini terkait dengan Bioinformatika karena
penggunaan teknik-teknik dari ilmu Fisika untuk memahami struktur.
- Computational
Biology
Computational biology merupakan bagian dari Bioinformatika (dalam arti yang
paling luas) yang paling dekat dengan bidang Biologi umum klasik. Fokus dari
computational biology adalah gerak evolusi, populasi, dan biologi teoritis
daripada biomedis dalam molekul dan sel. Tak dapat dielakkan bahwa Biologi
Molekul cukup penting dalam computational biology, namun itu bukanlah inti dari
disiplin ilmu ini. Pada penerapan computational biology, model-model statistika
untuk fenomena biologi lebih disukai dipakai dibandingkan dengan model
sebenarnya. Dalam beberapa hal cara tersebut cukup baik mengingat pada kasus
tertentu eksperimen langsung pada fenomena biologi cukup sulit. Tidak semua
dari computational biology merupakan Bioinformatika, seperti contohnya Model
Matematika bukan merupakan Bioinformatika, bahkan meskipun dikaitkan dengan
masalah biologi.
- Medical
Informatics Medical informatics lebih memperhatikan struktur dan algoritma
untuk pengolahan data medis, dibandingkan dengan data itu sendiri. Disiplin
ilmu ini, untuk alasan praktis, kemungkinan besar berkaitan dengan data-data
yang didapatkan pada level biologi yang lebih “rumit” yaitu informasi dari
sistem-sistem superselular, tepat pada level populasi di mana sebagian besar
dari Bioinformatika lebih memperhatikan informasi dari sistem dan struktur
biomolekul dan selular.
- Cheminformatics
Cheminformatics
adalah kombinasi dari sintesis kimia, penyaringan biologis, dan pendekatan
data-mining yang digunakan untuk penemuan dan pengembangan obat (Cambridge
Healthech Institute’s Sixth Annual Cheminformatics conference). Pengertian
disiplin ilmu yang disebutkan di atas lebih merupakan identifikasi dari salah
satu aktivitas yang paling populer dibandingkan dengan berbagai bidang studi
yang mungkin ada di bawah bidang ini. Salah satu contoh penemuan obat yang
paling sukses sepanjang sejarah adalah penisilin, dapat menggambarkan cara
untuk menemukan dan mengembangkan obat-obatan hingga sekarang meskipun terlihat
aneh. Cara untuk menemukan dan mengembangkan obat adalah hasil dari kesempatan,
observasi, dan banyak proses kimia yang intensif dan lambat. Sampai beberapa
waktu yang lalu, desain obat dianggap harus selalu menggunakan kerja yang
intensif, proses uji dan gagal (trial-error process). Ruang lingkup
pembelajaran dari cheminformatics ini sangat luas. Contoh bidang minatnya antara
lain: Synthesis Planning, Reaction and Structure Retrieval, 3-D Structure
Retrieval, Modelling, Computational Chemistry, Visualisation Tools and
Utilities.
- Genomics
Genomics
adalah bidang ilmu yang ada sebelum selesainya sekuen genom, kecuali dalam bentuk
yang paling kasar. Genomics adalah setiap usaha untuk menganalisa atau
membandingkan seluruh komplemen genetik dari satu spesies atau lebih. Secara
logis tentu saja mungkin untuk membandingkan genom-genom dengan membandingkan
kurang lebih suatu himpunan bagian dari gen di dalam genom.
- Proteomics
Istilah
proteomics pertama kali digunakan untuk menggambarkan himpunan dari
protein-protein yang tersusun (encoded) oleh genom. Ilmu yang mempelajari
proteome, yang disebut proteomics, pada saat ini tidak hanya memperhatikan
semua protein di dalam sel yang diberikan, tetapi juga himpunan dari semua
bentuk isoform dan modifikasi dari semua protein, interaksi diantaranya,
deskripsi struktural dari protein-protein dan kompleks-kompleks orde tingkat
tinggi dari protein. Mengkarakterisasi sebanyak puluhan ribu protein-protein
yang dinyatakan dalam sebuah tipe sel yang diberikan pada waktu tertentu apakah
untuk mengukur berat molekul atau nilai-nilai isoelektrik protein-protein
tersebut melibatkan tempat penyimpanan dan perbandingan dari data yang
memiliki jumlah yang sangat besar, tak terhindarkan lagi akan memerlukan
Bioinformatika.
- Pharmacogenomics
Pharmacogenomics
adalah aplikasi dari pendekatan genomik dan teknologi pada identifikasi dari
target-target obat. Contohnya meliputi menjaring semua genom untuk penerima
yang potensial dengan menggunakan cara Bioinformatika, atau dengan menyelidiki
bentuk pola dari ekspresi gen di dalam baik patogen maupun induk selama
terjadinya infeksi, atau maupun dengan memeriksa karakteristik pola-pola
ekspresi yang ditemukan dalam tumor atau contoh dari pasien untuk kepentingan
diagnosa (kemungkinan untuk mengejar target potensial terapi kanker).
- Pharmacogenetics
Tiap individu mempunyai respon yang berbeda-beda terhadap berbagai pengaruh
obat; sebagian ada yang positif, sebagian ada yang sedikit perubahan yang
tampak pada kondisi mereka dan ada juga yang mendapatkan efek samping atau
reaksi alergi. Sebagian dari reaksi-reaksi ini diketahui mempunyai dasar genetik.
Pharmacogenetics adalah bagian dari pharmacogenomics yang menggunakan metode
genomik/Bioinformatika untuk mengidentifikasi hubungan-hubungan genomik,
contohnya SNP (Single Nucleotide Polymorphisms), karakteristik dari profil
respons pasien tertentu dan menggunakan informasi-informasi tersebut untuk
memberitahu administrasi dan pengembangan terapi pengobatan. 4.
4.
Penerapan
utama bioinformatika
- Basis
data sekuens biologis Sesuai dengan jenis informasi biologis yang disimpannya, basis data sekuens biologis dapat berupa
basis data primer untuk menyimpan sekuens primer asam nukleat maupun protein, basis data sekunder untuk
menyimpan motif sekuens protein, dan basis data struktur untuk menyimpan data
struktur protein maupun asam nukleat. Basis data utama untuk sekuens asam
nukleat saat ini adalah GenBank (Amerika
Serikat), EMBL (Eropa), dan DDBJ(Inggris)
(DNA Data Bank of Japan, Jepang). Ketiga basis
data tersebut bekerja sama dan bertukar data secara harian untuk menjaga
keluasan cakupan masing-masing basis data. Sumber utama data sekuens asam
nukleat adalah submisi langsung dari periset individual, proyek sekuensing genom, dan pendaftaran paten. Selain berisi sekuens asam
nukleat, entri dalam basis data sekuens asam nukleat umumnya mengandung
informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme sumber asam nukleat tersebut, dan
pustaka yang berkaitan dengan sekuens asam nukleat tersebut. Sementara itu,
contoh beberapa basis data penting yang menyimpan sekuens primer protein adalah PIR (Protein Information Resource, Amerika
Serikat), Swiss-Prot (Eropa), dan TrEMBL
(Eropa). Ketiga basis data tersebut telah digabungkan dalam UniProt (yang didanai terutama oleh Amerika
Serikat). Entri dalam UniProt mengandung informasi tentang sekuens protein,
nama organisme sumber protein, pustaka yang berkaitan, dan komentar yang
umumnya berisi penjelasan mengenai fungsi protein tersebut. BLAST (Basic Local Alignment Search Tool)
merupakan perkakas bioinformatika yang berkaitan erat dengan penggunaan basis
data sekuens biologis. Penelusuran BLAST (BLAST search) pada basis data sekuens
memungkinkan ilmuwan untuk mencari sekuens asam nukleat maupun protein yang
mirip dengan sekuens tertentu yang dimilikinya. Hal ini berguna misalnya untuk
menemukan gen sejenis pada beberapa organisme atau untuk memeriksa keabsahan
hasil sekuensing maupun untuk memeriksa fungsi
gen hasil sekuensing. Algoritma yang
mendasari kerja BLAST adalah penyejajaran sekuens. PDB (Protein
Data Bank, Bank Data Protein) adalah basis data tunggal yang menyimpan model
struktural tiga dimensi protein dan asam nukleat hasil penentuan eksperimental
(dengan kristalografi sinar-X, spektroskopi NMR dan mikroskopi elektron).
PDB menyimpan data struktur sebagai koordinat tiga dimensi yang
menggambarkan posisi atom-atom dalam protein ataupun asam
nukleat.
- Penyejajaran
sekuens
Penyejajaran
sekuens (sequence alignment) adalah proses penyusunan/pengaturan dua atau lebih sekuens sehingga
persamaan sekuens-sekuens tersebut tampak nyata. Hasil dari proses tersebut
juga disebut sebagai sequence alignment atau alignment saja. Baris
sekuens dalam suatu alignment diberi sisipan (umumnya dengan tanda " –")
sedemikian rupa sehingga kolom-kolomnya memuat karakter yang identik atau sama
di antara sekuens-sekuens tersebut. Berikut adalah contoh alignment DNA dari
dua sekuens pendek DNA yang berbeda, "ccatcaac" dan
"caatgggcaac" (tanda "|" menunjukkan kecocokan atau match
di antara kedua sekuens).
c
c a t --- c a a c
|
| | | | | |
c
a a t gggca a c
Sequence
alignment merupakan metode dasar dalam analisis sekuens. Metode ini digunakan
untuk mempelajari evolusi sekuens-sekuens dari leluhur yang
sama (common ancestor). Ketidakcocokan (mismatch) dalam alignment diasosiasikan
dengan proses mutasi, sedangkan kesenjangan (gap, tanda " –")
diasosiasikan dengan proses insersi atau delesi. Sequence alignment
memberikan hipotesis atas proses evolusi yang terjadi dalam sekuens-sekuens
tersebut. Misalnya, kedua sekuens dalam contoh alignment di atas bisa jadi
berevolusi dari sekuens yang sama "ccatgggcaac". Dalam kaitannya
dengan hal ini, alignment juga dapat menunjukkan posisi-posisi yang
dipertahankan (conserved) selama evolusi dalam sekuens-sekuens protein, yang menunjukkan bahwa
posisi-posisi tersebut bisa jadi penting bagi struktur atau fungsi protein
tersebut. Selain itu, sequence alignment juga digunakan untuk mencari sekuens
yang mirip atau sama dalam basis data sekuens.
BLAST adalah salah satu metode alignment yang sering digunakan dalam
penelusuran basis data sekuens. BLAST menggunakan algoritma heuristik dalam penyusunan alignment.
Beberapa metode alignment lain yang merupakan pendahulu BLAST adalah metode
"Needleman-Wunsch" dan "Smith-Waterman". Metode
Needleman-Wunsch digunakan untuk menyusun alignment global di antara dua atau
lebih sekuens, yaitu alignment atas keseluruhan panjang sekuens tersebut.
Metode Smith-Waterman menghasilkan alignment lokal, yaitu alignment atas
bagian-bagian dalam sekuens. Kedua metode tersebut menerapkan pemrograman dinamik (dynamic
programming) dan hanya efektif untuk alignment dua sekuens (pairwise alignment)
Clustal adalah program bioinformatika untuk alignment multipel (multiple
alignment), yaitu alignment beberapa sekuens sekaligus. Dua varian utama
Clustal adalah ClustalW dan ClustalX. Metode lain yang dapat
diterapkan untuk alignment sekuens adalah metode yang berhubungan dengan Hidden
Markov Model ("Model Markov Tersembunyi", HMM). HMM merupakan model
statistika yang mulanya digunakan dalam ilmu komputer untuk mengenali pembicaraan
manusia (speech recognition). Selain digunakan untuk alignment, HMM juga
digunakan dalam metode-metode analisis sekuens lainnya, seperti prediksi daerah
pengkode protein dalam genom dan prediksi
struktur sekunder protein.
- Prediksi
struktur protein Secara kimia/fisika, bentuk struktur protein diungkap dengan kristalografi sinar- X ataupun spektroskopi NMR, namun
kedua metode tersebut sangat memakan waktu dan relatif mahal. Sementara itu,
metode sekuensing protein relatif lebih mudah
mengungkapkan sekuens asam amino protein. Prediksi struktur
protein berusaha meramalkan struktur tiga dimensi protein berdasarkan sekuens
asam aminonya (dengan kata lain, meramalkan struktur tersier dan struktur
sekunder berdasarkan struktur primer protein). Secara umum, metode prediksi
struktur protein yang ada saat ini dapat dikategorikan ke dalam dua kelompok,
yaitu metode pemodelan protein komparatif dan metode pemodelan de novo.
Pemodelan protein komparatif (comparative protein modelling) meramalkan
struktur suatu protein berdasarkan struktur protein lain yang sudah diketahui.
Salah satu penerapan metode ini adalah pemodelan homologi (homology modelling),
yaitu prediksi struktur tersier protein berdasarkan kesamaan struktur primer
protein. Pemodelan homologi didasarkan pada teori bahwa dua protein yang homolog memiliki
struktur yang sangat mirip satu sama lain. Pada metode ini, struktur suatu
protein (disebut protein target) ditentukan berdasarkan struktur protein lain
(protein templat) yang sudah diketahui dan memiliki kemiripan sekuens dengan
protein target tersebut. Selain itu, penerapan lain pemodelan komparatif adalah
protein threading yang didasarkan pada kemiripan struktur tanpa kemiripan
sekuens primer. Latar belakang protein threading adalah bahwa struktur protein
lebih dikonservasi daripada sekuens protein selama evolusi; daerah-daerah yang
penting bagi fungsi protein dipertahankan strukturnya. Pada pendekatan ini,
struktur yang paling kompatibel untuk suatu sekuens asam amino dipilih dari
semua jenis struktur tiga dimensi protein yang ada. Metode-metode yang
tergolong dalam protein threading berusaha menentukan tingkat kompatibilitas
tersebut. Dalam pendekatan de novo atau
ab initio, struktur protein ditentukan dari sekuens primernya tanpa
membandingkan dengan struktur protein lain. Terdapat banyak kemungkinan dalam
pendekatan ini, misalnya dengan menirukan proses pelipatan (folding) protein
dari sekuens primernya menjadi struktur tersiernya (misalnya dengan simulasi dinamika molekular),
atau dengan optimisasi global fungsi energi protein. Prosedur-prosedur ini
cenderung membutuhkan proses komputasi yang intens, sehingga saat ini hanya
digunakan dalam menentukan struktur protein-protein kecil. Beberapa usaha telah
dilakukan untuk mengatasi kekurangan sumber daya komputasi tersebut, misalnya
dengan superkomputer (misalnya superkomputer Blue Gene [1] dari IBM) atau komputasi terdistribusi (distributed
computing, misalnya proyek Folding@home) maupun komputasi grid.
- Analisis
ekspresi gen Ekspresi gen dapat
ditentukan dengan mengukur kadar mRNA dengan berbagai
macam teknik (misalnya dengan microarray ataupun Serial Analysis of Gene Expression
["Analisis Serial Ekspresi Gen", SAGE]). Teknik-teknik tersebut
umumnya diterapkan pada analisis ekspresi gen skala besar yang mengukur
ekspresi banyak gen (bahkan genom) dan menghasilkan data skala
besar. Metode-metode penggalian data (data mining) diterapkan pada data
tersebut untuk memperoleh pola-pola informatif. Sebagai contoh, metode-metode
komparasi digunakan untuk membandingkan ekspresi di antara gen-gen, sementara
metode-metode klastering (clustering) digunakan untuk mempartisi data tersebut
berdasarkan kesamaan ekspresi gen.
5.
Penerapan
pada bidang lainnya
- Bioinformatika
dalam bidang klinis Perananan Bioinformatika dalam bidang klinis ini sering
juga disebut sebagai informatika klinis (clinical informatics). Aplikasi dari
clinical informatics ini adalah berbentuk manajemen data-data klinis dari
pasien melalui Electrical Medical Record (EMR) yang dikembangkan oleh Clement
J. McDonald dari Indiana University School of Medicine pada tahun 1972.
McDonald pertama kali mengaplikasikan EMR pada 33 orang pasien penyakit gula
(diabetes). Sekarang EMR ini telah diaplikasikan pada berbagai penyakit. Data
yang disimpan meliputi data analisa diagnosa laboratorium, hasil konsultasi dan
saran, foto ronsen, ukuran detak jantung, dll. Dengan data ini dokter akan bisa
menentukan obat yang sesuai dengan kondisi pasien tertentu. Lebih jauh lagi,
dengan dibacanya genom manusia, akan memungkinkan untuk mengetahui penyakit
genetik seseorang, sehingga personal care terhadap pasien menjadi lebih akurat.
Sampai saat ini telah diketahui beberapa gen yang berperan dalam penyakit
tertentu beserta posisinya pada kromosom. Informasi ini tersedia dan bisa
dilihat di home page National Center for Biotechnology Information (NCBI) pada
seksi Online Mendelian in Man (OMIM) (http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM). OMIM adalah search tool untuk gen manusia dan
penyakit genetika. Selain berisikan informasi tentang lokasi gen suatu
penyakit, OMIM ini juga menyediakan informasi tentang gejala dan penanganan
penyakit tersebut beserta sifat genetikanya. Dengan demikian, dokter yang
menemukan pasien yang membawa penyakit genetika tertentu bisa mempelajarinya
secara detil dengan mengakses home page OMIM ini.
- Bioinformatika
untuk penemuan obat Usaha penemuan obat biasanya dilakukan dengan penemuan
zat/senyawa yang bisa menekan perkembangbiakan suatu agent penyebab penyakit.
Karena banyak faktor yang bisa mempengaruhi perkembangbiakan agent tersebut,
faktor-faktor itulah yang dijadikan target. Diantara faktor tersebut adalah
enzim-enzim yang diperlukan untuk perkembangbiakan suatu agent. Langkah pertama
yang dilakukan adalah analisa struktur dan fungsi enzim-enzim tersebut.
Kemudian mencari atau mensintesa zat/senyawa yang bisa menekan fungsi dari
enzim-enzim tersebut.
Penemuan
obat yang efektif adalah penemuan senyawa yang berinteraksi dengan asam amino
yang berperan untuk aktivitas (active site) dan untuk kestabilan enzim
tersebut.
Karena
itu analisa struktur dan fungsi enzim ini biasanya difokuskan pada analisa asam
amino yang berperan untuk aktivitas (active site) dan untuk kestabilan enzim
tersebut. Analisa ini dilakukan dengan cara mengganti asam amino tertentu dan
menguji efeknya. Sebelum perkembangan bioinformatika, analisa penggantian asam
amino ini dilakukan secara random sehingga memakan waktu yang lama. Dengan adanya
Bioinformatika, data-data protein yang sudah dianalisa bebas diakses oleh
siapapun, baik data sekuen asam amino-nya seperti yang ada di SWISS-PROT (http://www.ebi.ac.uk/swissprot/) maupun
struktur 3D-nya yang tersedia di Protein Data Bank (PDB) (http://www.rcsb.org/pdb/).
Dengan database yang tersedia ini, enzim yang baru ditemukan bisa dibandingkan
sekuen asam amino-nya, sehingga bisa diperkirakan asam amino yang berperan
untuk active site dan kestabilan enzim tersebut. Hasil perkiraan kemudian diuji
di laboratorium. Dengan demikian, akan lebih menghemat waktu dari pada analisa
secara random.
- Bioinformatika
dalam Virologi Sebelum kemajuan bioinformatika, untuk mengklasifikasikan virus
kita harus melihat morfologinya terlebih dahulu. Untuk melihat morfologi virus
dengan akurat, biasanya digunakan mikroskop elektron yang harganya sangat mahal
sehingga tidak bisa dimiliki oleh semua laboratorium. Selain itu, kita harus
bisa mengisolasi dan mendapatkan virus itu sendiri. Isolasi virus adalah suatu
pekerjaan yang tidak mudah. Banyak virus yang tidak bisa dikulturkan, apalagi
diisolasi. Virus hepatitis C (HCV), misalnya, sampai saat ini belum ada yang
bisa mengkulturkannya, sehingga belum ada yang tahu bentuk morfologi virus ini.
Begitu juga virus hepatitis E (HEV) dan kelompok virus yang termasuk ke dalam
family Calliciviridae, dimana sampai saat ini belum ditemukan sistem
pengkulturannya. Walaupun untuk beberapa virus bisa dikulturkan, tidak semuanya
bisa diisolasi dengan mudah. Oleh karena itu, sebelum perkembangan
bioinformatika, kita tidak bisa mengidentifikasi dan mengklasifikasikan
virus-virus semacam ini. Dengan kemajuan teknik isolasi DNA/RNA, teknik
sekuensing dan ditunjang dengan kemajuan bioinformatika, masalah diatas bisa
teratasi. Untuk mengidentifikasi dan mengklasifikasikan virus, isolasi virus
tidak lagi menjadi suatu hal yang mutlak. Kita cukup dengan hanya melakukan
sekuensing terhadap gen-nya. Ini adalah salah satu hasil kemajuan
bioinformatika yang nyata dalam bidang virologi.
sumber:
-http://id.wikipedia.com/bioinfomatika.html diakses tanggal 8 Novembber 2013
-http://bioinformatika-q.blogspot.com/ diakses tanggal 8 November 2013
-http://www.academia.edu/5353692/BIOINFORMATIKA_PROTEIN diakses tanggal 17 November 2014