Bioinformatika (grč.bios = život +informatika) jeste nauka koja se bavi bioinformacijskim procesima i pojavama u živimćelijama pri informacijskom djelovanju svjetlosti -elektromagnetnih talasa, ionizirajućeg zračenja,bakterija ilivirusa, biološki aktivnih i materija hemijske prirode, mehanizmima prijema i obrade informacija na ćelijskom nivou, međućelijskoj komunikaciji kao i prijenosom, čuvanjem, organizacijom, analizom i praktičnom primjenom na živim organizmima.
Biologija je nauka o životu, a informatika – nauka o prikupljanju, manipulaciji, pohranjivanju, distribuciji i klasifikaciji podataka (informacionom procesuiranju). U raznorodnoj literaturi je evidentirano mnogo “širih” i “užih” definicija bioinformatike. Navodimo samo neke:
“Bioinformatika je kombinacija kompjuterske nauke, informacione tehnologije i genetike u svrhu determinacije i analize genetičke informacije”;
“Bioinformatika je nauka i tehnologija o saznanju, upravljanju i procesuiranju bioloških informacija”;
“Bioinformatika je integracija matematičkih, statističkih i kompjuterskih metoda u svrhu analize molekularno–bioloških, biohemijskih i biofizičkih podataka”;
“Bioinformatika je definisana kao interdisciplinarna istraživačka oblast koja primjenjuje kompjutersku i informacionu nauku u rješavanju bioloških problema”.
Možda je jednu od najsažetijih i najkonkretnijih definicija bioinformatike dao Nacionalni centar za biotehnološke informacije SAD–a (National Center for Biotechnology Information), koja glasi: “Bioinformatika je polje nauke u kojoj su se biologija, kompjuterska nauka i informaciona tehnologija spojile u jednu disciplinu”.
Bioinformatika je interdisciplina naučna oblast koja razvija metode isoftverski alat za razumevanjebioloških podataka. Za analizu i tumačenje bioloških podataka, bioinformatika kombinira potrebna znanja izbiologija,informatike,informatičkog inženjerstva,matematike istatistike. Bioinformatika se koristi zain silico analize bioloških pitanja koristeći matematičke i statističke tehnike i procedure.Bioinformatika uključuje biološke studije koje koristeračunarsko programiranje kao dio svojih postupaka, kao i posebne povezne kanale za analizu koji se više puta koriste, posebno u područjugenomike. Uobičajene upotrebe bioinformatike uključuju identifikaciju kandidatskihgena ijednostrukih nukleotidnih polimorfizama (SNP-ova). Često se takva identifikacija vrši s ciljem boljeg razumijevanja genetičkih osnova bolesti, jedinstvenih prilagodbi, poželjnih svojstava (posebno kod poljoprivrednih vrsta) ili razlika između populacija. Na manje formalan način, bioinformatika pokušava da razumije i principe organizacije i struktute unutarnukleinskih kiselika iproteinskih sekvenci, zvanihproteomika.[1]
Bioinformatika je postala važan dio mnogih područja biologije. U eksperimentalnojmolekulskoj biologiji, bioinformatičke tehnike poputslika iobrada signala omogućavaju izdvajanje korisnih rezultata iz velike količine neobrađenih podataka. U području genetike, pomaže u sekvenciranju i dešifriranju genoma i njihovih promatranihmutacija Ima ulogu u razumijevanjuznačenja teksta biološke literature i razvoju biološke i genskeontologije za organiziranje i ispitivanje bioloških podataka. Takođe ima ulogu i u analizi ekspresije i regulacije gena i proteina. Bioinformatički alat pomaže u usporedbi, analizi i interpretaciji genetičkih i genskih podataka i općenito u razumijevanju evolucijskih aspekata molekularne biologije. Na više integrativnoj razini, pomaže analizi i katalogiziranju bioloških puteva i mreža, koji su važan diobioloških sistema. Ustrukturnoj biologiji pomaže u simulaciji i modeliranjuDNK,[2]RNK,[2][3] proteins[4] kao i interakcije biomolekula.[5][6][7][8]
U posljednih par decenija došlo je do ogromnog napredovanja u oblasti molekularne biologije, genetičkog inženjerstva i biotehnologije. To je dovelo do naglog porasta potrebe za analitičkom obradom bioloških podataka dobijenih rezultatima naučnih istraživanja iz tih oblasti. Ogroman priliv takvih informacija je zahtijevao kompjuterizovane baze podataka za pohranu, organizovanje i indeksiranje podataka kao i razvoj alata za analiziranje takvih podataka.
U početku “genomske revolucije”, zadatak bioinformatike je bio da kreira i održava velike baze bioloških podataka kao što su one o nukleotidnim i aminokiselinskim sekvencama. Za to je bilo potrebno izraditi kompleksan mehanizam koji će istraživačima omogućiti korištenje već postojećih bioloških informacija kao i nadopunjavanje takvih baza podataka novim ili revidiranim biološkim informacijama.
Međutim, kako je u prirodi sve povezano u jedan sistem, tako i biološke informacije nisu fragmentirane, već su povezane u jedan logički sistem. Zato bioinformatika obuhvata i interpretaciju različitih tipova bioloških podataka uključujući strukturu nukleotida, aminokiselina i proteina. Proces analiziranja i interpretiranja podataka se odnosi na computational biology (računarnu biologiju).
Ciljevi različitih bioinformatičkih disciplina su u razvoju:
alata koji će omogućiti efikasan pristup, korištenje i manipulaciju različitih tipova bioloških podataka;
novih matematičkih i statističkih metoda sa ciljem rješavanja određenih zadataka (npr. lociranja gena u sekvencama, predviđanja proteinske strukture i funkcije, određivanja odnosa različitih velikih setova bioloških podataka itd.).
Mnogo je primjera primjene bioinformatičkih metoda. Navest ćemo samo neke:
Evolucijska biologija
–Novi način sagledavanja molekularnih struktura omogućava drugačiji pristup u istraživanju homologije (može se koristiti u svrhe istraživanja genetički uvjetovanih bolesti). –Poznavanjem nukleotidne i proteinske sekvence moguće je pronaći evolutivnu povezanost različitih organizama sa zajedničkim pretkom. Iskustva pokazuju da organizmi koji su sličniji imaju i sličnije sekvence za razliku od onih koji su udaljeniji. Proteinske sekvence mogu pokazivati jasan evolutivni odnos između populacija, organizama, pripadajućih vrsta i viših sistematskih kategorija. Proučavajući proteinske sekvence i strukture, naučnici su u mogućnosti odrediti evolutivni odnos između vrsta kao i vrijeme divergencije od zajedničkog pretka.
Proteinsko modeliranje
–U odsustvu determinacije strukture proteina, korištenjem X–ray kristalografije i NMR–spektroskopije moguće je predvidjeti trodimenzionalne strukture primjenom proteinskog i molekularnog modeliranja. Ovaj metod koristi eksperimentalno uvtrđenu proteinsku strukturu (template – kalup) za predviđanje strukture drugog proteina koji ima sličnu aminokiselinsku sekvencu (proteinska struktura koja se analizira). Iako ovaj metod nema toliku važnost u usporedbi sa eksperimentalnim, ipak je od pomoći prilikom potvrđivanja određenih hipoteza. –Realizacija različitih genomskih projekata će producirati sve više sekvenci, pa će tako i ovaj metod proteinskog modeliranja imati sve veću važnost.
Genomsko mapiranje
–Prije nekoliko godina naučnici su, u lokalizaciji gena i nukleotidnih sekvenci, bili prisiljeni na manuelno mapiranje genoma. Zahvaljujući novoj tehnologiji, danas je sekvenciranje genoma mnogo lakše, tako da su mape genoma različitih organizama dostupne široj naučnoj zajednici. –Kompjuterizovane genomske mape su omogućile lokalizacije gena mnogo brže, jeftinije i praktičnije. Genomsko mapiranje na novim tehnološkim osnovama bi bilo nezamislivo bez primjene bioinformatike.
Kao najvažnija dostignuća bioinformatike posljednjih godina mogu se smatrati: –kreiranje nukleotidnih i proteinskih baza podataka te njihova dostupnost široj naučnoj zajednici; –kompjuterska podrška projektima sekvenciranja genoma; –omogućavanje predikcije proteinske strukture i funkcije.
NobelovacClaude E. Shannon nazvan je "ocem informatičke teorije".[9] On je pokazao daBooleova algebra može konstruirati i riješiti bilo koju logičku ili brojčanu relaciju. Njegov značaj za razvoj bioinformatike je ogroman.
Prvi bioinformatički programi bili su razvijeni za sekvencijalnu analizuDNK.
Posljednja naučna bioinformatička istraživanja usmjerena su na ćeliju i međućelijske komunikacije. Takva istraživanja, uporedo s istraživanjimagenetičara koja su posvećena proučavanju mehanizama nasljednih informacija, omogućuju da se u informatici izdvoji novi naučni pravac - bioinformatika. Suštinski, bioinformatika daje naučni osnov za razvoj vrlo značajnog i novog pravca umedicini - informacione medicine.Samuel Hahnemann (1755-1843)[10] među prvima je uočio utjecaj informacija na ćelije čovjeka.
Unazad 30 godina veoma aktivno se proučavaju principi djelovanja bioloških materija na izolirane organe kod ljudi i životinja, s posebnim naglaskom na informaciono stanje ćelija. Utvrđeno je da hemijskemolekule utječu na ćelijsku strukturu, kako neposrednim kontaktom, tako i indirektnim djelovanjem. U svim eksperimentima, biološki efekat na ćelije zavisio je ne samo od doza postojećih materija i njihovih energija već i od kvaliteta informacije, tj. informacione komponente. Ćelija je jasno reagirala na strukturuinformacionog polja materije, pri čemu prenošenje signala nije zavisilo od količine (materijalne doze) hemijske supstance ienergije.
U međuvremenu, bioinformatika se upotrebljava i ufarmaciji, za proračun prognoze proteinskih struktura i interakcije. Simulacija i proračun bioloških eksperimenata i podataka naziva se iin silico proračun. Tu se radi prvenstveno o brzom pronalaženju ponovljenih dijelova (šablona) u veoma dugimDNK-sekvencama i rješavanje problema preklapanja i pozicioniranja dviju ili više sekvenci da bi se dobila njihova najveća podudarnost. Primjenu u toj oblasti našli su algoritmi dinamičnog i metodološkog programiranja. Kod bioloških hipoteza rijetko se traže tačne podudarnosti kratkih sekvencijalnih dijelova, i to najčešće za odvojene "signale" kao startna i završna sekvenca genetskog koda.
Pored tih, razvijena su i rješenja za pronalaženjegena u nepoznatim DNK-sekvencama (prognoza gena,engl.gene prediction).
Glavni problemi bioinformatike[11]kao naučnog pravca jesu:
istraživanje molekularnih i ćelijskih mehanizama detektiranja prijema pojedinačnih informacionih signala i informacionih poruka (recepcija informacionih signala);
istraživanja uloge različitih nosača informacija (fizičkih, hemijskih) u međućelijskoj i unutarćelijskoj komunikaciji;
istraživanje mehanizama kodiranja i prekodiranja informacija u živim sistemima;
proučavanje jezika na kojima se odvija unutarćelijska, međućelijska, međutkivna, međuorganska i međusistemska komunikacija u čovjekovom organizmu i šire gledano u organizmima životinja, biljaka, mikroorganizama i virusa;
istraživanje mehanizama prevođenja informacija s jednog biološkog jezika na drugi;
istraživanje invarijantnosti informacionih poruka;
istraživanje strukture i funkcija kanala za prijenos informacija u organizmima čovjeka, životinja, biljaka, mikroorganizama i virusa;
istraživanje mehanizama bilježenja (pamćenja) i čuvanja (memoriziranja) informacija;
istraživanje mehanizama obrade i interakcije među informacijama;
istraživanje mehanizama generiranja biološkog odgovora na informacione signale i poruke (elektromehanička sprega);
istraživanje uloge i mehanizama stvaranja povratnih veza u živim sistemima;
istraživanje dinamike informacionih poruka u živim sistemima.
U današnje vrijeme proučeni su primarni mehanizmi prijema pojedinačnih informacionih signala koje prenose neki nosači informacionih signala. Istraživani su mehanizmi recepcije informacionih signala koje prenose medijatori:acetilholin,adrenalin. Utvrđeno je da se receptori proteinskih, peptidnihhormona i mnogih biološki aktivnih materija nalaze nacitoplazmatskim membranama, a receptori steroidnih hormona nalaze se u citoplazmi. Ispitivana je uloga različitih sekundarnih posrednika u mehanizmu prenošenja informacija koje prima plazmatska membrana uz djelovanje medijatora i hormona, peptida na unutarćelijske strukture.
Proučavanje bioloških jezika počinje od proučavanja ″slova", ″glasova", ″riječi" i ″rečenica". Svaka ćelija ″zna" nekoliko jezika. Dobro su proučeni jezici molekula DNK,RNK,bjelančevina. ″Slova" jezika RNK predstavljaju nukleotidi:adenin,citozin,guanin iuracil. ″Riječi" jezika DNK i RNK sastoje se od tri slova – tripleta nukleotida. ″Rečenice" gena sastoje se od različitog broja ″riječi". ″Abeceda" jezika bjelančevina sastoji se od 20 ″slova" –aminokiselina. Dešifriranjem genetskog koda utvrđeno je da svakom ″slovu" jezika bjelančevina odgovara ″riječ" jezika RNK – tripletu nukleotida. U jeziku bioloških membrana ″slova" su sekundarni posrednici:ionikalcija,ciklični nukleotidi,diacilglicerin,inozitoltrifosfat. ″Slova" jezika međućelijske i međuorganske komunikacije predstavljaju primarne posrednike: medijatore, hormone, biološki aktivne materije. Biološke informacije mogu prenositi ne samo materijalni prenosioci – ″slova" - već i energetski prenosioci – ″glasovi". Takvi ″glasovi" pri transmembranskom prenošenju informacija predstavljaju potencijale dejstva ili tzv. spore talase, a kod međućelijskog prenošenja informacija to su elektromagnetni talasi, mehaničke oscilacije i dr. Dokazano je da se uobičajeno biološke informacije ne prenose ″slovima" ili ″glasovima", već ″rečenicama" koje se sastoje od ″riječi". U posljednje vrijeme učinjen je pokušaj proučavanjafonetike,morfologije isintakse ćelijskih jezika.
Istraživani su struktura i funkcije kanala za prenos informacija u organizmu čovjeka i životinja, mehanizmi memoriziranja, mehanizmi generiranja biološkog odgovora na informacione signale, mehanizmi stvaranja povratnih veza u živim sistemima.
Još uvijek nisu dovoljno istraženi mehanizmi obrade i interakcije između informacija i dinamika informacionih poruka u živim sistemima.
Razvoj bioinformatike ima veliku važnost za dalji razvoj informacione medicine s veoma važnim dijelovima poput informodijagnostike, biorezonantne, multirezonantne i informacione terapije. Dalji razvoj bioinformatike u budućnosti može omogućiti stvaranje čitavih zdravstvenih programa na jezicima unutarćelijske, međućelijske, međutkivne, međuorganske i međusistemske komunikacije. Prijenos tih programa ćelijama organizma pomoću pogodnog nosača informacija omogućuje ćelijama da uspostave razmjenu materija, energije i informacija u organizmu čovjeka, usljed čega dolazi do liječenja i ozdravljenja.
Napretkom u istraživanju i dostignućima iz oblasti funkcionalne analize genoma (npr., crvaCaenorhabditis elegans), težište rada u bioinformatici prebacuje se na hipotezeproteomike, kao, npr., problem razlaganja i prognoza strukture proteina, odnosno pitanje sekundarne i tercijarne strukture kod određenih sekvenci aminokiselina. Pitanje interakcije proteina s različitimligandima (nukleinskim kiselinama, drugim proteinima ili manjim molekulima) veoma je važno zato što iz odgovora na to pitanje proizlaze zaključci i važne informacije za medicinu i farmaciju; npr., "Kakav utjecaj ima mutacijom izmijenjeni protein na tjelesne funkcije" ili "Koji preparati djeluju na različitimproteinima".
Primjenom naučnih saznanja iz bioinformatike u dijagnostičke svrhe masovno se primjenjujuelektrokardiogram (EKG),elektromiogram (EMG),elektroencefalogram (EEG) i oni predstavljaju zlatni standard u dijagnostici vitalnih organa. Razvojem kompjuterske tehnologije nastala je posebna grupa dijagnostičkih aparata za čitavo tijelo i sve čovjekove organe i sisteme. Posebno se izdvajaukrajinski dijagnostičkikompjutersko-softverski kompleks "PSI Vektor DiaKor".
Kompjuterska dijagnostika funkcionalnog stanja svih čovjekovih vitalnih organa zasnovana je na mjerenju parametara zonske električne provodljivosti jednosmjerne struje u različitim receptornim zonamakože koje su funkcionalno povezane s određenim unutrašnjim organima pomoću nervnih vlakana somatskog ivegetativnog nervnog sistema.
Primjenom naučnih saznanja iz bioinformatike u dijagnosticisrca (EKG),mozga (EEG), razvojem informatičkih tehnologija, kompjutera itd. nastalo je dosta softverskih uređaja namijenjenih funkcionalnoj dijagnostici cjelokupnog čovjekovog organizma. NjemačkiljekarReinhold Voll (1909-1989) otkrio je i definirao neinvazivnu metodu kojom se precizno može izmjeriti akcioni membranski potencijal ćelija organa i sistema.
Informoterapija razrađuje metode terapijske i preventivne primjene informacija, pri čemu više pažnje posvećuje patogenetskom i terapijskom djelovanju informacija, a bioinformatika teorijskim, praktičnim i eksperimentalnim problemima razmjene informacija u živim sistemima.
Informoterapija predstavlja jedno od praktičnih dostignuća u primjeni bioinformacionih tehnologija, pri čemu se terapijska metoda koristi u cilju informacione regulacije zdravstvenog stanja.
Informoterapija proučava:
utjecaj informacija na fiziološke, biohemijske, biofizičke i patološke procese u organizmu čovjeka i životinja
procese prijema, kodiranja, čuvanja, dekodiranja i korištenja informacija.
Naučno obrazloženje informacione terapije nastalo je sredinom80-ih godina20. vijeka, pri čemu prioritet u svijetu imaju ukrajinski naučnici.
Osnova informacione terapije sastoji se, prije svega, u korištenju usmjerenog informacionog toka koji primaju određene ćelijske strukture. Usmjereni informacioni tok dovodi do procesa stvaranja endogenih materija u organizmu, koje reguliraju homeostazu. Takav efekt postiže se tzv. mikrogeneratorima, u kojima se nalaze mikrobioprocesori s memoriziranim informacijamamatičnih ćelija. Terapijsku informaciju prenose odgovarajući informonosači bez dodatnog utroška energije. Takve bioinformacije malo zavise od doze. Njih primaju bolesne ćelije, usljed čega se ponovo uspostavlja njihovo normalno funkcionalno stanje. Informoterapijom se aktiviraju unutrašnje rezerve organizma i njegovi energetski resursi sintetizirani intracelularno u vidu visokoenergetskih materija. Korištenje informacionih mehanizama terapijskog djelovanja na ljudski organizam prvi je put primijenjeno nakonČernobilske katastrofe.
U poređenju s farmakoterapijom i fizioterapijom, gdje se koriste kompleksne i dozirane materije ili energije, u informacionoj terapiji efekti liječenja postižu se informacionim djelovanjem zdravih matičnih ćelija na bolesne i oštećene ćelije, dijelove organa ili sistema. Informoterapiju ne karakterizira informacioni utjecaj na cio organizam, pa čak ne ni na pojedine organe, već selektivno samo na određene ćelije koje se nalaze u stanju disfunkcije i oštećenja (Z. Skripnjuk).
Terapijsko djelovanje informacionog polja zavisi samo od toga u kolikoj mjeri ono odgovara informacionom biopolju nekog konkretnog organa njegovim ćelijama. Teoretski, metode informoterapije efikasne su kod liječenja bilo kojih oboljenja, jer je riječ o ponovnom uspostavljanju informacione sposobnosti raznih organa da razmjenjuju informacije na ćelijskom nivou, a one mogu biti promijenjene, poremećene i čak djelomično izgubljene. U ovom je slučaju terapijski efekat određen granicama u okviru kojih se odvija prijem informacije od strane ćelija raznih organa, što se može uporediti a povratnom reakcijom čovjeka na djelovanje riječi prepoznatljivog i neprepoznatljivog smisla.
Prema tome, maksimalni terapijski efekat moguć je samo pri kompleksnom korigiranju mehanizama koji održavaju homeostazu, i to nervnog i humoralnog sistema koji su vezani za razmjenu električne i hemijskomaterijalne energije, kao i ″trećeg regulacionog sistema" – informacionog.
Primjenom informacionih terapija moguće je uspješno liječiti sve viruse i zaustaviti kancerogenezu u ranom stadiju, pri čemu se jasno definiranim bioinformacijama daju precizne instrukcije svim mehanizmimaimunog sistema dafagocitiraju opasne agense (Z. Skripnjuk).
Znatan dio posla jednog bioinformatičara sastoji se, pored matematičkih analiza, i iz konsolidiranja i pohranjivanja podataka u indiciranim i povezanim biološkim bazama podataka. Zbunjujuća raznolikost DNK i proteinskih baza podataka širom svijeta dosad je prouzrokovala redudantno (isti sadržaj na više mjesta) i samim tim greškama sklono pohranjivanje podataka.
↑Spiga, E.; Degiacomi, M. T.; Dal Peraro, M. (2014). "New Strategies for Integrative Dynamic Modeling of Macromolecular Assembly". u Karabencheva-Christova, T. (ured.).Biomolecular Modelling and Simulations. Advances in Protein Chemistry and Structural Biology.96. Academic Press. str.77–111.doi:10.1016/bs.apcsb.2014.06.008.ISBN9780128000137.PMID25443955.
Sehgal et al.: Structural, phylogenetic and docking studies of D-amino acid oxidase activator(DAOA ), a candidate schizophrenia gene. Theoretical Biology and Medical Modelling 2013 10 :3.
Srinivas Aluru, ed.Handbook of Computational Molecular Biology. Chapman & Hall/Crc, 2006.ISBN1-58488-406-1 (Chapman & Hall/Crc Computer and Information Science Series)
Baldi, P and Brunak, S,Bioinformatics: The Machine Learning Approach, 2nd edition. MIT Press, 2001.ISBN0-262-02506-X
Barnes, M.R. and Gray, I.C., eds.,Bioinformatics for Geneticists, first edition. Wiley, 2003.ISBN0-470-84394-2
Baxevanis, A.D. and Ouellette, B.F.F., eds.,Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, third edition. Wiley, 2005.ISBN0-471-47878-4
Baxevanis, A.D., Petsko, G.A., Stein, L.D., and Stormo, G.D., eds.,Current Protocols in Bioinformatics. Wiley, 2007.ISBN0-471-25093-7
Keedwell, E.,Intelligent Bioinformatics: The Application of Artificial Intelligence Techniques to Bioinformatics Problems. Wiley, 2005.ISBN0-470-02175-6
Kohane, et al.Microarrays for an Integrative Genomics. The MIT Press, 2002.ISBN0-262-11271-X
Lund, O. et al.Immunological Bioinformatics. The MIT Press, 2005.ISBN0-262-12280-4
Lior Pachter and Bernd Sturmfels. "Algebraic Statistics for Computational Biology" Cambridge University Press, 2005.ISBN0-521-85700-7
Pevzner, Pavel A.Computational Molecular Biology: An Algorithmic Approach The MIT Press, 2000.ISBN0-262-16197-4