Internacionalni hemijski identifikator (InChI) je tekstualniidentifikatorhemijskih supstanci. On je dizajniran da bude standard kodiranja molekulske informacije koji je jednostavan za čitanje, i istovremeno prikladan za pretragu informacija u bazama podataka. Razvile su ga je organizacijeIUPAC (engleski:International Union of Pure and Applied Chemistry) iNIST (engleski:National Institute of Standards and Technology) u toku 2000-2005. Format i algoritmi su nezaštićeni, i implementirani su u računarskim programima koji su slobodno dostupni podLGPL licencomotvorenog koda. TerminInChI je oznaka definisana od strane IUPAC organizacije.[1]
Ovi identifikatori opisuju hemijske supstance u vidu informacionihslojeva – atomi i hemijske veze,tautomerska informacija,izotopska informacija,stereo-hemija, jonizacija. Svi slojevi nisu uvek neophodni, na primer, tautomerski sloj se može izostaviti kad ta je vrsta informacije nevažna.
InChI identifikatori se razlikuje odCAS brojeva u tri pogleda:
InChI identifikatori se mogu smatrati generalnom I veoma formalnom verzijomIUPAC imena. Oni mogu sadržati veći informacioni sadržaj nego jednostavnijaSMILES notacija. Poput kanoničkihSMILES oni sujedinstveni nizovi znakova, i prikladni su za upotrebu u bazama podataka. 3D koordinate atoma nisu deo InChI formata.
InChI algoritam pretvara strukturnu informaciju u jedinstveni InChI identifikator u tri stepena: normalizacija (odstranjivanje nepotrebnih podataka), kanonizacija (stvaranje jedinstvene numeričke etikete atoma), i formiranje niza znakova.
InChIKey je kaširaniInChI identifikator sa fiksnom dužinom od 25 znakova. InChIKey specifikacija je objavljena u Septembru 2007. godine da bi se omogućila Veb pretraživanja hemijskih jedinjenja, pošto je to bilo problematično koristeći InChI.[2]
CH3CH2OH etanol | InChI=1/C2H6O/c1-2-3/h3H,2H2,1H3 |
![]() L-askorbinska kiselina | InChI=1/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-10H,1H2/t2-,5+/m0/s1 |