Movatterモバイル変換


[0]ホーム

URL:


Przejdź do zawartości
Wikipediawolna encyklopedia
Szukaj

International Chemical Identifier

Z Wikipedii, wolnej encyklopedii

International Chemical Identifier[a], skrótowiec:InChIidentyfikator stosowany dlasubstancji chemicznych, wprowadzony w 2005 roku przezMiędzynarodową Unię Chemii Czystej i Stosowanej (IUPAC) przy udziale, między innymi, amerykańskiegoNational Institute of Standards and Technology (NIST).

Historia

[edytuj |edytuj kod]

Począwszy od lat 60. XX wieku, rozwójinformatyki spowodował potrzebę opracowania metody komputerowego opisu struktur chemicznych i jednoznacznej identyfikacjisubstancji chemicznej. Do końca wieku powstało wiele takich metod, z których najczęściej stosowanymi okazały sięSMILES oraznumer CAS (powiązany z bazą CAS Registry). Duża liczba powstałych standardów i rozwiązań miała jednak pewne ograniczenia: nie były one z sobą powiązane, część była wykorzystywana jedynie w wąskim zakresie, a wiele było standardami własnościowymi, to znaczy opracowanymi przez prywatne przedsiębiorstwa i wymagającymi od użytkowników opłat licencyjnych[2].

Idea utworzenia publicznie dostępnego standardu reprezentacji struktur chemicznych zrodziła się w NIST w 1999 i miała na celu powiązanie z sobązwiązków chemicznych w różnychbazach danych zarządzanych przez NIST[2][3]. W 2000 roku IUPAC rozpoczęła prace nad nowym sposobem opisu substancji chemicznych, który – w przeciwieństwie donazewnictwa chemicznego – mógłby być stosowany zarówno w publikacjach papierowych, jak i w systemach informatycznych (mógłby być odczytywany maszynowo). Założeniami nowego identyfikatora była możliwość generowania go na podstawie powszechnie stosowanych zasad przedstawiania struktur chemicznych opracowanych przez IUPAC i przy użyciupublicznie dostępnego algorytmu oraz niezależność od jakiejkolwiek bazy danych struktur chemicznych. Innymi słowy, dwustronna konwersja między strukturą chemiczną a identyfikatorem mogłaby być dokonana przez każdego użytkownika[2]. Projekt utworzenia nowego identyfikatora substancji chemicznych oficjalnie rozpoczął się z początkiem 2001, przy współpracy IUPAC, NIST i wielu innych podmiotów. W 2009 został utworzony InChI Trust, brytyjskaorganizacja non-profit, której zadaniem jest wspieranie i rozwijanie standardu InChI[2], a której członkami są zarówno przedsiębiorstwa związane z branżą chemiczną, jak i instytucje publiczne czy organizacje chemiczne[3].

Pierwsza wersja (1.00) InChI została opracowana w 2005, trzy lata później udostępniono InChIKey,haszowaną wersję InChI, która ma zawsze tę samą liczbę znaków i jest łatwiejsza do użycia, na przykład przy wyszukiwaniu substancji chemicznych. Z uwagi na możliwość generowania różnych InChI dla takiej samej struktury (w zależności od pożądanego stopnia szczegółowości), w 2009 utworzono wersje standardowe InChI i InChIKey (oznaczane czasem jako StdInChI i StdInChIKey), które mają z góry ustalony poziom szczegółowości (czyli z danej struktury chemicznej zostanie wygenerowany zawsze taki sam identyfikator). Najnowszą wersję (1.05; stan na listopad 2018) opublikowano w 2017, wraz z RInChI (identyfikatorami dlareakcji chemicznych)[3], jednak wiele projektów związanych z rozszerzeniem zakresu InChI (m.in. namieszaniny,związki nieorganiczne imetaloorganiczne,biomolekuły,tautomery,rotaksany,struktury Markusha czy zastosowaniekodów QR dla InChI) jest wciąż nieukończonych[4].

InChI

[edytuj |edytuj kod]

InChI jest identyfikatorem generowanym na podstawie struktury chemicznej, narysowanej zgodnie ze standardami przedstawiania takich struktur opracowanymi przez IUPAC. Natomiast na podstawie już wygenerowanego InChI możliwe jest odtworzenie takiej struktury. Długość identyfikatora wzrasta wraz z wielkością struktury chemicznej, z której jest generowany, przy czym maksymalna liczbaatomów w strukturze nie może przekroczyć 1000[2].

Podstawą InChI jest pewien rdzeń strukturalny, to znaczy struktura bez określonejtautomerii istereochemii, o naturalnymskładzie izotopowym i w stanie neutralnym. Na identyfikator składa się kilka warstw i podwarstw informacji, z których każda określa dany aspekt struktury chemicznej; przedstawiana struktura jest więc pochodną rdzenia strukturalnego o cechy wskazane przez kolejne warstwy i podwarstwy informacji. Możliwe jest generowanie identyfikatorów z określonym poziomem szczegółowości (np. bez rozróżnienia tautomerów), a więc w efekcie otrzymanie różnych InChI dla takiej samej struktury chemicznej. Z tego powodu istnieje również standardowy InChI – identyfikator, który generowany jest zawsze w identyczny sposób, bez względu na preferencje użytkownika, a więc stanowi identyfikator unikatowy dla danej struktury chemicznej. Identyfikatory takie rozpoczynają się od prefiksuInChI=1S/ zamiastInChI=1/. Kolejne warstwy i podwarstwy oddzielane są za pomocą ukośnika/. Po prefiksie następuje pierwsza warstwa informacji będącawzorem sumarycznym. Następnie umieszczone są kolejne warstwy, z których część może nie występować w danym identyfikatorze, jeżeli nie ma znaczenia dla danej struktury chemicznej:

InChIKey

[edytuj |edytuj kod]

InChI jest identyfikatorem o różnej, często bardzo dużej liczbie znaków, a przy tym zawierającym wiele znaków niebędących cyframi ani literami. Z tego względu jego użycie do wyszukiwania struktur chemicznych w wielu bazach danych lub wyszukiwarkach jest ograniczone. Z tego powodu wraz z InChI generowany jest również InChIKey, to znaczy InChIzhaszowany przy użyciuSHA-256, mający zawsze 27 znaków. Ogólny format InChIKey toAAAAAAAAAAAAAA-BBBBBBBBFV-P i zawiera pięć bloków informacji:

  • 14-znakowy członAAAAAAAAAAAAAA określa ogólną strukturę cząsteczki
  • 8-znakowy członBBBBBBBB zawiera dodatkowe informacje strukturalne, na przykład stereochemię cząsteczki lub skład izotopowy
  • F przyjmuje wartośćS dla wersji standardowej lubN dla wersji niestandardowej
  • V to oznaczenie wersji (A dla wersji 1)
  • P określa protonowanie/deprotonowanie (przy czymA oznacza wartość mniejszą od −12 lub większą od +12,B doM to wartości od −12 do −1,N oznacza 0, a litery odO doZ oznaczają wartości od +1 do +12).

Z InChIKey nie jest jednak nigdy możliwe odtworzenie ani InChI, ani wyjściowej struktury chemicznej[2][5]. Metoda generowania InChIKey sprawia ponadto, że wystąpieniekolizji (czyli przypisania dwóm identyfikatorom InChI takiego samego InChIKey) jest nieuniknione, choć prawdopodobieństwo wystąpienia takiego zdarzenia jest niewielkie[6].

Przykłady

[edytuj |edytuj kod]
Przykłady InChI i InChIKey dla różnych struktur chemicznych
Związek chemicznyStrukturaInChIInChIKey
metanInChI=1S/CH4/h1H4VNWKTOKETHGBQD-UHFFFAOYSA-N
etanolInChI=1S/C2H6O/c1-2-3/h3H,2H2,1H3LFQSCWFLJHTTHZ-UHFFFAOYSA-N
kwasL-(+)-askorbinowyInChI=1S/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-10H,1H2/t2-,5+/m0/s1CIWBSHSKHKDKBQ-JLAZNSOCSA-N
D-(–)-morfinaInChI=1S/C17H19NO3/c1-18-7-6-17-10-3-5-13(20)16(17)21-15-12(19)4-2-9(14(15)17)8-11(10)18/h2-5,10-11,13,16,19-20H,6-8H2,1H3/t10-,11+,13-,16-,17-/m0/s1BQJCRHHNABKAKU-KBQPJGBKSA-N
β-karotenInChI=1S/C40H56/c1-31(19-13-21-33(3)25-27-37-35(5)23-15-29-39(37,7)8)17-11-12-18-32(2)20-14-22-34(4)26-28-38-36(6)24-16-30-40(38,9)10/h11-14,17-22,25-28H,15-16,23-24,29-30H2,1-10H3/b12-11+,19-13+,20-14+,27-25+,28-26+,31-17+,32-18+,33-21+,34-22+OENHQHLEOONYIE-JLTXGRSLSA-N

Uwagi

[edytuj |edytuj kod]
  1. W literaturze polskojęzycznej pojawia się tłumaczenie „międzynarodowy identyfikator chemiczny”[1], ale nie jest to ugruntowana polska nazwa tego identyfikatora.

Przypisy

[edytuj |edytuj kod]
  1. Poradnik dotyczący identyfikacji i nazywania substancji na podstawie rozporządzeń REACH i CLP, Helsinki: Europejska Agencja Chemikaliów, 2017, s. 12,DOI10.2823/279785,ISBN 978-92-9495-724-5 .
  2. abcdefgStephenS. Heller StephenS.,AlanA. McNaught AlanA.,StephenS. Stein StephenS.,DmitriiD. Tchekhovskoi DmitriiD.,IgorI. Pletnev IgorI.,InChI – the worldwide chemical structure identifier standard, „Journal of Cheminformatics”, 5, 2013, s. 7,DOI10.1186/1758-2946-5-7,PMID23343401,PMCIDPMC3599061 (ang.).
  3. abcAbout the InChI Trust [online], InChI Trust [dostęp 2018-11-05] [zarchiwizowane zadresu 2018-01-16] (ang.).
  4. SteveS. Heller SteveS.,InChI Trust Project Director’s Report [online], InChI Trust, lipiec 2017 [dostęp 2018-11-05] [zarchiwizowane zadresu 2018-11-05] (ang.).
  5. abStephen R.S.R. Heller Stephen R.S.R.,AlanA. McNaught AlanA.,IgorI. Pletnev IgorI.,StephenS. Stein StephenS.,DmitriiD. Tchekhovskoi DmitriiD.,InChI, the IUPAC International Chemical Identifier, „Journal of Cheminformatics”, 7, 2015, s. 23,DOI10.1186/s13321-015-0068-4,PMID26136848,PMCIDPMC4486400 (ang.).
  6. IgorI. Pletnev IgorI. i inni,InChIKey collision resistance: an experimental testing, „Journal of Cheminformatics”, 4 (39), 2012,DOI10.1186/1758-2946-4-39,PMID23256896,PMCIDPMC3558395 (ang.).
Źródło: „https://pl.wikipedia.org/w/index.php?title=International_Chemical_Identifier&oldid=78452736
Kategoria:

[8]ページ先頭

©2009-2026 Movatter.jp