نحوه نگارش فرمول اسمایلز برایسیپروفلوکساسین: شکستن حلقه، سپس نوشتن شاخهها از روی ستون اصلی
سیستم خطی سادهشدهٔ دروندهی مولکولی (انگلیسی:Simplified molecular-input line-entry system) که به اختصار به آن «اسمایلز» (SMILES) میگویند نوعی فرمول خطی برای توصیف ساختارگونههای شیمیایی با استفاده ازرشتههای کوتاهASCII است. بسیاری ازبرنامههای رایانهایِ ویرایشِ مولکول، قادر به استفاده و درونریزی رشتههای اسمایلز برای تبدیل مجدد آنها به نقشههای دوبعدی یا مدلهای سه بعدی مولکولی هستند.
در ژوئیهٔ ۲۰۰۶، «آیوپاک»شناسه شیمیایی بینالمللی (InChI) را به عنوان استانداردی برای نمایش فرمولهای شیمیایی معرفی کرد. اسمایلز عموماً خوانایی آسانتری نسبت بهشناسه شیمیایی بینالمللی برای انسان دارد. اسمایلز همچنین پایگاه گستردهای از پشتیبانی نرمافزاری با پشتوانه نظری گسترده (مانندنظریه گراف) دارد.
اتمها با علامت اختصاری استانداردعناصر شیمیایی، درقلاب (کروشه) نشان داده میشوند، مانند[Au] برای طلا. ممکن است براکتها در حالت معمول حذف شوند؛ برای اتمهایی که:
اتمهای اصلی زیستی-حیاتیB،C،N،O،P،S،F،Cl،Br یاI، و
تعداد هیدروژنهای متصلشده توسط مدل ظرفیتی اسمایلز مشخص شده است (معمولاً ظرفیت طبیعی آنها، اما برای نیتروژن و فسفر ۳ یا ۵ است، و برای گوگرد ۲، ۴ یا ۶ است)، و
تمام عناصر دیگر باید درقلاب (کروشه) قرار گیرند وبار الکتریکی و هیدروژنها هم نمایش داده شوند. برای مثال، اسمایلز برای آب ممکن است به صورتO یا[OH2] نوشته شود. هیدروژن همچنین ممکن است به عنوان یک اتم جداگانه نوشته شود. آب را میتوان بهصورت[H]O[H] هم نمایش داد.
هنگامی که ازقلاب (کروشه) استفاده میشود، اگر اتم داخل کروشه به یک یا چند هیدروژن پیوند داشته باشد، نمادH اضافه میشود، به دنبال آن؛ تعداد اتمهای هیدروژن اگر بیشتر از ۱ باشد و سپس علامت+ برای بار الکتریکی مثبت یا- برای بار الکتریکی منفی افزوده میشود. به عنوان مثال،[NH4+] برایآمونیوم (NH+ 4). اگر بیش از یک بار الکتریکی وجود داشته باشد، معمولاً به صورت عددی نوشته میشود. با این حال، میتوان علامت مثبت یا منفی را به تعداد دفعاتی که یون بار الکتریکی دارد تکرار کرد: برایتیتانیم(IV) Ti4+ میتوان نوشت[Ti+4] یا[Ti++++]. بنابراین، آنیونهیدروکسید (OH−) با[OH-]، کاتیونهیدرونیوم (H 3O+ ) با[OH3+] و کاتیونکبالت (III) (Co3+) هم یا[Co+3] یا[Co+++] است.
پیوند شیمیایی با یکی از این علائم نشان داده میشود:. - = # $ : / \.
پیوندهای بین اتمهایترکیبات آلیفاتیک منفرد فرض میشوند، مگر اینکه طور دیگری در فرمولنویسی خطی اسمایلز مشخص شده باشد. اگرچه پیوندهای منفرد ممکن است به صورت- نوشته شوند، این معمولاً این علامت را حذف میکنند. برای مثال، اسمایلز برایالکل طبی ممکن است به صورتC-C-O،CC-O یاC-CO نوشته شود، اما معمولاًCCO نوشته میشود.
پیوندهای شیمیایی دوگانه، سهگانه و چهارگانه را بهترتیب با علائم=،#، و$ نمایش میدهند؛ مثلا:O=C=O (کربن دیاکسید CO2)،C#N (هیدروژن سیانید HCN) و[Ga+]$[As-] (گالیم آرسنید)
یک نوع دیگر از پیوند، «غیر-پیوند» است که با. نشان داده شده است، تا نشان دهد که دو قسمت به هم متصل نیستند. برای مثال،سدیم کلرید آبی را به صورت[Na+].[Cl-] مینویسند تا این عدم اتصال را نشان داده باشند.
یک پیوند آروماتیک «یکی و نصفی» را میتوان با: نشان داد.
پیوندهای منفرد مجاور با پیوندهای دوگانه ممکن است با استفاده از/ یا\ برای نشان دادن پیکربندی استریوشیمیایی مولکول نشان داده شوند.
ساختارهای حلقه با شکستن هر حلقه در یک نقطه دلخواه نوشته میشوند (اگرچه برخی از انتخابها منجر به خوانایی بهتر اسمایلز نسبت به سایر فرمولها میشود) تا یک ساختار غیر چرخهای ایجاد شود و برچسبهای عددی بسته شدن حلقه برای نشان دادن اتصال بین اتمهای غیر همجوار اضافه شود.
به عنوان نمونه،سیکلوهگزان ودیاُکسان ممکن است به ترتیب به صورتC1CCCCC1 وO1CCOCC1 نوشته شوند. برای حلقه دوم، برچسب ۲ خواهد بود. برای مثال،دکالین (دکاهیدرونافتالین) ممکن است به صورتC1CCCC2C1CCCC2 نوشته شود.
حلقههایآروماتیک همچونبنزن به یکی از سه صورت زیر نوشته میشود:
به صورتککوله با پیوندهای منفرد و دوتایی متناوب، به عنوان مثال:C1=CC=CC=C1
با استفاده از نماد پیوند آروماتیک:. مثلا:C:1:C:C:C:C:C1، یا
معمولاً با نوشتن اتمهای تشکیل دهنده بور، کربن، نیتروژن، اکسیژن، فسفر و گوگرد به ترتیب با حروف کوچکb،c،n،o،p وs
در مورد آخری، پیوندهای بین دو اتم آروماتیک (اگر به صراحت نشان داده نشده باشد) به عنوان پیوندهای آروماتیک فرض میشوند؛ بنابراین،بنزن،پیریدین وفوران را میتوان به ترتیب باc1ccccc1,n1ccccc1 ando1cccc1. نشان داد.
نیتروژن آروماتیک متصل به هیدروژن، که مثلا درپیرول یافت می شود، باید حتما به صورت[nH] نشان داده شود. بنابراین ایمیدازول با نماد اسمایلز به صورتn1c[nH]cc1 نوشته میشود.
هنگامی که اتمهای آروماتیک به صورت مجزا به یکدیگر پیوند میخورند، مانندبیفنیل، یک پیوند منفرد باید به وضوح ارائه شود:c1ccccc1-c2ccccc2. این یکی از معدود مواردی است که نماد پیوند منفرد- مورد نیاز است. (در واقع، اکثر نرمافزارهای اسمایلز میتوانند به درستی استنباط کنند که پیوند بین دو حلقه نمیتواند آروماتیک باشد و بنابراین فرم غیر استانداردc1ccccc1c2ccccc2 را میپذیرد).
شاخهها باکمان (پرانتز) نمایش داده میشوند، مانندCCC(=O)O برایپروپانوئیک اسید وFC(F)F برایفلوئوروفرم. نخستین اتم داخل پرانتز و نخستین اتم بعد از گروه پرانتزشده، هر دو به یک اتم نقطه شاخهای متصل هستند. نماد پیوند باید در داخل پرانتز ظاهر شود و خارج آن (به عنوان مثال:CCC=(O)O) پذیرفته نیست.
حلقههای جایگزین را میتوان با نقطه انشعاب در حلقه نوشت، همانطور که درCOc(c1)cccc1C#N (تصویر) وCOc(cc1)ccc1C#N (تصویر) دیده میشوند که ایزومرهای ۳ و ۴-سیانوآنیزول را کد میکنند. نوشتن اسمایلز برای حلقههای جایگزین به این روش میتواند آنها را برای انسان خواناتر میکند.
یکی از شاخههایی که نیازی به استفاده از پرانتز در فرمولنویسی ندارد، پیوندهای حلقه بسته هستند. انتخاب مناسب پیوندهای تکمیل حلقه میتواند تعداد پرانتزهای مورد نیاز را کاهش دهد. به عنوان مثال،تولوئن معمولاً به صورتCc1ccccc1 orc1ccccc1C نوشته میشود تا از بهکارگیری پرانتزهای مورد نیاز در روشc1cc(C)ccc1 یاc1cc(ccc1)C اجتناب شود.
ایزوتوپها با عددی برابر با جرم ایزوتوپی عدد صحیح قبل از نماد اتمی مشخص میشوند.بنزن که یک اتم آنکربن-۱۴ است بهصورت[14c]1ccccc1 ودئوتراتد کلروفرم بهصورت[2H]C(Cl)(Cl)Cl نوشته میشود.
برای نشان دادن یک مولکول با بیش از ۹ حلقه، مولکول «سفالوستاتین-۱» را در نظر بگیرید[۸] یکپیرازین استروئیدی ۱۳ حلقهای بافرمول تجربیC54H74N2O10 که از یکی ازنیمطنابداراناقیانوس هند به نام«سفالودیسکوس گیلکریستی» بهدست آمد:
↑Weininger D (February 1988). "SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules".Journal of Chemical Information and Computer Sciences.28 (1): 31–6.doi:10.1021/ci00057a005.
↑Weininger D, Weininger A, Weininger JL (May 1989). "SMILES. 2. Algorithm for generation of unique SMILES notation".Journal of Chemical Information and Modeling.29 (2): 97–101.doi:10.1021/ci00062a008.
↑Weininger D (August 1990). "SMILES. 3. DEPICT. Graphical depiction of chemical structures".Journal of Chemical Information and Modeling.30 (3): 237–43.doi:10.1021/ci00067a005.
↑Byers JA, Birgersson G, Löfqvist J, Appelgren M, Bergström G (March 1990). "Isolation of pheromone synergists of bark beetle, Pityogenes chalcographus, from complex insect-plant odors by fractionation and subtractive-combination bioassay".Journal of Chemical Ecology.16 (3): 861–876.doi:10.1007/BF01016496.PMID24263601.S2CID226090.