ASMILES széles körben használt leíró nyelv amolekulákASCII-karakterekkel történő tömör kódolására. A névmozaikszó, az angolsimplified molecular input line entry specification(egyszerűsített, begépelhető molekulaleíró rendszer) kifejezés rövidítése. A legtöbb molekula-szerkesztő elfogadja bemenetként a SMILES kódokat, és képes őket kétdimenziós rajzokká vagy háromdimenziós modellekké alakítani. A SMILES-t Arthur és David Weininger fejlesztette ki az1980-as években.[1][2] Azóta többen is bővítették és fejlesztették, elsősorban a Daylight Chemical Information Systems égisze alatt.[3] ABlue Obelisk csoport 2007-ben létrehozta a SMILES egynyílt forráskódú megvalósítását OpenSMILES néven.[4]
A SMILES képes atomok, izotópok, vegyületek és kémiai reakciók leírására, beleértve a vegyületek térszerkezetét és aromás voltát. A nyelv kizárólag a hagyományos betűkészletet használja (32−127 közöttiASCII-kódok), és (különösen egyszerű molekuláknál) hasonlít a szokásos kémiai képletekre.
Az atomok SMILES-a a vegyjel szögletes zárójelben. Pl.:[Au] az arany SMILES-kódja. A vegyjelek első betűje nagy-, a második kisbetű. (Néhány egybetűs vegyjel kisbetűvel írható, ha aromás gyűrű tagja; lásdalább.)
A szögletes zárójelben megadható:
az atom töltése, pl.[H+] a proton,[Fe++] vagy[Fe+2] a vas(II)-ion,
A szerves kémiában a képletek egyszerűsítése végett a hidrogénatomokat sokszor nem tüntetik fel. Ezt a gyakorlatot a SMILES is átvette. A szerves kémiában gyakori atomok szögletes zárójel nélkül írhatók. Az atomot ilyenkor hidrogénatomokkal a kémiai kötések figyelembe vételével a legkisebb „szabályos” vegyértékűre egészítik ki.
Az oldalláncot zárójellel jelölik az után az atom után, amelyikből elágazik. A főlánc az (utolsó) oldallánc záró zárójele után folytatódik. A SMILES nem írja elő, melyik láncot tekintjük fő- ill. oldalláncnak. A lánc nem feltétlenül tartalmaz szénatomot. Az oldalláncban újabb oldallánc(ok) lehet(nek) (egymásba ágyazott zárójelezés).
SMILES-ban nyílt vegyületeknél új kémiai kötést mindig egy új atommal együtt adják meg. Gyűrű lezárásakor egy új és egy korábban már előfordult atom között kell megadni kötést. Az ilyen atomokat megcímkézik. Ugyanaz a címke pontosan kétszer kell szerepeljen: a második előfordulás a gyűrűzárás.
A címke egy természetes szám. Az 1–9 közötti címkét közvetlenül a vegyjel után írják. Például a ciklopropán SMILES-kódjaC1CC1. Az 1-es címke adja meg az első és harmadik szénatom közötti kötést.
Aromás vegyületek megadhatók váltakozó kettőskötésekkel (Kekulé-alak), vagy az aromás gyűrű atomjainak kisbetűs megadásával:
Benzol – Kekulé-alak C1=CC=CC=C1
Benzol – aromás alak c1ccccc1
A gyűrűzáró atom oldalláncban is lehet:
3-cianoanizol.[5] A piros vonal mutatja a molekula bejárását. SMILES: COc(c1)cccc1C#N
Egy atomnak több címkéje is lehet, és a címke is lehet 9-nél nagyobb. Ilyenkor %-jelet kell használni. Pl. aC2%13%24 SMILES-részletben a szénatomnak három címkéje van: 2, 13 és 24.
A címkék újrahasznosíthatók. Ha már mindkét előfordulásuk megvolt, akkor új gyűrűzáró kötés adható meg velük.
Egy bonyolultabb példa:
Egy bonyolultabb molekula SMILES-kódja. A: az eredeti képlet. B: a gyűrűzáró élek és címkézésük. C: zölddel jelölve a főlánc, a többi színnel az oldalláncok. D: a SMILES-kód, színekkel jelölve a hozzájuk tartozó részlet
↑Weininger, D. (1988), SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules,J. Chem. Inf. Comput. Sci.28, 31-36.