SMILES記法の特徴とその利用法
SMILES(Simplified Molecular Input Line Entry System)記法は、化学
分子の構造を
ASCII 文字列として表現する手法です。その特長は、高い表現力とともに、
分子構造の曖昧さを排除できる点にあります。SMILES
文字列は、さまざまな
分子エディタでインポート可能であり、化学構造を二次元または三次元で視覚化することが可能です。
SMILESの開発と進化
この記法は
1980年代末に David Weininger によって開発され、その後多くの研究者や企業によって改良や拡張がなされてきました。特に、Daylight Chemical Information Systems社の貢献が顕著です。SMILES 記法は、他の類似の表記法とともに化学コミュニティに広がり、「Wiswesser Line Notation」や「ROSDAL」、さらには「SLN(Tripos社)」なども存在します。
SMILESは
グラフ理論に基づいており、その観点からは
分子グラフを深さ優先で探索し、
原子(節点)や
化学結合(辺)を
文字列として表現します。
分子の構築では、
水素
原子を取り除き、結合が環を形成している場合はそれに数字でラベルを付けることで
全域木に変換します。丸括弧を用いて分枝を示すなど、構造を見やすくする工夫もされています。
原子の表記には角括弧が使われますが、特定の条件を満たす場合にはこれを省略できます。例えば、炭素
原子や
酸素原子はそのまま記述しても良く、
原子価に基づいて隐含の
水素が付加されるとみなされます。結合は一重結合、
二重結合、三重結合など、異なる記号によって表され、シス・トランス異性体の識別にも対応しています。
環構造とラベル付け
環構造の表現では、結合している
原子に数字でラベルを付けることで、環の位置関係を明示します。SMILES 記法では、独自のルールに従ってこれらのラベルが使用されます。環のラベルは一つの
原子に一対の数字を対応させることが基本ですが、再利用も可能です。特徴的な指定方法によって、より複雑な
分子の情報も扱えるようになっています。
不斉中心の表記
不斉中心は特定の記号を用いて表現され、向きに関する情報も含まれています。これにより、立体化学的な情報が正確に伝わります。一つの
分子の SMILES 表記は一意ではなく、複数の表現が存在することもあります。このため、ある特定のアルゴリズムに基づく「正規化」された SMILES が必要とされる場合もあります。
化学反応の表現
化学反応は SMILES を用いて、反応物と生成物、あるいは触媒を示すことができます。例えば、プロペンに
水が付加される反応を示す場合、適切な記法が用いられます。
発展と関連技術
SMARTS は SMILES の拡張で部分構造検索が可能で、化学データベースからの検索に広く使用されています。また、SMIRKS はSMILES と SMARTS を組み合わせた形式で、化学反応の概要を記述します。これにより、
分子の検索や反応を扱うための新しいツールとしての役割が強化されています。
SMILES記法の利点と劣点
SMILES 記法の利点は、少ない情報量で化学構造を表現でき、簡単なルールで人間が扱いやすい点です。しかし、視覚的な構造情報の一部が失われることや、相対配置や絶対配置の表現ができないなどの欠点もあります。そのため、活用に際してはこれらの特性を理解しておくことが重要です。
SMILES記法は化学構造を記述する強力なツールであり、今後も進化し続けることでしょう。