化学データベースについて詳しく解説

導入

化学データベースは、化学情報に特化したデータベース (おそらく書誌情報) です。ほとんどの化学データベースには、安定した分子に関する情報が保存されています。化学構造は伝統的に、原子間の化学結合 (電子対) を表す線を使用するルイス表現で表され、紙上にプロットされます (2 次元構造式)。これらは化学者に適した視覚的表現を構成しますが、コンピュータで使用、特に研究や保管には使用できません。
大規模な化学データベースは、数百万の分子 (またはその他の化学物体) に関する情報をテラバイト単位の物理メモリに保存および取得できなければなりません。

化学データベースについて詳しく解説

表現

化学構造を数値ベースで表すには、主に 2 つの手法があります。

  • 接続テーブル / 隣接行列 /化学結合(エッジ) および原子データ (ノード) に関する追加情報を含むリスト:
    MDL モルファイル、PDB、CML
  • パスまたは深さパスに基づく線形表記:
    スマイルズ/スマート、SLN、 WLNインチ

これらのアプローチは、立体化学的な違い、電荷、さらには有機金属化合物における結合などの特殊なタイプの結合を表現できるように改良されています。コンピュータ表現の主な利点は、ストレージの増加と高速かつ柔軟な検索の可能性です。

化学データベースについて詳しく解説

記述子

構造を超えたすべての「分子」特性は、記述子とも呼ばれる物理化学的特性または薬理学的特性のいずれかに分離できます。このシステムに加えて、多かれ少なかれあいまいな名前や同義語を生成する分子や化学物体のための、多かれ少なかれ標準化された人工システムが数多くあります。 IUPAC 命名法は通常、にとっても読みやすく、文字列を構成する方法で分子構造を表現する場合に適していますが、大型種の場合は実用的ではありません。一方、自明名詞には同音異義語や同義語が豊富にあるため、基本定義キーの選択には適していません。一方、モル質量、(部分)電荷、溶解度などの物理化学的記述子薬理学的記述子は分子構造に基づいてほぼ直接的に計算できますが、薬理学的記述子は多変量統計または実験結果 (スクリーニング、生物学的アッセイなど) から間接的にのみ推定できます。これらすべての記述子は、計算コストの理由から、分子の表現とともに保存でき、一般的にそうされます。

化学データベースについて詳しく解説

研究

化学者は、構造の一部、IUPAC 命名法の一部、または特性に課せられた制約を使用してデータベースを検索できます。化学データベースは、部分構造を検索する方法が他のより一般的なデータベースとは特に異なります。このタイプの検索は、部分グラフの同型性(単型性とも呼ばれる) を探すことによって実行され、グラフ理論の応用として広く研究されています。検索アルゴリズムは数値的に負荷が高く、時間計算量が O( n3 ) または O( n4 ) になる場合もあります ( n は関与する原子のです)。集中的な研究コンポーネントは、アトムごとの検索(ABAS) と呼ばれます。 ABAS 検索では通常、ウルマン アルゴリズムまたはそのバリエーションが使用されます。速度の向上は、事前に計算された情報を使用して時間を節約することで構成される一時的な償却によって得られます。この事前計算には通常、分子フラグメントの有無を表す一連のビットの作成が含まれます。存在するフラグメントを監視することにより、構造検索において、構造検索に必要なフラグメントを持たないターゲット分子または化学物体との ABAS 比較の必要性を排除することができます。この除去はスクリーニングと呼ばれますが、製薬研究で使用されるスクリーニング手順や原子論のスクリーニングと混同しないでください。これらのアプリケーションに使用されるビット シーケンスは、構造キーとも呼ばれます。このようなキーのパフォーマンスは、キーの構築に使用されるフラグメントの選択と、データベース内の分子内にそのフラグメントが存在する確率によって決まります。別のタイプのキーは、デジタル的に決定されたフラグメントに基づくハッシュ コードを使用します。これらは「フィンガープリント」と呼ばれますが、この用語は構造キーと同義で使用されることもあります。これらの構造キーとフィンガープリントの保存に必要なメモリ空間は、賢明なビット操作を使用してキー部分を結合し、全体の長さを短縮することによって生成される「圧縮」によって削減できます。

化学データベースについて詳しく解説
  1. Chemische Datenbank – allemand
  2. Chemical database – anglais
  3. Base de datos química – espagnol
  4. پایگاه داده شیمیایی – persan
  5. Basis data kimia – indonésien
  6. 化学データベース – japonais

化学データベースについて詳しく解説・関連動画

サイエンス・ハブ

知識の扉を開け、世界を変える。