AI4Scienceが科学的発見の5番目のパラダイムに力を与える

AI4Scienceが科学的発見の5番目のパラダイムに力を与える

wccftech

クリストファービショップ、テクニカルフェロー兼マイクロソフトリサーチAI4サイエンスディレクター

今後10年間で、ディープラーニングは自然科学に変革の影響を与えるように見えます。 その結果は潜在的に広範囲に及ぶ可能性があり、空間と時間のさまざまなスケールにわたって自然現象をモデル化および予測する能力を劇的に向上させる可能性があります。 この機能は、科学的発見の新しいパラダイムの夜明けを表すことができますか?

チューリング賞を受賞し、元マイクロソフトテクニカルフェローであるジムグレイは、4つのパラダイムを通じて科学的発見の歴史的進化を特徴づけました。 起源は数千年前にさかのぼり、最初のパラダイムは純粋に経験的であり、自然現象の直接観察に基づいていました。 これらの観察では多くの規則性が明らかでしたが、それらをキャプチャまたは表現する体系的な方法はありませんでした。 2番目のパラダイムは、17世紀のニュートンの運動の法則や19世紀のマクスウェルの電気力学の方程式などの自然の理論モデルによって特徴づけられました。 経験的観察からの誘導によって導き出されたそのような方程式は、直接観察されたものよりもはるかに広い範囲の状況への一般化を可能にしました。 これらの方程式は単純なシナリオで解析的に解くことができましたが、より一般的なケースで解くことができるのは20世紀のデジタルコンピューターの開発まででなく、数値計算に基づく3番目のパラダイムにつながりました。 21世紀の夜明けまでに、計算は再び科学を変革しました。今回は、大量のデータを収集、保存、処理する機能を通じて、データ集約型の科学的発見の4番目のパラダイムにつながりました。 機械学習は、第4パラダイムのますます重要なコンポーネントを形成し、大量の実験科学データのモデリングと分析を可能にします。 これらの4つのパラダイムは補完的であり、共存しています。

先駆的な量子物理学者のポール・ディラックは1929年に次のようにコメントしています。 「したがって、物理学の大部分と化学全体の数学的理論に必要な基礎となる物理法則は完全に知られています。困難なのは、これらの法則を正確に適用すると、方程式が複雑すぎて解けないということだけです。」 たとえば、シュレディンガー方程式は、分子や物質の素粒子レベルでの振る舞いを非常に正確に記述していますが、高精度の数値解法は、少数の原子で構成される非常に小さなシステムでのみ可能です。 より大規模なシステムへのスケーリングには、ますます大幅な近似が必要になり、スケールと精度の間の難しいトレードオフにつながります。 それでも、量子化学計算はすでに非常に実用的な価値があり、最大のスーパーコンピューターワークロードの1つを形成しています。

ただし、過去1〜2年の間に、科学的発見のためのこの速度と精度のトレードオフに対処するための強力なツールとして、ディープラーニングを活用する新しい方法の出現が見られました。 これは、機械学習の4番目のパラダイムを特徴付けるデータのモデリングとは大きく異なります。これは、ニューラルネットワーク自体のトレーニングに使用されるデータが、経験的な観察ではなく、科学の基本方程式の数値解から得られるためです。 科学方程式の数値解は次のように見ることができます シミュレーター 天気予報、銀河の衝突のモデル化、核融合反応器の設計の最適化、候補薬物分子の結合親和性の計算などのアプリケーションで関心のある量を計算するために、高い計算コストで使用できる自然界の標的タンパク質。 ただし、機械学習の観点からは、シミュレーションの中間の詳細は、深層学習のトレーニングに使用できるトレーニングデータと見なすことができます。 エミュレーター。 このようなデータは完全にラベル付けされており、データの量は計算予算によってのみ制限されます。 トレーニングが完了すると、エミュレータは新しい計算を高効率で実行できるため、速度が大幅に向上し、場合によっては数桁向上します。

この科学的発見の「第5のパラダイム」は、機械学習と自然科学にとって最もエキサイティングなフロンティアの1つです。 これらのエミュレーターが十分に高速で堅牢、そして汎用的に主流になるまでには長い道のりがありますが、実際の影響の可能性は明らかです。 例えば、小分子薬候補だけでも10と推定されています。60、安定した材料の総数は約10と考えられていますが180 (おおよそ、既知の宇宙の原子数の2乗)。 これらの広大な空間を探索するためのより効率的な方法を見つけることは、病気を治療するためのより良い薬、大気中の二酸化炭素を捕獲するための改善された基質、電池のためのより良い材料、水素経済を動かす燃料電池のための新しい電極などの新しい物質を発見する私たちの能力を変えるでしょう。無数の他。

AI4Scienceは、マイクロソフトの使命に深く根ざした取り組みであり、AI機能を最大限に活用して、科学的発見のための新しいツールを開発し、科学界の私たちや他の人々が人類の最も重要な課題のいくつかに立ち向かうことができるようにします。 Microsoft Researchには、好奇心と発見の30年以上の遺産があり、地理と科学分野にまたがるAI4Scienceチームは、その遺産に並外れた貢献をもたらす可能性があると私は信じています。

ケビン・スコット、マイクロソフトのエグゼクティブバイスプレジデント兼最高技術責任者

本日、この5番目のパラダイムを実現することに注力するために、英国、中国、オランダにまたがるMicrosoftResearchの新しいグローバルチームを率いることを発表できることをうれしく思います。 私たちのAI4Scienceチームは、機械学習、量子物理学、計算化学、分子生物学、流体力学、ソフトウェアエンジニアリング、およびこの分野で最も差し迫った課題のいくつかに取り組むために協力している他の分野の世界的な専門家を網羅しています。

プロジェクトの例は、中国チームの同僚であるTie-YanLiuが率いるGraphormerです。 これは、研究者や開発者が材料科学や創薬などの分子モデリングタスク用のカスタムモデルをトレーニングできるようにするディープラーニングパッケージです。 最近、Graphormerは、AIによる触媒-吸収反応システムのモデル化を目的とした分子動力学コンテストであるOpen Catalyst Challengeで優勝し、密度汎関数理論によってシミュレートされた66万を超える触媒-吸収緩和システム(1億4400万の構造エネルギーフレーム)を持っています。 (DFT)ソフトウェア。 ケンブリッジの私たちのチームが共同で行った別のプロジェクト ノバルティスはGenerativeChemistryであり、科学者にAIを提供して、画期的な医薬品の発見と開発をスピードアップしています。

として AIイノベーションラボのグローバルヘッド、Iya Khalil 最近注目されたノバルティスでは、この作品はもはや空想科学小説ではなく、実際の科学です。

「AIは過去の実験から学ぶことができるだけでなく、ラボでの設計とテストの新しい反復ごとに、機械学習アルゴリズムは新しいパターンを識別し、初期の薬剤発見と開発プロセスを導くのに役立ちます。 うまくいけば、これを行うことで、人間科学者の専門知識を強化して、より良い分子をより速く設計できるようになります。」

それ以来、チームはプラットフォームを使用して、さらなる探索のために合成されたいくつかの有望な初期段階の分子を生成しました。

中国と英国のチームに加えて、世界的に有名な機械学習の専門家であるMax Wellingの採用など、オランダでチームを成長させてきました。 また、本日、アムステルダムにある新しいラボが マトリックスワン、アムステルダムサイエンスパークで現在建設中です。 この専用スペースはアムステルダム大学とアムステルダム自由大学に近接しており、博士課程の学生の共同監督を通じて両機関との強力な提携を維持します。

アムステルダムのマトリックスワンの建物の画像
アムステルダムのマトリックスワンビル

私たちがこの次のステップを踏み出し、地理を超えたチームとして集まり、私たちの前にある先駆者の足跡をたどり、科学的発見のこの次のパラダイムに貢献し、そうすることで多くの重要な社会的課題に影響を与えることは、誇りと興奮です。 。 私たちの興奮と野心を共有し、私たちに参加したい場合は、私たちのオープンポジションを確認するか、チームの誰かと話をするために連絡を取ることをお勧めします。

Sharing is caring!

Leave a Reply