NVIDIA、AI およびデジタル生物学を前進させる、大規模言語モデルクラウドサービスを発表

NVIDIA NeMo LLM サービスにより、開発者は巨大な言語モデルのカスタマイズが可能になり、NVIDIA BioNeMo サービスが分子、タンパク質、DNA の生成や予測の研究を支援

2022 年 9 月 20 日、カリフォルニア州サンタクララ — GTC — NVIDIA は本日、NVIDIA NeMo Large Language Model サービス( https://www.nvidia.com/en-us/gpu-cloud/nemo-llm-service/ )と NVIDIA BioNeMo LLM サービス( https://www.nvidia.com/en-us/gpu-cloud/bionemo/ )という、2 つの大規模言語モデル (LLM) クラウド AI サービスを発表しました。これらのサービスにより、開発者は簡単に LLM を採用し、コンテンツ生成、テキスト要約、チャットボット、コード開発、ならびにタンパク質構造や生体分子特性の予測などのためにカスタマイズされた AI アプリケーションを導入できるようになります。

NeMo LLM サービスにより、開発者は NVIDIA によって管理されたインフラストラクチャ上でプロンプト学習( https://docs.nvidia.com/deeplearning/nemo/user-guide/docs/en/main/nlp/nemo_megatron/prompt_learning.html )と呼ばれるトレーニング手法を使い、事前トレーニングされたいくつもの基盤モデルを迅速にカスタマイズすることができます。NVIDIA BioNeMo サービスは、LLM のユースケースを言語だけでなく、科学アプリケーションにまで広げ、製薬企業やバイオテクノロジ企業の創薬を加速させる、クラウドアプリケーションプログラミングインターフェイス (API) です。

NVIDIA の創業者/CEO であるジェンスンフアン (Jensen Huang) は、次のように述べています。「大規模言語モデルには、すべての産業を変容させる潜在力があります。基盤モデルをチューニングできる機能により、数百万人の開発者が巨大なモデルを一から構築する必要なく、LLM のパワーを利用して言語サービスを創出し、科学的発見を促進できるようになります」

NeMo LLM サービスがプロンプト学習によって精度を高め、展開を加速
NeMo LLM を使うことで、開発者は独自のトレーニングデータを使って多様なサイズの基盤モデル (30 億パラメーターのモデルから、Megatron 530B のような世界最大規模のモデル) をカスタマイズできるようになります。一からモデルをトレーニングする方法では数週間から数か月を必要としていましたが、この作業は数分から数時間で完了します。

モデルは、P-チューニングと呼ばれる手法を使うプロンプト学習によってカスタマイズされます。これにより、研究者はわずか数百の例を使うだけで、元々は数十億のデータポイントでトレーニングされた基盤モデルを迅速にカスタマイズできるようになります。このカスタマイズ作業により、タスク特有のプロンプトトークンが生成されます。その後、これらトークンが基盤モデルと組み合わされ、特定のユースケースに対してより高い精度とより適切なレスポンスを提供します。

開発者は、同じモデルを複数のユースケースに対応できるようにカスタマイズし、多様なプロンプトトークンを生成できるようになります。プレイグラウンド機能により、コーディングをせずに簡単にモデルの実験やインタラクションが可能になり、業界固有のユースケースで LLM の効果およびアクセシビリティをさらに高めることができます。

展開の準備が整うと、チューニングされたモデルをクラウドインスタンスまたはオンプレミスのシステム、もしくは API から実行することができます。

BioNeMo LLM サービスにより、研究者は巨大モデルのパワーを活用可能に
BioNeMo LLM サービス( https://blogs.nvidia.com/blog/2022/09/20/bionemo-large-language-models-drug-discovery/ )には、化学および生物学用の 2 つの新しい BioNeMo 言語モデルが含まれています。タンパク質、DNA および化学的データに対応しており、研究者は生物学的配列のパターンを発見し、洞察を得られるようになります。

BioNeMo により、研究者は数十億個のパラメーターが含まれているモデルを活用して、自身の研究の幅を広げることができます。これらの大規模モデルは、タンパク質の構造や遺伝子間の進化的関係についてのより多くの情報を格納することができ、さらに治療に応用可能な、斬新な生体分子の生成もできるようになります。

クラウド API を通じて Megatron 530GB などトレーニング済みモデルへのアクセスが可能に
基盤モデルのチューニングに加えて、LLM サービスでは、クラウド API を通じてトレーニング済みのカスタムモデルを使用することもできます。

このオプションにより、開発者は Megatron 530B を含む多様なトレーニング済み LLM を利用することができます。LLM サービスを使う開発者は、現在オープンベータが利用可能な、NVIDIA NeMo Megatron フレームワーク( https://developer.nvidia.com/blog/?search_posts_filter=NeMo+Megatron )を使って構築された T5 および GPT-3 モデルを利用して、多様なアプリケーションや多言語サービスの要件に対応することができます。

自動車、コンピューティング、教育、ヘルスケア、テレコミュニケーションおよびその他の業界における主要な企業は、NeMo Megatron を使って、中国語、英語、韓国語、スウェーデン語やその他の言語でのお客様向けの画期的なサービスを他社に先駆けて展開しています。

提供予定
NeMo LLM と BioNeMo の両サービス、ならびにクラウド API は、来月よりアーリーアクセスを通じて利用可能となる予定です。現在、開発者は詳細を知るために申請することができます。

NeMo Megatron フレームワークのベータリリースは現在 NVIDIA NGC™ ( https://www.nvidia.com/ja-jp/gpu-cloud/ )より入手可能で、NVIDIA DGX™ Foundry ( https://www.nvidia.com/ja-jp/data-center/dgx-foundry/ )および NVIDIA DGX SuperPOD™( https://www.nvidia.com/ja-jp/data-center/dgx-superpod/ )、ならびに Amazon Web Services、Microsoft Azure および Oracle Cloud Infrastructure ( https://blogs.oracle.com/cloud-infrastructure/post/oracle-partners-with-nvidia-to-solve-the-largest-ai-and-nlp-models )のアクセラレーテッドクラウドインスタンスで実行できるように最適化されています。

NeMo Megatron フレームワークを活用してみたい開発者は、NVIDIA LaunchPad ( https://www.nvidia.com/ja-jp/data-center/launchpad/ )ラボにて無料でお試しいただけます。

NVIDIA AI を活用した大規模言語モデルについての詳細を知るためには、GTCにおけるジェンスンフアンの基調講演( https://www.nvidia.com/gtc/keynote/ )のリプレイをご視聴ください。

NVIDIA について
1993 年の創業以来、NVIDIA (NASDAQ: NVDA) は、アクセラレーテッドコンピューティングのパイオニアとして活動してきました。1999年の GPU の発明は、PC ゲーミング市場の成長に拍車をかけ、コンピュータグラフィックスを再定義し、現在の AI 時代の火付け役となりました。NVIDIA は現在、データセンター規模の製品を提供するフルスタックコンピューティング企業であり、産業のあり方を大きく変えています。詳細は、こちらのリンクから：https://nvidianews.nvidia.com/