CUVIC GPU Zero ｜CUVIC GPU Zero（キュービックジーピーユーゼロ）は、AIエージェント開発機能をワンパッケージで提供し機密データを安全に活用できる生成AI基盤サービスです。《特長》

2026年03月02日更新

CUVIC GPU Zero（キュービックジーピーユーゼロ）は、AIエージェント開発機能をワンパッケージで提供し機密データを安全に活用できる生成AI基盤サービスです。

以下の作業を弊社にてワンストップで対応いたします。

安定した基盤をご提供すると共に、障害/保守対応やQA対応窓口をご提供します。

ご提供するGPU基盤のハードウェア運用やOSの脆弱性対応を行います。

また、年間2回GPU基盤に増設されているLLMモデルの更新情報を連携し、お客様の要望に応じて、更新作業を実施いたします。

No	対応項目	対応内容
1	ハードウェアのファームウェア更新	ベンダーが提供するハードウェアのファームウェアを更新
2	オペレーティングシステムの脆弱性対応	緊急性の高いセキュリティ脆弱性に対するパッチ適用作業
3	LLMモデルの更新	新たに公開されるLLMモデルの更新は年2回情報提供し、お客様の要望の応じて更新作業を実施
4	運用ネットワーク機器のオペレーティングシステム更新	運用ネットワーク機器のオペレーティングシステム更新作業運用ネットワーク機器のパッチ適用作業

導入規模	学習済みモデルを利用して、中規模な推論同時アクセス数～100 複数部門利用～30部署
導入環境	データセンター、サーバールーム 200V電源（電源形状：NEMA L6-20P×2）合計6ラックユニット（1ノードの場合）消費電力 1KW程度

24時間/365日稼働を想定した高信頼GPU
NVIDIA RTX PRO 6000 （96GB GPUメモリ）を搭載した高信頼のGPU基盤をご提供します。
同時100アクセスに対応可能なハードウェア構成
同時10リクエストを実施時に、20トークン/秒以上のスループットで処理できる
※ 実利用条件が異なるため、あらゆる条件下でも同時アクセスに耐えられることを保証するものではありません。
多重アクセスにも強いソフトウェア構成
ハードウェアリソースを効率的に利用できるように、
無駄な処理待ち時間を最小化し、遂次処理する仕組みを組込んだ構成としております。

業務利用に適した言語モデルをプリインストールしております。
汎用的なLLM（大規模言語モデル）に加え、マルチモーダル対応のMLLM、図表やグラフ処理に強いVLMなどを搭載し、ご利用用途に合わせてモデルを切り替えながらLLMをご利用可能です。
RAG（検索拡張生成）の精度に関連する「エンベディングモデル」や文書解析ツールも搭載しており、複雑な表形式が含まれるPDF資料なども、高精度で解析、分析されることが可能です。

生成AIモデル ※同時に複数のLLM,VLMを利用することができません	LLM （言語モデル）	gpt-oss-20b	オープンソースで提供される 20B パラメータの汎用LLM。高い推論能力と自然な文章生成が可能であり、社内チャットボット基盤や社内QA・FAQの自動化処理に適しているモデル
	MLLM （マルチモーダル）	Gemma3-12B-it-GPTQ	Gemma3 の軽量版AIモデル。省メモリで高速動作を実現し、社内ツールへのAI組み込みや文章処理に利用可能
	MLLM （マルチモーダル）	Gemma3-27B-it-GPTQ	12B よりも高精度な理解力を持ち、情報検索・文書生成・文章要約など精度重視の業務に適しているモデル
	VLM （図表・グラフ）	Karakuri-VL-32B-Instruct	日本語を含む多言語の画像内テキストを理解することや図表の読解に強みがあるモデル
エンベディングモデル	Ruri-v3-310m	軽量で高速に動作し、社内ツールの簡単な自動化やチャットボットに利用可能なモデル
エンベディングモデル	multilingual-e5-large	多言語処理に対応可能。文章の意味を理解して必要な情報を探し出すこと（意味検索）を得意とし、資料検索や問い合わせ対応などに適しているモデル

搭載LLMは、購入時期によって変わる可能性がございます。最新の搭載モデルはCUVIC GPU Zeroサービス担当までお問い合わせください。

このページのソリューション・関連情報が属するキーワードで探す