ローカルLLMを15万円で｜Ryzen AI 7 350搭載PC構築ガイド

はじめに：クラウドAIの「壁」に気づいた日
なぜ今、このPCなのか——50 TOPSという閾値の意味
開封〜セットアップ：15分で動かすまでの手順
1. スペック早見表
実用ベンチマーク：ビジネス用途での体感速度
「完全無料・無制限」の経済合理性を計算する
開発者・ライターなどの職種別：実際のワークフロー
弱点と正直な評価
購入ガイド：Amazonで間違えずに買うために
まとめ：これはガジェット趣味ではなく、インフラ投資だ

はじめに：クラウドAIの「壁」に気づいた日

ChatGPT Plusのレート制限に引っかかったのは、締め切り前日の深夜だった。提案書の草案を一気に仕上げようとしていたその夜、「リクエストが多すぎます。しばらく待ってください」という文字が画面に表示された瞬間、自分のAI活用が根本的に他者のインフラに依存しているという現実を突きつけられた。

月額課金、レート制限、プライバシーの懸念——これらはクラウドAIを使い続けることのリアルなコストだ。未公開のコードやビジネス文書をOpenAIのサーバーに送り続けることに、慣れてはいけない感覚がずっと残っていた。

そこで選んだ答えが、15万円のRyzen AI 7 350搭載PCだった。

HP OmniBook7 Aero 13-bg 13.3インチグレイシャーシルバー (BF8H6PA-AAAA)

￥229,900（2026/07/27 10:22時点）

Amazonの商品レビュー・口コミを見る

▲筆者が購入したHP OmniBook 7 Aero 13（Ryzen AI 7 350/32GB/1TB）

なぜ今、このPCなのか——50 TOPSという閾値の意味

Ryzen AI 7 350の核心は、50 TOPS（Tera Operations Per Second）のNPU（Neural Processing Unit）を内蔵している点だ。

NPUとは何か。一言で言えば、AI推論に特化した演算ユニットだ。CPUは汎用処理、GPUは並列演算に強いが、NPUはAIのテンソル演算だけに最適化されており、圧倒的な電力効率を誇る。発熱が少なく、バッテリーを消費しにくい。

なぜ50 TOPSが実用的な閾値なのか。AMDの検証データによれば、4ビット量子化されたGemma3モデル（1Bおよび4B）をNPU上で動作させた場合、CPUと比較して最大33.5倍のプリフィル速度、最大8.7倍のデコード速度を達成した。電力効率においては、iGPUやCPUと比較して最大222.9倍の改善（tokens/sec/W）を記録している。

つまり、ノートPC上でもAIが「静かに、熱くならず、速く」動く。これは実用上、非常に大きな意味を持つ。

2026年時点でAMDはGemma 4の軽量モデル（E2BおよびE4B）への完全NPU対応を確認済みだ。FastFlowLMというOllama互換のフレームワークがNPU上での推論を実現しており、コンテキストウィンドウ256kまでのトークンストリーミングが可能になっている。

一点、正直に書いておく。2025年末時点ではNPUを使ったローカルLLM実行は「ドライバが整っておらず実質使えない」という報告が多かった。しかし、AMDとエコシステムの整備が急速に進み、現在は実用的な環境が揃いつつある。後述の弱点セクションも参照してほしい。

開封〜セットアップ：15分で動かすまでの手順

スペック早見表

項目	仕様
CPU	AMD Ryzen AI 7 350（8コア16スレッド）
NPU	50 TOPS
RAM	32GB LPDDR5X
ストレージ	1TB NVMe SSD
OS	Windows 11 Home

セットアップの流れはシンプルだ。

1. Ollamaのインストール（5分）
公式サイトから実行ファイルをダウンロードしてインストール。コマンド一行で完結する。

2. Gemma 4 E4Bモデルの取得（3〜5分）

ollama pull gemma4:e4b

モデルサイズは約3GB。ダウンロードが終わればすぐに使える。

3. FastFlowLMの導入（3分）
NPU推論を使いたい場合はFastFlowLMを追加インストールする。Ollama APIと互換性があるため、既存のツール・プラグインをそのまま利用できる。

初回起動からレスポンスまで体感2〜3秒。これはClaude.aiのWebインターフェースと遜色ない速度感だ。

実用ベンチマーク：ビジネス用途での体感速度

抽象的なベンチマーク数値より、実際の業務で何ができるかの方が重要だ。

コード補完（VS Code + Continue）

Gemma 4 E4BをNPUで動かした場合、30〜40 tokens/secを安定して出せる。一般的な関数補完や変数名の提案はリアルタイムに近い速度で返ってくる。GPT-4o APIが混雑時に遅延するケースと比べると、むしろ体感が上のこともある。

長文ドラフト生成

2000字程度の提案書ドラフトなら1〜2分で生成できる。Claude SonnetやGPT-4oと比較すると文章の多様性に若干の差は感じるが、「叩き台」として十分使える品質だ。プロンプトを最適化すれば、実用上の差はほとんど感じなくなる。

RAG（ローカル文書検索）

LlamaIndexと組み合わせることで、自社の資料・議事録・仕様書をローカルで検索しながら回答を生成できる。クラウドAIでは絶対に実現できない「社外秘データを使った質問応答がオフラインで完結する」環境だ。法律事務所、コンサルタント、スタートアップのCTO層に直接刺さるユースケースだと感じている。

クラウドAIとの正直な比較

日常業務の7〜8割のタスクはローカルLLMで十分に処理できる。残り2〜3割の高度な推論が必要な局面でのみクラウドを使う、というハイブリッド戦略が現実的だ。GPT-4oやClaude Opus 4.7クラスの「深い推論」が必要な仕事を、ローカルが全て代替できるとは言わない。それでも、日常の大半をローカルで回せることの価値は十分に大きい。

「完全無料・無制限」の経済合理性を計算する

感情論を排して数字で考える。

ChatGPT Plus：月額3,000円 × 60ヶ月（5年）＝18万円
Claude Pro：月額3,000円 × 60ヶ月（5年）＝18万円
両方契約している場合：36万円

このPCへの投資は15万円（一回限り）。電気代の増加分を月800円と見積もっても、5年間で約4.8万円。トータル約20万円で、クラウド2サービス継続の36万円を大幅に下回る。

さらに見落とされがちなコストがある。プライバシーコストだ。未公開の製品仕様、採用候補者の情報、M&Aの検討資料——これらをクラウドAIに投げることのリスクを金額換算するのは難しいが、「ゼロではない」ことは明白だ。ローカルLLMはそのリスクをゼロにする。

投資回収ラインは約25ヶ月。ChatGPT PlusとClaude Proを両方使っている場合、2年強でペイできる計算だ。

開発者・ライターなどの職種別：実際のワークフロー

【開発者向け】

VS Code + ContinueをローカルOllamaに向けるだけで、GitHub Copilotと同等のコード補完環境が無料で手に入る。テスト生成・コードレビュー・ドキュメント生成もローカルで完結する。APIキーの管理も、課金の心配もない。プライベートリポジトリのコードをそのままAIに読み込ませても、情報漏洩リスクがゼロだ。

【ライター・企画職向け】

ObsidianとローカルRAGの組み合わせが強力だ。過去に書いた記事・メモ・資料を全てベクトル化しておけば、「あの資料をもとに新しい提案書を書いて」という指示に、ローカルのAIが自分のナレッジベースを参照しながら答えてくれる。NotionAIやGPT-4oでは実現できない、完全にパーソナライズされたAIアシスタントだ。

オフライン環境での稼働

新幹線の中でも、ホテルのWi-Fiが不安定な海外出張中でも、AIは止まらない。「インターネット接続が前提のツール」という制約から解放されることの価値を、使い始めると強く実感する。

弱点と正直な評価

画像生成・動画AI

Stable DiffusionのフルモデルやSoraクラスの動画生成には力不足だ。それらを目的とするなら、外付けGPUか専用マシンが必要になる。このPCはテキスト系AIに特化した投資だと割り切るべきだ。

NPUエコシステムの成熟度

前述のとおり、2025年末時点ではNPUを使ったローカルLLM実行が実質機能しないという報告が複数存在した。現在はFastFlowLMとOllamaの組み合わせで実用的に動作するようになっているが、まだWindowsドライバの更新依存が残る部分があり、発展途上であることは認識しておくべきだ。

Apple Silicon（MacBook Pro）との比較

MBPのNeural Engineを活用したローカルLLM環境は成熟度が高く、特にmacOSエコシステムにいる人には安定性で一歩先行している面がある。すでにMacをメイン機にしている場合は、あえて移行するメリットを慎重に検討してほしい。

購入ガイド：Amazonで間違えずに買うために

Ryzen AI 7 350搭載PCを選ぶ際の確認事項を3点に絞る。

RAMは32GB以上：ローカルLLMはメモリを大量に消費する。16GBでは量子化モデルを動かせても、他のアプリとの共存が厳しい。32GBが最低ライン。
ストレージは1TB以上：Gemma 4 E4Bは約3GBだが、複数のモデルを入れ、RAGのベクトルDBを置き始めると消費は一気に増える。
型番にNPU 50 TOPSの記載があるか確認：Ryzen AI 300シリーズでもNPU性能が異なるモデルが存在する。スペック欄に「NPU: 50 TOPS」または「Ryzen AI 7 350」と明記されているものを選ぶこと。

まとめ：これはガジェット趣味ではなく、インフラ投資だ

クラウドAIは便利だ。しかしその便利さは、他者のサーバーと規約に依存した便利さだ。いつでも制限され、課金され、仕様を変更される。

ローカルLLMは、AI能力を自分のマシンに所有することを意味する。レート制限も、プライバシーリスクも、月額費用も存在しない。15万円は一時的な出費だが、その対価として得られるのは何年にもわたって稼働し続ける、自律したAI環境だ。

クラウドAIへの依存を断ち切ることは、開発速度の向上だけでなく、情報の主権を自分に取り戻すことでもある。自分のAI、自分のペースで、無制限に。

それが、このPCを選んだ理由だ。

モデルのファインチューニング（LoRA）や複数モデルの切り替え自動化など、次のステップはまだ先にある。ローカルAI環境は、一度構築して終わりではなく、育て続けるインフラだ。

15万円で手に入れる、クラウド不要のAI開発環境｜Ryzen AI 7 350搭載PCで構築するローカルLLM完全ガイド