Ollamaを使ってPC上でAI（LLM）を動かしてみた

入力履歴の外部流出や課金を気にせずに、PC上でChatGPTやGeminiを動かすことはできないか？ということに興味があって、年末年始休暇にOllamaを試してみた。

１．https://ollama.com/download　でOllama本体のインストラーをダウンロード

※Windows版は OllamaSetup.exeで1.2GB程度

２．インストールが完了したらWindowsPowershell（Mac/Linuxはターミナル）を開いてollamaと打ってエンターでUsage:（使い方）などが表示されることを確認。

３．Webブラウザで https://ollama.com/search （downloadした画面が開いていれば画面上部のModelsをクリックしてもよい）にアクセスしてダウンロードするモデルを選択する。

※モデルによってはデータサイズが数十GB以上になるので注意。モデル名の下部に[cloud][270m][1b][4b][12b]などと書かれているが、[cloud]を選択するとPC上での動作完結にならない、その他はおおよそのデータサイズに沿っているようだ。bはbillionでLLM(Large Language Model：大規模言語モデル）のデータ生成に使用したパラメータ数と言う方が正確のようだ。今回はgemma3:4b(3.3GB)を選択してみた。

モデル名の横に表示されるコピペ用ウィンドウで"ollama run gemma3:4b"の文字列をコピーする。

４．WindowsPowershell（Mac/Linuxはターミナル）で ollama run gemma3:4b と打って（貼り付けて）エンターを押下（実行）する。プログレスバーが100%の表示になってsuccessと表示されるまで待機する。

５．OllamaのGUIを起動してモデルを読み込む

※上記のモデルダウンロードに成功していればCUIベースで質問の入力と回答の表示は可能

Windowsではタスクトレイの横の上矢印をクリックしてOllamaのアイコンを押下する。

Macでは時計のそばにOllamaアイコンが表示されている。

６．OllamaのGUI画面で（＋）をクリックしてダウンロード済みのモデル（右にダウンロードアイコンが表示されていないもの）を選択する

７．これで準備完了、LINEのトーク画面のつもりで質問を入れるとGoogle GeminiベースのgemmaモデルがPC上で答えを返してくれる。

※GTX1650（VRAM4GB)のグラフィックボードでも一応仕事をしているようだ。低スペックのPCでは"gemma3:270m"というモデル（コマンド "ollama run gemma3:270m" で入手可能）が300MB弱のサイズなので、こういう小さなモデルから試してみてもよいかもしれない。なお、Settingsを開いて"Model Location"でモデルのダウンロード先が選択可能なのでストレージの空き容量に応じて変更すると良い。ChatGPTベースのモデルが試したい場合はgpt-oss系のモデルを選択する。

８．まとめ

個人的には現在の自分の主な使い方である「検索エンジンの進化版」としての使用では、回答内容、応答時間ともに十分実用に耐える印象だ。

「ちゃんばら」組曲の新曲

オーケストラとエレキギターのための「ちゃんばら」　第肆章 "宙"

学生のころから頭の中に響いている断片をつなぎ合わせて「今」の方法論でまとめ上げる作業もそろそろ限界かもと思うくらいこの曲は難産でした。

いったん距離を置こうかとも思いましたが、逆にこれを２０２５年内に仕上げて、２０２６年からは「ちゃんばら」を離れて新しい気持ちで創作するべきだ、と思うに至りました。

結局ここ（ちゃんばら）に戻ってくるかもしれませんが、新年は心機一転して別の曲調で始めたいと思っています。

Koichi IIJIMA ・ "Chanbara" for orchestra and electric guitar, Chapter 4 "Cosmos"

パルナッソス山遭難記

2025年12月30日火曜日

「ちゃんばら」組曲の新曲