Llama（ラマ）の使い方や日本語は？ダウンロード手順とブラウザ実装サイト。 / メモ / いがわ

Llama（ラマ）の使い方や日本語は？ダウンロード手順とブラウザ実装サイト。

2023.07.21 2024.09.26更新。

Contents - 目次

1 Llamaとは？
2 Llama。Meta社による会話型、対話型AI、LLM。
3 Llamaのダウンロードページ。
4 Llama 2、Llama 3のブラウザ実装サイト。
5 AI 関連メモ。

Llamaとは？

Meta社のLLM（大規模言語モデル）。

Llama

Llamaは、Meta社による会話型、対話型のAI。

OpenAI社のChatGPTと同じく、もともとはGoogle社が開発したTransformer (機械学習、深層学習モデル)による自然言語処理をベースとしている。

動物のラマ（リャマ）と同じスペルで、名前が可愛らしい。

MetaによるLLM。

LLMは「Large Language Models（大規模言語モデル）」の略称であり、ChatGPTやBard（現Gemini）、Bing Chat（現Copilot）などの生成AIのことを指す言葉。

Llamaと会話できる？チャットサイトの使い方や日本語対応は？

Llama。Meta社による会話型、対話型AI、LLM。

次世代LLM。Llama 2、そしてLlama 3。

Llamaは「Large Language Model Meta AI（Metaの大規模言語モデル）」の略称となっており、FacebookやInstagramで有名なMeta社による生成AI。

今回はそのLlamaの、バージョンアップ版となる。

※後日追記）

2024.04.19 – Llama 3モデルが登場。
2024.07.24 – Llama 3.1モデルが登場。
2024.09.26 – Llama 3.2モデルが登場。

Llama 2、Llama 3にできること。

自然言語による会話。
文章の生成。
翻訳。
インターネット検索。
AIチャットシステムの作成。
MicrosoftのAzureやWindows、AmazonのAWSなどでの活用。

※Llama 3.1は画像生成も可能。
※Llama 3.2（11Bと90B）は画像認識も可能。

その他、さまざまな場面で使用されていくと思われる。

引用元サイト：Llama 3.2

Llamaは、商用利用可、かつ無料で使える。

Llama 2の発表時には、Meta社のブログによると、Microsoft社も関わっており、研究や商用利用が無料で可能とのアナウンスがされていた。

（※月間ユーザー数が7億人を超えると、追加ライセンスのリクエストが必要。）

その後にリリースされたLlama 3もオープンソースなので、基本的に無料で商用使用ができる。

Llamaとラマ、そして人間とのニューラルネットワークは可能だろうか？

Llama 2、Llama 3の読み方は？

Llama 2、Llama 3の読み方は、そのまま「ラマツー」、「ラマスリー」となる見通し。

Llama 2の日本語対応は？

後述のチャットサイトなどで日本語対応がされているが、実際に会話してみたところ、現時点では日本語力は高くない。

また、使用モデル（7B、13B、70B）によって、精度が異なる。

日本語の情報量、学習量が少ないことが想定されるので、これから対応していくと思われる。

Llama 3の日本語対応は？

日本語能力は着実に向上している。405Bのモデルも登場。

Llama 2、Llama 3はオープンソースで提供。

Llama 3.2では、モバイル（スマホなど）向けに1Bと3Bの軽量モデルも登場。

オープンソースで軽量モデル（1Bと3B）とマルチモーダルモデル（11Bと90B）が提供されている。

（※リニューアルなどでサイトのデザインが変わっていることがあります。）

引用元サイト：AI at Meta

商用利用とライセンスの注意点。

商用利用も可能。ただしLlama 2コミュニティライセンス契約によると、月間ユーザー数が7億人を超えている場合は追加ライセンスが必要となる。

ライセンス契約や利用規約などについては下記ページへ記載されている。

参照： Llama 2 Community License Agreement – Meta AI （英語。ブラウザで翻訳可。）
参照：Use Policy （英語。ブラウザで翻訳可。）

Llamaのダウンロードページ。

Metaの公式サイトに、Llamaのダウンロードページが用意されている。

※2024.09.26 追記）

2024年9月26日現在の最新バージョン、Llama 3.2のダウンロードも可。

Metaのダウンロードページへ。

引用元サイト：Meta Llama

Llamaモデルへのアクセスリクエスト。

ページ内の「Download」をクリックすると画面が切り替わり、Metaへリクエストを送るための、氏名やメールアドレスなどの入力項目が現れる。

Meta Llamaのダウンロードサイトの画像。

ブラウザでの日本語訳。

Meta Llamaのダウンロードサイトの画像。

引用元サイト：Download Llama

ダウンロード注意点。

ダウンロードされるのはあくまでもコード類であり、実装するためには、Pythonやコマンドプロンプトやターミナル、GitHubなどの、プログラム系の知識が必要。

（※ChatGPTやGeminiなどのように、チャットだけを試してみたい場合は、下記にLlama 2 チャットサイトの紹介があります。）

Llama 2と、Llama 3のモデル。

Llama 2には以下の３つのモデルがある。

Llama 2-7B：70億パラメータ
Llama 2-13B：130億パラメータ
Llama 2-70B：700億パラメータ

（※「B」は「Billion（10億）」の略。）

Llama 3は以下の2つのモデル。

Llama 3-8B：80億パラメータ
Llama 3-70B：700億パラメータ

（※「B」は「Billion（10億）」の略。）

Llama 3.1は以下の3つのモデル。

Llama 3.1-8B：80億パラメータ
Llama 3.1-70B：700億パラメータ
Llama 3.1-405B：4050億パラメータ

（※「B」は「Billion（10億）」の略。）

Llama 3.2は以下の4つのモデル。

Llama 3.2-11B：110億パラメータ
Llama 3.2-90B：900億パラメータ
Llama 3.2-1B：10億パラメータ
Llama 3.2-3B：30億パラメータ

（※「B」は「Billion（10億）」の略。）

パラメータが増えていくにつれ精度、性能が高くなるが、その分インストールするローカル環境のスペックによってはかなり重たくなってしまう。

先代のLlamaを全てダウンロードすると200GBを超えるという情報や、Llama 2の7Bモデルだけで13GBや16GB以上という情報もあった。

LLMのパラメータは、ニューロンとシナプス、ニューラルネットワークのよう。

LLMのパラメータとは？

LLMのパラメータは、人間の脳で例えた場合、ニューロン（神経細胞）をつなぐシナプスのようなものと言われたりする。

基本的に数が多いほど学習量が多く、情報量や情報伝達に長けている。

ただし情報過多になると逆に判断力が鈍ってしまうように、単純にパラメータが多ければ良いというわけではない。

目安としては、他のLLMのパラメータは以下の数となっている。

（※確認できた範囲、またはそれぞれのAIに聞いてみたおおよその数値。）

GPT-3：175B（1,750億）パラメータ
ChatGPT 3.5：355B（3,550億）パラメータ
GPT-4：非公開
Gemini Nano：3.25B（32.5億）パラメータ
Gemini Pro、Ultra：非公開
Grok-1：314B（3,140億）パラメータ
Claude 3：非公開

GitHubからLlamaをダウンロードできる。

GitHubのLlama。

Llama 2の事前トレーニング済みモデルは、2兆のトークンでトレーニングされているという。

トークン数が多いほど単語や文字数の扱いに長けるが、GitHub上のREADMEによると、事前トレーニング済みモデルはチャットやQ&A用に微調整されていないとのこと。

なので、3つのモデルがさらに２つに分けられる。

Pretrained Models（事前トレーニング済みモデル）
Fine-tuned Chat Models（チャット用にファインチューニングされたモデル。llama-2-7b-chat、llama-2-13b-chat、llama-2-70b-chatなど。）

pets要チェック、README。

※2023.07.18時点で、ダウンロードやライセンス同意についての注意が記載されている。

参照：facebookresearch/llama: Inference code for LLaMA models

AzureやWindowsにおけるLlama。

Microsoft Azureのクラウドで活用できるようになり、Windows上のローカル環境での実行にも最適化されているとのこと。

参照：Meta and Microsoft Introduce the Next Generation of Llama

MetaのLLM。Llama 2。

Llama 2、Llama 3のブラウザ実装サイト。

Llamaのブラウザ実装サイト。

すでにLlamaのチャットモデルをサイトに実装している方々がおり、ブラウザ上で会話を試すことができる。

注意点。

ChatGPTやGemini、Copilotなどと同じように、個人情報や機密情報の入力には気をつけた方が無難。

HuggingChat（ハギングチャット）。

アカウント不要かつ無料で、Llamaとチャットが可能。

モデルの選択。

HuggingChatの画面左下の「Models」をクリック。

HuggingChatでは、Llama 3.1の2つのモデルが実装されている。

画面は英語でも、チャットは日本語で可能。ログイン不要で無料でも使える。

（※スクショはダークモード時のもの。）

Llama 3.1の使い方の例。

ModelsからLlama-3.1のモデルを選択。

HuggingChatには現時点、「Llama-3.1-70B」と「Llama-3.1-405B」が用意されている。

70B、405Bのうち、チャットをしてみたい方のモデルをクリックする。

Llama 3.1の使い方の例。

画面下部の入力欄にテキストを入力。

使い方。

使い方はChatGPTやClaudeなどの他の生成AIと同じく、テキストによるキャッチボール形式。

Llama 3.1の使い方の例。

混雑中などで反応が遅いこともあるので、しばらく待つか、モデルを変えてみる。

Llama 3.1の使い方の例。

ログインなしの場合のリミット。

ログインをしないと制限がかかる。無料プランが用意されているので、アカウント登録しておくと良いかも。

Llama 3.1の使い方の例。

ブラウザによる日本語訳。

参照：HuggingChat

Chat with Meta Llama 3.1 on Replicate

アカウント不要かつ無料で、Llamaとチャットが可能。

（※2024.09.26現在、使用方法が変わっています。APIトークンの入力が求められ、GitHubなどのアカウントが必要となっています。）

モデルの選択。

LLaMA2 Chatbot（現Chat with Meta Llama 3.1 on Replicate）の場合は、画面上のメニューから、Llama 2やLlama 3のモデルを選択できる。

最新モデルのLlama 3.1 405Bも、無料で使える。インターフェイスは英語でもチャットは日本語もOK。

LLaMA Chatbotのチャット画面。

Settings – 設定。

画面右側の「Settings」をクリックするとサイドバーが現れ、文字数などの調整ができる。

LLaMA Chatbotのチャット画面。

参照：Chat with Meta Llama 3.1 on Replicate

モデルや文字数の調整などについて。

Llama Size: サイズが大きいほどスマートになるが、速度は遅くなる。
System Prompt: プロンプトの先頭に追加され、システムの動作をガイドするのに役立つとのこと。
Temperature: ランダム性の調整。1以上はランダム。MAXは5。0.75が適切な開始値。
Max Tokens：チャットの最大文字数。ChatGPT（GPT-3.5）の目安が日本語2,048文字まで。
Top P: テキストをデコード（解読）するときに、最も可能性の高いトークン（単語や句読点で分けたテキスト）の上位からサンプリングする。MAXは1。

使い方。

チャットは、同じく画面下の入力欄から始められる。

（※スクショはダークモード時のもの。）

LLaMA Chatbotのチャット画面。

参照：Chat with Meta Llama 3.1 on Replicate

日本語レベル。

Llama 2のときの日本語対応は、ChatGPT（GPT-3.5）などに比べ、まだちょっと時間を要しそうだった。

Llama 3、Llama 3.1とモデルの性能が上がるたびに、徐々に学んでいくと思われる。

ReplicateのLlama。

アカウント不要かつ無料で、Llamaとチャットが可能。

（※2024.09.26現在、使用方法が変わっています。APIトークンの入力が求められ、GitHubなどのアカウントが必要となっています。）

GitHubを見てみたところ、「https://llama.replicate.dev」というサイトもあり、全く同じ作り、ソースコードになっている。

LLaMA Chatbotのチャット画面。

参照：Chat with Meta Llama 3 on Replicate

両サイトともログイン不要で使用可能。

Replicateとはユーザーが投稿したAIを試すことができるWebサービスの１つ。

Perplexity Labs

アカウント不要かつ無料で、Llamaとチャットが可能。

Perplexity Labsは、今のところアカウント不要でかつ無料で使うことができる。

モデルの選択。

画面右下のメニューからモデルを選択できる。こちらは70Bでも回答速度はなかなか速い。

モデル数も着々と増えている。

LlamaなどのLLMを使用した、Perplexity Labsのサイトの画面。

日本語レベル。

当初は日本語での会話は難しかったが、こちらも数ヶ月間で驚くほど上達している。

使い方。

画面下の入力欄から始められる。

Llamaを利用した、Perplexity Labsの画面。

参照：Perplexity Labs

Perplexity Labsには、いまのところLlama 3.1モデルはない。

画面右上のボタンから進める、日本でも2024年春ころから話題となっている検索AI「Perplexity」の開発の方を優先しているのかもしれない。

ELYZA（イライザ）

東大、松尾研究室発のAIモデル&カンパニー。

日本人によるLlama 2デモサイト。

参照：elyza (ELYZA.inc)

アカウント不要かつ無料で、Llamaとチャットが可能。

ELYZAのデモサイトも、今のところアカウント不要でかつ無料で使うことができる。

モデルの選択。

7Bモデルと13Bモデルのデモが、URLによって分けられている。

※現在は公開終了済みとのこと。あたらしいデモサイトは、ELYZA LLM for JP (デモ版) | 株式会社ELYZA から利用可能。

日本語レベル。

日本語は得意で返答速度もスムーズ。気軽なチャットができる。知識レベルはこれから学んでいくのだと思われる。

使い方。

利用規約に同意してから、すぐに利用ができる。日本語なので、使いやすい。

ELYZA LLM for JP (デモ版 ) 利用規約の画面。

ELYZAとのチャット例。

ELYZA LLM for JP (デモ版) | 株式会社ELYZAの画面。

参照：ELYZA LLM for JP (デモ版) | 株式会社ELYZA

replicate / llama-2-70b-chat

アカウント不要かつ無料で、Llamaとチャットが可能。

Replicateとは？

Replicate.comでは、機械学習された生成AIを使うことができる。言語生成だけでなく、画像生成や動画生成のAIもある。短時間の利用であれば無料。

研究者、開発者向けな感じのサイトで初心者用とは言えないが、翻訳を使えば色々と試せる。

Replicateのサイトから直接、replicate/llama-2-70b-chat – Run with an API on Replicateを使っても、アカウント不要かつ無料で、Llama 2 チャットができる。

モデルの選択。

モデルは各ページ別となっている。こちらも70Bでも回答速度は遅くない。

Llama 2

7Bの場合は、llama-2-7b-chat
13Bの場合は、llama-2-13b-chat
70Bの場合は、llama-2-70b-chat

日本語レベル。

日本語でチャットはできるが、操作方法がちょっと難しいかもしれない。

Llama 3.1

405B：meta-llama-3.1-405b-instruct

使い方。

画面左側の入力欄（「Input」 > 「prompt」）から始められる。回答のランダム性の調整や生成するトークン数なども細かく調整可能。

日本語でのチャットも可能。

Llama 2 – 70B

Llama 2-Chat - Replicateの画面。

Llama 3.1 – 405B

Llama 3.1-Chat - Replicateの画面。

参照： meta/llama-2-70b-chat – Run with an API on Replicate

Llamaの使い方、日本語対応を考える猫ちゃん。

参照： meta/llama-2-70b-chat – Run with an API on Replicate

以上、参考になれば幸いです。

AI 関連メモ。

ChatGPT 関連メモ。

Gemini 関連メモ。

Copilot、Bing 関連メモ。

Llama 関連メモ。

Claude 関連メモ。

※Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。（元々はメモ書きでした。） ※事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 ※写真は主にUnsplashやPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。