Contents - 目次
Llamaとは?
Meta社のLLM(大規模言語モデル)。
Llama
Llamaは、Meta社による会話型、対話型のAI。
OpenAI社のChatGPTと同じく、もともとはGoogle社が開発したTransformer (機械学習、深層学習モデル)による自然言語処理をベースとしている。
動物のラマ(リャマ)と同じスペルで、名前が可愛らしい。
MetaによるLLM。
LLMは「Large Language Models(大規模言語モデル)」の略称であり、ChatGPTやBard(現Gemini)、Bing Chat(現Copilot)などの生成AIのことを指す言葉。
Llama。Meta社による会話型、対話型AI、LLM。
次世代LLM。Llama 2、そしてLlama 3。
Llamaは「Large Language Model Meta AI(Metaの大規模言語モデル)」の略称となっており、FacebookやInstagramで有名なMeta社による生成AI。
今回はそのLlamaの、バージョンアップ版となる。
- 2024.04.19 – Llama 3モデルが登場。
- 2024.07.24 – Llama 3.1モデルが登場。
- 2024.09.26 – Llama 3.2モデルが登場。
Llama 2、Llama 3にできること。
- 自然言語による会話。
- 文章の生成。
- 翻訳。
- インターネット検索。
- AIチャットシステムの作成。
- MicrosoftのAzureやWindows、AmazonのAWSなどでの活用。
※Llama 3.1は画像生成も可能。
※Llama 3.2(11Bと90B)は画像認識も可能。
その他、さまざまな場面で使用されていくと思われる。
引用元サイト:Llama 3.2
Llamaは、商用利用可、かつ無料で使える。
Llama 2の発表時には、Meta社のブログによると、Microsoft社も関わっており、研究や商用利用が無料で可能とのアナウンスがされていた。
(※月間ユーザー数が7億人を超えると、追加ライセンスのリクエストが必要。)
その後にリリースされたLlama 3もオープンソースなので、基本的に無料で商用使用ができる。
Llama 2、Llama 3の読み方は?
Llama 2、Llama 3の読み方は、そのまま「ラマツー」、「ラマスリー」となる見通し。
Llama 2の日本語対応は?
後述のチャットサイトなどで日本語対応がされているが、実際に会話してみたところ、現時点では日本語力は高くない。
また、使用モデル(7B、13B、70B)によって、精度が異なる。
日本語の情報量、学習量が少ないことが想定されるので、これから対応していくと思われる。
Llama 3の日本語対応は?
日本語能力は着実に向上している。405Bのモデルも登場。
Llama 2、Llama 3はオープンソースで提供。
Llama 3.2では、モバイル(スマホなど)向けに1Bと3Bの軽量モデルも登場。
オープンソースで軽量モデル(1Bと3B)とマルチモーダルモデル(11Bと90B)が提供されている。
(※リニューアルなどでサイトのデザインが変わっていることがあります。)
引用元サイト:AI at Meta
商用利用とライセンスの注意点。
商用利用も可能。ただしLlama 2コミュニティライセンス契約によると、月間ユーザー数が7億人を超えている場合は追加ライセンスが必要となる。
ライセンス契約や利用規約などについては下記ページへ記載されている。
参照: Llama 2 Community License Agreement – Meta AI (英語。ブラウザで翻訳可。)
参照:Use Policy (英語。ブラウザで翻訳可。)
Llamaのダウンロードページ。
Llamaのダウンロードページ。
Metaの公式サイトに、Llamaのダウンロードページが用意されている。
2024年9月26日現在の最新バージョン、Llama 3.2のダウンロードも可。
Metaのダウンロードページへ。
引用元サイト:Meta Llama
Llamaモデルへのアクセス リクエスト。
ページ内の「Download」をクリックすると画面が切り替わり、Metaへリクエストを送るための、氏名やメールアドレスなどの入力項目が現れる。
ブラウザでの日本語訳。
引用元サイト:Download Llama
ダウンロード注意点。
ダウンロードされるのはあくまでもコード類であり、実装するためには、Pythonやコマンドプロンプトやターミナル、GitHubなどの、プログラム系の知識が必要。
(※ChatGPTやGeminiなどのように、チャットだけを試してみたい場合は、下記にLlama 2 チャットサイトの紹介があります。)
Llama 2と、Llama 3のモデル。
Llama 2には以下の3つのモデルがある。
- Llama 2-7B:70億パラメータ
- Llama 2-13B:130億パラメータ
- Llama 2-70B:700億パラメータ
(※「B」は「Billion(10億)」の略。)
Llama 3は以下の2つのモデル。
- Llama 3-8B:80億パラメータ
- Llama 3-70B:700億パラメータ
(※「B」は「Billion(10億)」の略。)
Llama 3.1は以下の3つのモデル。
- Llama 3.1-8B:80億パラメータ
- Llama 3.1-70B:700億パラメータ
- Llama 3.1-405B:4050億パラメータ
(※「B」は「Billion(10億)」の略。)
Llama 3.2は以下の4つのモデル。
- Llama 3.2-11B:110億パラメータ
- Llama 3.2-90B:900億パラメータ
- Llama 3.2-1B:10億パラメータ
- Llama 3.2-3B:30億パラメータ
(※「B」は「Billion(10億)」の略。)
パラメータが増えていくにつれ精度、性能が高くなるが、その分インストールするローカル環境のスペックによってはかなり重たくなってしまう。
先代のLlamaを全てダウンロードすると200GBを超えるという情報や、Llama 2の7Bモデルだけで13GBや16GB以上という情報もあった。
LLMのパラメータとは?
LLMのパラメータは、人間の脳で例えた場合、ニューロン(神経細胞)をつなぐシナプスのようなものと言われたりする。
基本的に数が多いほど学習量が多く、情報量や情報伝達に長けている。
ただし情報過多になると逆に判断力が鈍ってしまうように、単純にパラメータが多ければ良いというわけではない。
目安としては、他のLLMのパラメータは以下の数となっている。
(※確認できた範囲、またはそれぞれのAIに聞いてみたおおよその数値。)
- GPT-3:175B(1,750億)パラメータ
- ChatGPT 3.5:355B(3,550億)パラメータ
- GPT-4:非公開
- Gemini Nano:3.25B(32.5億)パラメータ
- Gemini Pro、Ultra:非公開
- Grok-1:314B(3,140億)パラメータ
- Claude 3:非公開
GitHubのLlama。
Llama 2の事前トレーニング済みモデルは、2兆のトークンでトレーニングされているという。
トークン数が多いほど単語や文字数の扱いに長けるが、GitHub上のREADMEによると、事前トレーニング済みモデルはチャットやQ&A用に微調整されていないとのこと。
なので、3つのモデルがさらに2つに分けられる。
- Pretrained Models(事前トレーニング済みモデル)
- Fine-tuned Chat Models(チャット用にファインチューニングされたモデル。llama-2-7b-chat、llama-2-13b-chat、llama-2-70b-chatなど。)
要チェック、README。
※2023.07.18時点で、ダウンロードやライセンス同意についての注意が記載されている。
参照:facebookresearch/llama: Inference code for LLaMA models
AzureやWindowsにおけるLlama。
Microsoft Azureのクラウドで活用できるようになり、Windows上のローカル環境での実行にも最適化されているとのこと。
参照:Meta and Microsoft Introduce the Next Generation of Llama
Llama 2、Llama 3のブラウザ実装サイト。
Llamaのブラウザ実装サイト。
すでにLlamaのチャットモデルをサイトに実装している方々がおり、ブラウザ上で会話を試すことができる。
注意点。
ChatGPTやGemini、Copilotなどと同じように、個人情報や機密情報の入力には気をつけた方が無難。
HuggingChat(ハギングチャット)。
アカウント不要かつ無料で、Llamaとチャットが可能。
モデルの選択。
HuggingChatの画面左下の「Models」をクリック。
HuggingChatでは、Llama 3.1の2つのモデルが実装されている。
画面は英語でも、チャットは日本語で可能。ログイン不要で無料でも使える。
(※スクショはダークモード時のもの。)
ModelsからLlama-3.1のモデルを選択。
HuggingChatには現時点、「Llama-3.1-70B」と「Llama-3.1-405B」が用意されている。
70B、405Bのうち、チャットをしてみたい方のモデルをクリックする。
画面下部の入力欄にテキストを入力。
使い方。
使い方はChatGPTやClaudeなどの他の生成AIと同じく、テキストによるキャッチボール形式。
混雑中などで反応が遅いこともあるので、しばらく待つか、モデルを変えてみる。
ログインなしの場合のリミット。
ログインをしないと制限がかかる。無料プランが用意されているので、アカウント登録しておくと良いかも。
ブラウザによる日本語訳。
参照:HuggingChat
Chat with Meta Llama 3.1 on Replicate
アカウント不要かつ無料で、Llamaとチャットが可能。
(※2024.09.26現在、使用方法が変わっています。APIトークンの入力が求められ、GitHubなどのアカウントが必要となっています。)
モデルの選択。
LLaMA2 Chatbot(現Chat with Meta Llama 3.1 on Replicate)の場合は、画面上のメニューから、Llama 2やLlama 3のモデルを選択できる。
最新モデルのLlama 3.1 405Bも、無料で使える。インターフェイスは英語でもチャットは日本語もOK。
Settings – 設定。
画面右側の「Settings」をクリックするとサイドバーが現れ、文字数などの調整ができる。
参照:Chat with Meta Llama 3.1 on Replicate
モデルや文字数の調整などについて。
- Llama Size: サイズが大きいほどスマートになるが、速度は遅くなる。
- System Prompt: プロンプトの先頭に追加され、システムの動作をガイドするのに役立つとのこと。
- Temperature: ランダム性の調整。1以上はランダム。MAXは5。0.75が適切な開始値。
- Max Tokens: チャットの最大文字数。ChatGPT(GPT-3.5)の目安が日本語2,048文字まで。
- Top P: テキストをデコード(解読)するときに、最も可能性の高いトークン(単語や句読点で分けたテキスト)の上位からサンプリングする。MAXは1。
使い方。
チャットは、同じく画面下の入力欄から始められる。
(※スクショはダークモード時のもの。)
参照:Chat with Meta Llama 3.1 on Replicate
日本語レベル。
Llama 2のときの日本語対応は、ChatGPT(GPT-3.5)などに比べ、まだちょっと時間を要しそうだった。
Llama 3、Llama 3.1とモデルの性能が上がるたびに、徐々に学んでいくと思われる。
ReplicateのLlama。
アカウント不要かつ無料で、Llamaとチャットが可能。
(※2024.09.26現在、使用方法が変わっています。APIトークンの入力が求められ、GitHubなどのアカウントが必要となっています。)
GitHubを見てみたところ、「https://llama.replicate.dev」というサイトもあり、全く同じ作り、ソースコードになっている。
参照:Chat with Meta Llama 3 on Replicate
両サイトともログイン不要で使用可能。
Replicateとはユーザーが投稿したAIを試すことができるWebサービスの1つ。
Perplexity Labs
アカウント不要かつ無料で、Llamaとチャットが可能。
Perplexity Labsは、今のところアカウント不要でかつ無料で使うことができる。
モデルの選択。
画面右下のメニューからモデルを選択できる。こちらは70Bでも回答速度はなかなか速い。
モデル数も着々と増えている。
日本語レベル。
当初は日本語での会話は難しかったが、こちらも数ヶ月間で驚くほど上達している。
使い方。
画面下の入力欄から始められる。
Perplexity Labsには、いまのところLlama 3.1モデルはない。
画面右上のボタンから進める、日本でも2024年春ころから話題となっている検索AI「Perplexity」の開発の方を優先しているのかもしれない。
ELYZA(イライザ)
東大、松尾研究室発のAIモデル&カンパニー。
日本人によるLlama 2デモサイト。
アカウント不要かつ無料で、Llamaとチャットが可能。
ELYZAのデモサイトも、今のところアカウント不要でかつ無料で使うことができる。
モデルの選択。
7Bモデルと13Bモデルのデモが、URLによって分けられている。
- ELYZA-japanese-Llama-2-13b-instruct-demo
- ELYZA-japanese-CodeLlama-7b-instruct-demo
- ELYZA-japanese-Llama-2-7b-instruct-demo
- ELYZA-japanese-Llama-2-7b-fast-instruct-demo
※現在は公開終了済みとのこと。あたらしいデモサイトは、ELYZA LLM for JP (デモ版) | 株式会社ELYZA から利用可能。
日本語レベル。
日本語は得意で返答速度もスムーズ。気軽なチャットができる。知識レベルはこれから学んでいくのだと思われる。
使い方。
利用規約に同意してから、すぐに利用ができる。日本語なので、使いやすい。
ELYZAとのチャット例。
参照:ELYZA LLM for JP (デモ版) | 株式会社ELYZA
replicate / llama-2-70b-chat
アカウント不要かつ無料で、Llamaとチャットが可能。
Replicateとは?
Replicate.comでは、機械学習された生成AIを使うことができる。言語生成だけでなく、画像生成や動画生成のAIもある。短時間の利用であれば無料。
研究者、開発者向けな感じのサイトで初心者用とは言えないが、翻訳を使えば色々と試せる。
モデルの選択。
モデルは各ページ別となっている。こちらも70Bでも回答速度は遅くない。
Llama 2
- 7Bの場合は、llama-2-7b-chat
- 13Bの場合は、llama-2-13b-chat
- 70Bの場合は、llama-2-70b-chat
日本語レベル。
日本語でチャットはできるが、操作方法がちょっと難しいかもしれない。
Llama 3.1
使い方。
画面左側の入力欄(「Input」 > 「prompt」)から始められる。回答のランダム性の調整や生成するトークン数なども細かく調整可能。
日本語でのチャットも可能。
Llama 2 – 70B
Llama 3.1 – 405B
参照: meta/llama-2-70b-chat – Run with an API on Replicate
参照: meta/llama-2-70b-chat – Run with an API on Replicate
以上、参考になれば幸いです。
AI 関連メモ。
ChatGPT 関連メモ。
- ChatGPT searchとは?使い方や、有料と無料、Googleとの違い。
- Chrome拡張機能、ChatGPT searchの使い方。自然言語、日常会話で検索。
- ChatGPTに検索機能。ChatGPT searchでWeb検索が可能に。
- MacとWindowsでもChatGPTと音声会話。Advanced Voiceが利用可能に。
- Advanced Voiceによる音声会話。ChatGPTとプラトニックな関係に?
- OpenAI o1の使い方。考えてから答える新しいChatGPTモデル。
- Voice Engineという名の、音声合成技術。日本語の精度は?
- SearchGPT。ChatGPTがAI検索エンジンに。使い方の例と順番待ちへの登録方法。
- GPT-4o miniが登場。ChatGPT無料版はGPT-3.5からバージョンアップ。
- ChatGPT無料ユーザーにもメモリ機能が。記憶や使い方の例。
- iPhoneやiPad、MacでChatGPT(GTP-4o)が。Apple Intelligence。
- 生成AIとWebデザイン、ChatGPTを活用したコーディングに必要なもの。
- ChatGPT最新モデル GPT-4oが無料でも。使える主な機能。
- ChatGPT(GPT-4o)で、PDF要約の精度を検証した結果。
- GPT-4o。ChatGPTと画像見ながら音声で会話?有料でも無料でも。
- ChatGPT無料版でも画像生成が可能に。有料版だけじゃない!?
- ChatGPT(チャットGPT)にアーカイブ機能が。復元も削除も。
- ChatGPT(チャットGPT)を日本語化。日本語設定の方法。
- ChatGPT(チャットGPT)との音声会話と、音声の変更方法。
- ChatGPTアプリのインストールとログイン方法、チャットの使い方。
- ChatGPT(チャットGPT)のスペルチェック、文章校正がむっちゃ楽。
- ChatGPT(チャットGPT)へのログイン方法。ログインできないとき。
- ChatGPTにプラグイン。広がる機能と使い方。最新情報へも。
- ChatGPTがLINEに?「AIチャットくん」の始め方、そして使い方。
- ChatGPTの始め方と使い方と。初心者向けシンプル版。
- ChatGPTはSVGアイコンを作れるのか?
- ChatGPTの文章作成やコーディング、SEO対策は変わるか?
DALL·E 関連メモ。
Sora 関連メモ。
- OpenAI Soraの短編映画。アーティストや映画制作者たち。
- OpenAIのSoraの公開デモから、Soraの仕組みをできるだけシンプルに。
- OpenAIからSora(動画生成AI)が広がる。デモやWebCMから一般公開へ。
Gemini 関連メモ。
- Google AI Studioの「Gemini 1.5 Pro 002とGemini Experimental 1114」にできること。
- Gemini 1.5 Pro 2Mモデル。Waitlistの登録手順。日本語上手なGoogle生成AI。
- BardからGeminiに。使い方はどう変わる?日本語対応は?
- Bard(Gemini)が絵を描けるように。テキストから画像生成の方法。
- Bard(Gemini)の画像認識の使い方。日本語対応済み、Googleレンズで画像読み取り。
- 最新情報を日本語かつ無料で使いたいときは、GoogleのBard?
- ChatGPTとBardの違い。なぜAIは日本語チャットが苦手なの?
- Bard(Gemini)が日本語対応。ログイン方法や最新情報など、使い方の例。
- BardでGemini。Googleの最新AIを無料で使う方法。
- GoogleのBardは、OpenAIのChatGPTを越えられるだろうか?
Copilot、Bing 関連メモ。
- ChatGPTとCopilotの違い。料金や、できることと、できないこと。
- Copilotとは? GPT-4とDALL·E 3が無料で使える生成AI。
- SkypeのBingチャット。GPT-4を日本語かつ無料で使える。& 注意点。
- BingのGPT-4、チャットの使い方。使えない?(今はまだ。)
- MacでGPT-4(ChatGPT最新版)を使う場合、Edgeが必要なのかも。
Llama 関連メモ。
- Llama 3.1登場。MetaのオープンソースAIとダウンロードサイト。
- Meta Horizon OSとApple Vision Pro。オープンかクローズか。
- Llama 3。無料でオープンソースなMeta AI最新モデル。
- Llama(ラマ)の使い方や日本語は? ダウンロード手順とブラウザ実装サイト。
Claude 関連メモ。
Perplexity 関連メモ。
- PerplexityとWordPressの名前と意味合い。著作権と知的財産。
- Perplexityの日本語化の方法と使い方や検索の例。
- Perplexity(パープレキシティ)のアカウント作成と使い方の基本。
※Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) ※事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 ※写真は主にUnsplashやPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。