Llama 3.1の登場。405Bも。MetaのオープンソースAIとダウンロードサイト。 / いがわ

.

Memo

Llama 3.1の使い方やダウンロードの仕方など。

Llama 3.1のモデルが発表。405Bモデルも。

Llama 3.1。 Metaのオープンソース AI。

Llama 3.1の3つのモデル。

オープンソースAIモデル「Llama」の最新モデルが、8B、70B、405Bと一気に登場。

特に405BモデルはLlama史上最大のモデルで、画像生成もできる模様。

Llama 3.1をローカルへ。Meta社のサイト。

参照:Llama 3.1

Llama 3.1のモデル。

Llama 2と同様に、以下の3つのモデルがある。

  • 405B: 4050億パラメータ。最も高性能な、最大の基盤モデル。
  • 70B: 700億パラメータ。コスト効率の高いモデル。
  • 8B: 80億パラメータ。軽量で、高速なモデル。
LLMのパラメータ数の目安。

確認できた範囲、またはそれぞれのAIに聞いてみたおおよその数値。)

  • GPT-3:175B(1,750億)パラメータ
  • ChatGPT 3.5:355B(3,550億)パラメータ
  • GPT-4:非公開
  • Gemini Nano:3.25B(32.5億)パラメータ
  • Gemini Pro、Ultra:非公開
  • Grok-1:314B(3,140億)パラメータ
  • Claude 3:非公開

マルチモーダルとしてのAI。

Llama3.1の主な機能。

Llama3.1の紹介ページを見ると、プロンプトによる画像生成(Text to Image)や、データ分析の例がある。

画像生成。

画像生成は他の生成AIと同様に、自然言語によるチャット形式のメッセージで、一度に4枚ずつ画像が生成されている。

推論やデータ分析、コーディング。

複雑な推論による画像生成や、ファイルをアップデートしてのデータ分析、コーディングのアシスタント機能などがある。


Llama 3.1とチャットができる、HuggingChat。

Hugging Face(ハギングフェイス)の
HuggingChat(ハギングチャット)。

使い方。

HuggingChatの画面左下の「Models」をクリック。

HuggingChatでは、すでにLlama 3.1の2つのモデルが実装されている。

画面は英語でも、チャットは日本語で可能。ログイン不要で、無料でも使える。

無料の場合は利用制限がある。

スクショはダークモード時のもの。)

Llama 3.1の使い方の例。

ModelsからLlama-3.1のモデルを選択。

HuggingChatには現時点、「Llama-3.1-70B」と「Llama-3.1-405B」が用意されている。

70Bか、405Bか、チャットをしてみたい方のモデルをクリックする。

Llama 3.1の使い方の例。

画面下部の入力欄にテキストを入力。

使い方はChatGPTやClaudeなどの他の生成AIと同じ、テキストによるキャッチボール形式。

使っていくうちに、すぐに慣れる。

Llama 3.1の使い方の例。

混み合っているときは反応が遅いこともある。

そのようなときは、しばらく待つか、モデルを変えてみると良いかもしれない。

Llama 3.1の使い方の例。

ログインなしの場合のリミット。

ログインをしない場合はリミットがある。無料プランが用意されているので、もっと使いたい場合はアカウント登録しておくと良いかも。

Llama 3.1の使い方の例。

ブラウザによる日本語訳。

Llama 3.1の使い方の例。HuggingChatの画面。

HuggingChatでの会話。無料での利用制限について。

Llama 3.1の使い方の例。HuggingChatの画面。

参照:https://huggingface.co/chat


Llama 3.1とチャットができる、Replicate。

Meta Llama 3.1 on Replicate

アカウント不要かつ無料で、Llamaとチャットが可能。
モデルの選択。

Chat with Meta Llama 3.1 on Replicate(旧LLaMA2 Chatbot)の場合は、画面上のメニューから、Llama 2やLlama 3のモデルを選択できる。

デフォルトは最新モデルのLlama 3.1 405Bとなっており、無料で使える。

インターフェイスは英語でも、チャットは日本語もOK。

スクショはダークモード時のもの。)

Llama 3.1の使い方の例。Meta Llama 3.1 on Replicateの画面。

Settings – 設定。

画面右側の「Settings」をクリックするとサイドバーが現れ、文字数などの調整ができる。

Llama 3.1の使い方の例。Meta Llama 3.1 on Replicateの画面。

モデルや文字数の調整などについて。
  • Llama Size: サイズが大きいほどスマートになるが、速度は遅くなる。
  • System Prompt: プロンプトの先頭に追加され、システムの動作をガイドするのに役立つとのこと。
  • Temperature: ランダム性の調整。1以上はランダム。MAXは5。0.75が適切な開始値。
  • Max Tokens: チャットの最大文字数。ChatGPT(GPT-3.5)の目安が日本語2,048文字まで。
  • Top P: テキストをデコード(解読)するときに、最も可能性の高いトークン(単語や句読点で分けたテキスト)の上位からサンプリングする。MAXは1。
使い方。

Meta Llama 3.1 on Replicateでのチャットの仕方は、ChatGPTやGemini、Copilotなどと同様、画面下の入力欄から始められる。

2024.08.13 追記)

現在はAPIトークンが必要。GitHubアカウントがあればすぐに取得可能で、初めて利用する場合は無料。

その後は使用した分だけ料金が発生し、クレジットカード情報の入力が必要となります。

参照:Pricing – Replicate

Llama 3.1の使い方の例。Meta Llama 3.1 on Replicateの画面。

参照:Chat with Meta Llama 3.1 on Replicate

APIトークンの取得方法。

Meta Llama 3.1 on Replicateへアクセス。

URL:Chat with Meta Llama 3.1 on Replicate

Llama 3.1 on ReplicateのAPIトークンの取得手順の画面。

Sign in with GitHubをクリック。

「Sign in with GitHub」をクリックすると、画面が進む。

Llama 3.1 on ReplicateのAPIトークンの取得手順の画面。

GitHubへログイン。

「Authorize replicate」をクリックし、次へ進む。

Llama 3.1 on ReplicateのAPIトークンの取得手順の画面。

APIトークンが表示される。

「API tokens」の「Default」に表示されている(一部が伏せ字となっている)文字列をコピーする。

Llama 3.1 on ReplicateのAPIトークンの取得手順の画面。

APIトークンを入力。

取得したAPIトークンをペーストすると、すぐにチャットが始められる。

Llama 3.1 on ReplicateのAPIトークンの取得手順の画面。


Llama 3.1のダウンロードURL。

Llama 3.1のダウンロード。

Llama 3.1のダウンロードURL。

3つのモデルが下記のMeta社によるLlamaのサイトから、それぞれ簡単にダウンロードできる。

URL: https://llama.meta.com/?ref=upstract.com

ダウンロードの注意点。

ダウンロードされるのはあくまでもコード類であり、アプリではない。(はず。)

実装するためには、Pythonやコマンドプロンプトやターミナル、GitHubなどのプログラム系の知識が必要で、パソコンのスペックも求められる。

Meta AIで試すことができるようだが、日本ではまだ利用することができない。

Mata AIのサイトの画面。

参照:Meta AI


Llama 3.1はオープンソースのAI。

GitHub上のLlama 3.1。

Llama Models – ラマモデル。

Llama 2、Llama 3、Llama 3.1のモデルが揃っている。

また、利用規約やライセンスも確認できる。

meta-llama/llama-models: Utilities intended for use with Llama models.

Llama as a System – システムとしてのラマ。

システムとしてのLlama。APIについての説明が記載されている。

meta-llama/llama-agentic-system: Agentic components of the Llama Stack APIs

Llama3.1の商用利用と料金について。

基本的には商用利用可、無料で使える。

LlamaはオープンソースのAIなので、基本的には商用利用も可能で、無料で使える。

追加ライセンスが必要な場合も。

Llama 2は、月間ユーザー数が7億人を超えると、追加ライセンスのリクエストが必要だったので、今回のLlama3.1もなんからの例外があるかもしれない。

参照:Llama 2 Community License Agreement – Meta AI

Llama 3。無料でオープンなソースのMeta AI最新モデル。

以上、参考になれば幸いです。


Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 写真は主にUnsplashPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。

井川 宜久 / Norihisa Igawa
デザイナー、ディレクター、講師、コーチ / 井川宜久

AI 関連メモ。

ChatGPT 関連メモ。

DALL·E 関連メモ。

Sora 関連メモ。

Gemini 関連メモ。

Copilot、Bing 関連メモ。

Llama 関連メモ。

Claude 関連メモ。

Perplexity 関連メモ。


免責事項について

  • 記事ページ(Memosのページ)は当初は文字通りメモ書きでした。その後、修正や更新をしております。
  • 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ早急に対応いたします。
  • 一個人のポートフォリオサイトですので、万一損害・トラブル等が発生した場合でも、一切の責任を負いかねます。