
GPT-4o。無料でも使えるChatGPT最新モデル。 見て、読んで、聞いて、声で会話するChatGPT。 音声会話が格段に飛躍。 ChatGPTが、文字・画像・音声などのトレーニングによる新たなニューラルネットワークの構築で、より自然な音声で会話ができるようになる。 感情表現ができ、バリエーションがあり、声の抑揚やトーンも変えられる。 YouTube...
Memos
GPT-4o。無料でも使えるChatGPT最新モデル。 見て、読んで、聞いて、声で会話するChatGPT。 音声会話が格段に飛躍。 ChatGPTが、文字・画像・音声などのトレーニングによる新たなニューラルネットワークの構築で、より自然な音声で会話ができるようになる。 感情表現ができ、バリエーションがあり、声の抑揚やトーンも変えられる。 YouTube...
Claude(クロード)のアカウント作成方法。 Claudeは仕事用に作られたAI アシスタント。 Claudeの読み方は「クロード」。 名前の由来? Claudeは、情報理論の考案者であり、情報理論の父とも呼ばれるClaude Shannon(クロード・シャノン)と同じ名前。 また、印象派の名前の由来でもあり、著名な画家の「Claude Mo...
ドーキンスの『利己的な遺伝子』とは? 利己的な遺伝子とその乗り物として。 スマホが普及するずっと前の、科学の本。 イギリスの学者リチャード・ドーキンス(Richard Dawkins)は、1970年代に『利己的な遺伝子』、1980年代には『延長された表現型』という書籍を発表している。 遺伝子が利己的? 著書の中でのドーキンスの視点や定義では、「...
Gemini。GoogleのAI。 Geminiとは? GoogleのマルチモーダルAI。 現代社会では、大量のWebサイトやスライド資料などでの情報収集で、文章&画像作成が必要不可欠。 仕事や学習、プライベートなど、さまざまな場面でそれらのスキルが求められる。 しかし、膨大な情報量を処理し、分かりやすくまとめることは、難易度の高い作業。 そんな課題を解...
Meta Horizon OS MetaのOS。 Meta Horizon OS つい先日オープンソースの生成AI「Llama 3」を発表したばかりのMeta社が、今度はMeta Horizon OSを発表。 MetaのOSもオープンソースで、名称は「Meta Horizon OS」。 Meta Questブログによるイメージ画像。 画像...
Llama(ラマ)3。オープンに利用可能な大規模言語モデル。 オープンソースでフリーなLlama 3。 Llama 2からLlama 3へ。 最先端のオープンソース大規模言語モデルの次世代モデルであるMeta社の「Llama 3」が登場。 もはや言い古された感さえあるが、Llamaの最新モデルであることに変わりはなく、Llama 2を大きく上回るパフォーマンスとのこ...
Soraが、Adobeの動画編集ソフトPremiere Proへ。 PremiereへSoraが。 Premiere Proと動画生成AI。 Adobeの動画編集ソフト「Premiere Pro」へ、動画生成AIモデルとして「Runway」や「Pica」と一緒に、「Sora」が導入される模様。 Adobeにより、一般公開されているデモ動画。 YouTubeで公...
AIによる画像生成やイラスト生成。 AIによる画像やイラストたち。 AI画像の急速な普及。 AIによる画像生成やイラスト生成が止まらない。 それも、画像生成AIの「Stable Diffusion」や「Midjourney」だけでなく。 元々は対話型AIだった「ChatGPT」をはじめ、「Gemini(旧Bard)」や「Copilot(旧Bing Chat)」...
ChatGPTとCopilotの違い。 ChatGPTとCopilotは、同じ技術を使用している。 ベースは、GoogleのTransformer。 ChatGPTとCopilotは、Googleが2017年に発表した「Transformer」という機械学習、深層学習モデルがベースとなっている。 特許は当然Googleが持っているそうだが、誰でも使えるオープンソース...
OpenAI Soraの動画。とにかくアーティスティック。 Worldweight Official Music Video • Made by August Kamp with Sora 音楽と映像。 ミュージシャンのAugust Kampさんによる、OpenAIのSoraを使ったおそらく最初のミュージックビデオ。 ChatGPTで一躍有名企業となったOpenAI...
ChatGPTがログインなしでも利用可能に。 ログインなし、サインアップしなくてもチャットができる。 ChatGPTがログイン不要に。OpenAIが利用方法を変更。 OpenAIが、AIのメリットを簡単に体験できるように、ChatGPT使用時のサインアップの必要をなくしたとのこと。 すでにアカウント不要、ログイン不要で利用が可能。 ChatGPTを使いたい場合...
Soraの短編映画。プロによる動画生成。 Soraの短編映画。 最新のSora公開動画。 OpenAI社自身のデモ動画とサム・アルトマンCEOのX上での動画生成以外で、おそらく初めてのSoraを使った公開動画。 エミー賞へのノミネートやアカデミー賞候補のチーム、エミー賞2度受賞のデザイン代理店、Vimeo Staff Picks獲得の常連者などの、本...
Grok(グロック)のオープンソース化。 Grok-1を公開。 GrokのモデルのGrok-1。 xAIのLLM(大規模言語モデル)である「Grok」の、「Grok-1」が公開。 参照元:xAIのBlog イーロン・マスク氏の予告通り、対応が素早い。 イーロン・マスク(Elon Musk)とは? テスラやスペースXのCEO。 「テスラ...
ChatGPTのパスワード変更。 ChatGPTのパスワードは、OpenAIアカウントのパスワード。 ChatGPTのパスワードは、OpenAIのアカウントを利用している。 ところが現時点(2024年3月中旬)では、OpenAIのWebサイト上では変更することができない模様。 ChatGPTの画面内にも、パスワード変更の箇所は用意されていない。 パスワ...
動かないChatGPTの、原因と対処。 ChatGPTが反応しない。 原因はいくつかある。 ChatGPTが反応しなく、使えなくなったときは、原因としていくつか考えられる。 原因の切り分け。 原因は複数あるので、まず、「OpenAI側の方の原因」なのか、「自分の方の原因」なのかで切り分ける。 OpenAI側の方が原因の場合。 障害が起きていないかど...
Soraの仕組みと一般公開されたデモ動画。 Soraのデモ動画:ゴールドラッシュ - Gold Rush 空撮されたような、カリフォルニアのゴールドラッシュ。 19世紀のカリフォルニアの街、川を中心に木造建築物と馬に乗った人々が住む街を、空からドローンで撮影したように生成された動画。 画質はあえて古いカラー映画のようにしたようで、ぱっと見、実写の映画と見分けがつかな...
OpenAIからの、Soraの広がり - Text to Video テキストから動画を生成 - Creating Video from Text Soraの使い方について。 Soraの基本的な使い方としては、テキストからAI動画を生成する「Text to Video」の形式。 動画生成AIはもちろん、ChatGPTやGemini(旧Bard)、Copilotなどの...
ChatGPTでの画像生成。 ChatGPT無料版での画像生成。 無料プランでも。 有料プランのChatGPT Plusで始まっていた画像生成が、無料プランのChatGPTでも生成できるようになっている。 日本語でも。 英語だけでなく、日本語でも画像生成が可能。 新しい画像生成機能「Image Generation(Image Gen)」の使い方例。 ...
Geminiでも使い方は変わらず、日本語もOK。 Geminiに名称変更。Bardからブランド統一へ。 Gemini(ジェミニ)。 Geminiは、日本語で双子座という意味。読み方は「ジェミニ」となった。 Geminiのモデル。 Gemini Ultra – 非常に複雑なタスクに対応する、高性能かつ最大のモデル Gemini Pro – 幅広いタスクに対...
Geminiの使い方。画像生成の例。 Googleの生成AI Geminiの画像生成。 テキストから画像生成。 Googleの生成AI、「Bard(現Gemini)」が画像生成をスタート。 ChatGPTやCopilotのように、テキストによる指示で画像が生成ができる。 (※2024年2月8日に、BardからGemini(ジェミニ)に名称が変更。) ...