「OpenAIがChatGPTを支援するPrompt生成技術を搭載したDALL-E 3を発表」

OpenAI announces DALL-E 3 equipped with prompt generation technology to support ChatGPT.

OpenAIは、ChatGPTを使用してテキストから画像を生成するツールであるDALL-E 3のリリースを発表しました。ユーザーはChatGPTとの対話を通じて、生成したい画像の説明であるプロンプトを微調整することができます。

トップのAI画像生成器のほとんどは、テキスト形式でプロンプトを受け取り、さまざまなスタイルでアート作品を生成します。適切な画像のシリーズを生成するための鍵の一つは、適切なプロンプトを作り出すことであり、これは難しい課題であることがわかっています。DALL-E 3は、ChatGPTを使用してクリエイターがより良いプロンプトを考え出すのを支援することで、この痛点に対処しようとしています。

「DALL-E 3は、微妙なリクエストを非常に詳細で正確な画像に変換することができます」と同社は声明で述べています。

ChatGPTは、数語という短いユーザーの入力を受けて、DALL-E 3モデルが使用するより詳細なプロンプトを作成することができます。DALL-Eのもう一つの改良点は、プロンプトの解釈をより正確に行い、以前のバージョンよりも高品質な画像を生成する能力です。最新モデルは、より長いプロンプトや人間の手やテキストなどの内容の表現も改善されています。

10月から、ChatGPT PlusおよびChatGPT Enterpriseのクライアントは、APIを介してDALL-Eにアクセスすることができます。過去のバージョンと同様に、会社が無料のWebツールをリリースする予定かどうかは不明です。OpenAIは、最新バージョンが暴力的な、成人向けの、または憎悪的なコンテンツの生成能力に制限があるなど、追加のセーフティ対策を備えていることをユーザーに保証しました。また、公的な人物の名前で画像をリクエストするプロンプトや、生きているアーティストのスタイルで画像を生成しようとするプロンプトを拒否することもできます。クリエイターを安心させるために、OpenAIは、ユーザーが将来のテキストから画像を生成するモデルの訓練に自分の作品の一部または全部を使用しない選択肢も提供しています。同社はまた、最新バージョンにはアルゴリズム的なバイアスを減らすための新しいセーフガードもあると主張しています。

Midjourney、OpenAI、StabilityAI、BlueWillow、アリババのTongyi Wanxiangなど、いくつかのテック企業は、トップのテキストから画像へのAIツールを作成する競争の一環として、常に画像生成モデルを改良しています。AIによる画像の急速な出現は、いくつかの法的およびセキュリティ上の懸念を引き起こしています。先月、ワシントンD.C.の裁判所は、人間の入力なしで生成されたAIアートは、米国の法律において著作権が適用されないと判断しました。いくつかのAI企業は、アーティストやクリエイターからの訴訟に直面しており、彼らの著作権保護された作品がAIモデルの訓練に使用されたと主張されています。